На этой неделе подразделение Facebook AI объявило о запуске системы глубокого обучения под названием M2M-100, которая может переводить любую языковую пару (среди 100 языков), не полагаясь на английский в качестве посредника. То есть при переводе с китайского на французский процесс будет идти напрямую.
Ранее ИИ-модели переводили с китайского на английский, а с него — на французский. М2М-100 «тренируется» непосредственно на китайском и французском языках (факт помогает уменьшить число ошибок).
Модель для обучения включает в себя 7,5 млрд предложений на 100 языках и состоит из 15 млрд параметров. Обучение идёт по 2200 языковым направлениям (в 10 раз больше, чем у предыдущих модификаций).
Аппаратная часть включает в себя ускорители NVIDIA V100, программная базируется на PyTorch с расширением Fairscale.
В настоящее время Facebook не планирует использовать эту модель в своих продуктах (сейчас проводятся исследования).