ИИ-модели развиваются стремительно, но всё ещё уступают человеку в одном ключевом аспекте — здравом смысле. Людям не нужно объяснять, что лёд превращается в воду, а зеркала отражают свет. Для ИИ же подобные понятия — результат сложной и многоэтапной подготовки.
Компания NVIDIA решила эту проблему с помощью Cosmos Reason — модели, способной рассуждать о физических законах и пространственно-временных связях. Она уже возглавила рейтинги физического рассуждения на платформе Hugging Face.
Обучение через здравый смысл
Чтобы ИИ мог уверенно ориентироваться в реальном мире, его нужно «научить» основам физики. Для этого команда исследователей NVIDIA разработала серию тестов, направленных на развитие у моделей интуитивного понимания окружающей среды.
Кто стоит за этим?
Созданием обучающих материалов занимается команда NVIDIA Data Factory, в которую входят аналитики из самых разных областей: от биоинженерии до лингвистики. Они подбирают реальные видеоролики и формируют пары «вопрос–ответ», обеспечивая модели данными, которые помогают ей мыслить как человек.
Каждая пара проходит многоступенчатую проверку: от аннотации до финальной оценки качества, прежде чем будет использована для обучения Cosmos Reason.
Почему это важно?
Без понимания физики окружающего мира ИИ может совершать ошибки, опасные для людей и среды. Например, робот без «знания» гравитации может упасть или повредить объекты вокруг себя. Именно поэтому так важно внедрять в модели фундаментальные принципы физического существования.
Применение Cosmos Reason
Сценарии применения — от автономных роботов и тестирования систем безопасности до умных пространств и самоуправляемых транспортных средств. Cosmos Reason может анализировать видео, предсказывать исход событий и объяснять, почему пришла к тому или иному выводу.
Например, если модель видит два автомобиля, движущихся по одной полосе навстречу друг другу, она может определить наиболее вероятный исход — столкновение — и объяснить свою логику.