Компания Microsoft сделала важный шаг в развитии собственной AI-инфраструктуры, представив первые модели, созданные внутри собственного AI-подразделения: MAI-Voice-1 и MAI-1-preview. Ранее Microsoft в основном опиралась на партнерство с OpenAI, но теперь активно развивает собственные технологии, чтобы усилить возможности Copilot и других сервисов.
MAI-Voice-1: генерация речи за доли секунды
Модель MAI-Voice-1 способна генерировать минуту аудио менее чем за секунду, используя всего один GPU. Она уже применяется в Copilot Daily, где ИИ-ведущий озвучивает главные новости дня, а также в генерации подкастов и пояснительных обсуждений.
Пользователи могут протестировать MAI-Voice-1 на платформе Copilot Labs: ввести нужный текст, выбрать стиль и голос для озвучки. Это делает технологию доступной для создания кастомизированного аудиоконтента на лету.
MAI-1-preview: альтернатива GPT от Microsoft
Вторая представленная модель, MAI-1-preview, является ИИ широкого назначения, способным выполнять текстовые задачи, следовать инструкциям и давать полезные ответы на повседневные вопросы. Модель была обучена на базе около 15000 графических процессоров NVIDIA H100.
Microsoft уже начала публичное тестирование MAI-1-preview на платформе LMArena, а также готовит её интеграцию в Copilot, заменяя и дополняя модели от OpenAI в ряде сценариев.
Ориентация на массового пользователя
Глава Microsoft AI, Мустафа Сулейман, ранее заявил, что команда не стремится создавать модели только для корпоративного сектора. Основной акцент — на потребительские кейсы, где компания уже имеет обширные данные.
Источник: The Verge