Сб. 23 Ноя, 2024

Как обработать 10 часов аудио за 40 секунд с помощью GPU?

Проект Deepgram, стартап NVIDIA Inception, разрабатывающий модели глубокого обучения с автоматическим распознаванием речи (ASR), недавно опубликовал демонстрацию работы системы на базе графических процессоров. Создатели заявили, что их система распознавания речи обеспечивает максимально быструю и точную транскрипцию с высочайшим качеством на выходе.