Распознавание речи для колл-центра
Обучение и внедрение модели ASR на базе T-One для потоковой транскрибации звонков на русском языке: шумоподавление, диаризация спикеров, интеграция в телефонию.
Задача
Колл-центру нужна потоковая транскрибация звонков на русском с разделением спикеров и устойчивостью к шуму линии.
Подход
Дообучили и внедрили ASR на базе T-One, добавили шумоподавление и диаризацию, вывели streaming API на FastAPI с GPU-инференсом.
Результат
Транскрипты в реальном времени для контроля качества и аналитики. Сервис выдерживает нагрузку пиковых часов.
Результат
Высоконагруженный сервис транскрибации в реальном времени