← Все работы

Речь · 2025

Распознавание речи для колл-центра

Обучение и внедрение модели ASR на базе T-One для потоковой транскрибации звонков на русском языке: шумоподавление, диаризация спикеров, интеграция в телефонию.

T-OneASRFastAPIGPUStreaming

Задача

Колл-центру нужна потоковая транскрибация звонков на русском с разделением спикеров и устойчивостью к шуму линии.

Подход

Дообучили и внедрили ASR на базе T-One, добавили шумоподавление и диаризацию, вывели streaming API на FastAPI с GPU-инференсом.

Результат

Транскрипты в реальном времени для контроля качества и аналитики. Сервис выдерживает нагрузку пиковых часов.

Результат

Высоконагруженный сервис транскрибации в реальном времени

Контакт

Обсудим
похожую задачу

Опишите контекст — ответим с оценкой подхода и сроков