main-image

Технология распознавания речи

Набор алгоритмов обработки аудиосигналов и анализа текста, обученных на большом количестве размеченных вручную данных

Главные задачи

advantages-img

Правильно переводить голос в текст для того, что бы впоследствии текст переводить в синтезированный голос (вы пишите текст, а в результате воспроизводится голос)

advantages-img

Обучить модели для правильного расставления пауз, правильных смысловых интонаций, тона и громкости в зависимости от смысла предложения

82% Точность на зашумлённых данных из телефонии

Возможности

cases-img

Работает в облаке и в периметре заказчика.

cases-img

Высокая скорость распознавания (15 сек. аудио за 0,5-1 сек.)

cases-img

Возможна параллельная обработка нескольких голосовых потоков

cases-img

Применение архитектуры BERT (обеспечивает синтаксическую связность)

cases-img

Полностью кастомизируется под предметную область заказчика

cases-img

Различные модули пост обработки (фильтр мата, перевод цифр, расстановка пунктуации, определение пауз)

cases-img

6 real-time factor скорость обработки данных в облаке, что на 40-80% выше скорости конкурирующих сервисов

cases-img

Точные таймстампы начала каждого распознанного слова