Синтез русской речи

Описание

Синтез речи — это технология, которая дает возможность прочитать текст (документ, письмо, смс) голосом, приближенном к естественному. Чтобы синтезированная речь звучала натурально, необходимо решить целый комплекс задач, связанных как с обеспечением естественности голоса на уровне тембра, плавности звучания и интонации, так и с правильной расстановкой ударений, расшифровкой сокращений, чисел, аббревиатур и специальных знаков.

Методы синтеза речи

Сегодня наиболее динамично развивающимися и обеспечивающие наибольшую естественность речи являются два основных направления синтеза: компилятивный синтез с использованием технологии Unit Selection (выбор звуковых элементов из речевой базы), пришедший на смену аллофонному и дифонному синтезу, и синтез, генерирующий звуковой сигнал по предсказанным на основе скрытых марковских моделей (hidden Markov models) параметрам, – HMM-синтез. Но каждый из них в отдельности имеет свои недостатки:

  • Unit Selection — естественность тембра речи высока и в синтезированный голос сохраняет тембровую окраску голоса диктора-донора. Однако интонационное оформление может быть несколько неестественным и однообразным.
  • HMM-синтез — интонационное оформление, высота и тембр как бы «клонируются» с естественного голоса диктора, но генерируемая речь звучит несколько механически и «роботизировано».

Технология гибридного синтеза речи от ЦРТ

Специалистами компании «Центр речевых технологий» была разработана новая технология гибридного синтеза речи, объединившая в себе достоинства подхода Unit Selection и HMM-синтеза и практически исключившая их недостатки.

Синтез речи VitalVoice использует сложные лингвистические алгоритмы анализа текста и обработки выходного сигнала, что позволяет достичь максимального приближения к реальной речи.

В словаре VitalVoice содержится более 300 фразеологизмов, с помощью которых синтезатор понимает, что, например, выражение «ни пуха ни пера» — это единая смысловая конструкция с особой интонацией.

Особое внимание уделяется интонации и паузации синтетической речи, ведь именно эти параметры во многом обеспечивают естественность голоса. Блок лингвистической обработки позволяет автоматически расшифровывать множество вариантов сокращений, используемых в текстах на русском языке.

Основные характеристики системы:

  • Морфо-грамматический словарь - 182649 лемм
  • Словарь частотных аббревиатур - 787 единиц
  • Словарь частотных иноязычных аббревиатур - 329 единиц
  • Словарь частотных иноязычных слов - 2781 единица
  • Словарь сокращений - 285 единиц
  • 2 мужских и 5 женских голосов + возможность изменения темпа чтения, высоты и тембра голоса
  • Поддержка основных тегов стандарта SSML: с помощью тегов можно задавать паузу, повышать и понижать частоту основного тона, изменять произношение слова и т. п.
  • Возможность задать нужное ударение в слове через пользовательский словарь
  • Поддержка ОС Windows, Apple iOS и Linux

Преимущества

  • Синтез речи VitalVoice обладает целым рядом преимуществ таких как:
  • Высокая естественность звучания при чтении произвольного текста
  • Учет фонетических, морфологических и грамматических особенностей русского языка
  • Технология клонирования естественной интонации и тембра голоса диктора-донора
  • Правильная расстановка ударений
  • Правильная расшифровка сокращений, чисел, аббревиатур и специальных знаков
  • Простота использования и внедрения
  • Поддержка стандартных протоколов обмена данными и языков разметки (MRCP, SAPI, SSML)
  • 7 различных голосов синтеза
  • Возможность создания уникального голоса «на заказ»

Использование в продукции

  • Распознавание и синтез речи
  • Поддержка ведущих IVR платформ
  • Совместимость с open source IP PBX
  • приём и обработка 100% поступающих звонков
  • работа со всеми типами телефонов
  • срок окупаемости системы: 6-10 месяцев
  • Прием и обработка до 100 000 вызовов в сутки
  • Средний уровень автоматизации - 95%
  • распознавание и синтез русской речи
  • обработка входящих звонков в компанию и внутренних звонков сотрудников
  • совместимость с любыми IP PBX
  • управление с помощью WEB -интерфейса
  • статистика звонков

Естественный интуитивно понятный способ навигации.

  • поддержка современных CMS платформ
  • совместим со всеми интернет-браузерами
  • идеален для создания интерактивных Web-проектов

Приложение для Apple iPad и Apple iPhone для озвучивания электронных книг.

Приложение на AppStore

Бесплатное приложение для Apple iPad и Apple iPhone для прослушивания новостных RSS-каналов.

Приложение на AppStore

Автоматическая система информирования клиентов.

  • голосовое оповещение по цифровым каналам связи
  • рассылка SMS-сообщений и электронной почты
  • интеграция с CRM-системами
  • формирование персональных сообщений

Система автоматического речевого оповещения

  • голосовое оповещение с помощью технологии синтеза русской речи
  • 2 мужских и 3 женских синтезированных голоса
  • автоматическое формирование персональных сообщений
  • интеграция с 1С