Новая технология распознования речи от IBM усовершенствует голосовое управление автомобильными навигационными системами
Корпорация IBM объявила о новом достижении в области голосовых технологий, которое позволит водителям автомобилей и пользователям карманных ПК управлять аппаратными средствами с помощью естественного языка, освободив их от необходимости заучивания специфических, заранее определенных команд.
Новый компонент программного пакета IBM Embedded ViaVoice 4.4 позволяет усовершенствовать технологии голосового управления для карманных устройств и навигационных систем автомобилей. При этом обеспечивается большая гибкость системы и точность выполнения указаний пользователя. Прежде, для того чтобы взаимодействовать с системами распознавания речи, пользователям требовалось изучить, запомнить и использовать фиксированный набор фраз и команд. Теперь, благодаря разработанной IBM новой технологии, для управления радиоприемником водитель может просто сказать, например: «настроиться на частоту 104,3», или «установить приемник на частоту 104,3», или «изменить радиостанцию на 104,3». Чтобы настроить радиоприемник на желаемую волну, можно использовать самые разнообразные, простые и понятные фразы, поэтому больше не нужно запоминать набор специфических команд.
Пакет IBM Embedded ViaVoice 4.4 включает компонент freeform command recognition (распознавание команд в свободной форме), использующий средства статистического языкового моделирования и семантической интерпретации, чтобы обеспечить взаимодействие между пользователем и системой распознавания голоса в радиоприемниках, навигационных системах автомобиля или карманных ПК на естественном языке.
Кроме того, новый пакет обеспечивает значительное повышение точности распознавания голоса на фоне любых шумов благодаря использованию новых акустических моделей, усовершенствованным методикам обучения акустическим моделям и улучшенному определению границы речь/тишина с учетом различных случайных шумов (неровности дорожного покрытия, сирены, пересечение железнодорожной линии и т.д.).
ПО IBM Embedded ViaVoice Version 4.4 предлагает голосовые технологии для мобильных устройств, таких как навигационные системы автомобилей, телефоны с голосовым управлением, карманные ПК и других интеллектуальных устройств. Встраиваемые приложения могут использовать голосовые технологии IBM как для автоматического распознавания речи (Automatic Speech Recognition, ASR), чтобы вводить команды в мобильные устройства, так и для преобразования текста в речь (Text-To-Speech, TTS), чтобы синтезировать голос человека для воспроизведения текста и другой информации из мобильного устройства.