Эта статья — о технологии Яндекса. Об одноимённой компании см. Яндекс.

Yandex.SpeechKit (произносится как Яндекс.СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс[1].

Yandex.SpeechKit
Yandex-speechkit.tech logo rgb2.png
Разработчик Яндекс
Языки интерфейса русский, турецкий, английский
Первый выпуск 2013
Сайт tech.yandex.ru/speechkit…
Commons-logo.svg Медиафайлы на Викискладе

Краткие сведенияПравить

 
Демонстрация новых возможностей СпичКита на YaC-2014

Разработками в области обработки естественной речи компания «Яндекс» занимается с 2012 года[2].

SpeechKit[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC[1].

Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8[1] и понимает запросы на русском и турецком языках[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно[5]. Скорость распознавания — 1,1 секунды[5].

SpeechKit[3] используется в приложениях «Яндекс.Браузер», «Яндекс.Город», «Яндекс.Карты», «Яндекс.Навигатор» и ещё около 400 приложениях[4].

4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов[4].

ВозможностиПравить

Голосовая активацияПравить

Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне[6].

Выделение смысловых объектовПравить

Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город[6].

Синтез речиПравить

Преобразование текста в речь на базе скрытых марковских моделей[6].

Применение технологииПравить

Комплекс речевых технологий Яндекса успешно применяется в различных направлениях[7]:

ПримечанияПравить

  1. 1 2 3 «Яндекс» разработал собственную технологию распознавания речи
  2. Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса // радио Эхо Москвы
  3. 1 2 Речевые технологии Yandex SpeechKit – распознавание речи, синтез речи, смысловой разбор сказанного, голосовая активация.. speechkit.yandex.ru. Дата обращения: 29 сентября 2015.
  4. 1 2 3 4 5 Яндекс представил SpeechKit Cloud — облачный сервис распознавания речи (недоступная ссылка). Дата обращения: 4 августа 2014. Архивировано 6 августа 2014 года.
  5. 1 2 «Яндекс» распознает речь на iOS и Android
  6. 1 2 3 Право голоса
  7. Вести.net: синтез речи от «Яндекса» и плата за репосты.
  8. «Яндекс» выпустил голосового помощника «Алиса».
  9. «Яндекс» готовит на экспорт речевые технологии: для автопрома, телекомов и медицины.
  10. Россияне смогут переводить деньги с помощью голосовых команд.
  11. Коллтрекинговый сервис Calltouch запустил услугу распознавания качества звонков при помощи технологий «Яндекса».
  12. НМГ перезапустила сайт «Известий» через два месяца после предыдущего редизайна.

См. такжеПравить

СсылкиПравить

  Внешние аудиофайлы
  Железки начали понимать // Интернет-кафе «Соб@ка»
  Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса // радио Эхо Москвы