Yandex SpeechKit

Эта статья — о технологии Яндекса. Об одноимённой компании см. Яндекс.
Yandex.SpeechKit
Логотип программы Yandex.SpeechKit
Скриншот программы Yandex.SpeechKit
Разработчик Яндекс
Языки интерфейса русский, турецкий, английский
Первый выпуск 2013
Сайт tech.yandex.ru/speechkit…
Логотип Викисклада Медиафайлы на Викискладе

Yandex SpeechKit (произносится как Яндекс СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс[1].

Краткие сведения

Демонстрация новых возможностей СпичКита на YaC-2014

Разработками в области обработки естественной речи компания «Яндекс» занимается с 2012 года[2].

SpeechKit[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC[1].

Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8[1] и понимает запросы на русском и турецком языках[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно[5]. Скорость распознавания — 1,1 секунды[5].

SpeechKit[3] используется в приложениях «Яндекс Браузер», «Яндекс Город», «Яндекс Карты», «Яндекс Навигатор» и ещё около 400 приложениях[4].

4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов[4].

Возможности

Голосовая активация

Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне[6].

Выделение смысловых объектов

Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город[6].

Синтез речи

Преобразование текста в речь на базе скрытых марковских моделей[6].

Применение технологии

Комплекс речевых технологий Яндекса успешно применяется в различных направлениях[7]:

Примечания

  1. 1 2 3 «Яндекс» разработал собственную технологию распознавания речи  (неопр.). Дата обращения: 30 декабря 2013. Архивировано 30 декабря 2013 года.
  2. Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса Архивная копия от 29 апреля 2015 на Wayback Machine // радио Эхо Москвы
  3. 1 2 Речевые технологии Yandex SpeechKit – распознавание речи, синтез речи, смысловой разбор сказанного, голосовая активация.  (неопр.) speechkit.yandex.ru. Дата обращения: 29 сентября 2015.
  4. 1 2 3 4 5 Яндекс представил SpeechKit Cloud — облачный сервис распознавания речи  (неопр.). Дата обращения: 4 августа 2014. Архивировано из оригинала 6 августа 2014 года.
  5. 1 2 «Яндекс» распознает речь на iOS и Android  (неопр.). Дата обращения: 30 декабря 2013. Архивировано 1 января 2014 года.
  6. 1 2 3 Право голоса  (неопр.). Дата обращения: 31 октября 2014. Архивировано из оригинала 14 сентября 2015 года.
  7. Вести.net: синтез речи от «Яндекса» и плата за репосты.  (неопр.) Дата обращения: 13 сентября 2016. Архивировано 10 мая 2017 года.
  8. «Яндекс» выпустил голосового помощника «Алиса».  (неопр.) Дата обращения: 30 октября 2017. Архивировано 21 июня 2018 года.
  9. «Яндекс» готовит на экспорт речевые технологии: для автопрома, телекомов и медицины.  (неопр.) Дата обращения: 30 октября 2017. Архивировано 20 октября 2020 года.
  10. Россияне смогут переводить деньги с помощью голосовых команд.  (неопр.) Дата обращения: 30 октября 2017. Архивировано 7 августа 2020 года.
  11. Коллтрекинговый сервис Calltouch запустил услугу распознавания качества звонков при помощи технологий «Яндекса».  (неопр.) Дата обращения: 30 октября 2017. Архивировано 29 октября 2021 года.
  12. НМГ перезапустила сайт «Известий» через два месяца после предыдущего редизайна.  (неопр.) Дата обращения: 30 октября 2017. Архивировано 7 ноября 2017 года.

См. также

Ссылки

Внешние аудиофайлы
Железки начали понимать // Интернет-кафе «Соб@ка»
Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса // радио Эхо Москвы
  • Медиафайлы на Викискладе
  • Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit // Хабрахабр
  • Официальное сообщество СпичКита
  • Почему роботы разговаривают с нами только в кино // Журнал «Афиша»
Перейти к шаблону «Яндекс»
Люди
Основатели
Инвесторы
Менеджеры
и сотрудники
Поисковые службы
Персональные службы
Электронная коммерция
и фудтех
Вебмастерам и компаниям
Финтех
Программы
Технологии
Устройства
Умный дом
  • Умный дом Яндекса
    • Пульт
    • Розетка
    • Лампочка
Автотранспорт
Роботы-курьеры
Образование
Сервисы Яндекс 360
Индустрия компьютерных игр
Закрытые
и проданные проекты
Прочее