Частичное распознавание голоса


В настоящее время я хорошо провожу время с распознаванием голоса с помощью речевого движка Microsoft. Он довольно прост в настройке и использовании с C#, и позволяет достичь больших результатов с меньшим количеством строк кода, чем я сначала себе представлял.

Теперь дело в том, что я действительно не знаю, как справиться с этим : Я понимаю, что двигатель должен начать слушать, затем вы говорите слово или предложение, и он сравнивает в своем словаре, чтобы увидеть, может ли он увидеть совпадение. Если да, то программа делает все, что вы хотите это делать.

То, что я чешу в голове, это то, что я хотел бы, чтобы двигатель "обнаружил" слова, которые находятся в его словаре, в полной случайной фразе, содержащей одно или все эти слова.

Предположим, что в словаре есть следующие слова: : - "Читать" - "Новости"

Я хотел бы закодировать что-то, что обнаруживало бы эти конкретные слова всякий раз, когда я говорю, например : - "Почитай мне Новости" - "Ты можешь читать новости?" - "Читать новости"...

Как я могу добиться этого ?

1 5

1 ответ:

Эта функция называется "распознавание ключевых слов". Обычно вы не можете выполнить поиск ключевых слов с помощью механизма распознавания речи, вам нужен конкретный пакет поиска. Ключевой вопрос заключается в том, что движок должен постоянно сравнивать два результата - слово найдено и слово не найдено. Распознавание речи только ищет слова, которые находятся в грамматике и не учитывает другие звуки. Для обнаружения пятен просто требуется другой алгоритм.

Существует обходной путь, чтобы добавить много возможных слогов или других звуки в грамматику распознавания речи и надеемся, что движок найдет их вместо ключевого слова, но это не очень хорошее решение с точки зрения точности по сравнению с конкретным ключевым словом spotter.

Если вы не тесно связаны с движком Microsoft и вам нужен общий язык, такой как американский английский или французский, вы можете реализовать поиск ключевых слов с помощью программных инструментов с открытым исходным кодом для распознавания речи, таких как CMUSphinx.