speech-recognition

У меня есть несколько вопросов по установке Pocketsphinx на Android-телефон, и я не смог найти ответы на форуме поддержки CMUSphinx, IRC, существующих сообщениях StackOverflow или интенсивном Гугле. Если у кого-нибудь здесь найдется минутка и он захочет помочь, я буду очень признателен. Во-первых, я не увер...

Почему распознавание речи так сложно? Какие конкретными связанные с этим проблемы? Я прочитал вопрос о распознавании речи, который частично ответил на некоторые мои вопросы, но ответы были в основном анекдотическими, а не техническими. Он также до сих пор не ответил, почему мы все еще не можем просто бросить ...

Мне нужно обучить двунаправленную модель LSTM распознавать дискретную речь (отдельные числа от 0 до 9) я записал речь из 100 динамиков. Что мне делать дальше? (Предположим, я разделяю их на отдельные части .wav файлы, содержащие по одному номеру на файл) я буду использовать mfcc в качестве функций для сети. ...

У меня есть приложение Delphi 6, которое встраивает веб-браузер Chromium. Я хочу нажать кнопку Chrome microphone (управление речевым вводом) из Javascript. Я попробовал обычный метод вызова обработчика click () кнопки, но ничего не произошло. Ниже приведен HTML, который я пробовал с первым элементом ввода,...

В настоящее время я хорошо провожу время с распознаванием голоса с помощью речевого движка Microsoft. Он довольно прост в настройке и использовании с C#, и позволяет достичь больших результатов с меньшим количеством строк кода, чем я сначала себе представлял. Теперь дело в том, что я действительно не знаю, к...

Я программирую, используя распознавание речи microsoft. Я привел пример, и он работает очень хорошо. Но если я открою распознавание речи, программа всегда будет внутри. Я хочу, чтобы каждый раз, когда двигатель останавливается, когда он распознает слова. Разве это возможно? Мой код немного похож на этот: _...

Я хотел бы построить модель языка для CMU Sphinx, но мой корпус содержит более 1000 слов, поэтому я не могу использовать онлайн-инструмент. Как я использую (скрипты в cmuclmtk?) построить свою языковую модель?...

Я читал это руководство по распознаванию речи , и в нем упоминалось, что мне нужны три элемента для распознавания речи: акустическая модель, языковая модель, фонетический словарь. Я хотел начать играть с этой python demo, которая использует Gstreamer для захвата с микрофона и ресамплирования до 8 кГц, 16-би...

возможно ли это без изменения API android? Я нашел статью об этом. Есть один комментарий, что я должен сделать изменения в API android. Но он не сказал, как сделать модификацию. Кто-нибудь может дать мне несколько советов о том, как это сделать? Спасибо! Я нашел эту статью; SpeechRecognizer Его потребност...

Я хочу разработать распознаватель речи в android, который должен работать в автономном режиме. Поскольку встроенный распознаватель речи android использует сервер google, которому нужен интернет, я хочу альтернативу, которая работает в отсутствие интернета. пожалуйста, предложите мне какой-то способ для дости...