Обучение программированию онлайн

Установка Pocketsphinx на Android

У меня есть несколько вопросов по установке Pocketsphinx на Android-телефон, и я не смог найти ответы на форуме поддержки CMUSphinx, IRC, существующих сообщениях StackOverflow или интенсивном Гугле. Если у кого-нибудь здесь найдется минутка и он захочет помочь, я буду очень признателен. Во-первых, я не увер...

5

android speech-recognition

Почему распознавание речи затруднено? [закрытый]

Почему распознавание речи так сложно? Какие конкретными связанные с этим проблемы? Я прочитал вопрос о распознавании речи, который частично ответил на некоторые мои вопросы, но ответы были в основном анекдотическими, а не техническими. Он также до сих пор не ответил, почему мы все еще не можем просто бросить ...

5

9

theory algorithm speech-recognition

Как подготовить набор данных для распознавания речи

Мне нужно обучить двунаправленную модель LSTM распознавать дискретную речь (отдельные числа от 0 до 9) я записал речь из 100 динамиков. Что мне делать дальше? (Предположим, я разделяю их на отдельные части .wav файлы, содержащие по одному номеру на файл) я буду использовать mfcc в качестве функций для сети. ...

1

4

speech-recognition

Как нажать кнопку Chrome Mic из Javascript в приложении Delphi 6 или хотя бы найти кнопку и получить ее координаты на экране Windows?

У меня есть приложение Delphi 6, которое встраивает веб-браузер Chromium. Я хочу нажать кнопку Chrome microphone (управление речевым вводом) из Javascript. Я попробовал обычный метод вызова обработчика click () кнопки, но ничего не произошло. Ниже приведен HTML, который я пробовал с первым элементом ввода,...

1

4

google-chrome delphi speech-recognition

Частичное распознавание голоса

В настоящее время я хорошо провожу время с распознаванием голоса с помощью речевого движка Microsoft. Он довольно прост в настройке и использовании с C#, и позволяет достичь больших результатов с меньшим количеством строк кода, чем я сначала себе представлял. Теперь дело в том, что я действительно не знаю, к...

1

5

c# speech-recognition

Программирование с распознаванием речи от microsoft. Как я мог закрывать механизм распознавания речи каждый раз, когда он получал слово

Я программирую, используя распознавание речи microsoft. Я привел пример, и он работает очень хорошо. Но если я открою распознавание речи, программа всегда будет внутри. Я хочу, чтобы каждый раз, когда двигатель останавливается, когда он распознает слова. Разве это возможно? Мой код немного похож на этот: _...

2

4

c# speech-recognition

Как построить модель языка с большим словарным запасом для CMU Sphinx?

Я хотел бы построить модель языка для CMU Sphinx, но мой корпус содержит более 1000 слов, поэтому я не могу использовать онлайн-инструмент. Как я использую (скрипты в cmuclmtk?) построить свою языковую модель?...

2

8

speech-recognition

PocketSphinx python и установка акустической модели?

Я читал это руководство по распознаванию речи , и в нем упоминалось, что мне нужны три элемента для распознавания речи: акустическая модель, языковая модель, фонетический словарь. Я хотел начать играть с этой python demo, которая использует Gstreamer для захвата с микрофона и ресамплирования до 8 кГц, 16-би...

1

5

python speech-recognition

Как я могу использовать распознавание речи без раздражающего диалога в телефонах android

возможно ли это без изменения API android? Я нашел статью об этом. Есть один комментарий, что я должен сделать изменения в API android. Но он не сказал, как сделать модификацию. Кто-нибудь может дать мне несколько советов о том, как это сделать? Спасибо! Я нашел эту статью; SpeechRecognizer Его потребност...

4

115

android speech-recognition

Android: распознавание речи без использования сервера google

Я хочу разработать распознаватель речи в android, который должен работать в автономном режиме. Поскольку встроенный распознаватель речи android использует сервер google, которому нужен интернет, я хочу альтернативу, которая работает в отсутствие интернета. пожалуйста, предложите мне какой-то способ для дости...

5

52

android speech-recognition offline