Как я могу построить график интонации образца голоса?


Я хочу сделать приложение для iOS, которое позволит мне построить график интонации (подъема и падения высоты тона их голоса) аудиосимпла, прочитанного пользователем. Интонация очень важна в различных языках по всему миру, и это было бы попыткой практиковать интонацию, а также произношение.

Я не очень разбираюсь в мире речевых / звуковых технологий, так что мне нужно? Есть ли библиотеки, которые поставляются с Cocoa-touch, что дает мне возможность получить доступ к данные, которые мне нужны из голосового образца? Что именно я буду искать, чтобы захватить?

Если у кого-то есть идея технологии, которую мне нужно будет использовать, я был бы признателен за точку в правильном направлении.

Спасибо!

1 2

1 ответ:

То, что вы ищете, называется формантным анализом.

Форманты-это, по существу, спектральные пики произносимых звуков. Они перечислены в порядке частотности, как в f1, f2 и т. д. Мне кажется, что то, что вы хотите построить, - это f1. Формантный анализ лежит в основе распознавания речи, обычно f1 и f2 достаточно, чтобы различать гласные друг от друга. Я бы рекомендовал вам сделать поиск по алгоритмам формантного анализа и взять его оттуда.

Удачи:)