Различные уровни в программном обеспечении распознавания речи

StackOverflow https://stackoverflow.com/questions/1216894

  •  06-07-2019
  •  | 
  •  

Вопрос

Есть фонетический уровень, синтаксический уровень, семантический уровень, фонологический уровень, акустический уровень, языковой уровень, языковой уровень.

Есть ли другие уровни?

Какой порядок снизу вверх?

И о чем они на самом деле?

Это было полезно?

Решение

Язык допускает большое разнообразие, но он также подчиняется многим правилам (хотя часто и свободным, с множеством исключений). Таким образом, на определенном языке определенные звуки с большей вероятностью будут следовать за другими звуками, определенные слова с большей вероятностью будут следовать за другими, и так далее. Уровни в основном уровень моделирования.

Акустический уровень пытается определить, какие акустические сигналы полезны для распознавания человеческой речи. Он пытается ответить на такие вопросы, как, & Quot; это фоновый шум или речевой звук? & Quot;

Фонологический уровень основан на том, какие звуки наиболее вероятно объединяются, когда он пытается преобразовать акустический сигнал в последовательность фонем. Я думаю, что это по сути то же самое, что и фонетический уровень.

Уровень языка определяет, какой акцент у пользователя, диалект и т. д.

На синтаксическом уровне вы смотрите, какие слова могут появляться вместе, основываясь на синтаксисе предложения. Это избавляет от слов, которые он бы догадался на основе фонологического уровня, но построил бы неграмотные предложения.

Лингвистический уровень, насколько я понимаю, это больше вопрос выбора правильного слова (например, какой омоним наш или час ) на основе контекста.

На семантическом уровне он пытается смоделировать значение предложения и избавиться от вещей, которые не соответствуют грамматическим отношениям глаголов и предлогов. Например, глагол исчезать не требует прямого объекта, поэтому, если в этом семантическом слоте есть что-то, вероятно, есть ошибка.

Порядок будет зависеть от приложения, некоторые из них могут быть объединены друг с другом, а некоторые вообще не могут использоваться. Концептуальная иерархия, которая имеет смысл для меня, является акустической & Lt; фонологический = фонетический < язык < синтаксический < лингвистический < семантический.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top