Хм для оценки перспективы в изображении документа, не может понять алгоритм

https://stackoverflow.com/questions/2679939

30-09-2019
|

Вопрос

Вот бумага, речь идет о оценке перспективы двоичного изображения, содержащего текст и некоторые шумовые или не текстовые объекты.

PDF документ

Алгоритм использует скрытую модель Markov: на самом деле два условия T - текст B - Backgrouond (т.е. шум)

Трудно понять сам алгоритм. Вопрос в том, что я прочитал о скрытых моделях Markov, и я знаю, что он использует вероятности, которые должны быть известны. Но в этом алгоритме я не могу понять, если они используют HMM, как они получают эти вероятности (вероятность изменения состояния от S1 в другое состояние например S2)?

Я не нашел ничего о тренировке там тоже в этой статье. Итак, если кто-то понимает это, пожалуйста, скажите мне. Также можно ли использовать HMM, не зная состояния изменений вероятностей?

Редактировать: Может быть, они используют некоторую оценку, не зная параметров HMM (вероятностей)

Решение

Возможно, это слишком академический, более связанный с прикладной математикой, чем для программирования?

В любом случае: HMM традиционно обученный (то есть изучить значение параметров модели, в данном случае вероятности), используя некоторую базу данных уже классифицировать данные. Увидеть Баум Уэлч алгоритм. Отказ Это разделение двух этапов: обучение (или обучение) сначала (с классифицированными маркированными данными), классификация (или реальная работа) после (с неклассифицированными данными) типична для многих алгоритмов, и он называется Контролируемая классификация.

С другой стороны, иногда у нас нет «известных» (классифицированных) данных, поэтому мы должны прибегать к Неснесенная классификация, в котором мы пытаемся изучать модель и классифицировать одновременно. Это гораздо более ограничено, и обычно подразумевает много симпедисту и уменьшение параметров для модели (так, чтобы у нас не было так много вещей, чтобы учиться). На первый взгляд, это, похоже, путь, сделанный в этой статье: они не считают полностью общими HMM, а очень ограниченный и пытаются найти хорошую пригодность для модели. Но, опять же, я не прочитал это серьезно.

Лицензировано под: CC-BY-SA с атрибуция

Не связан с StackOverflow