как кластеризация данных помогает в распознавании изображений или образов

StackOverflow https://stackoverflow.com/questions/1436260

Вопрос

Я поиграл с различными алгоритмами кластеризации данных, работая над поиском кластеров между случайными точками данных, представленными узлами, я продолжаю читать, что кластеризация данных используется для распознавания изображений.Мне не удается установить связь, как кластеризация данных помогает в распознавании изображения или в распознавании лиц.кто-нибудь может это объяснить?

Это было полезно?

Решение

Неудивительно, что кластеризация используется для распознавания образов в целом и изображений в частности:кластеризация - это процесс сокращения, а изображения в эту эпоху мегапикселей нуждаются в доработке...Это также процесс , который создает категории и это, конечно, полезно.

Однако существуют существует множество подходов к использованию кластеризации как метода распознавания изображений.Одна из причин такого разнообразия заключается в том, что кластеризация может применяться на разных уровнях, для разных целей:от базового уровня пикселей до уровня объектов (объект может быть линией, геометрической фигурой ...), для классификации или для других целей.

На очень высоком уровне, кластеризация - это статистический инструмент, это помогает выявить относительную важность различных измерений при определении принадлежности конкретного товара к определенной категории.

Один [из многих] случаев использования такого инструмента, является с контролируемое обучение, посредством чего набор выбранных человеком элементов (скажем, изображений) подается в логику на основе кластеров вместе с меткой, связанной с конкретным элементом ("это яблоко", "это другое яблоко", "это лимон" ...), затем логика кластеризации определяет, насколько важно каждое измерение входных данных для того, чтобы помочь каждой группе элементов (яблоки, лимоны ...) поместиться в отдельный кластер (например, цвет может иметь относительно небольшое значение, но форма, или наличие точек, или что-то еще может иметь большое значение).После этого этапа обучения новые изображения могут быть загружены в логическую систему, и, увидев, насколько близко к определенному кластеру это изображение падает, оно "распознается" (как банан!).

Когда дело доходит до обработки изображений, нужно помнить, что все, что "подается" в логику кластеризации, не обязательно (на самом деле, редко) является необработанными пикселями, но различными "объектами" характеризующий различные "элементы" исходных данных (по существу, набор векторов относительно высокой размерности, мало чем отличающихся от тех, с которыми можно было столкнуться в других примерах кластеризации данных) и полученный на предыдущих этапах процесса.Например, важным элементом распознавания лиц, вероятно, является точное расстояние между центрами глаз.На предыдущих этапах изображение обрабатывается таким образом, чтобы определить, где находятся глаза (возможно, опираясь на другую логику, основанную на кластеризации).Затем расстояние между глазами вместе со многими другими элементами передается в конечную логику кластеризации.

Предыдущее описание является лишь одним из примеров использования кластеризации для распознавания изображений.Действительно, различные формы нейронных сетей были использованы, и очень успешно, в этой области, и можно утверждать, что в некотором смысле эти нейронные сети являются кластеризующими информацию.Одна из причин успеха нейронных сетей может заключаться в их способности более уважительно относиться к населенный пункт размер, указанный в исходных входных данных, а также их способность работать в иерархический стиль.

Хорошим завершением этой статьи был бы краткий список онлайн-ресурсов, но в данный момент у меня мало времени..."продолжение следует" ;-)

Правка на следующий день:(неудачная попытка предоставить вводную онлайн-библиографию по данному вопросу)

Мой поиск литературы по теме кластеризации применительно к искусственному зрению и обработке изображений выявил два отличных друг от друга...кластеры ;-)

  • Такие книги , как Алгоритмы обработки изображений и компьютерного зрения Джей Паркей, паб Уайли, или Машинное зрение :Теория, Алгоритмы, Практические аспекты M Seul et.Эл ПОДНЯЛСЯ.Такие книги обычно охватывают все важные методы, связанные с шумоподавлением, определением границ, преобразованием цвета или интенсивности и многими другими элементами цепочки обработки изображений, большинство из которых не связаны с кластеризацией или даже статистическими методами, и они посвящают кластеризации лишь одну-две главы или даже незначительные упоминания применительно к распознаванию образов или другим задачам.
  • Научные статьи и руководства для конференций, в которых конкретно рассматриваются методы кластеризации, применяемые к искусственному зрению и тому подобному, но в самом узком и глубоком виде (например:Варианты алгоритма Фукунаги и Нарендры для приложений распознавания символов или быстрые методы для выбора ближайших соседей-кандидатов в любом контексте.)

Короче говоря, я чувствую себя не в состоянии предложить какую-либо конкретную книгу или статью.

Возможно, вам покажется информативным просматривать заголовки, скажем, в Google Books, используя "Искусственное зрение", "Распознавание изображений" или некоторые из названий, упомянутых выше.Благодаря функции предварительного просмотра, а также облаку тегов (кстати, еще одному приложению кластеризации), которое можно найти по ссылке "об этой книге", можно получить хорошее представление о содержимом различных книг и, возможно, решить приобрести некоторые из них.К сожалению, ограниченная читательская аудитория и потенциально прибыльные приложения в данной области делают эти книги относительно дорогими.На другом конце спектра вы можете скачать, иногда бесплатно, исследовательские работы, в которых обсуждаются передовые темы в данной области.Они также будут отображаться в обычном (веб-) Google или в специализированных репозиториях, таких как Ситесер.

Удачи вам в ваших исследованиях в этой области!

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top