Как разработать приближенный алгоритм решения

StackOverflow https://stackoverflow.com/questions/624788

Вопрос

Я хочу написать алгоритм, который может брать части изображения и сопоставлять их с другим изображением того же объекта.

Например, если бы я дал компьютеру изображение вазы и картинку сцены с вазой в ней, я бы ожидал, что он определит, где на изображении находится ваза.Как бы я начал разрабатывать подобный алгоритм?

Конечным применением этого алгоритма будет приложение, которое, например, по изображению чьего-либо лица могло бы определить, находится ли он в толпе людей.Этот алгоритм в конечном итоге будет применен к видеопотокам.

Редактировать: Я не ожидаю реального решения этой проблемы, поскольку не надеюсь решить ее в ближайшее время.Реальный вопрос заключался в том, как вы определяете что-то подобное компьютеру, чтобы вы могли создать алгоритм для этого.

Спасибо

Это было полезно?

Решение

Первая проблема, которую вы описываете, и вторая - обе совершенно разные.

Большая часть каждого из них решается с помощью многочисленные доступны библиотеки машинного зрения.Возможно, вам понадобится комбинация техник для достижения любого успеха в выполнении любой задачи.

В первом случае вам понадобится что-то, что в общих чертах распознает объекты.Вероятно, я бы использовал несколько алгоритмов совместно, чтобы идентифицировать объект переднего плана на изображении модели, а затем выполнить какое-то взвешенное сравнение разделенного целевого изображения.

Во втором случае изучение лиц является гораздо более сложной задачей по сравнению с описанным выше общим распознавателем.Лица у всех одинаковые, или почти одинаковые.То, что заметил бы обычный распознаватель, вряд ли пригодится для различения лиц.Вам нужен алгоритм, уже настроенный на распознавание лиц.К счастью, это быстро развивающаяся область, и вы, вероятно, сможете сделать это так же хорошо, как и в первом случае, но с другим набором функций.

Другие советы

Мой бывший учитель написал докторскую диссертацию по аналогичной проблеме, за исключением того, что его вкладом была подробная 3D-модель чего-либо, которую он использовал для поиска этого объекта на 2D-изображениях.Это ОЧЕНЬ нетривиальная проблема, нет единого "ответа", и уж точно ничего такого, что соответствовало бы формату Stack Overflow.

Мой лучший ответ:соберите кучу денег и наймите очень опытного программиста.

Желаю вам удачи.

Простой ответ заключается в том, чтобы найти математический способ описания граней, который может учитывать углы и частично отсутствующие данные, затем усовершенствовать и обучить этому.

По-видимому, Apple уже делала что-то подобное, однако она все еще допускает ошибки, и ее приходится учить по мере продвижения вперед.

Я ожидаю, что это будет больше связано с математикой, чем с программированием.

Я думаю, вы обнаружите, что это довольно сложная задача.Это чрезвычайно сложная проблема и является одной из многих областей вычислительной техники, которые относятся к области искусственного интеллекта (ИИ).Распознавание лиц, безусловно, было бы самым популярным вариантом решения этой проблемы, и, несмотря на то, что вы можете прочитать в средствах массовой информации, любые заявленные успехи не являются тем, за что их выдают.Я думаю, что наиболее близкие решения связаны с нейронными сетями, и обычно они требуют очень четких и тщательно подобранных изображений.

Вы могли бы попробовать почитать здесь хотя.Удачи!

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top