Путаница в отношении распознавания объектов и функций с использованием серфинга

StackOverflow https://stackoverflow.com/questions/19851134

Вопрос

У меня есть некоторые концептуальные проблемы в понимании серфинга и алгоритма SIFT Все о серфингах. Анкет Насколько я понимаю, Surf считает, что Лапласиан Гаусса и SIFT действует на разнице гаусса. Затем он строит вокруг него вектор 64-переменной, чтобы извлечь функции. Я применил это КОД.

(Q1) Итак, что формирует функции?

(Q2) Мы инициализируем алгоритм с использованием детектора SurffeaturedEctor (500). Итак, это означает, что размер пространства функций составляет 500?

(Q3) Вывод Surf Good_Matches дает совпадения между клавишами1 и KeyPoint2, и путем настройки количества совпадений мы можем сделать вывод, что если объект был найден/обнаружен или нет. Что подразумевается под клавиатурами? Они хранят функции?

(Q4) Мне нужно сделать приложение распознавания объектов. В коде видно, что алгоритм может распознать книгу. Таким образом, это может быть применено для распознавания объектов. У меня было впечатление, что серфинг можно использовать для дифференциации объектов на основе цвета и формы. Но Surf and Sift обнаруживают обнаружение угловых краев, поэтому нет смысла использовать цветные изображения в качестве обучающих образцов, поскольку они будут преобразованы в серый шкалу. В этих алгоритмах нет возможности использовать цвета или ВПГ, если я не вычисляю клавиши для каждого канала отдельно, что является различной областью исследований (Оценка цветовых дескрипторов для распознавания объектов и сцены).

Итак, как я могу обнаружить и распознавать объекты на основе их цвета, формы? Я думаю, что я могу использовать Surf для дифференциации объектов на основе их формы. Скажите, например, у меня есть 2 книги и бутылка. Мне нужно распознать только одну книгу из всех объектов. Но, как только в сцене появляются и другие подобные объекты формы, Surf дает много ложных срабатываний. Я буду ценить предложения о том, какие методы подать заявку.

Это было полезно?

Решение

  1. Местные максимумы (ответ собаки, которая больше (меньше), чем ответы соседей пиксели вокруг точки, верхнего и любовника в районе пирамиды - 3x3x3) образуют координаты центра функции (круга). Радиус круга - это уровень пирамиды.

  2. Это гессский порог. Это означает, что вы возьмете только максимумы (см. 1) со значениями, большими, чем порог. Более высокий порог приводит к меньшему количеству функций, но стабильность функций лучше и виза.

  3. КЛОГОВАНА == Особенность. В OpenCV КЛЕГЕНЬ - это структура для хранения функций.

  4. Нет, серфинг хорош для сравнения текстурированных объектов, но не для формы и цвета. Для формы я рекомендую использовать MSER (но не OpenCV One), Canmy Edge Detector, а не локальные функции. Это презентация может быть полезен

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top