Domanda

Ho alcune questioni concettuali nella comprensione dell'algoritmo di surf e setaccio Tutto sul surf. Per quanto riguarda la mia comprensione, il surf trova Laplacian di Gaussiani e SIFT opera sulla differenza di gaussiani. Costruisce quindi un vettore variabile 64 attorno a esso per estrarre le caratteristiche. Ho applicato questo CODICE.

(Q1) Allora, quali forma le caratteristiche?

(Q2) Inizializziamo l'algoritmo utilizzando SurffEatureDector Detector (500). Quindi, questo significa che la dimensione dello spazio delle caratteristiche è 500?

(Q3) L'output di Surf Good_Matches fornisce corrispondenze tra KeyPoint1 e KeyPoint2 e sintonizzando il numero di corrispondenze, possiamo concludere che se l'oggetto è stato trovato/rilevato o meno. Cosa si intende per Keypoints? Questi archiviano le funzionalità?

(Q4) Devo fare l'applicazione di riconoscimento degli oggetti. Nel codice, sembra che l'algoritmo possa riconoscere il libro. Quindi, può essere applicato per il riconoscimento degli oggetti. Avevo l'impressione che il surf potesse essere usato per differenziare gli oggetti in base al colore e alla forma. Ma Surf e SIFT trovano il rilevamento del bordo angolo, quindi non ha senso usare immagini a colori come campioni di addestramento poiché saranno convertiti in scala di grigi. Non esiste alcuna possibilità di utilizzare colori o HSV in questi algoritmi, a meno che non calcola i punti di tastiera per ciascun canale separatamente, che è un'area di ricerca diversa (Valutazione dei descrittori di colori per il riconoscimento di oggetti e scene).

Quindi, come posso rilevare e riconoscere gli oggetti in base al loro colore, forma? Penso di poter usare il surf per differenziare oggetti in base alla loro forma. Dì, per esempio ho 2 libri e una bottiglia. Devo riconoscere solo un singolo libro su tutti gli oggetti. Ma, non appena ci sono altri oggetti di forma simile nella scena, Surf dà molti falsi positivi. Apprezzerò i suggerimenti su quali metodi richiedere per la mia applicazione.

È stato utile?

Soluzione

  1. I massimi locali (risposta del cane che è maggiore (più piccolo) delle risposte dei pixel vicini attorno al punto, all'immagine superiore e amante nella piramide - 3x3x3 quartiere) costituiscono le coordinate del centro caratteristico (cerchio). Il raggio del cerchio è il livello della piramide.

  2. È la soglia dell'Assia. Significa che prenderesti solo i massimi (vedi 1) con valori più grandi della soglia. La soglia maggiore porta al minor numero di funzionalità, ma la stabilità delle funzionalità è migliore e Visa Versa.

  3. Funzione KeyPoint ==. In OpenCv KeyPoint è la struttura per archiviare le funzionalità.

  4. No, il surf è buono per il confronto tra gli oggetti strutturati ma non per la forma e il colore. Per la forma che consiglio di utilizzare MSER (ma non OpenCv One), Canny Edge Detector, non caratteristiche locali. Questa presentazione potrebbe essere utile

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top