Wie ein ungefähren Lösungsalgorithmus entwerfen

https://stackoverflow.com/questions/624788

05-07-2019
|

Frage

Ich möchte einen Algorithmus schreiben, die sie Teile eines Bildes und passen auf ein anderes Bild des gleichen Objekts erfolgen kann.

Zum Beispiel, wenn ich den Computer ein Bild von einer Vase und ein Bild einer Szene mit der Vase in ihm gab, würde ich erwarten, dass es zu bestimmen, wo im Bild die Vase ist. Wie würde ich beginnen, einen Algorithmus wie das?

zu entwickeln

Die endgültige Verwendung für diesen Algorithmus wird eine Anwendung sein, die zum Beispiel mit einem Bild von Gesicht könnte jemand sagen, wenn sie in einer Menge von Menschen sind. Dieser Algorithmus würde schließlich auf Videoströme angewendet werden.

Bearbeiten Ich bin nicht eine tatsächliche Lösung für dieses Problem erwarten, wie ich hoffe, dass es nicht in absehbarer Zeit zu lösen. Die eigentliche Frage war, wie man so etwas zu einem Computer definieren Sie, so dass Sie einen Algorithmus, es zu tun machen könnten.

Danke

Lösung

Das erste Problem, das Sie beschreiben, und der zweite ist beide ganz anders.

Ein wesentlicher Teil jeder wird durch die zahlreiche Machine-Vision-Bibliotheken zur Verfügung. Sie können eine Kombination von Techniken benötigen keinen Erfolg bei jeder Aufgabe zu erreichen.

In der ersten, würden Sie brauchen etwas, das allgemein Objekte erkennt. Wahrscheinlich würde ich eine Reihe von Algorithmen gemeinsam verwenden, um das Vordergrundobjekt im Modellbild zu identifizieren und dann eine Art gewichteter Vergleichs des partitionierten Zielbildes zu tun.

Im zweiten Fall untersuchen Gesichter, ist ein viel schwierigeres Problem in Bezug auf die allgemeinen Erkennungs oben. Gesichter sehen alle gleich, oder fast so. Die Dinge, die eine allgemeine Erkennungs bemerken würde wahrscheinlich nicht zur Differenzierung Gesichter gut zu sein. Sie benötigen einen Algorithmus bereits auf Gesichtserkennung abgestimmt. Glücklicherweise ist dies ein schnell reifenden Feld und man kann wohl als ersten Fall dies auch tun, sondern mit einem anderen Satz von Funktionen.

Andere Tipps

Ein ehemaliger Lehrer von mir schrieb seine Doktorarbeit über eine ähnliche Art von Problem, außer seinem Eingang ein detailliertes 3D-Modell von etwas war, das er das Objekt zu finden, in 2D-Bildern verwenden würde. Dies ist ein sehr nicht-triviales Problem, gibt es keine einzige ‚Antwort‘, schon gar nichts, was das Stack-Überlauf-Format passen würde.

Meine beste Antwort: eine Menge Geld sammeln und einen sehr erfahrenen Programmierer mieten

Viel Glück für Sie.

Die einfache Antwort ist, einen mathematischen Weg finden, Gesichter zu beschreiben, die für Winkel und teilweise fehlende Daten erklären können, dann verfeinern und lehren es.

Offenbar hat Apple etwas getan, aber es macht immer noch Fehler und hat gelehrt werden, wie es nach vorne bewegt.

Ich erwarte, dass es mehr über die Mathematik sein, als über die Programmierung.

Ich glaube, Sie dies eine ziemliche Herausforderung sein wird zu finden. Dies ist ein äußerst schwieriges Problem und ist eine der vielen Bereichen der Informatik, die unter dem Bereich der künstlichen Intelligenz (KI) fallen. Gesichtserkennung sicherlich die beliebteste Variante dieses Problems wäre, und trotz allem, was man in den Medien lesen kann, der behauptete Erfolg ist nicht das, was sie gemacht werden, zu sein. Ich denke, die nächsten Lösungen neuronale Netze einzubinden und sie erfordern sehr klar und sorgfältig Bilder in der Regel ausgewählt.

Sie könnten versuchen, das Lesen hier though. Viel Glück!

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow