Frage

Also ich bin auf der Suche nach Ideen, wie die Funktionalität auf digg gesehen am besten replizieren. Im Wesentlichen Sie eine URL Ihrer Seite von Interesse vorlegen, digg dann ist Crawl der DOM alle der IMG-Tags zu finden (wahrscheinlich nur einige auswählen, die über einer bestimmte Höhe / Breite) sind und erstellt dann ein Miniaturbild von ihnen und bittet Dich, die Sie möchten, dass Ihre Vorlage vertreten.

Während es gibt viel los dort, ich interessiere mich hauptsächlich für die beste Methode der Bilder aus der eingereichten Seite abgerufen wird.

War es hilfreich?

Lösung

Während Sie könnten versuchen, die Web-Seite HTML analysieren kann so ein Durcheinander sein, dass Sie mit etwas am besten sein würde, schließen aber unvollkommen.

  1. Extrahieren Sie alles, was wie ein Bild-Tag Referenz aussieht.
  2. Versuchen Sie die URL
  3. holen
  4. Überprüfen Sie, ob Sie ein Bild bekam zurück

Nur auf der Suche nach und der Erfassung der Inhalt von src = „...“ würde Sie dort ankommen. Einige grundlegende Manipulation mit relativ vs. absolute Bildreferenzen zu behandeln und Sie sind da.

Natürlich, immer wenn Sie eine Web-Asset auf Nachfrage von einem Dritten holen Sie müssen darauf achten, Sie sind nicht missbraucht werden.

Andere Tipps

Ich schlage vor, cURL + regexp.

Sie können auch verwenden PHP Einfache HTML-DOM-Parser mit dem Sie alle Image-Tags suchen helfen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top