Domanda

Quindi sto cercando idee su come replicare meglio le funzionalità visto su digg. In sostanza, si invia un URL della pagina di interesse, digg poi strisciare il DOM per trovare tutti i tag IMG (probabilmente solo la selezione di un paio che sono al di sopra di una certa altezza / larghezza) e quindi crea una miniatura da loro e si chiede quale si desidera rappresentare la vostra presentazione.

Mentre c'è un sacco di cose lì, io sono principalmente interessati al metodo migliore per recuperare le immagini dalla pagina presentata.

È stato utile?

Soluzione

Mentre si potrebbe tentare di analizzare la pagina web HTML può essere un tale casino che si sarebbe meglio con qualcosa di simile, ma imperfetta.

  1. Estratto di tutto ciò che si presenta come un riferimento tag di immagine.
  2. Prova a prendere l'URL
  3. Controlla se hai un'immagine di nuovo

Solo in cerca di e catturare il contenuto di src = "..." sarebbe arrivare lì. Qualche manipolazione di base per affrontare con relativa vs. riferimenti immagine assoluta e siete arrivati.

Ovviamente in qualsiasi momento si recupera una risorsa web su richiesta da parte di terzi è necessario fare attenzione non si è abusato.

Altri suggerimenti

Suggerisco cURL + regexp.

È inoltre possibile utilizzare PHP Simple HTML DOM Parser che vi aiuterà a cercare tutti i tag di immagine.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top