Domanda

Sto cercando di costruire qualcosa di simile a Facebook "Condividi" di funzionalità per il mio sito web.

Ho ottenuto al punto in cui posso accettare un URL, raschiare per meta keywords e opportunamente ottenere i titoli/descrizioni, ma io sono un po ' bloccato come il modo migliore per determinare la probabilità foto l'utente desidera condividere.

Io attualmente uso il SimpleXMLElement di voltare pagina in un attraversabile DOM, e trovare tutti i tag, trasformandoli in assoluto Url.Dopo di che, io non sono sicuro di come posso fare per trovare un adatto miniatura.

Devo scaricare tutti loro, e la dimensione del file?Posso utilizzare una sorta di euristica come, "è stato rilevato nel mezzo della pagina"?

Qualcun altro ha le raccomandazioni, suggerimenti o consigli?

È stato utile?

Soluzione

Ho scritto qualcosa di simile un po ' di tempo fa per ottenere immagini da raschiato i post del blog.I miei criteri per la scelta di un'immagine era qualcosa lungo le linee di ottenere un elenco di tutte le immagini sulla pagina, l'assegnazione di priorità di punti:

  • Ignorare le immagini ospitato da una blacklist preso da AdBlocker elenco
  • Ignorare indiretta immagini, ad esempio, collegato a fogli di stile o in un IFRAME
  • Ignorare le immagini al di sotto del 50 pixel di larghezza o di alta
  • Ignorare le immagini che si ripetono più di una volta
  • Assegnare punti prioritari per immagini ospitato da un elenco di host (ad esempio photobucket, imageshack.noi)
  • Assegnare punti prioritari per il più grande 3 immagini sulla pagina
  • Assegnare punti prioritari per immagini sullo stesso host
  • Assegnare punti prioritari per le immagini con i tag ALT definito
  • Assegnare punti prioritari per le immagini che appaiono in un tag P

Quindi, scegliere quello con più punti prioritari.Certo non era infallibile o troppo scientifico, ma ha qualcosa di utile molto più spesso di quanto non.

Altri suggerimenti

Non ho alcuna esperienza diretta in questo modo non sono sicuro che non vi è alcuna specifica best practice, ma in generale penso che un approccio euristico guardando diversi fattori avrebbe senso a causa della variabilità trovato nel sito implementazioni.

Vorrei guardare i due insiemi di elementi:le proprietà dell'immagine e il contesto di dove/come le immagini vengono spostate.

Le Proprietà Dell'Immagine:

  • La larghezza e l'altezza di soddisfare le soglie minime
  • Il rapporto di aspetto è ragionevole (le immagini di sfondo che la piastrella è estremamente proporzioni, che fornisce una buona indicazione che l'immagine potrebbe non essere adatto)
  • Più di un colore esiste in immagine (che è più difficile da rilevare, ma può evitare di immagini di sfondo diverse)

Contesto Dell'Immagine:

  • Immagine non ripetere nella pagina (questo evita l'utilizzo di icone e altri elementi di design che possono ripetere)
  • Si verifica dopo h1, h2, ecc tag sulla pagina;questo si ottiene per il vostro punto circa le immagini provenienti dalla parte centrale della pagina, di nuovo, evitando elementi di design.
  • Ha un tag alt (anche se questo non è sempre utilizzato, quindi, forse, non fornisce molte informazioni utili)

Vorrei assegna pesi agli elementi precedenti e quindi classificare le immagini in base al modo in cui ogni immagine soddisfa le regole.

Si noti, inoltre, che alcune pagine potrebbero utilizzare i CSS (o Flash, ecc) per la visualizzazione di immagini.Questi nostri al di fuori della vostra sfera di competenza delle immagini (secondo l'algoritmo è definito);forse non un grande affare, ma è qualcosa da prendere in considerazione.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top