Question

Je suis à la recherche d'idées sur la façon de reproduire au mieux la fonctionnalité vu sur digg. Essentiellement, vous soumettez une URL de votre page d'intérêt, digg alors crawl est le DOM pour trouver toutes les balises IMG (probablement seulement sélectionner quelques-unes qui sont au-dessus d'une certaine hauteur / largeur) et crée ensuite une miniature d'eux et vous demande qui vous souhaitez représenter votre soumission.

Alors il y a beaucoup de choses là-bas, je suis principalement intéressé la meilleure méthode pour récupérer les images de la page présentée.

Était-ce utile?

La solution

Alors que vous pouvez essayer d'analyser la page Web HTML peut être un tel gâchis que vous seriez mieux avec quelque chose de proche, mais imparfait.

  1. Extrait tout ce qui ressemble à une référence de balise image.
  2. Essayez de chercher l'URL
  3. Vérifiez si vous avez une image de retour

Il suffit de regarder et capturer le contenu src = « ... » Voulez-vous y arriver. Certaines manipulations de base pour traiter avec des références d'image absolue par rapport vs et vous y êtes.

Il est évident que chaque fois que vous allez chercher un atout Web à la demande d'un tiers, vous devez prendre soin que vous n'êtes pas victime de mauvais traitements.

Autres conseils

Je suggère cURL + regexp.

Vous pouvez également utiliser PHP simple HTML DOM Parser qui vous aidera à rechercher toutes les balises d'image.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top