Question

Je suis en train de créer une application Web sur laquelle je dois obtenir toutes les images et toutes les vidéos Flash incorporées (par exemple, youtube) sur une URL donnée. J'utilise Python.

J'ai cherché sur Google, mais je n'ai trouvé aucune bonne information à ce sujet (probablement parce que je ne sais pas comment cela s'appelle chercher), est-ce que quelqu'un a une expérience de cela et sait comment faire? / p>

J'aimerais voir des exemples de code s'il en existe.

Merci!

Était-ce utile?

La solution

BeautifulSoup est une excellente bibliothèque de grattage d'écran. Utilisez urllib2 pour récupérer la page et BeautifulSoup pour l’analyser. Voici un exemple de code de leur documentation:

import urllib2
from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen("http://www.icc-ccs.org/prc/piracyreport.php")
soup = BeautifulSoup(page)
for incident in soup('td', width="90%"):
    where, linebreak, what = incident.contents[:3]
    print where.strip()
    print what.strip()
    print
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top