script python pour télécharger toutes les touches Ctrl + Alt + Del webcomics? [fermé]

StackOverflow https://stackoverflow.com/questions/1183111

  •  19-09-2019
  •  | 
  •  

Question

Quelqu'un at-il un? Ive a essayé Comicdownloader mais qui ne me permet de télécharger la nouvelle bande dessinée et je ne comprends pas assez bien Python pour savoir comment le changer pour télécharger toutes les bandes dessinées

Était-ce utile?

La solution

Eh bien, il est python pas et la méthode ne soit très élégant, mais ça va marcher.

Après une brève inspection de la ctrl + alt + suppr site d'archive Je trouve que toutes les bandes dessinées sont stockées dans / BD / sous forme de fichiers jpg.

Avec cette hypothèse, exécutez la commande suivante dans un shell sur une machine * nix téléchargera toutes les bandes dessinées. Les noms sont évidemment les dates dans le format AAAAMMJJ.

$ for filename in $(seq 20020101 20090726); do wget http://www.ctrlaltdel-online.com/comics/"$filename".jpg; done

Oh, et il peut prendre un certain temps.)

Autres conseils

Eh bien, il existe plusieurs approches. Vous pouvez regarder les urls des images comiques elles-mêmes, pour voir si elles suivent un modèle, écrire un petit script pour générer des urls qui correspondent au modèle, et utilisent simplement wget ou quelque chose de similaire pour les télécharger. Pour en savoir le python nécessaire, je vous recommande le python tutoriel . Regardez en particulier la manière de combiner les chaînes, la mise en forme de chaîne, les opérations de chaîne, de sorte que vous pouvez construire vos URL à partir de chaînes composant, numéros, et ainsi de suite. Ce type de projet peut être une bonne excuse pour apprendre python, ce qui va probablement vous aider à d'autres choses à l'avenir. (Et est amusant!)

Sinon, je pense que les gens ont fait cela avant - il y a des applications qui ne tiennent presque certainement ce que vous voulez, compte tenu des urls des images, ou tout simplement le modèle de urls. Regarde autour de toi.

Vous pouvez écrire à l'auteur de la bande dessinée et demander si elles sont disponibles en vrac en quelque sorte, peut-être à l'achat, peut-être comme un livre. J'imagine ctrl-alt-del est assez populaire pour absorber simplement la charge supplémentaire de vous télécharger l'ensemble des archives, mais les sites plus petits pourraient ne pas apprécier ce - bien que je ne pense pas qu'ils peuvent vraiment vous arrêter ou quoi que ce soit

.

Quant à votre question, ce site devrait vous aider à répondre à vos questions de programmation, vous aider avec les problèmes que vous rencontrez, vous pousser du coude le long du chemin - mais la plupart des gens ne l'apprécient pas si vous leur demandez d'écrire simplement votre code pour vous. Apprenez quelques python, essayez vous-même, si vous rencontrez un problème, demandez alors.

J'utilise urllib avec un user-agent modifié (depuis Timmy bloqué l'original) et BeautifulSoup. Quoi qu'il en soit, voici le générateur de date:

t1 = datetime.date(2002, 10, 22)
t2 = datetime.date.today()
while t2 > t1:
    t1 = t1 + datetime.date.resolution
    toon = t1.strftime("%Y%m%d")
    url1 = str(toon)
    main(url1)

et ma main (): ressemble à ceci (a pris le « Vérifiez si le fichier existe » une partie arrière)

def main(url):
    con = httplib.HTTPConnection("www.cad-comic.com")
    con.request("GET", "/cad/" + url)
    r1 = con.getresponse()
    soup = BeautifulSoup(r1)
    img = soup.findAll("img")[1]
    nImg = str(img)
    imgSplit = re.split('"', nImg)
    imgUrl = imgSplit[1]
    if imgUrl.startswith('http://www.cad-comic.com/comics/'):
        MeOpans().retrieve(imgUrl, url + ".jpg")
        print "Downloaded " + url

"MeOpans ()" ressemble à ceci:

class MeOpans(urllib.URLopener):
    version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top