모든 Ctrl+Alt+Del WebComics를 다운로드하기위한 Python 스크립트? [닫은

StackOverflow https://stackoverflow.com/questions/1183111

  •  19-09-2019
  •  | 
  •  

문제

누구도 하나있어? Ive는 Comicdownloader를 시도했지만 최신 만화를 다운로드 할 수 있으며 모든 만화를 다운로드하기 위해 그것을 변경하는 방법을 알아낼 수있을만큼 Python을 잘 이해하지 못합니다.

도움이 되었습니까?

해결책

글쎄, 그것은 파이썬이 아니며 방법은 매우 우아하지는 않지만 작동합니다.

간단한 검사 후 Ctrl+Alt+DEL 아카이브 사이트 모든 만화는 / 만화 / JPG 파일에 저장되어 있음을 알았습니다.

그 가정을 통해 *닉스 머신의 쉘에서 다음 명령을 실행하면 모든 만화를 다운로드합니다. 파일 이름은 분명히 yyyymmdd 형식으로 날짜입니다.

$ for filename in $(seq 20020101 20090726); do wget http://www.ctrlaltdel-online.com/comics/"$filename".jpg; done

아, 그리고 시간이 걸릴 수 있습니다 :).

다른 팁

글쎄, 몇 가지 접근법이 있습니다. 만화 이미지 자체의 URL을보고 패턴을 따르는지 확인하고, 작은 스크립트를 작성하여 패턴과 일치하는 URL을 생성하고, 단순히 wget 또는 유사한 것을 사용하여 다운로드 할 수 있습니다. 필수 파이썬을 배우려면 추천합니다 파이썬 튜토리얼. 구체적으로 문자열, 문자열 서식, 문자열 작업을 결합하는 방법을 살펴보면 구성 요소 문자열, 숫자 등에서 URL을 빌드 할 수 있습니다. 이런 종류의 프로젝트는 Python을 배우는 좋은 변명 일 수 있으며, 이는 앞으로 다른 것들에 도움이 될 것입니다. (그리고 재미있다!)

또는 사람들이 이전에 이것을 해냈다 고 생각합니다. 이미지의 URL 또는 URL 패턴을 감안할 때 원하는 것을하는 앱이 거의 확실합니다. 주위를 살펴 보자.

당신은 만화의 저자에게 편지를 쓰고 그들이 어떻게 든, 아마도 책으로 구매할 수 있는지 대량으로 구매할 수 있는지 물어볼 수 있습니다. CTRL-ALT-DEL은 전체 아카이브를 다운로드하는 추가로드를 단순히 흡수 할만 큼 인기가 있다고 생각하지만 작은 웹 사이트는 감사하지 않을 수도 있습니다.

귀하의 질문에 관해서는,이 사이트는 프로그래밍 질문에 도움이되고, 문제를 해결하고, 길을 따라 가면서 도움을주십시오. 그러나 대부분 사람들이 코드를 작성하도록 요청하면 사람들이 감사하지 않습니다. 파이썬을 배우고 직접 시도해보십시오. 문제가 발생하면 물어보십시오.

수정 된 사용자 에이전트 (Timmy가 원본을 차단 한 이후)와 BeautifulSoup과 함께 Urllib을 사용합니다. 어쨌든, 그녀는 날짜 생성기입니다.

t1 = datetime.date(2002, 10, 22)
t2 = datetime.date.today()
while t2 > t1:
    t1 = t1 + datetime.date.resolution
    toon = t1.strftime("%Y%m%d")
    url1 = str(toon)
    main(url1)

그리고 나의 main () : 이렇게 보인다 ( "파일이 있는지 확인했다"는 부분을 파악했다)

def main(url):
    con = httplib.HTTPConnection("www.cad-comic.com")
    con.request("GET", "/cad/" + url)
    r1 = con.getresponse()
    soup = BeautifulSoup(r1)
    img = soup.findAll("img")[1]
    nImg = str(img)
    imgSplit = re.split('"', nImg)
    imgUrl = imgSplit[1]
    if imgUrl.startswith('http://www.cad-comic.com/comics/'):
        MeOpans().retrieve(imgUrl, url + ".jpg")
        print "Downloaded " + url

"meopans ()"은 다음과 같습니다.

class MeOpans(urllib.URLopener):
    version = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11'
라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top