문제

나는 Python의 좋은 라이브러리를 찾고있는 RSS 피드를 구문 분석하는 데 도움이 될 것입니다. FeedParser를 사용한 사람이 있습니까? 아무 피드백?

도움이 되었습니까?

해결책

사용 FeedParser Minidom 또는 BeautifulSoup으로 자신을 굴리는 것보다 훨씬 더 나은 선택입니다.

  • RSS와 Atom의 모든 버전의 차이를 정규화하므로 각 유형에 대해 다른 코드가 필요하지 않습니다.
  • 피드의 다른 날짜 형식 및 기타 변형을 감지하는 것이 좋습니다.
  • 자동으로 HTTP 리디렉션을 따릅니다.
  • HTML 컨텐츠를 소독합니다.
  • ETAG 및 마지막으로 변형 된 헤더를 지원하므로 전체 피드가 아닌 HTTP 헤더를 다운로드하여 피드가 변경되었는지 확인할 수 있습니다.
  • 인증 된 피드를 지원합니다.
  • HTTP 프록시를 지원합니다.

다른 사람들이 언급 한 것처럼 시도해보십시오. 피드를 구문 분석하는 것은 2 줄의 코드와 같습니다. 내 유일한 불만은 사전을 데이터 모델로 사용하고 일부 속성이 피드에 있지 않은 경우 사전에서 누락 될 수 있다는 것입니다. 따라서 코드에서이를 확인해야합니다. 그러나 문서는 어떤 속성이 항상 사전에 있고 누락 될 수 있는지에 대해 매우 명확합니다.

마지막으로, 나는 그것을 사용하는 응용 프로그램을 작성했기 때문에 그것을 보증 할 수 있습니다. 여기를 봐: http://www.feednotifier.com/

다른 팁

FeedParser는 매우 강력하고 구성 가능하며 사용하기 쉽습니다. 매우 친절한 학습 곡선.

예시

질문이 얼마나 많은지에 대한 답변을 프로그램적으로 결정하십시오.

easy_install feedparser
python -c 'import feedparser; print len(feedparser.parse("http://bit.ly/c785aj")["entries"])'

대안을 원한다면 xml.dom.minidom을 사용해보십시오. "django is python", "rss is xml"처럼.

나는 이것이 아주 오래된 주제라는 것을 알고 있지만, 그 가치가있는 것에 대해 FeedParser (Universal Feed Parser) 버전 5.1.3을 사용하고 있었고 최근에 나는 스피드 스파르 (0.1.8) 성능상의 이유로. 그것은 거의 같은 인터페이스를 가지고 있지만 더 빨리 실행됩니다.

나는 아마추어를 위해 그것을 사용하고 있습니다 안드로이드의 파이썬 애플리케이션 및 Speedparser는 피드에서 약 5 배 빠르게 실행됩니다.

후속 조치에 대한 답변. BeautifulSoup을 사용할 수 있습니다. 그러나 FeedParser는 RSS 건조기를 향해 훨씬 더 잘 사용됩니다.

으르렁 거리는 소리는 아니지만 FeedParsers를 읽었습니다 선적 서류 비치? 사용하기가 더 간단 할 수있는 방법을 모르겠습니다.

2019 년 현재 atoma 가능한 대안입니다 feedparser, 나는 그것을 사용하지 않았지만.

FeedParser를 강력히 추천합니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top