문제

나는 파이썬의 아름다운 수프 스크래핑 라이브러리를 좋아합니다. 그것은 단지 작동합니다. 루비에 가까운 곳이 있습니까?

도움이 되었습니까?

해결책

이 페이지에서 루비 도구 상자 다양한 파서의 상대적인 인기에 대한 차트가 포함되어 있습니다.

다른 팁

노코 시리 또 다른 HTML/XML 파서입니다. 에 따르면 HPRICOT보다 빠릅니다 이러한 벤치 마크. Nokogiri는 libxml2를 사용하며 HPRICOT를 대체하는 것이 줄어 듭니다. 또한 CSS3 선택기 지원이있어 꽤 좋습니다.

편집 : Nokogiri, Libxml-Ruby, HPricot 및 Rexml을 비교하는 새로운 벤치 마크가 있습니다. 여기.

루비 도구 상자 HTML 파서에 카테고리가 있습니다 여기.

거기 있습니다 Scrubyt!, 루비 풀-쿠스 (더 이상 유지되지 않음),www :: 기계화, scrapi 그리고 몇 가지 더.

또는 hpricot 만 사용할 수 있습니다 노코 시리 구문 분석을 위해.

HPRICOT? 다른 사람들이 무엇을 사용하고 있는지 모르겠습니다 ...

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top