문제

이 질문은 이미 있는 대답을 여기:

I've been doing some HTML 긁는 PHP 에서 사용하는 정규표현식이 있습니다.이 작품은,그러나 결과는 까다롭고 깨지기 쉬운 것입니다.누군가는 사용된 모든 패키지를 제공하는 더 강력한 솔루션?성 기반 솔루션이 될 것이 이상적인,하지만 나는 까다 롭고 있습니다.

도움이 되었습니까?

해결책

PHP 간단한 HTML DOM 분석기 후에 당신은 긁어 HTML 페이지에서.그것을 지원하는 잘못된 HTML,제공하는 아주 쉬운 방법을 처리하 HTML 요소입니다.

다른 팁

만약 페이지를 긁는 것은 유효 X(HT)ML,다음 PHP 의 내장에서는 XML 파서 할 것입니다.

가 없었습니다 훨씬 성공 PHP 라이브러리를 긁.당신은 모험을 하지만,당신이 시도할 수 있는 simplehtmldom.내가 권하고 싶 Hpricot 루비나 아름다운 수프 파이썬은 모두 파서를 위한 HTML.

또한 것을 권장'간단한 HTML DOM Parser.' 그것은 좋은 옵션은 특히 귀하의 익숙 jQuery JavaScript 선택기 당신은 자신 집에서 찾을 수 있습니다.

난 그것에 대해 블로그에서이다.

나는 몇 가지 재미있는 작업 htmlSQL, 하지 않은,그래서 많이 높은 솔루션이지만,정말 간단합니다.

PHP 를 사용하여 HTML 긁는 것이 좋습 컬+regexp 또는 컬+일부 DOM 파서 비록 나 개인적으로 사용하는 컬+regexp.는 경우에 당신은 깊은 맛의 정규 표현식,그것이 실제로 더 많은 정확한 때때로.

나는 아주 좋은 결과로 간단한 Html DOM 분석기 위에서 언급한뿐만 아니라.그리고 거기 깔끔한 확장자를 위한 PHP 뿐만 아니라 실제로 너무 잘 작동한다.

를 사용했다는 컬 내 호스트에서 1and1.

http://www.quickscrape.com/ 가와 함께 사용하여 간단한 돔 클래스!

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top