문제

PHP에서 HTML을 조작하는 좋은 방법을 찾고 있습니다.예를 들어, 제가 현재 가지고있는 문제는 잘못된 HTML을 다루는 것입니다.

다음과 같은 입력을 받고 있습니다. 라코 디스

알다시피 HTML에 닫는 태그가 없습니다.이 문제를 해결하기 위해 정규식 또는 XML 파서를 사용할 수 있습니다.그러나 앞으로 다른 DOM 조작을해야 할 것 같습니다.Javascript가 DOM 조작을 처리하는 방식과 유사한 DOM 조작을 처리하는 좋은 PHP 라이브러리가 있는지 궁금합니다.

도움이 되었습니까?

해결책

PHP에는 HTML Tidy의 기능에 액세스 할 수있는 PECL 확장 기능 이 있습니다.Tidy는 이와 같은 코드를 가져와 지능적으로 태그를 닫을 수있는 매우 강력한 라이브러리입니다.

가져 오기 전에 분류 된 광고 시스템에서 보낸 잘못된 XML 및 HTML을 정리하는 데 사용합니다.

다른 팁

PHP Simple HTML DOM이 지금까지 가장 유용하고 간단한 라이브러리라는 사실을 발견했습니다.PECL보다 낫습니다.

마이 스페이스 아티스트 투어 날짜를 스크랩하는 데 사용하는 방법 (예제) 다음은 php 간단한 html dom 파서

이제 내장 된 DOM 라이브러리는이 문제를 쉽게 해결할 수 있습니다.loadHTML 메소드는 잘못된 XML을 허용하지만로드 메소드는 허용하지 않습니다. 라코 디스

출력은 다음과 같습니다. 라코 디스

DOM을 조작하기 위해 찾고있는 것이 이것이라고 생각합니다..저는 웹에서 HTML 문서를 구문 분석하는 데 사용해 왔으며 잘 작동했습니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top