문제

그래서 나는 digg에서 볼 수 있는 기능을 가장 잘 복제하는 방법에 대한 아이디어를 찾고 있습니다.기본적으로 관심 있는 페이지의 URL을 제출하고 DOM을 크롤링하여 모든 IMG 태그를 찾은 다음(아마도 특정 높이/너비보다 높은 몇 개만 선택) 해당 태그에서 썸네일을 만들고 어떤 것이 무엇인지 묻습니다. 당신은 당신의 제출물을 대표하고 싶습니다.

많은 일이 벌어지고 있는 동안 저는 주로 제출된 페이지에서 이미지를 검색하는 가장 좋은 방법에 관심이 있습니다.

도움이 되었습니까?

해결책

웹 페이지 HTML을 구문 분석하려고 시도할 수는 있지만 완벽하지는 않지만 가까운 것을 사용하는 것이 가장 좋을 정도로 엉망이 될 수 있습니다.

  1. 이미지 태그 참조처럼 보이는 모든 것을 추출합니다.
  2. URL을 가져오세요
  3. 이미지가 다시 돌아왔는지 확인하세요

src="..."의 내용을 찾아 캡처하면 해당 위치에 도달할 수 있습니다.상대 대 상대를 처리하기 위한 몇 가지 기본 조작절대적인 이미지 참조가 있으면 거기에 있습니다.

분명히 제3자로부터 요청에 따라 웹 자산을 가져올 때마다 남용되지 않도록 주의해야 합니다.

다른 팁

나는 cURL + regexp를 제안합니다.

당신은 또한 사용할 수 있습니다 PHP 단순 HTML DOM 파서 그러면 모든 이미지 태그를 검색하는 데 도움이 됩니다.

라이센스 : CC-BY-SA ~와 함께 속성
제휴하지 않습니다 StackOverflow
scroll top