YQL 전체 웹 사이트/도메인을 긁어냅니다
-
20-09-2019 - |
문제
나는 도메인에서 일련의 링크와 컨텐츠 세트를 물러나려고 노력하고 있습니다.
Google의 쿼리가 될 것입니다
"site:www.newswebsite.com search_term"
나는 이것을 작동시키는 데 가까운 것을 보았지만 전체 웹 사이트에서 검색을 수행 한 다음 검색어로 필터링 할 수는 없습니다.
사용자 정의 데이터 테이블없이 가능합니까?
해결책
나는 결국 그 바닥에 도착했다.
select title,abstract,url,date from search.web(0) where query="search_term" and sites="www.website1.com,www.website2.com,www.website3.com" | sort (field='date') | reverse()
이것은 3 개의 사이트, 날짜 별 주문 및 최신 첫 번째 사이트를 검색합니다. 정렬을 뒤집는 대체 방법이 있지만 지금은 효과가있는 것 같습니다. 내림차순이라고 생각합니다 = 정렬 내에서 true (field = 'date', 내림차순 = 'true')
내가 그렇게 말하더라도 매우 유용합니다.
다른 팁
Christian Heilmann은 방금 YQL에 대해 상당히 멋진 글을 썼고 HTML 데이터 소스에서 정보를 얻었습니다. 24Way 웹 사이트.
제휴하지 않습니다 StackOverflow