YQL刮整个网站/域名
-
20-09-2019 - |
题
我想花葶回了一组从一个域的链接和内容。
在查询在谷歌将是
"site:www.newswebsite.com search_term"
我已经看到了一些接近的东西来得到这个工作,但我似乎无法完全得到搜索横跨整个网站的工作,然后由检索词进行过滤。
这可能是一个没有定义数据表?
解决方案
我到的它到底底部。
select title,abstract,url,date from search.web(0) where query="search_term" and sites="www.website1.com,www.website2.com,www.website3.com" | sort (field='date') | reverse()
此搜索3个点,定单日期,和最新的第一个。还有就是要颠倒排序的另一种方法,但这似乎现在的工作。我认为这是降序=真排序内(字段=“日期”,降=“真”)
非常有用的,即使我不这样说我自己。
其他提示
基督教海尔曼只是写上YQL一个相当不错的书面记录和获取信息传回从HTML数据源上的 24ways网站。
不隶属于 StackOverflow