有谁知道是否有可供雅虎允许搜索结果限制所以只能指向特定类型的文件编程搜索一些参数将返回(如PDF例如)? 这是可以做到的,在GUI,但如何做到这一点通过API?

我很欣赏Python中的示例代码,但任何其他的解决方案可能是有帮助。

有帮助吗?

解决方案 2

感谢您。 我发现自己是这样的工作确定(文件类型是第一个参数,和查询是第二个):

格式= sys.argv中[1]

查询= “”。加入(sys.argv中[2:])

SRCH = create_search( “网络”,APP_ID,查询=查询,格式=格式)

其他提示

下面是我为这种事做。它暴露了更多的参数,以便您可以将其调整到您的需要。这应该打印出从查询“简历”的前十页PDF文件的URL [我的不是他们中的一个;)。只要你喜欢,你可以下载这些URL。

这会从该查询返回的JSON字典是有点毛,但是这应该让你开始。要知道,在真正的代码,你将需要检查一些在字典中的键是否存在。如果没有结果,这段代码可能会抛出异常。

这蒂亚戈提供的链接是良好的知道什么值都为“类型”参数的支持。

from yos.crawl import rest
APPID="XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
base_url = "http://boss.yahooapis.com/ysearch/%s/v%d/%s?start=%d&count=%d&type=%s" + "&appid=" + APPID
querystr="resume"
start=0
count=10
type="pdf"
search_url = base_url % ("web", 1, querystr, start, count, type)
json_result = rest.load_json(search_url)
for url in [recs['url'] for recs in json_result['ysearchresponse']['resultset_web']]:
    print url
许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top