我想知道哪些编程语言提供相当数量的图书馆编程网络机器人? 类似的数据抓取网页。说我要为weather.yahoo.com网站获取天气。

另外将回答是相同一个AI桌面机器人?

有帮助吗?

解决方案

下面是你如何能做到这一点在Python:

from urllib2 import urlopen
from BeautifulSoup import BeautifulSoup
soup=BeautifulSoup(urlopen("http://weather.yahoo.com/").read())
for x in soup.find(attrs={"id":"myLocContainer"}).findAll("li"):
  print x.a["title"], x.em.contents

打印:

芝加哥,伊利诺斯州,美国(雾度)[u'35 ... 47°F']结果,全部的预测 伦敦,大伦敦,英格兰(小雨)u'43 ... 45°F']点击全预测 纽约,纽约州,美国(多云)u'42 ... 62°F']点击全预测 旧金山,加利福尼亚,美国(晴间多云)[u'51 ... 70°F']

全预测

其他提示

我不知道这是否是最佳,但的Python 的绝对是相当不错的,简单了点。

有关屏幕抓取和web爬行另一个好蟒库是 scrapy

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top