Библиотека Python Yahoo BOSS, ExpatError
-
07-07-2019 - |
Вопрос
Я попытался установить Yahoo BOSS mashup framework, но у меня возникли проблемы с запуском приведенных примеров.Примеры 1, 2, 5 и 6 работают, но 3 и 4 приводят к ошибкам экспатов.Вот выходные данные из ex3.py:
gpython examples/ex3.py
examples/ex3.py:33: Warning: 'as' will become a reserved keyword in Python 2.6
Traceback (most recent call last):
File "examples/ex3.py", line 27, in <module>
digg = db.select(name="dg", udf=titlef, url="http://digg.com/rss_search?search=google+android&area=dig&type=both§ion=news")
File "/usr/lib/python2.5/site-packages/yos/yql/db.py", line 214, in select
tb = create(name, data=data, url=url, keep_standards_prefix=keep_standards_prefix)
File "/usr/lib/python2.5/site-packages/yos/yql/db.py", line 201, in create
return WebTable(name, d=rest.load(url), keep_standards_prefix=keep_standards_prefix)
File "/usr/lib/python2.5/site-packages/yos/crawl/rest.py", line 38, in load
return xml2dict.fromstring(dl)
File "/usr/lib/python2.5/site-packages/yos/crawl/xml2dict.py", line 41, in fromstring
t = ET.fromstring(s)
File "/usr/lib/python2.5/xml/etree/ElementTree.py", line 963, in XML
parser.feed(text)
File "/usr/lib/python2.5/xml/etree/ElementTree.py", line 1245, in feed
self._parser.Parse(data, 0)
xml.parsers.expat.ExpatError: syntax error: line 1, column 0
Похоже, что оба примера завершаются неудачей при попытке выполнить запрос Digg.com.Вот запрос, который строится в ex3.py's код:
diggf = lambda r: {"title": r["title"]["value"], "diggs": int(r["diggCount"]["value"])}
digg = db.select(name="dg", udf=diggf, url="http://digg.com/rss_search?search=google+android&area=dig&type=both§ion=news")
Решение
Проблема в поисковой строке digg. Это должно быть " s = " ;. Не " поиск = "
Другие советы
Я считаю, что это, должно быть, ошибка в примере:он получает результат в формате JSON (действительно, если вы скопируете и вставите этот URL-адрес в свой браузер, вы загрузите файл names search.json, который начинается с
{"results":[{"profile_image_url":
"http://a3.twimg.com/profile_images/255524395/KEN_OMALLEY_REVISED_normal.jpg",
"created_at":"Mon, 14 Sep 2009 14:52:07 +0000","from_user":"twilightlords",
т. е.совершенно нормальный JSON;но затем вместо того, чтобы анализировать его с помощью таких модулей, как json или simplejson, он пытается проанализировать его как XML - и, очевидно, эта попытка завершается неудачей.
Я полагаю, что исправление (которое, вероятно, необходимо довести до сведения тех, кто поддерживает этот код, чтобы они могли включить его) заключается либо в запросе XML вместо вывода JSON, ЛИБО в разборе результирующего JSON с помощью соответствующих средств вместо того, чтобы пытаться рассматривать его как XML (не уверен, как наилучшим образом реализовать любое изменение, поскольку я не знаком с этим кодом).