質問

私が使っているのは、 mechanize Python からいくつかの Web クエリを実行するモジュール。プログラムがエラーに強く、あらゆる種類のエラー (間違った URL、403/404 応答) を適切に処理できるようにしたいと考えています。ただし、me​​chanize のドキュメントには、さまざまなエラーに対してスローされるエラー/例外が見つかりません。

私はそれを次のように呼び出すだけです:

    self.browser = mechanize.Browser()
    self.browser.addheaders = [('User-agent', browser_header)]

    self.browser.open(query_url)
    self.result_page = self.browser.response().read()

ここでどのようなエラー/例外がスローされるかを知り、それらを処理するにはどうすればよいですか?

役に立ちましたか?

解決

$ perl -0777 -ne'print qq($1) if /__all__ = \[(.*?)\]/s' __init__.py | grep Error 

'BrowserStateError',
'ContentTooShortError',
'FormNotFoundError',
'GopherError',
'HTTPDefaultErrorHandler',
'HTTPError',
'HTTPErrorProcessor',
'LinkNotFoundError',
'LoadError',
'ParseError',
'RobotExclusionError',
'URLError',

または:

>>> import mechanize
>>> filter(lambda s: "Error" in s, dir(mechanize))
['BrowserStateError', 'ContentTooShortError', 'FormNotFoundError', 'GopherError'
, 'HTTPDefaultErrorHandler', 'HTTPError', 'HTTPErrorProcessor', 'LinkNotFoundErr
or', 'LoadError', 'ParseError', 'RobotExclusionError', 'URLError']

他のヒント

これはかなり前に投稿されたものですが、まさにこの質問が Google の検索結果に表示されるため、質問に正しく答える必要があると思います。

これを書きながら機械化(バージョン Python 265 の = (0, 1, 11, None, None)) は urllib2.HTTPError を発生させるため、この例外をキャッチすることで http ステータスを取得できます。例:

import urllib2
try:
...  br.open("http://www.example.org/invalid-page")
... except urllib2.HTTPError, e:
...  print e.code
... 
404

彼らのドキュメントでこれを見つけました。

最後に注意すべきことの1つは、次のことを除いて、いくつかのキャッチオールベアがあるということです。モジュールのステートメント。プログラムをクラッシュせずに予期しない悪い入力を処理するためにあります。これが発生した場合、それは機械化のバグなので、警告テキストをメールで郵送してください。

したがって、例外は発生しないと思います。ソース コードで例外サブクラスを検索し、それらがどのように使用されているかを確認することもできます。

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top