Python urllib2をリダイレクトしてpostメソッドに従うようにする方法
-
12-09-2019 - |
質問
urllib2 を使用してデータをフォームに投稿しています。問題は、フォームが 302 リダイレクトで応答することです。によると Python HTTPリダイレクトハンドラー リダイレクト ハンドラーはリクエストを受け取り、POST から GET に変換し、301 または 302 に従います。POSTメソッドとオープナーに渡されたデータを保存したいと考えています。新しいリクエストに data=req.get_data() を追加するだけで、カスタム HTTPRedirectHandler を実行しようとして失敗しました。
これは以前にも行われたと思うので、投稿しようと思いました。
注記:これは似ています この郵便受け そして これです しかし、リダイレクトを阻止したくはなく、POSTデータを保持したいだけです。
これが機能しない私のHTTPRedirectHandlerです
class MyHTTPRedirectHandler(urllib2.HTTPRedirectHandler):
def redirect_request(self, req, fp, code, msg, headers, newurl):
"""Return a Request or None in response to a redirect.
This is called by the http_error_30x methods when a
redirection response is received. If a redirection should
take place, return a new Request to allow http_error_30x to
perform the redirect. Otherwise, raise HTTPError if no-one
else should try to handle this url. Return None if you can't
but another Handler might.
"""
m = req.get_method()
if (code in (301, 302, 303, 307) and m in ("GET", "HEAD")
or code in (301, 302, 303) and m == "POST"):
# Strictly (according to RFC 2616), 301 or 302 in response
# to a POST MUST NOT cause a redirection without confirmation
# from the user (of urllib2, in this case). In practice,
# essentially all clients do redirect in this case, so we
# do the same.
# be conciliant with URIs containing a space
newurl = newurl.replace(' ', '%20')
return Request(newurl,
headers=req.headers,
data=req.get_data(),
origin_req_host=req.get_origin_req_host(),
unverifiable=True)
else:
raise HTTPError(req.get_full_url(), code, msg, headers, fp)
解決
これは考えれば考えるほど本当に悪いことです。たとえば、フォームを送信すると、http://example.com/add (アイテムを追加するための投稿データを使用)、応答は302リダイレクトです http://example.com/add 最初に投稿したのと同じデータを投稿すると、無限ループに陥ります。なぜこれまで思いつかなかったのかわかりません。これを考えている他の人への警告として、ここでの質問は残しておきます。
所属していません StackOverflow