URLは、繰り返されるリダイレクトが多すぎます
-
28-10-2019 - |
質問
私はURLをロードしようとしています、そして、私はこのエラーを取得します:
ダウンロードエラー:ApplicationError:2繰り返しリダイレクトが多すぎます
これは私が使用しているコードです。
headers = { 'User-Agent' : 'Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; de-at) AppleWebKit/533.21.1 (KHTML, like Gecko) Version/5.0.5 Safari/533.21.1' }
url = "http://www.cafebonappetit.com/menu/your-cafe/collins-cmc/cafes/details/50/collins-bistro"
cmcHTM = urlfetch.fetch(url=url)
cmcHTML = str(cmcHTM.content)
このウェブサイトのリダイレクトを次のように確認します。 http://www.internetofficer.com/seo-tool/redirect-check/そして、私はこのサイトがそれ自体にリダイレクトされていることを発見しました!したがって、URLフェッチは、このページをロードしようとして輪になっているようです。一方、このページは私のブラウザで正常にロードされます。
だから私はこのコードを使用しようとしました:
cmcHTM = urlfetch.fetch(url=url,
follow_redirects=False,
deadline=100
)
しかし、これは何も返されません。このHTMLを取得する方法はありますか?!
解決
応答が遅れてすみません。私はこれがうまくいったことを見つけました:
import urllib, urllib2, Cookie
from google.appengine.api import urlfetch
class URLOpener:
def __init__(self):
self.cookie = Cookie.SimpleCookie()
def open(self, url, data = None):
if data is None:
method = urlfetch.GET
else:
method = urlfetch.POST
while url is not None:
response = urlfetch.fetch(url=url,
payload=data,
method=method,
headers=self._getHeaders(self.cookie),
allow_truncated=False,
follow_redirects=False,
deadline=10
)
data = None # Next request will be a get, so no need to send the data again.
method = urlfetch.GET
self.cookie.load(response.headers.get('set-cookie', '')) # Load the cookies from the response
url = response.headers.get('location')
return response
def _getHeaders(self, cookie):
headers = {
'Host' : 'www.google.com',
'User-Agent' : 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.2) Gecko/20090729 Firefox/3.5.2 (.NET CLR 3.5.30729)',
'Cookie' : self._makeCookieHeader(cookie)
}
return headers
def _makeCookieHeader(self, cookie):
cookieHeader = ""
for value in cookie.values():
cookieHeader += "%s=%s; " % (value.key, value.value)
return cookieHeader
キーはwhileループだと思います - リターンヘッダーに基づいてリダイレクトに従ってください...
他のヒント
これはサイトの問題であり、コードでは問題ではないと思います。このサイトは、ブラウザによって慣習的に送信されるヘッダーを検出しない場合、それ自体にリダイレクトを行うように設計されているようです。たとえば、カールでアクセスしようとすると、302リダイレクトがある空のボディがありますが、ブラウザではページが表示されます。あなたは彼らがチェックしているものをサイトの所有者に尋ねなければなりません...
所属していません StackOverflow