Как указать аутентифицируемый прокси для http-соединения Python?
Вопрос
Как лучше всего указать прокси с именем пользователя и паролем для http-соединения в python?
Решение
Используйте это:
import requests
proxies = {"http":"http://username:password@proxy_ip:proxy_port"}
r = requests.get("http://www.example.com/", proxies=proxies)
print(r.content)
Я думаю, что это намного проще, чем использовать urllib
. Я не понимаю, почему люди так любят использовать urllib
.
Другие советы
Это работает для меня:
import urllib2
proxy = urllib2.ProxyHandler({'http': 'http://
username:password@proxyurl:proxyport'})
auth = urllib2.HTTPBasicAuthHandler()
opener = urllib2.build_opener(proxy, auth, urllib2.HTTPHandler)
urllib2.install_opener(opener)
conn = urllib2.urlopen('http://python.org')
return_str = conn.read()
Настройка переменной среды с именем http_proxy , например: http: // имя пользователя: пароль @ proxy_url: порт
Лучший способ пройти через прокси-сервер, требующий аутентификации, - это использовать urllib2 . создать пользовательский открыватель URL, а затем использовать его для выполнения всех запросов, которые вы хотите пройти через прокси. Обратите внимание, в частности, вы, вероятно, не хотите вставлять пароль прокси в URL или исходный код Python (если это не просто быстрый взлом).
import urllib2
def get_proxy_opener(proxyurl, proxyuser, proxypass, proxyscheme="http"):
password_mgr = urllib2.HTTPPasswordMgrWithDefaultRealm()
password_mgr.add_password(None, proxyurl, proxyuser, proxypass)
proxy_handler = urllib2.ProxyHandler({proxyscheme: proxyurl})
proxy_auth_handler = urllib2.ProxyBasicAuthHandler(password_mgr)
return urllib2.build_opener(proxy_handler, proxy_auth_handler)
if __name__ == "__main__":
import sys
if len(sys.argv) > 4:
url_opener = get_proxy_opener(*sys.argv[1:4])
for url in sys.argv[4:]:
print url_opener.open(url).headers
else:
print "Usage:", sys.argv[0], "proxy user pass fetchurls..."
В более сложной программе вы можете отделить эти компоненты соответствующим образом (например, используя только один менеджер паролей на весь срок службы приложения). В документации по python есть дополнительные примеры того, как выполнять сложные действия с помощью urllib2 , которые вы могли бы также найти полезным.
Или, если вы хотите установить его, чтобы он всегда использовался с urllib2.urlopen (чтобы вам не нужно было хранить ссылку на открывашку):
import urllib2
url = 'www.proxyurl.com'
username = 'user'
password = 'pass'
password_mgr = urllib2.HTTPPasswordMgrWithDefaultRealm()
# None, with the "WithDefaultRealm" password manager means
# that the user/pass will be used for any realm (where
# there isn't a more specific match).
password_mgr.add_password(None, url, username, password)
auth_handler = urllib2.HTTPBasicAuthHandler(password_mgr)
opener = urllib2.build_opener(auth_handler)
urllib2.install_opener(opener)
print urllib2.urlopen("http://www.example.com/folder/page.html").read()
Вот метод использования urllib
import urllib.request
# set up authentication info
authinfo = urllib.request.HTTPBasicAuthHandler()
proxy_support = urllib.request.ProxyHandler({"http" : "http://ahad-haam:3128"})
# build a new opener that adds authentication and caching FTP handlers
opener = urllib.request.build_opener(proxy_support, authinfo,
urllib.request.CacheFTPHandler)
# install it
urllib.request.install_opener(opener)
f = urllib.request.urlopen('http://www.python.org/')
"""