Come si accede a un forum phpBB3 tramite uno script Python usando urllib, urllib2 e ClientCookie?
Domanda
(ClientCookie è un modulo per la gestione (automatica) dei cookie: http://wwwsearch.sourceforge.net/ ClientCookie )
# I encode the data I'll be sending:
data = urllib.urlencode({'username': 'mandark', 'password': 'deedee'})
# And I send it and read the page:
page = ClientCookie.urlopen('http://www.forum.com/ucp.php?mode=login', data)
output = page.read()
Lo script non effettua l'accesso, ma sembra essere reindirizzato alla stessa pagina di accesso chiedendogli un nome utente e una password. Cosa sto sbagliando?
Qualsiasi aiuto sarebbe molto apprezzato! Grazie!
Soluzione
Hai provato a recuperare prima la pagina di accesso?
Suggerirei di utilizzare Tamper Data per dare un'occhiata esattamente ciò che viene inviato quando richiedi la pagina di accesso e accedi normalmente utilizzando un browser Web da un nuovo inizio, senza cookie iniziali, in modo che lo script possa replicarlo esattamente.
Questo è l'approccio che ho usato per scrivere quanto segue, estratto da uno script che deve accedere a un forum di Invision Power Board, usando cookielib e urllib2 - potresti trovarlo utile come riferimento.
import cookielib
import logging
import sys
import urllib
import urllib2
cookies = cookielib.LWPCookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookies))
urllib2.install_opener(opener)
headers = {
'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 5.0; en-GB; rv:1.8.1.12) Gecko/20080201 Firefox/2.0.0.12',
'Accept': 'text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5',
'Accept-Language': 'en-gb,en;q=0.5',
'Accept-Charset': 'ISO-8859-1,utf-8;q=0.7,*;q=0.7',
}
# Fetch the login page to set initial cookies
urllib2.urlopen(urllib2.Request('http://www.rllmukforum.com/index.php?act=Login&CODE=00', None, headers))
# Login so we can access the Off Topic forum
login_headers = headers.copy()
login_headers.update({
'Referer': 'http://www.rllmukforum.com/index.php?act=Login&CODE=00',
'Content-Type': 'application/x-www-form-urlencoded',
})
html = urllib2.urlopen(urllib2.Request('http://www.rllmukforum.com/index.php?act=Login&CODE=01',
urllib.urlencode({
'referer': 'http://www.rllmukforum.com/index.php?',
'UserName': RLLMUK_USERNAME,
'PassWord': RLLMUK_PASSWORD,
}),
login_headers)).read()
if 'The following errors were found' in html:
logging.error('RLLMUK login failed')
logging.info(html)
sys.exit(1)
Altri suggerimenti
Consiglio di dare un'occhiata alla meccanizzare ; è progettato proprio per questo tipo di attività. È anche molto più facile che farlo a mano.