Como definir as propriedades QNETWORKREPL para obter páginas corretas do NCBI?
-
24-09-2019 - |
Pergunta
Eu tento obter este URL a seguir usando a função DownloadUrl da seguinte forma:
http://www.ncbi.nlm.nih.gov/nuccore/27884304
Mas os dados não são como o que podemos ver através do navegador, agora sei que é porque são necessárias algumas informações corretas (como o tipo de navegador). Como posso saber que tipo de informação eu preciso definir e como posso defini -las? (Por função setheader ou de alguma outra maneira ??)
No VC ++, podemos usar o objeto Cincternetssession e ChttpConnection para obter os dados corretos sem definir outras informações detalhadas, existe alguma maneira semelhante no QT ou em outra rede de C ++ da plataforma cruzada? (Sim, eu preciso da propriedade da plataforma cruzada.)
QNetworkReply::NetworkError downloadURL(const QUrl &url, QByteArray &data) {
QNetworkAccessManager manager;
QNetworkRequest request(url);
request.setHeader(QNetworkRequest::ContentTypeHeader ,"Mozilla/5.0 (Windows; U; Windows NT
6.0; en-US; rv:1.9.1.7) Gecko/20091221 Firefox/3.5.7 (.NET CLR 3.5.30729)");
QNetworkReply *reply = manager.get(request);
QEventLoop loop;
QObject::connect(reply, SIGNAL(finished()), &loop, SLOT(quit()));
loop.exec();
QVariant statusCodeV = reply->attribute(QNetworkRequest::RedirectionTargetAttribute);
QUrl redirectTo = statusCodeV.toUrl();
if (!redirectTo.isEmpty())
{
if (redirectTo.host().isEmpty())
{
const QByteArray newaddr = ("http://"+url.host()+redirectTo.encodedPath()).toAscii();
redirectTo.setEncodedUrl(newaddr);
redirectTo.setHost(url.host());
}
return (downloadURL(redirectTo, data));
}
if (reply->error() != QNetworkReply::NoError)
{
return reply->error();
}
data = reply->readAll();
delete reply;
return QNetworkReply::NoError; }
Por VC, podemos apenas fazer isso, os dados corretos estão no chttpfile.
CString downloadURL (CString sGetFromURL)
{
// create an internet session
CInternetSession csiSession;
int pos;
BOOL neof;
// parse URL to get server/object/port
DWORD dwServiceType;
CString sServerName;
CString sObject;
INTERNET_PORT nPort;
CHttpConnection* pHTTPServer = NULL;
CHttpFile* pFile = NULL;
AfxParseURL ( sGetFromURL, dwServiceType, sServerName, sObject, nPort );
// open HTTP connection
pHTTPServer = csiSession.GetHttpConnection ( sServerName, nPort );
// get HTTP object
pFile = pHTTPServer->OpenRequest ( CHttpConnection::HTTP_VERB_GET, sObject, NULL, 1, NULL, NULL, INTERNET_FLAG_RELOAD );
pFile->SendRequest();
}
Solução
Fechar, mas você não está definindo o cabeçalho correto. Você precisa fazer:
request.setRawHeader("User-Agent", "Mozilla/5.0 (Windows; U; Windows NT 6.0; en-US; rv:1.9.1.7) Gecko/20091221 Firefox/3.5.7 (.NET CLR 3.5.30729)" );
Outras dicas
Você define o cabeçalho do tipo de conteúdo errado. O valor que você forneceu se encaixa mais cabeçalho de agente de usuário