Pregunta

cuando obtengo la siguiente URL con curl

curl -D headers.http "http://www.springerlink.com/index/10.1007/s00453-007-9157-8"

los encabezados del archivo. http contiene una " Ubicación " encabezado:

HTTP/1.1 302 Found
Date: Tue, 27 Oct 2009 17:00:20 GMT
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
X-AspNet-Version: 2.0.50727
Location: http://www.springerlink.com/link.asp?id=c104731297q64224
Set-Cookie: CookiesSupported=True; expires=Wed, 27-Oct-2010 17:00:20 GMT; path=/
Cache-Control: private
Content-Type: text/html; charset=utf-8
Content-Length: 173

pero cuando utilicé la biblioteca apache httpclient esta " Ubicación: " faltaba el encabezado (?).

int status = httpClient.executeMethod(method);
if(status!=HttpStatus.SC_OK &&
status!=HttpStatus.SC_MOVED_TEMPORARILY &&
status!=HttpStatus.SC_MOVED_PERMANENTLY
    )
    {
    throw new IOException("connection failure for "+url+" status:"+status);
    }
Header header=method.getResponseHeader("Location");
if(header==null )
    {

    for(Header h:method.getResponseHeaders())
        {
        LOG.info(h.toString());
        }

    throw new IOException(
        "Expected a redirect for "+url
        );
    }

He enumerado los encabezados a continuación:

INFO: Date: Tue, 27 Oct 2009 17:05:13 GMT
INFO: Server: Microsoft-IIS/6.0
INFO: X-Powered-By: ASP.NET
INFO: X-AspNet-Version: 2.0.50727
INFO: Set-Cookie: ASP.NET_SessionId=js1o5wqnuhuh24islnvkyr45; path=/; HttpOnly
INFO: Cache-Control: private
INFO: Content-Type: text/html; charset=utf-8
INFO: Content-Length: 17245

uhh ???

¿Fue útil?

Solución

Lo que está sucediendo es que con curl , obtienes un 302 que en realidad es una redirección, a la URL en el encabezado de ubicación.

Con el httpclient de Apache, realiza el redireccionamiento por usted y devuelve los encabezados de la solicitud a la ubicación redirigida.

Para demostrar este intento

curl -D headers.http "http://www.springerlink.com/link.asp?id=c104731297q64224"

y compara la respuesta.

editar: en realidad hay alrededor de 4 redirecciones allí si sigue cada encabezado de ubicación con curl.

Otros consejos

http://www.springerlink.com/index/10.1007 / s00453-007-9157-8 es en realidad una redirección. Dado que la opción -D significa '' solo encabezados '', el primero no está redirigiendo a la Ubicación especificada: ... , mientras que el segundo sí. Eche un vistazo a Content-Length, es muy diferente.

¿Qué sucede cuando omite el -D ?

Añadir esto

  method.setFollowRedirects(false); 

Antes de ejecutar el método.

HttpClient sigue la redirección automáticamente de forma predeterminada, pero Curl no lo hace.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top