Pregunta

Estoy luchando con el getForm y el problema de redirigir mi consulta.He intentado experimentar con cookiefile y followlocation como en otros temas en Stackoverflow pero sin resultado.

Mi código:

  getForm("http://korpus.pl/poliqarp/poliqarp.php",
          query = "pies", corpus = "2", showMatch = "1",showContext = "3",
          leftContext = "5", rightContext = "5", wideContext = "50", hitsPerPage = "10",              
          .opts = curlOptions(
            verbose = TRUE,
            followlocation=TRUE
            )
      )

¿Tengo razón en que obtengo el contenido de la página de redirección?Si es así, ¿cómo puedo evitarlo?

¿Fue útil?

Solución

curl = getCurlHandle(cookiefile = "", verbose = TRUE, followlocation=TRUE)

getForm("http://korpus.pl/poliqarp/poliqarp.php",
        query = "pies", corpus = "2", showMatch = "1",showContext = "3",
        leftContext = "5", rightContext = "5", wideContext = "50", hitsPerPage = "10",              
        .opts = curlOptions(
          verbose = TRUE,
          followlocation=TRUE
        )
        , curl = curl)


test1 <- getURL("http://korpus.pl/poliqarp/poliqarp.php", curl = curl)
test2 <- getURL("http://korpus.pl/poliqarp/poliqarp.php", curl = curl)

Con un poco de persuasión, el test2 debería contener los resultados.

curl es un identificador que persistirá en todas las llamadas.configuración cookiefile le dice a RCurl que almacene las cookies.Puede acceder a la información en el controlador curl usando getCurlInfo(curl).Por ejemplo

> cat(getCurlInfo(curl)$cookielist)
korpus.pl   FALSE   /   FALSE   0   PHPSESSID   ark8hbi13e2c4qrp51aq51nj62

La llamada getForm establece la cookie importante PHPSESSID.El primer getURL da como resultado:

> library(XML)
> htmlParse(test1)['//h3'][[1]]
<h3>This page will <a href="poliqarp.php">refresh</a> automatically in a second</h3> 

Le indica que probablemente se actualizará automáticamente con javascript, por lo que debe realizar esta actualización manualmente realizando otra llamada.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top