Decode página web gzipped recuperados via cURL em PHP
Pergunta
Eu estou recuperando uma página web gzipped via onda, mas quando eu a saída do conteúdo recuperado para o navegador eu só obter os dados gzipped cru. Como posso decodificar os dados em PHP?
Um método que eu encontrei foi a de escrever o conteúdo para um arquivo tmp e depois ...
$f = gzopen($filename,"r");
$content = gzread($filename,250000);
gzclose($f);
.... mas o homem, não tem que haver uma maneira melhor.
Edit:. Este não é um arquivo, mas uma página html gzipped retornado por um servidor web
Solução
Eu uso curl e:
curl_setopt($ch,CURLOPT_ENCODING , "gzip");
Outras dicas
Existem várias soluções propostas nos comentários na página href="http://www.php.net/manual/en/function.gzdecode.php" rel="nofollow noreferrer"> PHP .
função Versátil Gunzip:
function gunzip($zipped) { $offset = 0; if (substr($zipped,0,2) == "\x1f\x8b") $offset = 2; if (substr($zipped,$offset,1) == "\x08") { # file_put_contents("tmp.gz", substr($zipped, $offset - 2)); return gzinflate(substr($zipped, $offset + 8)); } return "Unknown Format"; }
Exemplo de integração com função ONDA:
$headers_enabled = 1; curl_setopt($c, CURLOPT_HEADER, $headers_enabled) $ret = curl_exec($c); if ($headers_enabled) { # file_put_contents("preungzip.html", $ret); $sections = explode("\x0d\x0a\x0d\x0a", $ret, 2); while (!strncmp($sections[1], 'HTTP/', 5)) { $sections = explode("\x0d\x0a\x0d\x0a", $sections[1], 2); } $headers = $sections[0]; $data = $sections[1]; if (preg_match('/^Content-Encoding: gzip/mi', $headers)) { printf("gzip header found\n"); return gunzip($data); } } return $ret;
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow