Pergunta

Como posso digitalizar uma página HTML, para texto dentro de uma certa div?

Foi útil?

Solução

A maneira mais simples de fazer isso seria usar Aparente simples html dom

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');

Outras dicas

Você também pode fazer isso usando o DOMDocument classe.

O uso é bastante direto:

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

Documentação é aqui.

Um exemplo de uso do mundo real pode ser encontrado aqui.

Você pode usar o Build in funcionalidade, conforme sugerido por outras pessoas ou experimentar o A Parser simples HTML DOM é implementado como uma classe PHP simples e algumas funções auxiliares. Ele suporta raspagem de tela de estilo seletor CSS (como no jQuery), pode lidar com HTML inválido e até fornece uma interface familiar para manipular um DOM.

Vale a pena conferir em http://simplehtmldom.sourceforge.net/

preg_match() Para corresponder à substring que você deseja ou use DOM/XML.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top