Pergunta

Esta questão já tem uma resposta aqui:

Estou a incorporação de páginas da Wikipedia em meu aplicativo, e eu gostaria de mostrar os mesmos que mostra abstratas simplificados do Google Earth. (Ele dá os primeiros parágrafos e um link para o conteúdo completo, sem qualquer layout sério.)

Eu sei sobre a opção de impressão = true, mas isso não é o que estou procurando.

Foi útil?

Solução

Você pode querer considerar o uso do API : você pode pegar um "texto "versão de qualquer artigo. Em seguida, é até você para extrair o resumo.

Outra opção é apenas para solicitar a página no raw formato:

Raw (Wikitext) page processing: sending a action=raw or a action=raw&templates=expand GET request to index.php will give the unprocessed wikitext source code of a page.

por exemplo.

http://en.wikipedia.org/wiki/Main_Page?action=raw

É claro que você precisa fazer um pouco uma raspagem. Indo através da API pode ser mais eficiente que você tenha um melhor controle do que você pode puxar do banco de dados diretamente (wikitext se desejar).

Outras dicas

Será que você olha para a API Wikipedia? Mediawiki (e assim Wikipedia) tem uma API rico em recursos e flexível que está documentada no http: // www. mediawiki.org/wiki/API

Use a MediaWiki API com action = consulta e prop = revisões para buscar uma dada revisão , remova o wikitext (imagens, infoboxes) e extrair o conteúdo da primeira frase.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top