Ligando a Wikipedia abstrai (a forma como o Google Earth faz isso) [duplicado]
-
10-07-2019 - |
Pergunta
Esta questão já tem uma resposta aqui:
- Fetch trecho da Wikipedia artigo? 4 respostas
Estou a incorporação de páginas da Wikipedia em meu aplicativo, e eu gostaria de mostrar os mesmos que mostra abstratas simplificados do Google Earth. (Ele dá os primeiros parágrafos e um link para o conteúdo completo, sem qualquer layout sério.)
Eu sei sobre a opção de impressão = true, mas isso não é o que estou procurando.
Solução
Você pode querer considerar o uso do API : você pode pegar um "texto "versão de qualquer artigo. Em seguida, é até você para extrair o resumo.
Outra opção é apenas para solicitar a página no raw formato:
Raw (Wikitext) page processing: sending a action=raw or a action=raw&templates=expand GET request to index.php will give the unprocessed wikitext source code of a page.
por exemplo.
http://en.wikipedia.org/wiki/Main_Page?action=raw
É claro que você precisa fazer um pouco uma raspagem. Indo através da API pode ser mais eficiente que você tenha um melhor controle do que você pode puxar do banco de dados diretamente (wikitext se desejar).
Outras dicas
Será que você olha para a API Wikipedia? Mediawiki (e assim Wikipedia) tem uma API rico em recursos e flexível que está documentada no http: // www. mediawiki.org/wiki/API
Use a MediaWiki API com action = consulta e prop = revisões para buscar uma dada revisão , remova o wikitext (imagens, infoboxes) e extrair o conteúdo da primeira frase.