Extraindo elementos HTML em uma determinada região?
-
10-07-2019 - |
Pergunta
Dada uma região definida por um retângulo e uma url, há alguma maneira de determinar quais os elementos que se encontram dentro do retângulo dado na página na url dada?
EDIT: Resolução da tela, tamanho da fonte, etc .. tudo pode ser configurado para padrões razoáveis.
Solução
- Obter o documento a partir do URL.
- Render-lo (em um navegador).
- Para cada elemento no DOM do navegador:
- Obter o retângulo [s] ocupada pelo elemento.
- Compare retângulo do elemento com o retângulo que você está interessado.
Outras dicas
Talvez, mas você nee para usar um motor de renderização do navegador completo. Eu recomendo a implementação QT de webkit . É bastante simples para começar.
Algumas coisas que você precisa considerar:
- Resolução da tela.
- Navegador Tamanho da fonte.
- Tipo navegador.
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow