¿Extraer elementos html en una región determinada?
-
10-07-2019 - |
Pregunta
Dada una región definida por un rectángulo y una url, ¿hay alguna forma de determinar qué elementos se encuentran dentro del rectángulo dado en la página en la url dada?
EDITAR: la resolución de pantalla, el tamaño de fuente, etc. se pueden establecer en valores predeterminados razonables.
Solución
- Obtenga el documento de la URL.
- Renderizarlo (en un navegador).
- Para cada elemento en el DOM del navegador:
- Obtener el rectángulo [s] ocupado por el elemento.
- Compare el rectángulo del elemento con el rectángulo que le interesa.
Otros consejos
Quizás, pero necesitarías usar un motor de renderizado de navegador completo. Recomiendo la implementación QT de webkit . Es bastante simple comenzar.
Algunas cosas que debe considerar:
- Resolución de pantalla.
- Tamaño de fuente del navegador.
- Tipo de navegador.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow