Extraire des éléments HTML dans une région donnée?
-
10-07-2019 - |
Question
Étant donné une région définie par un rectangle et une URL, existe-t-il un moyen de déterminer quels éléments se trouvent dans le rectangle donné sur la page à l'URL donnée?
EDIT: La résolution de l’écran, la taille de la police, etc. peuvent toutes être réglées sur des valeurs par défaut raisonnables.
La solution
- Récupérez le document à partir de l'URL.
- Rendez-le (dans un navigateur).
- Pour chaque élément du DOM du navigateur:
- Récupère le rectangle [s] occupé par l'élément.
- Comparez le rectangle de l'élément avec le rectangle qui vous intéresse.
Autres conseils
Peut-être, mais vous auriez besoin d’un moteur de rendu complet pour votre navigateur. Je recommanderais l'implémentation QT de webkit . C’est assez simplement pour y aller.
Certaines choses à prendre en compte:
- Résolution de l'écran.
- Taille de la police du navigateur.
- Type de navigateur.
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow