Question

Je me connecte à un site Web, je me connecte.

Le site Web me redirige vers de nouvelles pages et Mechanize traite tous les travaux de cookie et de redirection, mais je ne parviens pas à obtenir la dernière page. J'ai utilisé Firebug et j'ai refait le même travail et j'ai constaté qu'il me fallait encore passer deux pages avec Mechanize.

J’ai jeté un coup d’œil rapide sur les pages et j’ai constaté qu’il existait du code JavaScript et HTML, mais je ne pouvais pas le comprendre car il ne ressemblait pas à du code de page normal. A quoi servent ces pages? Comment peuvent-ils rediriger vers d'autres pages? Que dois-je faire pour les réussir?

Était-ce utile?

La solution

Si vous devez gérer des pages en Javascript, essayez WATIR ou Selenium - ils sont pilotés par un vrai navigateur Web et peuvent donc gérer n’importe quel script Javascript. WATIR Classic nécessite IE ou Firefox avec une certaine extension installée et vous verrez les pages clignoter à l’écran pendant son fonctionnement.

Votre autre option serait de comprendre ce que fait le Javascript sur la page incriminée et de le contourner manuellement, mais cela semble fastidieux.

Autres conseils

Actuellement, Mechanize ne gère pas JavaScript. On envisage de fusionner éventuellement les fonctionnalités de Johnson dans Mechanize, mais jusqu'à ce que cela se produise, vous avez deux options :

  1. Bien comprendre le code JavaScript pour comprendre comment parcourir ces pages.
  2. Automatisez un navigateur réel que comprend JavaScript en utilisant Watir .
  

à quoi servent ces pages? comment ils peuvent rediriger vers d'autres pages. que dois-je faire pour les passer?

Parfois, le travail est effectué sur ces pages. Parfois, le JavaScript est là pour empêcher un accès automatisé comme ce que vous essayez de faire :). De nombreux sites Web effectuent des vérifications inutiles pour vous assurer que vous disposez d'un "bon". navigateur, assurez-vous que votre user_agent est défini sur quelque chose de commun, comme IE. Parfois, définir user_agent pour ressembler à un ancien navigateur vous permettra de passer sans JavaScript.

L’automatisation du site Web est amusante parce que vous devez déjouer le site Web et ses développeurs de logiciels en utilisant plusieurs stratégies. Comme les autres l'ont dit, Watir est le meilleur outil pour passer le code JavaScript pour le moment.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top