Pregunta

Tengo una herramienta antigua que un (ex) colega escribió hace unos años con Jaxer, que me gustaría reemplazar/reescribir.

Chupón es un marco (abandonado) del lado del servidor basado en un navegador Mozilla/Gecko sin cabeza que le permite usar JavaScript y el lado del servidor DOM.

Dado que Jaxer está abandonado y debido a que tengo grandes problemas para instalar y ejecutar Aptana Studio 1.5 con Jaxer en una nueva computadora, estoy buscando una biblioteca/marco/algo en el que pueda basar una nueva versión.

Esta herramienta solo se ejecuta localmente dentro de Aptana Studio (el IDE para Jaxer) y nunca tuvo la intención de ser una aplicación web real. Ratea los sitios web de nuestros clientes cargándolos de página por página en la Mozilla del lado del servidor. Para hacerlo, utiliza selectores CSS JQuery y predefinidos para encontrar los enlaces en los menús y analizar otra información de las páginas. El resultado final es básicamente un mapa del sitio glorificado.

Me gustaría mantener este modus operandi si es posible y continuar usando jQuery/JavaScript/DOM para cargar y analizar/acceder a las páginas, pero puede envolverse en un marco basado en otro idioma como Java. Consideré escribir algo basado en gecko yo mismo, pero eso parece un poco exagerado, así que estoy abierto a otras sugerencias.

¿Fue útil?

Solución

En cuanto a HTML Rawling/Analying:http://ccil.org/~cowan/xml/tagsoup/

o

http://jsoup.org/

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top