El procesamiento de los comentarios XML utilizando SAX y Cyberneko - con el fin de DOM

StackOverflow https://stackoverflow.com/questions/4699814

  •  11-10-2019
  •  | 
  •  

Pregunta

Estoy usando cyberneko a documentos HTML limpias y de proceso.

Tengo que ser capaz de procesar todos los comentarios que se producen en los documentos HTML original.

He configurado el analizador cyberneko saxo a los comentarios del proceso de esta manera:

parser.setProperty("http://xml.org/sax/properties/lexical-handler", consumer);

... usando el mismo consumidor como soy de eventos DOM.

recibo una llamada de retorno para cada uno de los comentarios:

 @Override
 public void comment(char[] arg0, int arg1, int arg2) throws SAXException {
  System.out.println("COMMENT::: "+new String(arg0, arg1, arg2));
 }

El problema que tengo es que todos los comentarios se procesan primero , fuera de contexto del DOM. es decir, puedo obtener una devolución de llamada por todos los comentarios antes el encabezado del documento, cuerpo, etc ....

Lo que me gustaría es para las devoluciones de llamada de comentario que se produzca en el orden en que aparecen en el DOM.

Editar : lo que realmente estoy tratando de hacer es pasada a través de instrucciones de IE en el HTML original, como por ejemplo:

 <!--[if lte IE 6]><body class="news ie"><![endif]-->

En el momento todo lo que se dejan caer, lo que necesito para incluirlos en el documento HTML limpiado.

¿Fue útil?

Solución

Probablemente hay una explicación simple que sería clara si nos mostró más de su código.

Pero si se trata de un problema con cybernecko, usted podría intentar un programa de análisis diferente, como TagSoup.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top