Domanda

cyberneko ai documenti HTML pulito e di processo.

Ho bisogno di essere in grado di elaborare tutti i commenti che si verificano nei documenti HTML originale.

Ho configurato il parser cyberneko sax ai commenti di processo in questo modo:

parser.setProperty("http://xml.org/sax/properties/lexical-handler", consumer);

... utilizzando lo stesso consumatore come io sono per gli eventi DOM.

ho un callback per ciascuno dei commenti:

 @Override
 public void comment(char[] arg0, int arg1, int arg2) throws SAXException {
  System.out.println("COMMENT::: "+new String(arg0, arg1, arg2));
 }

Il problema che ho è che tutti i commenti vengono elaborate per prime , fuori dal contesto del DOM. vale a dire che ottenere un callback per tutti i commenti prima la testa del documento, il corpo etc ....

Quello che mi piacerebbe è per il commento callback a verificarsi nell'ordine in cui si verificano nel DOM.

Modifica : quello che sto effettivamente cercando di fare è passare attraverso le istruzioni per IE nel codice HTML originale, come ad esempio:

 <!--[if lte IE 6]><body class="news ie"><![endif]-->

Al momento sono tutti scesi, ho bisogno di includerle nel documento HTML pulito.

È stato utile?

Soluzione

Probabilmente c'è una spiegazione semplice che sarebbe chiaro se ci hai mostrato più del vostro codice.

Ma se si tratta di un problema con cybernecko, si potrebbe provare un parser diverso, ad esempio TagSoup.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top