Domanda

html Tidy fornisce questo come output per qualche motivo:

<?xml version="1.0" encoding="utf-16"?>
<?xml version="1.0" encoding="utf-16"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta name="generator" content=
"HTML Tidy for Linux/x86 (vers 11 February 2007), see www.w3.org" />
<meta name="vs_targetSchema" content="http://schemas.microsoft.com/intellisense/ie5" />

...rest of document

Quindi ci sono 2 intestazioni xml e del tipo sbagliato (non UTF-8). C'è un modo per rimuovere la seconda intestazione, cambiarla in UTF-8 e anche rimuovere DOCTYPE con XSL?

È stato utile?

Soluzione

Penso che sarebbe meglio risolvere il problema originale. Usi la libreria HTML Tidy?

Prova a impostare codifica output su utf8 e add-xml-decl su false. Il nodo DOCTYPE può essere soppresso impostando la proprietà doctype su omettere.

Altri suggerimenti

Sì. Crea un modello che corrisponda al primo elemento figlio che desideri accettare e quindi invia semplicemente il contenuto di tale elemento.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top