Eliminar el encabezado XML duplicado
Pregunta
html Tidy da esto como resultado por alguna razón:
<?xml version="1.0" encoding="utf-16"?>
<?xml version="1.0" encoding="utf-16"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta name="generator" content=
"HTML Tidy for Linux/x86 (vers 11 February 2007), see www.w3.org" />
<meta name="vs_targetSchema" content="http://schemas.microsoft.com/intellisense/ie5" />
...rest of document
Entonces hay 2 encabezados xml, y del tipo incorrecto (no UTF-8). ¿Hay alguna forma de eliminar el segundo encabezado, cambiarlo a UTF-8 y también eliminar el DOCTYPE con XSL?
Solución
Creo que sería mejor solucionar el problema original. ¿Usas la librería HTML Tidy?
Intente configurar salida-codificación para utf8 y add-xml-decl en false. El nodo DOCTYPE se puede suprimir configurando la propiedad doctype para omitir.
Otros consejos
Sí. Cree una plantilla que coincida con el primer elemento secundario que desea aceptar y luego pídale que simplemente envíe el contenido de ese elemento.
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow