Declaração de namespace corrigir xml
-
20-09-2019 - |
Pergunta
Estou tentando detestar/trabalhar por aí isto Bug nos elementos RSS. Isso significa que tenho que encontrar um espaço de nome de nome errado e alterar seu valor para o espaço para nome correto. Por exemplo:
xmlns:media="http://search.yahoo.com/mrss"
devemos ser:
xmlns:media="http://search.yahoo.com/mrss/"
Como posso alcançar isso com um org.w3c.document?
Desenvolvendo como obter como obter todos os elementos de um determinado namespace:
XPathFactory xpf = XPathFactory.newInstance();
XPath xpath = xpf.newXPath();
XPathExpression expr = xpath.compile("//*[namespace-uri()='http://search.yahoo.com/mrss']");
Object result = expr.evaluate(d, XPathConstants.NODESET);
if (result != null) {
NodeList nodes = (NodeList) result;
for(int node=0;node<nodes.getLength();node++)
{
Node n = nodes.item(node);
this.log.warn("Found old mediaRSS namespace declaration: "+n.getTextContent());
}
}
Então agora eu tenho que descobrir como alterar o espaço para nome de um nó via JAXP.
Solução 2
Apenas por uma questão de completude:
Código Java:
Document d = out.outputW3CDom(converted);
DOMSource oldDocument = new DOMSource(d);
DOMResult newDocument = new DOMResult();
TransformerFactory tf = TransformerFactory.newInstance();
StreamSource xsltsource = new StreamSource(
getStream(MEDIA_RSS_TRANSFORM_XSL));
Transformer transformer = tf.newTransformer(xsltsource);
transformer.transform(oldDocument, newDocument);
private InputStream getStream(String fileName) {
InputStream xslStream = Thread.currentThread().getContextClassLoader()
.getResourceAsStream("/" + fileName);
if (xslStream == null) {
xslStream = Thread.currentThread().getContextClassLoader() .getResourceAsStream(fileName);
}
return xslStream;
}
FLILESHEET:
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<!--identity transform that will copy matched node/attribute to the output and apply templates for it's children and attached attributes-->
<xsl:template match="node()|@*">
<xsl:copy>
<xsl:apply-templates select="@*|*|text()" />
</xsl:copy>
</xsl:template>
<!--Specialized template to match on elements with the incorrect namespace and generate a new element-->
<xsl:template match="//*[namespace-uri()='http://search.yahoo.com/mrss']">
<xsl:element name="{local-name()}" namespace="http://search.yahoo.com/mrss/" >
<xsl:apply-templates select="@*|*|text()" />
</xsl:element>
</xsl:template>
</xsl:stylesheet>
Agradecimentos especiais a Mads Hansen por seu ajuda com o XSLT.
Outras dicas
Você provavelmente poderia fazer isso com XSLT, com uma regra como esta:
<xsl:template match="media:*">
<xsl:element name="local-name()" namespace="http://search.yahoo.com/mrss/">
<xsl:apply-templates match="node()|@*"/>
</xsl:element>
</xsl:template>
onde a mídia está vinculada a "http://search.yahoo.com/mrss".
Você pode ter que ajustar um pouco a sintaxe, pois estou escrevendo isso sem a ajuda de um compilador. Além disso, o que você obterá provavelmente não é extremamente bem formatado (declarações de namespace em muitos elementos), mas devem estar locicamente corretos.