Pergunta

Estou tentando detestar/trabalhar por aí isto Bug nos elementos RSS. Isso significa que tenho que encontrar um espaço de nome de nome errado e alterar seu valor para o espaço para nome correto. Por exemplo:

xmlns:media="http://search.yahoo.com/mrss" 

devemos ser:

xmlns:media="http://search.yahoo.com/mrss/" 

Como posso alcançar isso com um org.w3c.document?

Desenvolvendo como obter como obter todos os elementos de um determinado namespace:

        XPathFactory xpf = XPathFactory.newInstance();
        XPath xpath = xpf.newXPath();
        XPathExpression expr = xpath.compile("//*[namespace-uri()='http://search.yahoo.com/mrss']");


        Object result = expr.evaluate(d, XPathConstants.NODESET);
        if (result != null) {
            NodeList nodes = (NodeList) result;
            for(int node=0;node<nodes.getLength();node++)
            {
                Node n = nodes.item(node);
                this.log.warn("Found old mediaRSS namespace declaration: "+n.getTextContent());
            }

        } 

Então agora eu tenho que descobrir como alterar o espaço para nome de um nó via JAXP.

Foi útil?

Solução 2

Apenas por uma questão de completude:

Código Java:

Document d = out.outputW3CDom(converted);
            DOMSource oldDocument = new DOMSource(d);
            DOMResult newDocument = new DOMResult();
            TransformerFactory tf = TransformerFactory.newInstance();
            StreamSource xsltsource = new StreamSource(
                    getStream(MEDIA_RSS_TRANSFORM_XSL));
            Transformer transformer = tf.newTransformer(xsltsource);
            transformer.transform(oldDocument, newDocument);

private InputStream getStream(String fileName) {
    InputStream xslStream = Thread.currentThread().getContextClassLoader()
                .getResourceAsStream("/" + fileName);
    if (xslStream == null) {
        xslStream = Thread.currentThread().getContextClassLoader()      .getResourceAsStream(fileName);
        }
        return xslStream;
    }

FLILESHEET:

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0"
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <!--identity transform that will copy matched node/attribute to the output and apply templates for it's children and attached attributes-->
    <xsl:template match="node()|@*">
        <xsl:copy>
            <xsl:apply-templates select="@*|*|text()" />
        </xsl:copy>
    </xsl:template>

    <!--Specialized template to match on elements with the incorrect namespace and generate a new element-->
    <xsl:template match="//*[namespace-uri()='http://search.yahoo.com/mrss']">
        <xsl:element name="{local-name()}" namespace="http://search.yahoo.com/mrss/" >
            <xsl:apply-templates select="@*|*|text()" />
        </xsl:element>
    </xsl:template>
</xsl:stylesheet>

Agradecimentos especiais a Mads Hansen por seu ajuda com o XSLT.

Outras dicas

Você provavelmente poderia fazer isso com XSLT, com uma regra como esta:

<xsl:template match="media:*">
   <xsl:element name="local-name()" namespace="http://search.yahoo.com/mrss/">
      <xsl:apply-templates match="node()|@*"/>
   </xsl:element>
</xsl:template>

onde a mídia está vinculada a "http://search.yahoo.com/mrss".

Você pode ter que ajustar um pouco a sintaxe, pois estou escrevendo isso sem a ajuda de um compilador. Além disso, o que você obterá provavelmente não é extremamente bem formatado (declarações de namespace em muitos elementos), mas devem estar locicamente corretos.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top