Perl, LibXML e esquemas
-
19-08-2019 - |
Pergunta
Eu tenho um exemplo Perl script que eu estou tentando carregar e validar um arquivo contra um esquema, os interrogam vários nós.
#!/usr/bin/env perl
use strict;
use warnings;
use XML::LibXML;
my $filename = 'source.xml';
my $xml_schema = XML::LibXML::Schema->new(location=>'library.xsd');
my $parser = XML::LibXML->new ();
my $doc = $parser->parse_file ($filename);
eval {
$xml_schema->validate ($doc);
};
if ($@) {
print "File failed validation: $@" if $@;
}
eval {
print "Here\n";
foreach my $book ($doc->findnodes('/library/book')) {
my $title = $book->findnodes('./title');
print $title->to_literal(), "\n";
}
};
if ($@) {
print "Problem parsing data : $@\n";
}
Infelizmente, embora seja validando a multa arquivo XML, não é encontrar todos os itens do livro $ e, portanto, não imprimir nada.
Se eu remover o esquema a partir do arquivo XML ea validação do arquivo PL, em seguida, ele funciona bem.
Eu estou usando o namespace padrão. Se eu mudá-lo para não usar o espaço para nome padrão (xmlns: lib = "http://libs.domain.com" e prefixar todos os itens no arquivo XML com lib e alterar as expressões XPath para incluir o prefixo namespace (/ lib: biblioteca / lib:. book), então ele novamente trabalha arquivo
Por quê? eo que eu estou ausente?
XML:
<?xml version="1.0" encoding="utf-8"?>
<library xmlns="http://lib.domain.com"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://lib.domain.com .\library.xsd">
<book>
<title>Perl Best Practices</title>
<author>Damian Conway</author>
<isbn>0596001738</isbn>
<pages>542</pages>
<image src="http://www.oreilly.com/catalog/covers/perlbp.s.gif" width="145" height="190"/>
</book>
<book>
<title>Perl Cookbook, Second Edition</title>
<author>Tom Christiansen</author>
<author>Nathan Torkington</author>
<isbn>0596003137</isbn>
<pages>964</pages>
<image src="http://www.oreilly.com/catalog/covers/perlckbk2.s.gif" width="145" height="190"/>
</book>
<book>
<title>Guitar for Dummies</title>
<author>Mark Phillips</author>
<author>John Chappell</author>
<isbn>076455106X</isbn>
<pages>392</pages>
<image src="http://media.wiley.com/product_data/coverImage/6X/07645510/076455106X.jpg" width="100" height="125"/>
</book>
</library>
XSD:
<?xml version="1.0" encoding="utf-8"?>
<xs:schema xmlns="http://lib.domain.com" xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" targetNamespace="http://lib.domain.com">
<xs:attributeGroup name="imagegroup">
<xs:attribute name="src" type="xs:string"/>
<xs:attribute name="width" type="xs:integer"/>
<xs:attribute name="height" type="xs:integer"/>
</xs:attributeGroup>
<xs:element name="library">
<xs:complexType>
<xs:sequence>
<xs:element maxOccurs="unbounded" name="book">
<xs:complexType>
<xs:sequence>
<xs:element name="title" type="xs:string"/>
<xs:element maxOccurs="unbounded" name="author" type="xs:string"/>
<xs:element name="isbn" type="xs:string"/>
<xs:element name="pages" type="xs:integer"/>
<xs:element name="image">
<xs:complexType>
<xs:attributeGroup ref="imagegroup"/>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
Solução
A partir da XML :: LibXML docs :
Um erro comum sobre XPath é supor que os testes de nodos constituídos por um nome de elemento sem correspondência de prefixo elementos no namespace padrão. Este pressuposto está errado - por XPath especificação, tais testes nó pode corresponder apenas a elementos que não são de (Isto é nulo) espaço de nomes. ...(e mais tarde) ... ... A maneira recomendada é usar o XML :: LibXML :: XPathContext módulo
Assim, a partir da perspectiva de XPath, não há espaço para nome "default" ... para qualquer namespace não nulo, você tem que especificá-lo em sua XPath. O XML :: módulo LibXML :: XPathContext permite criar um prefixo para qualquer espaço de nomes para o uso em sua expressão XPath.