Perl, LibXML e schemi
-
19-08-2019 - |
Domanda
Ho un esempio di script Perl che sto provando a caricare e convalidare un file su uno schema, che interrogano vari nodi.
#!/usr/bin/env perl
use strict;
use warnings;
use XML::LibXML;
my $filename = 'source.xml';
my $xml_schema = XML::LibXML::Schema->new(location=>'library.xsd');
my $parser = XML::LibXML->new ();
my $doc = $parser->parse_file ($filename);
eval {
$xml_schema->validate ($doc);
};
if ($@) {
print "File failed validation: $@" if $@;
}
eval {
print "Here\n";
foreach my $book ($doc->findnodes('/library/book')) {
my $title = $book->findnodes('./title');
print $title->to_literal(), "\n";
}
};
if ($@) {
print "Problem parsing data : $@\n";
}
Sfortunatamente, anche se sta convalidando il file XML bene, non trova elementi $ book e quindi non stampa nulla.
Se rimuovo lo schema dal file XML e la convalida dal file PL, allora funziona benissimo.
Sto usando lo spazio dei nomi predefinito. Se lo cambio per non utilizzare lo spazio dei nomi predefinito (xmlns: lib = " http: //libs.domain.com" e aggiungo il prefisso a tutti gli elementi nel file XML con lib e cambio le espressioni XPath per includere il prefisso dello spazio dei nomi (/ lib : library / lib: book) quindi funziona di nuovo il file.
Perché? e cosa mi sto perdendo?
XML:
<?xml version="1.0" encoding="utf-8"?>
<library xmlns="http://lib.domain.com"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://lib.domain.com .\library.xsd">
<book>
<title>Perl Best Practices</title>
<author>Damian Conway</author>
<isbn>0596001738</isbn>
<pages>542</pages>
<image src="http://www.oreilly.com/catalog/covers/perlbp.s.gif" width="145" height="190"/>
</book>
<book>
<title>Perl Cookbook, Second Edition</title>
<author>Tom Christiansen</author>
<author>Nathan Torkington</author>
<isbn>0596003137</isbn>
<pages>964</pages>
<image src="http://www.oreilly.com/catalog/covers/perlckbk2.s.gif" width="145" height="190"/>
</book>
<book>
<title>Guitar for Dummies</title>
<author>Mark Phillips</author>
<author>John Chappell</author>
<isbn>076455106X</isbn>
<pages>392</pages>
<image src="http://media.wiley.com/product_data/coverImage/6X/07645510/076455106X.jpg" width="100" height="125"/>
</book>
</library>
XSD:
<?xml version="1.0" encoding="utf-8"?>
<xs:schema xmlns="http://lib.domain.com" xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" targetNamespace="http://lib.domain.com">
<xs:attributeGroup name="imagegroup">
<xs:attribute name="src" type="xs:string"/>
<xs:attribute name="width" type="xs:integer"/>
<xs:attribute name="height" type="xs:integer"/>
</xs:attributeGroup>
<xs:element name="library">
<xs:complexType>
<xs:sequence>
<xs:element maxOccurs="unbounded" name="book">
<xs:complexType>
<xs:sequence>
<xs:element name="title" type="xs:string"/>
<xs:element maxOccurs="unbounded" name="author" type="xs:string"/>
<xs:element name="isbn" type="xs:string"/>
<xs:element name="pages" type="xs:integer"/>
<xs:element name="image">
<xs:complexType>
<xs:attributeGroup ref="imagegroup"/>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
Soluzione
Dai XML :: Documenti LibXML :
Un errore comune su XPath è supponiamo che i test dei nodi consistano in un nome di elemento senza prefisso elementi nello spazio dei nomi predefinito. Questa ipotesi è sbagliata - da XPath specifica, tali test nodo possono abbina solo gli elementi che si trovano nel n spazio dei nomi (ovvero null). ...(e più tardi) ... ... Il modo consigliato è utilizza il XML :: LibXML :: XPathContext modulo
Quindi, dal punto di vista di XPath, non esiste alcun "quotazione predefinita"; spazio dei nomi ... per qualsiasi spazio dei nomi non nullo, è necessario specificarlo nel proprio XPath. Il modulo XML :: LibXML :: XPathContext consente di creare un prefisso per qualsiasi spazio dei nomi da utilizzare nell'espressione XPath.