Perl, LibXML und Schemen
-
19-08-2019 - |
Frage
ich ein Beispiel Perl-Skript, das ich eine Datei gegen ein Schema zu laden und zu validieren versuchen, sie verschiedene Knoten abzufragen.
#!/usr/bin/env perl
use strict;
use warnings;
use XML::LibXML;
my $filename = 'source.xml';
my $xml_schema = XML::LibXML::Schema->new(location=>'library.xsd');
my $parser = XML::LibXML->new ();
my $doc = $parser->parse_file ($filename);
eval {
$xml_schema->validate ($doc);
};
if ($@) {
print "File failed validation: $@" if $@;
}
eval {
print "Here\n";
foreach my $book ($doc->findnodes('/library/book')) {
my $title = $book->findnodes('./title');
print $title->to_literal(), "\n";
}
};
if ($@) {
print "Problem parsing data : $@\n";
}
Leider obwohl es die XML-Datei in Ordnung ist, Validierung, wird es keine $ Buch Gegenstände und daher nichts auszudrucken.
Wenn ich das Schema aus der XML-Datei und die Validierung von der PL-Datei entfernen Sie es funktioniert gut.
Ich bin mit dem Standard-Namespace. Wenn ich es nicht ändere den Standard-Namespace verwenden (xmlns: lib = „http://libs.domain.com“ und alle Elemente in der XML-Datei mit Präfix lib und den XPath-Ausdrücke ändert das Namespacepräfix enthält (/ lib: Bibliothek / lib. Buch), dann wieder funktioniert Datei
Warum? und was bin ich dabei?
XML:
<?xml version="1.0" encoding="utf-8"?>
<library xmlns="http://lib.domain.com"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://lib.domain.com .\library.xsd">
<book>
<title>Perl Best Practices</title>
<author>Damian Conway</author>
<isbn>0596001738</isbn>
<pages>542</pages>
<image src="http://www.oreilly.com/catalog/covers/perlbp.s.gif" width="145" height="190"/>
</book>
<book>
<title>Perl Cookbook, Second Edition</title>
<author>Tom Christiansen</author>
<author>Nathan Torkington</author>
<isbn>0596003137</isbn>
<pages>964</pages>
<image src="http://www.oreilly.com/catalog/covers/perlckbk2.s.gif" width="145" height="190"/>
</book>
<book>
<title>Guitar for Dummies</title>
<author>Mark Phillips</author>
<author>John Chappell</author>
<isbn>076455106X</isbn>
<pages>392</pages>
<image src="http://media.wiley.com/product_data/coverImage/6X/07645510/076455106X.jpg" width="100" height="125"/>
</book>
</library>
XSD:
<?xml version="1.0" encoding="utf-8"?>
<xs:schema xmlns="http://lib.domain.com" xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" targetNamespace="http://lib.domain.com">
<xs:attributeGroup name="imagegroup">
<xs:attribute name="src" type="xs:string"/>
<xs:attribute name="width" type="xs:integer"/>
<xs:attribute name="height" type="xs:integer"/>
</xs:attributeGroup>
<xs:element name="library">
<xs:complexType>
<xs:sequence>
<xs:element maxOccurs="unbounded" name="book">
<xs:complexType>
<xs:sequence>
<xs:element name="title" type="xs:string"/>
<xs:element maxOccurs="unbounded" name="author" type="xs:string"/>
<xs:element name="isbn" type="xs:string"/>
<xs:element name="pages" type="xs:integer"/>
<xs:element name="image">
<xs:complexType>
<xs:attributeGroup ref="imagegroup"/>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
Lösung
Von der XML :: LibXML docs :
Ein häufiger Fehler über XPath ist davon ausgehen, dass der Knoten-Tests, bestehend aus ein Elementname ohne Präfixübereinstimmung Elemente im Standard-Namespace. Diese Annahme ist falsch - von XPath Spezifikation, solche Tests Knoten kann nur Elemente übereinstimmen, sind in keiner (D.h. null) Namensraum. ...(und später) ... ... Der empfohlene Weg ist, verwenden Sie die XML :: LibXML :: XPathContext Modul
So, aus der Sicht von XPath, gibt es kein „Standard“ Namespace ... für all Nicht-null-Namespace, haben Sie es in Ihrem XPath angeben. Die XML :: LibXML :: XPathContext-Modul kann Sie einen Präfix erstellen für jeden Namensraum in Ihrem XPath-Ausdruck verwenden.