Gibt es ein Open-Source-System für die Suche in XML-Dokumenten? [geschlossen]
-
05-10-2019 - |
Frage
ich viele Open-Source-XML-Datenbanken gefunden (TPOX, Bauholz, DBXML), aber sie arbeiten auf XPath und XQuery, ich brauche ein System, das für die Zwecke der „Stichwortsuche auf XML-Dokumenten“ entwickelt wird.
Lösung
Viele der XML-Datenbanken bieten Verschlagwortung auf den XML-Dokumenten in ihnen. Sie sind nicht nur auf XPath-Ausdrücke beschränkt. Sie können über alle Dokumente in der Datenbank eine Keyword-Suche.
Oft können Sie Ihre Keyword-Abfragen (und verarbeiten die Ergebnisse der Abfrage) in XQuery auszudrücken. Siehe exist-db für ein Beispiel: http://exist.sourceforge.net/kwic.html
Es gibt Unterstützung für Keyword auf bestimmte Elemente beschränkt oder Sie könnten nur über das Dokument als Ganzes tun Schlüsselwort. Siehe die XQuery Volltext Spezifikation für alle Optionen an: http: // www .w3.org / TR / XPath-Volltext-10 /
BaseX ist eine weitere Open-Source-XML-Datenbank, dass unterstützt der Volltext (dh Schlüsselwort-Suche) spec: http://www.inf.uni-konstanz.de/dbis/basex/
Wenn Sie Open-Source mögen, ohne die Datenbank Volltextsuche, obwohl Sie bei der älteren XQengine aussehen könnten wollen - http: / /xqengine.sourceforge.net/ -. oder, wie jemand anderes sagte, nur verwenden Lucene und Index den gesamten Text in einem Dokument auf diese Weise
Andere Tipps
Ich bin nicht sicher, was ein „Stichwortsuche“ ist, aber Sie können eine Suchmaschine, wie Lucene / Solr zu indizieren Ihre Daten einrichten und dann durch die Suche zu verwenden.