Frage

Ich habe FreeBase-Daten-Dump analysiert und haben jetzt RDF wie folgt:

generasacodicetagpre.

Mit diesem RDF-Dataset, wie kann ich den Namen und den Typ einer bestimmten Ressource extrahieren?Beispielsweise möchte ich aus den obigen Daten extrahieren:

generasacodicetagpre.

War es hilfreich?

Lösung

Was hast du gebraucht, um es zu parsen?Das Format, das Sie anzeigen, ist das Rohdatenformat.

Wenn Sie es in einen RDF-Speicher geladen haben, sollten Sie in der Lage sein, einfach abzufragen, um die Informationen zu erhalten, die Sie benötigen, indem Sie SPARQL oder welche andere Abfrage-Schnittstelle verwenden, die den Ladenangebot anbietet.

Wenn Sie nur mit der RAW-Textdatei arbeiten, sollten Sie in der Lage sein, die Tatsache nutzen zu können, dass sie nach Subjekt-ID sortiert ist (Sie sollten bestätigen, dass dies noch trifft), um es als Stream zu verarbeiten, ohne dass Sie viel benötigenArbeitsspeicher (z. B. RAM).

Der einzige temporäre Speicher, den Sie benötigen, ist 1) die aktuelle Subjekt-ID, 2) den Namen des aktuellen Subjekts und 3) die Art des aktuellen Subjekts.Wenn der Typ nicht der von Ihnen gewünschte (release_track) ist, können Sie einfach mit der nächsten Gruppe der Fach-Triples springen.Wenn es der richtige Typ ist, können Sie eine Zeile für Ihr Dreifach ausgeben, sobald Sie sowohl den Namen als auch den Typ haben.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top