Domanda

Ho analizzato Dump Data Freebase e ora ha RDF come il seguente:

<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.name> "Mit Rees und Hans im Bürgli"@de
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.name> "Granny Scratch Scratch"@en
.

Avere questo set di dati RDF, come posso estrarre il nome e il tipo di una determinata risorsa?Ad esempio, dai dati sopra, voglio estrarre:

Mit Rees und Hans im Bürgli ### music.release_track
Granny Scratch Scratch ### music.release_track 
.

È stato utile?

Soluzione

Cosa hai usato per analizzarlo?Il formato che stai mostrando è il formato dei dati grezzi.

Se lo hai caricato in un negozio RDF, è necessario essere in grado di interrogare facilmente per ottenere le informazioni necessarie utilizzando SPARQL o qualunque sia l'altro interfaccia di query, il negozio offre.

Se stai solo lavorando con il file di testo RAW, dovresti essere in grado di sfruttare il fatto che è ordinato per ID soggetto (dovresti verificare che questo sia ancora vero) per elaborarlo come un flusso senza richiedere un sacco diDeposito di lavoro (cioè RAM).

L'unico immagazzinamento temporaneo di cui è necessario è 1) l'ID soggetto corrente, 2) il nome del soggetto corrente e 3) il tipo del soggetto corrente.Se il tipo non è quello che vuoi (versione_track), puoi semplicemente saltare al prossimo gruppo di argomenti.Se è il tipo giusto, è possibile emettere una riga per il tuo triplo non appena hai sia il nome che il tipo.

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top