Question

J'ai parsed FreeBase Data Dump et a maintenant RDF comme ce qui suit:

<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.name> "Mit Rees und Hans im Bürgli"@de
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.name> "Granny Scratch Scratch"@en

Avoir ce jeu de données RDF, comment puis-je extraire le nom et le type d'une ressource particulière?Par exemple, à partir des données ci-dessus, je veux extraire:

Mit Rees und Hans im Bürgli ### music.release_track
Granny Scratch Scratch ### music.release_track 

Était-ce utile?

La solution

Qu'avez-vous utilisé pour l'analyser?Le format que vous montrez est le format de données brutes.

Si vous l'avez chargée dans un magasin RDF, vous devriez être capable de vous demander facilement d'obtenir les informations dont vous avez besoin en utilisant SPARQL ou toute autre interface de requête.

Si vous travaillez simplement avec un fichier texte brut, vous devriez pouvoir profiter du fait que cela est trié par un identifiant de sujet (vous devriez vérifier que cela reste vrai) pour le traiter comme un flux sans nécessiter de nombreusesstockage de travail (c.-à-d. RAM).

Le seul stockage temporaire dont vous avez besoin est 1) l'ID de sujet actuel, 2) le nom du sujet actuel et 3) le type du sujet actuel.Si le type n'est pas celui que vous souhaitez (publiez-vous), vous pouvez simplement passer au groupe suivant des triples de sujet.Si c'est le bon type, vous pouvez émettre une ligne pour votre triple dès que vous avez à la fois le nom et le type.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top