Name-Type抽出のためのFreeBase RDFダンプ解析..
-
23-12-2019 - |
質問
私はFreeBaseデータダンプを解析し、次のようなRDFを持っています。
<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.name> "Mit Rees und Hans im Bürgli"@de
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.name> "Granny Scratch Scratch"@en
.
このRDFデータセットを持つ、特定のリソースの名前と種類をどのように抽出できますか?たとえば、上記のデータから、抽出したいです。
Mit Rees und Hans im Bürgli ### music.release_track
Granny Scratch Scratch ### music.release_track
. 解決
それを解析するために何を使ったのですか?表示されているフォーマットは生データ形式です。
RDFストアにロードした場合は、SPARQLまたは他のクエリインタフェースを使用して、必要な情報を提供する情報を簡単に照会できます。
rawテキストファイルを使っている場合は、それが主題のIDによってソートされているという事実を利用することができるはずです(これがまだ真実であることを確認する必要があることを確認する必要がある)。作業保管(RAM)
必要な一時的な記憶域は1)現在の被写体ID、2)現在の被写体の名前と3)現在のサブジェクトの種類。タイプがあなたが望むものではない場合(release_track)、あなたはただ次の主題のトリプルのグループにスキップすることができます。正しいタイプの場合は、名前とタイプの両方があるとすぐにトリプルのために行を出力できます。
所属していません StackOverflow