Вопрос

У меня проанализировано дампа данных FreeBase, а теперь есть RDF, как следующее:

<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspb64> <http://rdf.freebase.com/ns/type.object.name> "Mit Rees und Hans im Bürgli"@de
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.type> <http://rdf.freebase.com/ns/music.release_track>
<http://rdf.freebase.com/ns/m.0mspd6m> <http://rdf.freebase.com/ns/type.object.name> "Granny Scratch Scratch"@en
.

Наличие этого набора данных RDF, как я могу извлечь имя и тип конкретного ресурса?Например, из данных выше, я хочу извлечь:

Mit Rees und Hans im Bürgli ### music.release_track
Granny Scratch Scratch ### music.release_track 
.

Это было полезно?

Решение

Что вы использовали для того, чтобы разбирать его?Формат, который вы показываете, является форматом необработанного данных.

Если вы загрузили его в магазин RDF, вы должны быть в состоянии легко запросить, чтобы получить информацию, необходимую, использующую с помощью SPARQL или любой другой интерфейс запроса в магазине.

Если вы просто работаете с необработанным текстовым файлом, вы должны быть в состоянии воспользоваться тем, что он отсортирован по субъекту ID (вы должны убедиться, что это все еще верно), чтобы обработать его как поток, не требуя большого количестваРабочее хранение (то есть RAM).

Единственное временное хранилище, которое вам нужно, это 1) текущий объект ID, 2) название текущего объекта и 3) тип текущего предмета.Если тип не тот, который вы хотите (Release_Track), вы можете просто перейти к следующей группе темы Triples.Если это правильный тип, вы можете выводить строку для вашего тройного, как только у вас есть как имя, так и тип.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top