سؤال

النظر في جملة مثل:

سافر جون سميث إلى واشنطن.

اسم Tagger يحدد، في يوم جيد، "جون سميث" كشخص، و "واشنطن" كمكان.ومع ذلك، دون أدلة أخرى، لا يمكن أن يروي أي من جميع "جون سميث" ممكن في العالم، أو حتى أي من "واشنطن" المختلفة.

في النهاية، قد تقرر عملية القرار، بناء على أدلة أخرى.حتى تلك النقطة، ومع ذلك، ما هي الممارسات الجيدة لتمثيل هذه المراجع في RDF؟تعيينها معرفات فريدة من نوعها في بعض مساحة الاسم؟جعل tuples فارغة (على سبيل المثال، تم الإشارة إلى بعض الشخص الذي يدعى جون سميث في الوثيقة D '.)؟بعض البديل الآخر؟كتاب يعطي مثالا ينطوي على محطات الطقس المجهولة، لكنني لا أتابع تماما كيف يناسب مثالهم مع كل شيء آخر حول وصف RDF.

هل كانت مفيدة؟

المحلول

قم بتعيين معرفات فريدة من نوعها في مساحة الاسم الخاصة بك.إذا اكتشفت لاحقا أن هذه "Washington" هي نفسها http://dbpedia.org/resource/ washington ،_ _d.c .، أو أيا كان، يمكنك إضافة بومة: sameas لتأكيد ذلك.

نصائح أخرى

أولا وقبل كل شيء، هناك خدمات جيدة موجودة، يمكنك استخدامها للاعتراف كيان مثل opencalais href="http://www.zemanta.com/" rel="nofollow noreferrer"> zemanta و الخيمياء .

لتكون أكثر تحديدا، نعم ببساطة "النعناع" URIS الخاص بك (معرفات) لكل شيء، ثم نتحدث عنها - لتقديم تمثيل لهذه المعلومات في السلاحف

giveacodicetagpre.

وإذا كنت تتطابق معها لاحقا، يمكنك استخدام البومة: Sameas كما Glenn McDonald يذكر.

قد تكون ذات صلة لك بقراءة كيف يقوم Apache Stanbol بذلك: http://stanbol.apache.org/docs/trunk/components/enhancer/enhancationsulture.html

يمكنك إما النعناع URI الخاص بك كما تمت مناقشته أعلاه، أو استخدم عقدة فارغة. هناك إيجابيات وسلبيات لكلا النهجين:

لديك هوية خارجية، حتى تتمكن من الرجوع صراحة إلى مفهومك في الاستعلامات المستقبلية التي يمكن أن تجعل بعض الاستفسارات أكثر بساطة؛ ولكن، لديك هوية خارجية، وبالتالي فإن الخوارزمية التي تستخدمها لبناء URI أصبح جزءا مهما من البنية التحتية الخاصة بك وعليك أن تضمن أنها مستقرة وفريدة من نوعها. قد يكون هذا تافيا في البداية، ولكن عند البدء في التعامل مع مستندات متعددة يتم إعادة معالجتها في أوقات مختلفة، غالبا ما تكون في الأنظمة الموازية، وعلى الأنظمة الموزعة، فإنه يتوقف بسرعة إلى الأمام على التوالي.

تم تضمين

العقد الفارغة خصيصا لحل هذه المشكلة، فإن تفردهم مضمون من قبل نطقهم؛ ولكن، إذا كنت ستحتاج إلى الرجوع إلى عقدة فارغة في استعلام صراحة، فستحتاج إلى استخدام إما امتدادا غير قياسي، أو ابحث عن طريقة لتمييز العقدة.

في كلتا الحالتين، ولكن بشكل خاص يجب عليك استخدام عقدة فارغة، يجب عليك تضمين بيانات المنشورات لتوصيفها على أي حال.

@ مثال ناثان هو فكرة جيدة للحصول على الفكرة.

لذلك قد يكون مثالا باستخدام العقد الفارغة:

giveacodicetagpre.

لاحظ استخدام معرفات نص RFC5147 / شظية عادية لتحديد الملف الذي تتم معالجته بشكل فريد، وهذا يوفر المرونة فيما يتعلق بكيفية تحديد الأعضاء الفردية. البديل هو التقاط كل هذا في URI لجذر المستند، أو التخلي عن الأصل تماما.

giveacodicetagpre.

سوف تلاحظ أن Foaf: الاسم يحتوي على مجموعة من البومة: شيء، لذلك يمكن تطبيقه على أي شيء. بديل يمكن استخدام SKOS: Concept و RDFS: التسمية للأسماء المناسبة.

الاعتبار النهائي لأجهزة العقدة الفارغة مقابل URI هو أن أي DataTore تستخدمه سيتعين عليه في النهاية تخزين أي URI تستخدمه، وهذا يمكن أن يكون له آثار بشأن الأداء إذا كنت تستخدم مجموعات بيانات كبيرة جدا.

في النهاية إذا كنت سأقوم بنشر معلومات المنتج في الرسم البياني مع الكيانات الموحدة النهائية، فسوف أميل إلى الذهاب مع العقد الفارغة وتخصيص URI للمفاهيم التي أؤديها في النهاية إلى توحيد الكيانات معها.

إذا كنت سأعمل على تتبع أصل الاستدلالات، وهذا مجرد تمرير واحد فقط في خط أنابيب ستجاهل في نهاية المطاف النتائج المتوسطة، وأود أن مجرد النعناع URIS باستخدام نوع من التجزئة المستندات والمعرف ويتم القيام به معها.

giveacodicetagpre.

مرخصة بموجب: CC-BY-SA مع الإسناد
لا تنتمي إلى StackOverflow
scroll top