Frage

Zum Beispiel ...

Chicken ist ein Tier .
Burrito ist ein Essen .

WordNet ermöglicht es Ihnen, "is-a" ... die hiearchy Funktion zu tun.

Aber wie kann ich wissen, wenn der Baum der bis zu stoppen? Ich möchte einen LEVEL.
Das ist konsistent.

Zum Beispiel, wenn mit einem Bündel von Worten vorgestellt, mag ich wordnet alle von ihnen kategorisieren, aber auf einem bestimmten Niveau, so dass es nicht zu weit nach oben geht. Kategorisieren „Burrito“ als „Ding“ ist zu weit gefasst, doch „mexikanische verpackte Lebensmittel“ zu spezifisch sind. Ich möchte die hiearchy oder down..until der richtigen Ebene gehen.

War es hilfreich?

Lösung

WordNet ist ein Lexikon eher als eine Ontologie, so ‚Ebene‘ gelten nicht wirklich.

Es gibt SUMO , die eine obere Ontologie, die auf WordNet bezieht sich, wenn Sie ein gerichtetes Gitter wollen statt ein Netzwerk.

Für einige Bereiche, SUMO der Mid-Level-Ontologie ist wahrscheinlich, wo Sie aussehen wollen, aber ich bin nicht sicher, dass es mexikanische verpackte Lebensmittel "hat, wie die meisten seiner Themen wissenschaftlichen oder Engineering.

WordNet Hierarchie ist

beef burrito < burrito < dish/2 < victuals < food < substance < entity. 

Entity ist ein Top-Level-Konzept, also wenn Sie ein unten Substanz stoppen werden Sie Burrito isa Essen. Sie können eine Ebene berechnen auf dieser Grundlage, aber es als SUMO ‚unbedingt gewohnt als konsistent sein, oder Ihren eigenen Satz von nützlichen Mid-Level-Konzepten erzeugen zu beenden. Es gibt keinen ‚mexikanische verpackte Lebensmittel‘ Schritt in WordNet.

Andere Tipps

[ Bitte zu Pete Kirkham , kam er zunächst mit dem Hinweis auf SUMO, die auch die Frage von Alex fragte beantworten können, die OP]

(Ich bin nur eine Ergänzung der Bereitstellung von Informationen hier, begann ich in einem Kommentarfeld aber bald lief aus Raum und das Layout capabilites ...)

Alex : Die meisten von SUMO ist Wissenschaft oder Technik? Dabei spielt es keine täglichen enthalten Wörter wie Lebensmittel, Menschen, Autos, Jobs, etc?
Pete K : SUMO ist eine obere Ontologie. Die Mid-Level-Ontologien auf der Seite enthält keine Lebensmittel aufgeführt (wo man Konzepte zwischen ‚Dinge‘ und ‚Rindfleisch-Burrito‘ finden würde), aber die Art von Organisationen widerspiegelt, die das Projekt finanzieren. Es ist eine Mid-Level-Ontologie für die Menschen. Es gibt auch einen für die Industrie (und damit Arbeitsplätze), einschließlich Lebensmittellieferanten, aber keine Erwähnung von Burritos, wenn Sie es grep .

Meine zwei Cent
100% der WordNet (3.0 heißt die neueste, sowie ältere Versionen) ist kartiert zu SUMO, und dass können nur sein, was Alex brauchen. Die Mid-Level-Ontologien mit SUMO verbunden sind (oder besser gesagt mit MILO) sind effektiv in bestimmten Bereichen, und dies nicht tun, zu dieser Zeit, sind Lebensmittel, aber da WordNet tut (enthalten alle -well, viele of- diese alltäglichen Dinge) Sie tun keine formale Ontologie „unter“ SUMO nutzen müssen, aber stattdessen Sumo WordNet Mapping (möglicherweise zusätzlich zu WordNet verwenden, was wiederum nicht eine Ontologie ist aber mit seiner informellen und losen „Hierarchie“ kann auch helfen.

können einige Schwierigkeiten ergeben sich jedoch aus zwei Bereich (und dann einige ;-)?):

  • die „Ebene“ der SUMO Ontologie kann nicht das Niveau sein, das Sie im Auge für Ihre Anwendung haben würden. Zum Beispiel, während " Burrito " bringt " Essen ", auf höchster Ebene Einheit in SUMO " Chicken " bringt gut „ Chicken “, die nur durch eine lange Kette findet " Animal "(genauer gesagt: Chicken-> Geflügel-> Vogel-> Warm_Blooded_Vertebrae-> Vertebrae-> Tier)
  • .
  • Wordnet Berichterstattung und Metadaten sind beeindruckend, aber im Hinblick auf die Mid-Level-Konzepte kann ein wenig inkonsistent sein. Zum Beispiel „unser“ hypernym des Burrito ist angemessen „Dish“, das es mit Geschirr circa 140 Essen liefert, die Generika wie „Suppe“ oder „Casserole“ sowie „Chicken Marengo“ (aber Weglassen sagen „Chicken Cacciatore“) enthält

Mein Punkt, in diese Fragen der Erziehung, nicht WordNet oder SUMO und die damit verbundene Ontologien zu kritisieren, sondern zeigen, einfach einige der Herausforderungen, mit dem Bau Ontologie verbunden ist, insbesondere auf der mittleren Ebene.

Unabhängig von einigen möglichen Mängel und lackings einer Lösung auf Basis von SUMO und WordNet, eine pragmatische Nutzung dieser Frameworks „passen die Rechnung“ kann gut (85% der Zeit)

Um Ebenen zu erhalten, müssen Sie den Inhalt jeder Ebene vordefinieren. Eine Ontologie definiert diese oft als die unmittelbaren IS_A Kinder eines bestimmten Konzept, aber wenn das nicht vorhanden ist, müssen Sie eine Methode, dass Sie sich entwickeln.

Der nächste Schritt ist eine Priorität für jedes Konzept zu setzen, falls Sie wollen nur eine Kategorie für jedes Wort präsentieren. Die Priorität kann auf verschiedene Weise erfolgen, beispielsweise als die Anzahl der IS_A Beziehungen zwischen der Kategorie und dem Wort, oder manuell für jede Kategorie ausgewählt Prioritäten. Für jedes Wort, können Sie dann mit der höchsten Priorität die Kategorien aus. Zum Beispiel können Sie Fleisch „Nahrung“ zu sein, anstatt chemische Substanz.

Sie sollten auch ein paar Worte wählen, dass die Priorität ändern, wenn sie im Weg sind. Zum Beispiel, wenn Sie einige Chemikalien wollen, die auch Lebensmittel sind, werden als Chemikalien angekündigt, aber andere sollten noch Nahrung.

WordNet die hypernym Baum endet mit einer einzigen Wurzel Synset für das Wort „Einheit“. Wenn Sie WordNet der C-Bibliothek verwenden, dann können Sie eine Weile rekursive Struktur für eine Synset Vorfahren mit traceptrs_ds, und Sie können rekursiv folgende nextss und ptrlst Zeiger die ganze Synset Baum, bis Sie null Zeiger getroffen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top