Question

Par exemple ...

Le poulet est un animaux .
Burrito est un alimentaire .

WordNet vous permet de faire "est-un" ... la fonction hiearchy.

Cependant, comment puis-je savoir quand arrêter de voyager dans l'arbre? Je veux un niveau.
Cela est conforme.

Par exemple, si elle est présentée avec un tas de mots, je veux WordNet catégoriser tous, mais à un certain niveau, donc il ne va pas trop loin. Catégorisation « burrito » comme une « chose » est trop large, mais « mexicain nourriture emballé » est trop spécifique. Je veux aller le hiearchy ou en down..until le bon niveau.

Était-ce utile?

La solution

WordNet est un lexique plutôt que d'une ontologie, donc « niveaux » ne vraiment appliquent pas.

Il est SUMO , qui est une ontologie supérieure qui concerne WordNet si vous voulez un réseau dirigé au lieu de un réseau.

Pour certains domaines, l'ontologie de niveau moyen de SUMO est probablement où vous voulez regarder, mais je ne suis pas sûr qu'il a « la nourriture mexicaine enveloppé », comme la plupart de ses sujets sont d'ordre scientifique ou technique.

La hiérarchie WordNet est

beef burrito < burrito < dish/2 < victuals < food < substance < entity. 

Entité est un concept de haut niveau, donc si vous arrêtez un en dessous de substance que vous obtiendrez la nourriture burrito isa. Vous pouvez calculer un niveau sur cette base, mais il ne sera pas » nécessairement aussi cohérente que SUMO, ou générer votre propre ensemble de concepts de niveau moyen utile pour se terminer à. Il n'y a pas d'étape « alimentaire mexicain enveloppé » dans WordNet.

Autres conseils

[ S'il vous plaît crédit Pete Kirkham , il a d'abord venu avec la référence à SUMO qui pourrait bien répondre à la question posée par Alex, l'OP]

(Je suis juste fournir un complément d'information ici, j'ai commencé dans un champ de commentaire, mais bientôt à court de capabilites espace et mise en page ...)

Alex : La plupart des SUMO est la science ou de l'ingénierie? Il ne contient pas tous les jours des mots tels que les aliments, les gens, les voitures, emplois, etc? Pete K : SUMO est une ontologie supérieure. Les ontologies de niveau intermédiaire (où vous trouverez des concepts entre « chose » et « boeuf burrito ») figurant sur la page ne comprennent pas la nourriture, mais reflètent les types d'organisations qui financent le projet. Il y a une ontologie de niveau intermédiaire pour les personnes. Il y a aussi un pour les industries (et donc des emplois), y compris les fournisseurs d'aliments, mais aucune mention de burritos si vous grep il .

Mes deux cents 100% de WordNet (3.0 à savoir la dernière, ainsi que les versions antérieures) est cartographiés à SUMO, et que peut être juste ce que Alex besoin. Les ontologies de niveau intermédiaire associés à SUMO (ou plutôt avec MILO) sont effectivement dans des domaines spécifiques, et ne sont pas, à ce moment, comprennent Foodstuff, mais depuis WordNet fait (comprennent tous -Bien, beaucoup Of- ces choses de tous les jours) que vous faites pas besoin de tirer parti de toute ontologie formelle « sous » SUMO, mais au lieu d'utiliser la cartographie WordNet de Sumo (peut-être en plus de WordNet, qui, encore une fois, n'est pas une ontologie mais avec sa « hiérarchie » informelle et lâche peut aussi aider.

Quelques difficultés peuvent survenir, cependant, de deux zones (et puis certains ;-)?):

  • le « niveau » de l'ontologie SUMO peut-être pas le niveau que vous auriez à l'esprit pour votre application. Par exemple, alors " Burrito " apporte " Alimentation ", au niveau des entités de niveau supérieur dans SUMO " Chicken " apporte bien « Chicken » qui ne trouve à travers une longue chaîne " animal "(en particulier: des volailles> aviculture> oiseau-> Warm_Blooded_Vertebrae-> Vertebrae-> animal)
  • .
  • couverture de Wordnet et de métadonnées est impressionnant, mais en ce qui concerne les concepts de niveau moyen peut être un peu incohérent. Par exemple, « notre » hypernym de Burrito est appropriée « plat », ce qui lui donne environ 140 plats de nourriture, qui comprend des génériques tels que « soupe » ou « Casserole », ainsi que « poulet Marengo » (mais en omettant dire « Chicken Cacciatore »)

Mon point, à mettre en place ces questions, est de ne pas critiquer WordNet ou SUMO et ses ontologies connexes, mais plutôt pour illustrer simplement quelques-uns des défis associés à l'ontologie de construction, en particulier au niveau intermédiaire.

Indépendamment de quelques défauts et lackings possibles d'une solution à base de SUMO et WordNet, une utilisation pragmatique de ces cadres pourrait bien « répondre au besoin » (85% du temps)

Afin d'obtenir des niveaux, vous devez prédéfinir le contenu de chaque niveau. Une ontologie définit souvent ces derniers comme les enfants is_a immédiats d'un concept spécifique, mais si cela est absent, vous devez développer une méthode de vous-même.

L'étape suivante consiste à mettre une priorité sur chaque concept, au cas où vous souhaitez présenter une seule catégorie pour chaque mot. La priorité peut être fait de plusieurs façons, par exemple que le nombre des relations entre is_a la catégorie et le mot ou les priorités sélectionnées manuellement pour chaque catégorie. Pour chaque mot, vous pouvez alors choisir la catégorie avec la plus haute priorité. Par exemple, vous voudrez peut-être de la viande « nourriture » plutôt que la substance chimique.

Vous pouvez également choisir des mots, que la priorité du changement si elles sont dans le chemin. Par exemple, si vous voulez des produits chimiques qui sont aussi des aliments, à annoncer que les produits chimiques, mais d'autres devraient encore être la nourriture.

arbre hyperonyme de WordNet se termine par un seul synset racine pour le mot « entité ». Si vous utilisez la bibliothèque C WordNet, vous pouvez obtenir un certain temps la structure récursive pour les ancêtres d'un synset en utilisant traceptrs_ds, et vous pouvez obtenir l'ensemble arbre synset par récursive suivant les pointeurs de nextss et ptrlst jusqu'à ce que vous frappez des pointeurs de null.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top