Pregunta

Por ejemplo...

El pollo es un animal.
burrito es un alimento.

WordNet le permite hacer "is-a"... la función de jerarquía.

Sin embargo, ¿cómo sé cuándo dejar de subir al árbol?Quiero un NIVEL.
Eso es consistente.

Por ejemplo, si se me presentan un montón de palabras, quiero que WordNet las categorice todas, pero en un cierto nivel, para que no suba demasiado.Categorizar "burrito" como una "cosa" es demasiado amplio, pero "comida mexicana envuelta" es demasiado específico.Quiero subir o bajar en la jerarquía... hasta el NIVEL correcto.

¿Fue útil?

Solución

WordNet es un léxico en lugar de una ontología, así que realmente no se aplican 'niveles'.

Hay SUMO , que es una ontología superior, que se relaciona con WordNet si quieres un entramado dirigido en lugar de una red.

En algunos dominios, la ontología de nivel medio de SUMO es, probablemente, en la que desea buscar, pero no estoy seguro de que tiene 'alimentos envueltos mexicano', ya que la mayoría de sus temas son científicos o de ingeniería.

WordNet de jerarquía es

beef burrito < burrito < dish/2 < victuals < food < substance < entity. 

Entidad es un concepto de nivel superior, por lo que si usted deja una sola sustancia a continuación obtendrá alimentos burrito ISA. Se puede calcular un nivel basado en eso, pero no lo puedo' necesariamente tan consistente como SUMO, o generar su propio conjunto de conceptos de nivel medio útil para terminar en. No hay ningún paso 'alimentos envueltos mexicana' en WordNet.

Otros consejos

[ Se ruega referir a Pete Kirkham , llegó por primera vez con la referencia a SUMO que bien puede responder a la pregunta hecha por Alex, el OP]

(sólo estoy proporcionando un complemento de la información aquí; Empecé en un campo de comentarios pero pronto se quedó sin espacio y de la disposición Capabilites ...)

Alex La mayoría de sumo es la ciencia o la ingeniería? No contiene todos los días palabras como alimentos, personas, coches, empleos, etc?
Pete K SUMO es una ontología superior. Las ontologías de nivel medio (donde se encontraría entre los conceptos 'cosa' y 'burrito de carne') aparece en la página no incluyen alimentos, pero reflejan el tipo de organizaciones que financian el proyecto. Hay una ontología de nivel medio para las personas. También hay una para las industrias (y por tanto puestos de trabajo), incluyendo los proveedores de alimentos, pero ninguna mención de burritos si GrEP que .

Mis dos centavos
100% de WordNet (3,0 es decir, la última, así como las versiones anteriores) es asignado a a SUMO, y que pueden Alex ser lo necesitan. Las ontologías de nivel medio asociados con SUMO (o más bien con MILO) son efectivamente en dominios específicos, y no lo hacen, en este momento, Productos alimenticios incluyen, pero desde hace WordNet (incluyen todos -bueno, muchos de- estas cosas de todos los días) lo hace no es necesario aprovechar cualquier ontología formal "en" SUMO, pero en lugar de utilizar la asignación de WordNet de Sumo (posiblemente además de WordNet, que, de nuevo, no es una ontología pero con su "jerarquía" informal y suelto también puede ayudar.

Algunos dificultad puede surgir, sin embargo, de dos áreas (y algo más ;-)?):

  • "nivel" de la ontología SUMO puede no ser el nivel que tendría en cuenta para su aplicación particular. Por ejemplo, mientras que " Burrito " trae " Alimentación ", en la entidad de nivel superior en SUMO " pollo " trae bien " pollo ", que sólo a través de una larga cadena hallazgos " Animal "(específicamente: pollo-> de aves de corral> Bird-> Warm_Blooded_Vertebrae-> Vertebrae-> animales)
  • .
  • cobertura y los metadatos del Wordnet es impresionante, pero con respecto a los conceptos de nivel medio puede ser un poco inconsistente. Por ejemplo, "nuestro" hypernym del Burrito es apropiada "del plato", que le proporciona alrededor de 140 platos de comida, que incluye los genéricos tales como "sopa" o "cazuela", así como "pollo Marengo" (pero omitiendo decir "Pollo Cacciatore")

Mi punto, en la crianza de estos temas, no es criticar WordNet o SUMO y sus ontologías relacionadas, sino simplemente para ilustrar algunos de los problemas asociados con la construcción de la ontología, sobre todo en el nivel medio.

Independientemente de algunos de los posibles defectos y carencias de una solución basada en SUMO y WordNet, un uso pragmático de estos marcos bien puede "ajustarse a la ley" (85% del tiempo)

Con el fin de conseguir los niveles, es necesario definir previamente el contenido de cada nivel. Una ontología define a menudo estos como los niños is_a inmediatos de un concepto específico, pero si que es ausente, es necesario desarrollar un método para que usted mismo.

El siguiente paso es poner una prioridad en cada concepto, en caso de que desee presentar una sola categoría para cada palabra. La prioridad se puede hacer de varias maneras, por ejemplo, como el recuento de las relaciones entre is_a la categoría y la palabra, o las prioridades seleccionadas manualmente para cada categoría. Para cada palabra, a continuación, puede elegir la categoría con la más alta prioridad. Por ejemplo, es posible que desee para carne para "comida" en lugar de la sustancia química.

También es posible que desee tomar algunas palabras, que la prioridad del cambio si se encuentran en el camino. Por ejemplo, si desea que algunos productos químicos que también son alimentos, que se anunciará como productos químicos, pero otros todavía deben ser alimentos.

El árbol de hiperónimos de WordNet termina con un conjunto sintético de raíz única para la palabra "entidad".Si está utilizando la biblioteca C de WordNet, puede obtener una estructura recursiva while para los ancestros de un conjunto sintetizador usando traceptrs_ds, y puede obtener el árbol synset completo siguiendo recursivamente nextss y ptrlst punteros hasta llegar null punteros.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top