Pregunta

Tengo una pregunta acerca del archivo de formato de datos WordNet. El wndb (5) en el manual dice en parte:

  

El campo de origen / destino distingue punteros léxicas y semánticas. Es un campo de cuatro bytes, que contiene dos números enteros hexadecimales de dos dígitos. Los dos primeros dígitos indican el número de palabra en el synset (fuente) actual, los dos últimos dígitos indican el número de la palabra en el synset objetivo. Un valor de 0000 indica que pointer_symbol representa una relación semántica entre el synset corriente (fuente) y el synset objetivo indicado por synset_offset.

     

A relación léxica entre dos palabras en diferentes synsets está representado por no cero valores en el número de palabras de origen y destino. Los primeros y últimos dos bytes de este campo indican los números de palabras en los de origen y destino synsets, respectivamente, entre los cuales posee la relación. número de palabras se asignan a los campos de Word en un synset, de izquierda a derecha, empezando por 1.

entiendo el segundo párrafo cuando los números de origen / destino no son cero, pero el significado de cuando el origen / destino son "0000" todavía no está claro para mí.

Permítanme poner un ejemplo para la palabra "aristócrata". La entrada index.noun es:

  

aristócrata n 1 4 @ ~ # m + 1 0 09807754

y la correspondiente data.noun entrada es:

  

09807754 18 n 03 aristócrata 0 blue_blood 0 patricio 0 013 @ 09623038 n 0000 #m 08388207 n 0000 + 01590484 un 0,306 + 01590484 un 0,102 ~ 09840639 n 0000 ~ 09872782 n 0000 ~ 10083823 n 0000 ~ 10175090 n 0000 ~ 10285135 n 0000 ~ 0000 ~ n 10472799 10474064 10505732 n 0000 ~ 0000 ~ n 10506642 n 0000 | un miembro de la aristocracia

la primera "ptr" para los que es:

  

@ 09623038 n 0.000

y que la entrada data.noun comienza con:

  

09623038 18 01 n líder 0 058 @ 0000 00007846 n ...

Lo que no está claro para mí son los que de palabra (s) esta relación son para. ¿El hypernym ( "@") de retención relación sólo la palabra original ( "aristrocrat") para todas las palabras del synset destino (en este caso, sólo hay "líder")?

O es que la bodega relación de todas las palabras del synset fuente ( "aristócrata", "sangre azul", y "patricio") para todas las palabras en el synset objetivo?

¿Fue útil?

Solución

La relación de hecho se mantiene para todas las palabras en la synset fuente a todas las palabras en el objetivo synset .

Esto no quiere decir que el líder es siempre un hiperónimo de aristócrata, pero es válido para el sentido estimada de aristócrata (un miembro de la aristocracia) y el sentido de considerar del líder (una persona que gobierna o guías o inspira a los demás) . Algunas relaciones pueden sonar raro, pero WordNet no es perfecto y no puede ser.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top