Question

J'ai une question sur les données de WordNet format de fichier. Le wndb (5) dans le manuel dit en partie:

  

Le champ de source / cible distingue des pointeurs lexicales et sémantiques. Il est un champ de quatre octets, contenant deux entiers hexadécimaux à deux chiffres. Les deux premiers chiffres indiquent le nombre de mots dans la (source) courant synset, les deux derniers chiffres indiquent le nombre de mots dans le synset cible. Une valeur de 0000 signifie que pointer_symbol représente une relation sémantique entre le courant (source) synset et le synset cible indiquée par synset_offset.

     

Une relation lexicale entre deux mots différents dans synsets est représenté par des valeurs non nulles dans les sources et cibles nombre de mots. Les premiers et les deux derniers octets de ce champ indiquent le nombre de mots dans la source et synsets cible, respectivement, entre lesquels la relation détient. numéros de mots sont affectés aux champs de mot dans un synset, de gauche à droite, en commençant par 1.

Je comprends le deuxième paragraphe, lorsque la source / numéros cibles ne sont pas nuls, mais le sens du moment où la source / cible sont « 0000 » est toujours pas clair pour moi.

Permettez-moi de prendre un exemple pour le mot « aristocrate ». L'entrée index.noun est:

  

aristócrata n 1 4 @ ~ # m + 1 0 09807754

et la data.noun entrée est relative:

  

09807754 18 n 03 aristocrate 0 blue_blood 0 0 patricienne 013 @ n 09623038 0000 08388207 # min n 0000 + 01590484 + un 0306 01590484 a 0102 ~ 09840639 n 0000 ~ 09872782 n 0000 ~ 10083823 n 0000 ~ 10175090 n 0000 ~ 10285135 n 0000 ~ 0000 ~ n 10472799 10474064 n 0000 ~ 10505732 n 0000 ~ 10506642 n 0000 | un membre de l'aristocratie

le premier "PTR" pour ce qui est:

  

@ n 09623038 0000

et que l'entrée de data.noun commence par:

  

09623038 18 n 01 0 chef @ 058 00007846 n 0000 ...

Ce qui ne me sont clair pour ce qui mot (s) cette relation sont pour. Est-ce que hypernym ( « @ ») de maintien de la relation que pour le mot original ( « Aristrocrat ») à tous les mots dans le synset cible (dans ce cas, il n'y a que « leader »)?

Ou le maintien de la relation pour tous les mots de la source synset ( « aristocrate », « sang bleu » et « patricien ») à tous les mots dans le synset cible?

Était-ce utile?

La solution

La relation tient en effet pour tous les mots du synset source à tous les mots dans la cible synset .

Cela ne signifie pas que le leader est toujours un hypernym d'aristocrate, mais il est vrai pour le sens prononcé de l'aristocrate (un membre de l'aristocratie) et le sens considéré du dirigeant (une personne qui gouverne ou guides ou inspire les autres) . Certaines relations peuvent sembler bizarre, mais WordNet est pas parfait et ne peut pas être.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top