Universität Hamburg Institut für Romanistik Logo Institut für Romanistik
Universität Hamburg
  UHH : Fachbereich 07 SLM : Institut für Romanistik : Forschung : Metapherndatenbank : Projektbeschreibung Suche  
Unterpunkt Literaturliste
Unterpunkt Linkliste
Unterpunkt WordNet-Einführung
Unterpunkt Teil-Evaluation EuroWordNet

Schnell-Einführung WordNet

Das "Original-WordNet" (Princeton WordNet) ist eine lexikalische Datenbank für das Englische. Die Einträge sind Synonymgruppen, sogenannte Synsets. Zwischen Synsets können Beziehungen wie Hyperonymie, Meronymie und Antonymie bestehen. Durch die Hyperonymstrukturen ergeben sich Hierarchien. Die folgenden drei Beispiele zeigen verschiedene Bedeutungen des Lexems cherry, das als sogenanntes "literal" in mehreren Synsets vorkommt. Abgebildet werden die Hyperonymstrukturen für die Synsets {cherry:1}, {cherry:2, cherry tree:1} und {cherry:3}.

cherry1

Die blauen Einträge [M...] zeigen an, dass {cherry:1} und {cherry:3} Meronyme von {cherry:2} sind:

cherry2 cherry3

Das EuroWordNet war ein europäisches Projekt, in dem WordNets für acht europäische Sprachen erstellt und über einen gemeinsamen Index miteinander verknüpft wurden. Aus der folgenden Abbildung ist ersichtlich, dass die Synsets arbre:1 (frz.) und Baum:2 (dt.) dieselbe Indexnummer (ILI) haben.

arbre und Baum

Konventionalisierte Metaphern sind im (Euro)WordNet keine Seltenheit. Die Verbindung zur Ausgangsbedeutung wird jedoch nicht dargestellt. (Weitere Probleme sind aus der folgenden Abbildung ersichtlich.)

Baumstruktur

Intern erfolgt die Darstellung von WordNets in standardisierten Formaten; das aktuelle, z. B. vom WordNet-Bearbeitungstool VisDic benutzte Format ist XML. In XML werden sogenannte "Tags" (Auszeichnungseinheiten) verwendet, um die unterschiedlichen Teile eines WordNet-Eintrags (Synsets) zu identifizieren. Der XML-Eintrag für das Synset {cherry:1} lautet z. B. wie folgt:

<SYNSET>
   <ID>ENG171-10581096-n</ID>
   <POS>n</POS>
   <SYNONYM>
      <LITERAL>cherry<SENSE>1</SENSE></LITERAL>
   </SYNONYM>
   <ILR><TYPE>hypernym</TYPE>ENG171-12772693-n</ILR>
   <ILR><TYPE>holo_portion</TYPE>ENG171-10580713-n</ILR>
   <DEF>wood of any of various cherry trees especially the black cherry</DEF>
</SYNSET>
  Impressum   Letzte Änderung: 01.04.2004