Seminar für Sprachwissenschaft

GermaNet - Eine Einführung

Was ist GermaNet?

GermaNet ist ein lexikalisch-semantisches Wortnetz, das deutsche Nomina, Verben und Adjektive semantisch zueinander in Beziehung setzt, indem es lexikalische Einheiten, die dasselbe Konzept ausdrücken, in Synsets zusammenfasst und semantische Relationen zwischen diesen Synsets definiert. GermaNet hat viel mit dem Englischen WordNet®  gemeinsam und kann als ein Online-Thesaurus oder als eine Lightweight-Ontologie betrachtet werden.

Die Elemente und die Struktur der Daten werden im Abschnitt Beschreibung ausführlich beschrieben.

GermaNet wurde 1996/7 von einer Forschungsgruppe des Fachbereichs Allgemeine Sprachwissenschaft und Computerlinguistik am Seminar für Sprachwissenschaft, Universität Tübingen entwickelt und wird seitdem im Rahmen verschiedener Projekte kontinuierlich erweitert und gepflegt. Das Basisvokabular von GermaNet ist in EuroWordNet (EWN), einem multilingualen Wortnetz, integriert worden.

Für eine weitergehende Einführung in GermaNet und EuroWordNet empfehlen wir Ihnen Kapitel 6.2 in Lothar Lemnitzer und Claudia Kunze: Computerlexikographie. Gunter Narr Verlag 2007. Sie können entweder diesen Text herunterladen oder online auf das vollständige Buch zugreifen. Für detailliertere wissenschaftliche Arbeiten, die sich auf GermaNet beziehen, schauen Sie sich bitte die entsprechenden Veröffentlichungen auf dieser Website an. 

Wie bekomme ich die Daten?

GermaNet ist für die wissenschaftliche Nutzung kostenfrei, es muss allerdings eine Lizenz unterschrieben werden. Um die Lizenz herunterzuladen und mehr über unsere F&E- und kommerziellen Lizenzen zu erfahren, gehen Sie bitte auf die Seite Lizenzen.

Gibt es Programmier-APIs?

Wir haben APIs für Java und Python entwickelt. Einzelheiten finden Sie im Abschnitt Anwendungen und Tools.

Gibt es Online-Tools?

GermaNet Rover kann verwendet werden, um die Daten zu untersuchen oder die semantische Verwandtschaft / Ähnlichkeit zwischen zwei Synsets zu berechnen. Es kann von jedem verwendet werden, der mit einer von Tausenden von akademischen Institutionen verbunden ist. Weitere Einzelheiten finden Sie im Abschnitt Anwendungen und Tools.

Aktuelle Größe von GermaNet (Version 15.0, Mai 2020)

  • Synsets: 144113
  • Lexikalische Einheiten: 185000
  • Literale: 169521
  • 1,28 lexikalische Einheiten pro Synset
  • Anzahl konzeptueller Relationen: 157921
  • Anzahl lexikalischer Relationen: 12203 (Synonymie ausgenommen)
  • Anzahl segmentierter Komposita: 98905
  • Anzahl von ILI-Einträgen (Interlingual Index): 28564 (separater Download)
  • Anzahl der Bedeutungsbeschreibungen aus Wiktionary: 29548 (separater Download)