Seminar für Sprachwissenschaft

Anwendungen und Tools


Sobald Sie die Lizenz unterschrieben haben, erhalten Sie die Daten als Archivdatei, typischerweise per Download. Die Daten sind in XML und als Datenbank-Dump verfügbar. Wir bieten verschiedene Tools und Anwendungsprogrammier-Schnittstellen an, mit denen auf diese Daten zugegriffen werden kann, einschließlich Rover (einem Tool für Online-Suche und semantische Verwandtschaft) und APIs für Java und Python.

Rover

GermaNet Rover ist eine Online-Anwendung, die zur Nutzung der GermaNet-Daten oder zur Berechnung der semantischen Verwandtschaft/Ähnlichkeit zwischen zwei Synsets verwendet werden kann. Sie bietet Visualisierungen und erweiterte Filteroptionen für die Synset-Suche. Die Anwendung ist nicht nur auf Lizenznehmer beschränkt, sondern sie kann von jedem verwendet werden, der mit einer der vielen akademischen Institutionen verbunden ist, die auf der Anmeldeseite aufgeführt sind. Sie werden aufgefordert, Ihre akademische Einrichtung auszuwählen, und nach erfolgreicher Anmeldung dort werden Sie zurück zu Rover geleitet.
Wenn Sie Zugangsdaten an einer akademischen Einrichtung haben, die NICHT aufgeführt ist, können Sie Zugang zu Rover erhalten, indem Sie einen CLARIN-Account beantragen und als Motivation angeben, dass Sie Zugang zu GermaNet Rover wünschen.

APIs

Die Python- und Java-APIs haben beide die gleiche Funktionalität, einschließlich:

  • erweiterte Suchkonfiguration (reguläre Ausdrücke, Bearbeitungsabstand, ausgewählte Wortarten, Wortklassen, orthografische Formen)
  • semantische Ähnlichkeitsberechnungen mit 6 unterschiedlichen Methoden
Frequenzlisten zur Verwendung mit der API:

Einige semantische Ähnlichkeitsberechnungen enthalten Frequenzinformationen über Wörter. Um diese Methoden zu verwenden, sind drei Dateien (mit Frequenzinformationen für jede Wortart) erforderlich. Wir stellen Frequenzlisten zur Verfügung, die auf großen deutschen Korpora aus dem COW-Projekt basieren. Wenn Sie eine Methode verwenden, die auf den Frequenzlisten beruht (IC-basierte Methoden), zitieren Sie bitte COW14 und COW16 und erstatten Sie dem COW-Projekt Bericht über Ihre Publikation.

Python API

Der Quellcode und die Tutorials sind auf GitHub verfügbar.

  • Python API: Docs  für GermaNet-Versionen 13.0, 14.0, 15.0, 16.0, 17.0, 18.0

Sie können die Python-API als Python-Package installieren über:

pip install germanetpy

Java API

Der Quellcode und die Tutorials sind auf GitHub verfügbar.

  • Java API 13.3.0: Javadocs  for GermaNet versions 13.0, 14.0, 15.0, 16.0, 17.0, 18.0
    • Performance-Verbesserungen
  • Java API 13.2.1: Javadocs für GermaNet Versionen 13.0, 14.0, 15.0, 16.0, 17.0, 18.0
    • Neu: erweiterte Suchfilter, Methoden zur Berechnung der semantischen Ähnlichkeit
  • Java API 13.1.0: Javadocs für GermaNet Versionen 13.0, 14.0, 15.0, 16.0, 17.0, 18.0

Wie man die API-Version auswählt

Verwenden Sie die aktuellste Version der API, die für Ihre Releasedaten geeignet ist.

Die Versionsnummern sind unterteilt, wobei der erste Teil das erste Release angibt, für die die API geeignet ist, und der zweite und optionale dritte Teil größere bzw. kleinere Korrekturen entsprechend angeben. Die API wird auch für nachfolgende Releases weiter funktionieren, bis sich die Struktur der Daten ändert.

Zum Beispiel:
Version 13.2.1 hatte 2 größere Updates, 1 kleineres Update und funktioniert für die Releases ab 13.0

Falls Sie nur die jar-Datei benötigen, gehen Sie zum Maven Repository, wählen Sie die Version aus, dann "Download" -> "jar".

Falls Sie Maven verwenden, fügen Sie die folgende dependency Ihrer pom-Datei hinzu:

<dependency>
    <groupId>de.tuebingen.uni.sfs.germanet</groupId>
    <artifactId>germanet-api</artifactId>
    <version>13.3.0</version>
</dependency>

germanet-common Javascript Library

germanet-common ist eine Javascript Programmbibliothek, die sich zur
Entwicklung der Web-Anwendungen mit GermaNet-Daten eignet. Die
Bibliothek ermöglicht es, die unterschiedlichen GermaNet Datentypen
über eine JSON API abzurufen, und bietet verschiedene
Render-Funktionen für diese Daten.

Die Programmbibliothek ist mit React und Redux aufgebaut und verwendet
CSS von Bootstrap. Der Quellcode ist auf GitHub verfügbar und kann als
Softwarepaket über NPM installiert werden.

Ältere Software (veraltet)

Semantic Relatedness API (API für semantische Verwandtschaft)

Methoden zur Berechnung der semantischen Verwandtschaft sind jetzt in den Java- und Python-APIs enthalten, und die Funktionalität dieses Tools ist zum großen Teil in GermaNet Rover verfügbar (vollständige Portierung in Vorbereitung). Es wird empfohlen, eine der anderen Alternativen zu verwenden, da die Semantic-Relatedness-API in Zukunft nicht mehr gewartet wird.

Um die semantische Verwandtschaft zwischen zwei beliebigen Wörtern/Lesarten in GermaNet zu berechnen, können Sie die in Java implementierte API für semantische Nähe verwenden:

  • Semantic Relatedness API 13.0: Sie können die neueste Version (13.0) der Semantic Relatedness API hier herunterladen (einschließlich Quellcode). Diese Version ermöglicht die Verarbeitung von Wortpaaren aus einer Datei, das Filtern nach Wortarten und das Speichern der Ergebnisse als csv-Datei. Diese API kann für GermaNet-Versionen 13.0, 14.0. 15.0 verwendet werden. Die Dokumentation finden Sie im beiliegenden Tutorial oder in der Online-Javadoc-Dokumentation.

GermaNet-Explorer

Die GermaNet-Daten können nun mit GermaNet Rover untersucht werden. Der GermaNet-Explorer wird in Zukunft nicht mehr gewartet.

Der GermaNet-Explorer ist eine Software zur Visualisierung von GermaNet. Er erlaubt es, alle lexikalischen Einheiten (Lesarten) und Synsets eines Wortes darzustellen. Darüber hinaus kann er alle semantischen Beziehungen in strukturierter Form darstellen. Eine visuelle graphische Navigation durch GermaNet ist möglich.

Diese Software wurde ursprünglich im Rahmen des Projekts "Hypertextualisierung auf textgrammatischer Grundlage" (HyTex) an der Universität Dortmund entwickelt. Der GermaNet-Explorer wurde von Marc Finthammer, Universität Dortmund, programmiert und an der Universität Tübingen an die neuen Java-APIs angepasst.

GernEdiT - The GermaNet Editing Tool

Obwohl größere Aktualisierungen an dieser GernEdiT-Desktop-Anwendung nicht mehr vorgenommen werden können, gibt es weiterhin kleinere Updates, damit diese Anwendung so lange wie möglich mit den neuen Releasedaten funktioniert.

GernEdiT ist ein grafischer Editor, der von den Lexikografen verwendet wird, um lexikografische Daten in die GermaNet-Datenbank GermaNet-Datenbank einzugeben. Er bietet eine grafische Benutzeroberfläche für die Datenbank, die hauptsächlich die Pflege der GermaNet-Daten auf benutzerfreundliche Weise ermöglicht. Es gibt mehrere Möglichkeiten, Daten zu suchen und den GermaNet-Graphen zu durchsuchen. Diese Funktionalitäten unterstützen die Lexikografen unter anderem dabei, den geeigneten Platz in der Hierarchie für das Einfügen neuer Synsets und lexikalischer Einheiten zu finden. GernEdiT ist frei zum Download verfügbar:

Some flash movies show GernEdiT in action:

  • GernEdiT flash movie 1: Grundlegende Suchfunktionalität, Liste der konzeptuellen Relationen, Hyperonymiegraph, Verbrahmen und Beispiele, Ansicht der Bearbeitungsvorgänge mit Filterfunktionalität, Liste aller lexikalischen Einheiten
  • GernEdiT flash movie 2: Neue konzeptuelle Beziehung hinzufügen, konzeptuelle Relation löschen, konzeptuelle Relation verfolgen, Liste mit allen Synsets mit ihren Such- und Filterfunktionalitäten
  • GernEdiT flash movie 3: Neues Synset mit lexikalischer Einheit einfügen, neue lexikalische Einheit einfügen, lexikalische Einheit löschen, Synset löschen

Für weitere Informationen zu GernEdiT schauen Sie:  The GermaNet Editing Tool