Seminar für Sprachwissenschaft

Tools

Weblicht: Web-basierte LRT Services

WebLicht ist eine Service Oriented Architecure (SOA) zur Erstellung annotierter Textcorpora. Sie wird seit Oktober 2008 im Rahmen des D-SPIN und des CLARIN-D Projekts gemeinsam mit Projektpartnern entwickelt.WebLicht umfasst 2011 ca. 130 Tools und Ressourcen zur Erstellung, Analyse und Visualisierung annotierter Textkorpora.
 

CASS

CASS ist ein finite-state Parser, der auf einer Kaskade von Automaten basiert. Er wurde auf Geschwindigkeit und Speicherbedarf optimiert.

CASS wurde von Steven Abney in seiner Tübinger Zeit entwickelt. Die jeweils aktuellste Version können Sie von seiner Homepage herunterladen.

 

BibTex-HTML Konverter

Unser BibTeX-XML-HTML-Paket wandelt eine (potenziell thematisch sortierte) BibTeX-Bibliographie in einen Satz HTML-Dateien um, um ihre Publikation im Internet zu ermöglichen.

Das Konversionsprogramm erstellt zunächst eine XML-Datei aus der BibTeX-Datei. XML besitzt den Vorteil, standardisiert, plattformunabhängig und allgemein gebräuchlich zu sein. Weiterhin lassen sich Dateien dieses Formats mit entsprechenden Tools leicht editieren und verwalten und mittels XSLT-Stylesheets in andere Formate wie HTML oder reinen Text exportieren. Unsere Programme erzeugen aus der XML-Repräsentation mehrere HTML-Dateien für die unmittelbare Veröffentlichung der Bibliographie im Internet.

Kontakt: Frank Richter

 

FSA Utilities

Die FSA Utilities sind eine Sammlung von Programmen zur Konstruktion von Automaten aus regulären Ausdrücken, zu deren Manipulation, Darstellung und zu ihrer Anwendung.

Diese Sammlung wurde in der Hauptsache von Gertjan van Noord an der Universität von Groningen in Zusammenarbeit mit Dale Gerdemann entwickelt.


Kontakt: Dale Gerdemann

 

LexParse

LexParse ist ein benutzerfreundliches, schnelles und flexibles Programm zum Parsen maschinenlesbarer Lexika. Es wendet vom Benutzer definierte Grammatiken auf Textdateien an. LexParse erkennt die einzelnen Lexikoneinträge und ihren internen Aufbau. Ebenso kann es die Ergebnisse in verschiedenen Formaten (als Baumstruktur, in SGML, in LaTeX) darstellen.

Kontakt: Lothar Lemnitzer

 

Trale

Das TRALE-System ist eine Implementierungsplattform für merkmalstrukturbasierte Grammatiken. Es entspringt unseren Erfahrungen mit der Entwicklung und Anwendung älterer Systeme für die Verarbeitung von Grammatiken im Stil der HPSG. Dabei versucht es, die Vorteile herkömmlicher, effizienter Parser mit einer möglichst getreuen Abbildung von theoretischen HPSG-Grammatiken auf computationelle Implementierungen zu vereinbaren.

Kontakt: Frank Richter