Seminar für Sprachwissenschaft

Tools

IR4LL - Information Retrieval for Language Learning

Information Retrieval for Language Learning ist das Resultat einer Masterarbeit von Niels Ott. Derzeit gibt es eine Implementierung eines Prototyps und Frameworks, welche das Suchen und Finden von Texten einer bestimmten sprachlichen Schwierigkeitsstufe ermöglichen. Traditionelle Suchmaschinen ermöglichen hingegen nur das Suchen nach bestimmter Information in den Texten. 

Ziel des Projektes ist es einerseits, Lehrern schnellen Zugriff auf sprachlich passendes Lesematerial für den Einsatz im Unterricht zu ermöglichen. Andererseits sollen Lerner auch selbst nach Texten suchen können, die ihrem Sprachlevel entsprechen und gleichzeitig für sie interessant sind. 

Im Moment hat das System den Status eines frühen Prototyps. Eine wichtige Komponente, die noch fehlt, ist ein Webcrawler. Ohne diesen werden die Suchergebnisse binnen kurzer Zeit irrelevant, da der Index zunehmend veraltet. Ein Webcrawler ist aber mittlerweile in Entwicklung. 

 

RFTagger Java Interface

Der beliebte TreeTagger hat mit RFTagger einen würdigen Nachfolger gefunden. Damit dieser Tagger effektiv und effizient in Java-Programmen genutzt werden kann, wurde das RFTagger Java Interface entwickelt. Dieses Tool erlaubt es, den RFTagger auf den drei großen Plattformen auf der Kommandozeile zu starten, oder ihn in beliebigen Java-Projekten als Bibliothek zu benutzen. Zusätzlich stellt das RFTagger Java Interface eine Reihe an Ergänzungen zur Verfügung, von denen zwei besonders zu erwähnen sind: 

  • Die zusätzliche Ausgabe von STTS-Tags stellt die Kompatibilität zu anderen computerlinguistischen Werkzeugen für das Deutsche her.
  • Die Eingebaute Portierung des Perl-basierten Lemmatizers für das Deutsche, der mit dem Original mitgeliefert wird, erlaubt es, TreeTagger vollständig durch RFTagger zu ersetzen.

Kontakt: Ramon Ziai

 

TAGARELA - Teaching Aid for Grammatical Awareness, Recognition and Enhancement of Linguistic Abilities

TAGARELA ist ein intelligentes Sprachlernsystem für Portugiesisch, das für den Einsatz in Sprachkursen an Universitäten konzipiert ist. Es ist eine Art intelligentes Arbeitsbuch, das es Lernern ermöglicht, ihre Fähigkeiten im Lesen, Hören und Schreiben zu verbessern. Da es sich um ein webbasiertes System handelt, braucht man zur Benutzung lediglich einen Computer mit Internetzugang. 

TAGARELA wurde im Rahmen der MA-These von Ramon Ziai auf Basis des UIMA-Frameworks neu implementiert. Die neue Version beinhaltet den vollen Funktionsumfang des ersten TAGARELA und bietet darüberhinaus die folgenden Neuerungen: 

  • Echte und erweiterbare annotationsbasierte Verarbeitung
  • Dynamische Anpassung des Systems an Aufgabentypen, basierend auf einer Spezifikation der Aufgabe (activity model)
  • Dynamische Anpassung von Feedback an einzelne Lerner, basierend auf einfacher Lernermodellierung (student modeling)

Kontakt: Ramon Ziai

WELCOME - the Web-Based Learner Corpus Machine

WELCOME ist ein Werkzeug zur Sammlung von Korpusdaten, das sich derzeit im der Entwicklung befindet. Es wird im Rahmen des Projekts A4 des Sonderforschungsbereichs 833 entwickelt und ermöglicht die dezentrale Eingabe von Daten für strukturierte Korpora wie das Lernerkorpus, das für A4 erstellt wird. WELCOME ist webbasiert und benötigt lediglich einen Computer mit aktuellem Browser. 

 

Kontakt: Ramon Ziai

WERTi - Working with English Texts interactively

WERTI ist ein intelligentes Sprachlernsystem, das den Unterricht ergänzende Übungen und Ressourcen für Englischlerner bietet. Es stellt gewissermaßen eine intelligente, automatische Version des traditionellen Arbeitsbuches dar. Da die Übungen automatisch aus Webseiten generiert werden, ist ihre Anzahl theoretisch unbegrenzt. Die Übungen zielen darauf ab, beim Lerner Bewusstsein über grammatische Formen und Funktionen zu schaffen. Da es sich bei WERTi um ein webbasiertes System handelt, braucht man zur Benutzung lediglich einen Computer mit Internetzugang. 

Kontakt: Detmar Meurers