Uni-Tübingen

A3

Korpusbasierte semantische Kompositionsmodelle für Phrasen

Das A3-Projekt befasst sich mit Modellen der semantischen Komposition von deutschen und englischen Phrasen. Dabei liegt der Fokus auf Adjektiv-Nomen-Phrasen und Präpositionalphrasen. Für die computerlinguistische Modellierung werden distributionelle Wortrepräsentationen und sog. Deep Learning Methoden, im Speziellen rekurrente neuronale Netze (RNN), verwendet.

Die Beziehung zwischen Komposition und Parsing ist hier von besonderem Interesse. Bestehende Kompositionsmodelle, die in Parser integriert wurden, werden normalerweise zusammen mit dem Parser durch überwachtes Lernen trainiert. Bei den Trainingsdaten handelt es sich meist um Daten aus Baumbanken. Im Gegensatz dazu werden in unserem Ansatz Kompositionsmodelle durch unüberwachtes Lernen mit großen geparsten Korpora trainiert. Die semantische Darstellung der Phrasen, die durch diese vortrainierten Kompositionsmodelle erstellt werden, können anschließend in einen Parser eingebaut werden, um dessen Genauigkeit beim Parsen zu verbessern.

Bewertet werden die Kompositionsmodelle anhand verschiedener Aufgaben, unter anderem durch die Klassifizierung semantischer Relationen, die Desambiguierung von PP-Bindungen, das Erkennen textueller Folgebeziehungen und der Text-Bild-Abruf.


Projektleitung

Prof. Dr. Erhard W. Hinrichs

+49(0) 7071-29-75446
Fax: +49(0) 7071-29-5214
ehspam prevention@sfs.uni-tuebingen.de

Seminar für Sprachwissenschaft
Wilhelmstr. 19
72074 Tübingen

Webseite

Dr. Daniël de Kok

daniel.de-kokspam prevention@uni-tuebingen.de

Gastwissenschaftler an der Universität Groningen

Oude Kijk in 't Jatstraat 26
9712 EK Groningen
Niederlande

Webseite


Mitarbeiter/-innen

Corina Dima

 +49(0) 7071-29-73953
corina.dimaspam prevention@uni-tuebingen.de

Seminar für Sprachwissenschaft
Wilhelmstraße 19, Raum 3.24
72074 Tübingen

Webseite

Patricia Fischer

+49(0) 7071-29-73953
patricia.fischerspam prevention@uni-tuebingen.de

Seminar für Sprachwissenschaft
Wilhelmstraße 19, Raum 3.24
72074 Tübingen

Webseite


Assoziiert

Jochen Saile

+49(0) 7071-29-78487
sailespam prevention@sfs.uni-tuebingen.de

Seminar für Sprachwissenschaft
Wilhelmstraße 19, Raum 2.25
72074 Tübingen


Studentische Hilfskräfte


Ehemalige Mitarbeiter/-innen (assoziiert) und studentische Hilfskräfte

Jianqiang Ma

Webseite

Dr. Heike Telljohann

Reinhild Barkey

Webseite

Dr. Dörte de Kok

Webseite

Dr. Verena Henrich

Webseite

Daniil Sorokin

Webseite

Christina Hoppermann

Dr. Yannick Versley

Webseite

Stefanie Simon

Webseite

Sabrina Schulze

Anne Brock

Studentische Hilfskräfte

Kathrin Adlung

Nadine Balbach

Tabea Sanwald

Holger Gauza

Janne Berlacher

Melike Heubach

Anna Gastel