Seminar für Sprachwissenschaft

Im folgenden sind die von der Quantitativen Linguistik bearbeiteten und ausgelaufenen Projekte aufgeführt. Die aktuellen Projekte befinden sich unter Projekte.

BMBF-EML

Spoken Morphology: Phonetics and phonology of complex words

Exzellenzcluster - Machinelles Lernen für die Wissenschaft (Cluster Sprecher: Philipp Berens, Cluster Sprecherin: Ulrike von Luxburg)

Website

Details zu BMBF-EML

Innovation Fund Projekt 1 in Forschungsbereich A - Verstehen jenseits einfacher Vorhersagen

Im Forschungsbereich A arbeiten wir an Algorithmen, die koplexe Strukturen und kausale Zusammenhänge in Daten erkennen, um maschinelles Lernen besser in den wissenschaftlichen Erkenntnisprozess zu integrieren. In  Projekt 1 untersuchen wir "Enhancing Machine Learning of Lexical Semantics with Image Mining".

Mitarbeiter

  • Hendrik Lensch (Projektleiter)
  • R. Harald Baayen (Projektleiter)
  • Zohreh Ghaderi (Doktorandin)
  • Hassan Shahmohammadi (Doktorand)

DFG-ART

Spoken Morphology: Phonetics and phonology of complex words

Projektleiter: R. Harald Baayen

Homepage

Details zu DFG-ART

Zusammenfassung

Tübinger Teilprojekt in DFG-ART

In Tübingen haben wir als Teil des DFG-ART Projekts die Artikulation morphologisch komplexer Wörter mit Hilfe von Elektromagnetischer Artikulografie erforscht. Das Projekt wurde von der Deutsche Forschungsgemeinschaft finanziell unterstützt.

Mitarbeiter

  • R. Harald Baayen (Projektleiter)
  • Benjamin V. Tucker (Mercator Fellow)
  • Fabian Tomaschek (Postdoktorand)
  • Motoki Saito (Doktorand)

ERC-WIDE

Wide Incremental learning with Discrimination nEtworks

Projektleiter: R. Harald Baayen

Webpage

Details zu ERC-WIDE

Zusammenfassung

In dem Projekt WIDE (Wide Incremental learning with Discrimination nEtworks) wurde versucht einen tieferen Einblick zu gewinnen, wie wir in der Alltagssprache Wörter bilden und verstehen.

Wörter können sich in alltäglichen Unterhaltungen deutlich von der geschriebenen Form unterscheiden: Im Deutschen wird „würden“ häufig als „wün“ ausgesprochen, im Niederländischen „natuurlijk“ (‚natürlich‘) zu „tk“ reduziert, und im chinesischen Mandarin wird 要不然 (jao pu zan, ‚andererseits‘) zu „ui“. Gängigen Theorien zufolge werden die Klangwellen, die unsere Ohren erreichen, zu Abfolgen abstrakter Lauteinheiten reduziert – ähnlich wie die Aneinanderreihung von Buchstaben, die geschriebene Wörter ergeben. Um die Bedeutung einer Äußerung zu erfassen, müssten die stark reduzierten Formen wie „wün“, „tk“ und „ui“ den entsprechenden ungekürzten Formen zugeordnet werden. Wie das als Rechenanleitung im Computer gelingen soll, ist ein bisher ungelöstes Problem.

Dem Projekt WIDE war den radikalen Vorschlag zugrunde gelegt, die buchstabenähnlichen Lauteinheiten ganz beiseite zu lassen und sich stattdessen auf die vielfältigen Details des Sprachsignals selbst zu konzentrieren. Ausgehend von den zehntausenden veränderlichen Merkmalen eines Sprachsignals will man künstliche neurale Netzwerke durch Versuch und Irrtum lernen lassen, welche Bedeutungen jeweils gemeint sind. In früheren Forschungsarbeiten, die von der Alexander von Humboldt-Stiftung gefördert wurden, konnte man bereits belegen, dass diese Vorgehensweise grundsätzlich Erfolge zeitigt. Im WIDE-Projekt wurde dieser Ansatz weiterentwickelt und über das Deutsche hinaus auf andere Sprachen ausgedehnt, darunter die tonale Sprache Mandarin und Estnisch, eine komplexe Sprache mit 28 bis 40 verschiedenen Formen eines Substantivs. Im WIDE-Projekt wollte man auch ein Computermodell zur Formung von Wörtern in der gesprochenen Sprache ohne den Einsatz von buchstabenähnlichen Lauteinheiten entwickeln.

Der Projektname „WIDE“ hebt einen zweiten Aspekt hervor, in dem das Projekt eine radikale Abkehr von gängigen Ansätzen in der Linguistik und bei der Erforschung der Verarbeitung natürlicher Sprache vornahm: Statt tiefe vielschichtige lernende Netzwerke zu verwenden, konzentrierte man sich auf das Potenzial ‚weiter‘, ausgedehnter, aber nur zweischichtiger Netzwerke mit Zehntausenden von Ein- und Ausgangseinheiten.

Mitarbeiter

  • R. Harald Baayen (Professor, Projektleiter)

  • Yu-Ying Chuang (Postdoktorandin)

  • Maja Linke (Doktorandin)

  • Jessie Nixon (Postdoktorandin)

  • Maria Heitmeier (Doktorandin)

  • Tino Sering (Doktorand)

  • Elnaz Shafaei Bajestan (Doktorandin)

  • Kun Sun (Postdoktorand)


BMBF-AvH-NDL

Alexander von Humboldt Professur: Naive discrimination learning

Projektleiter: R. Harald Baayen

Homepage

Details zu BMBF-AvH-NDL

Zusammenfassung

BMBF-AvH-NDL ist ein Projekt, das von der Alexander von Humboldt Stiftung und von dem Bundesministerium für Bildung und Forschung (BMBF) finanziert wird und die Sprachverarbeitung aus der Sicht des Naive Discrimination Learnings erforscht.

Naive Discrimination Learning ist ein computergestützter Ansatz zur Modellierung, welches die reiche Fülle an wiederkehrender Information in der Sprachform auswertet, um zwischen verschiedenen Bedeutungen zu unterscheiden. Dieses Projekt konzentriert sich auf die lexikalische Verarbeitung beim stillen Lesen, beim Vorlesen, beim Zuhören und in der Sprachproduktion. Außerdem werden Aspekte von Spracherwerb, Zweisprachigkeit, Syntax und Sprachwandel durch das Projekt untersucht.

Presentationen:           NDL-Humboldt Presentationen

Publikationen:              NDL-Humboldt Publikationen

Mitarbeiter

  • R. Harald Baayen (Projektleiter)

  • Michael Ramscar (Leitender Wissenschaftler)

  • Denis Arnold (Wissenschaftler)

  • Peter Hendrix (Wissenschaftler)

  • June Hendrix-Sun (Wissenschaftlerin)

  • Koji Miwa (Wissenschaftler)

  • Fabian Tomaschek (Wissenschaftler)

  • Karlina Denistia (Doktorandin)

  • Konstantin Sering (Doktorand)

  • Ben Tucker (Externer Mitarbeiter)

  • Tineke Baayen-Oudshoorn (Verwaltung)

  • Ryan Callihan (Wissenschaftlicher Hilfskraft BA)

  • Rachel Dockweiler (Wissenschaftliche Hilfskraft BA)

  • Gina Hermann (Studentische Hilfskraft)

  • Theresa Schmitt (Studentische Hilfskraft)

  • Marc Weitz (Studentischer Hilfskraft)


SSHRC RESEARCH GRANT

Lexical processing in discourse: a corpus- based approach

Hauptantragsteller: R. Harald Baayen

SSHRC Standard Research Grant

Details zu SSHRC RESEARCH GRANT

Zusammenfassung

Der SSHRC Research Grant lief von 2008 bis 2011.

Mitarbeiter

  • R. Harald Baayen
  • Peter Hendrix

NWO KLEIN PROGRAMMA

Morphophonological adaption in spoken Dutch: An examplar-based approach

Hauptantragsteller: R. Harald Baayen

NWO Homepage

Details zu NWO KLEIN PROGRAMMA

Zusammenfassung

Das von der Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) finanzierte NWO Klein Programma erlaubte Harald Baayen zwischen 2003 und 2008 daran zu forschen, ob sich morphologische Anpassungen hauptsächlich in hochfrequenten Worten des Niederländischen zeigen.

Mitarbeiter

  • R. Harald Baayen
  • Mirjam Ernestus
  • Mark Pluymakers

NWO PIONIER

The balance of storage and computation in the lexicon

Projektleiter: R Harald Baayen

NWO Forschungs Berichte

Details zu NWO PIONIER

Zusammenfassung

Das von der Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO) finanzierte NWO Pionier erlaubte Harald Baayen zwischen 1998 und 2003 daran zu forschen, inwiefern das mentale Lexikon Dinge abspeichert oder diese berechnet werden.

Mitarbeiter

  • R. Harald Baayen
  • Mirjam Ernestus
  • Nivja de Jong
  • Rachèl Kemps
  • Andrea Krott
  • Fermín Moscoso del Prado Martín