Professor Harald Baayen vom Seminar für Sprachwissenschaft der Universität Tübingen hat einen Advanced Grant des Europäischen Forschungsrats (European Research Council, ERC) eingeworben. Sein Projekt WIDE (Wide Incremental learning with Discrimination nEtworks), wird in den kommenden fünf Jahren mit rund 2,5 Millionen Euro gefördert. In dem Projekt WIDE will Baayen einen tieferen Einblick gewinnen, wie wir in der Alltagssprache Wörter bilden und verstehen.
Wörter können sich in alltäglichen Unterhaltungen deutlich von der geschriebenen Form unterscheiden: Im Deutschen wird „würden“ häufig als „wün“ ausgesprochen, im Niederländischen „natuurlijk“ (‚natürlich‘) zu „tk“ reduziert, und im chinesischen Mandarin wird 要不然 (jao pu zan, ‚andererseits‘) zu „ui“. Gängigen Theorien zufolge werden die Klangwellen, die unsere Ohren erreichen, zu Abfolgen abstrakter Lauteinheiten reduziert – ähnlich wie die Aneinanderreihung von Buchstaben, die geschriebene Wörter ergeben, berichtet Harald Baayen. Um die Bedeutung einer Äußerung zu erfassen, müssten die stark reduzierten Formen wie „wün“, „tk“ und „ui“ den entsprechenden ungekürzten Formen zugeordnet werden. Wie das als Rechenanleitung im Computer gelingen soll, ist ein bisher ungelöstes Problem.
Seinem Projekt WIDE legt Baayen den radikalen Vorschlag zugrunde, die buchstabenähnlichen Lauteinheiten ganz beiseite zu lassen und sich stattdessen auf die vielfältigen Details des Sprachsignals selbst zu konzentrieren. Ausgehend von den zehntausenden veränderlichen Merkmalen eines Sprachsignals will der Linguist künstliche neurale Netzwerke durch Versuch und Irrtum lernen lassen, welche Bedeutungen jeweils gemeint sind. In früheren Forschungsarbeiten, die von der Alexander von Humboldt-Stiftung gefördert wurden, konnte er bereits belegen, dass seine Vorgehensweise grundsätzlich Erfolge zeitigt. Im WIDE-Projekt soll dieser Ansatz weiterentwickelt und über das Deutsche hinaus auf andere Sprachen ausgedehnt werden, darunter die tonale Sprache Mandarin und Estnisch, eine komplexe Sprache mit 28 bis 40 verschiedenen Formen eines Substantivs. Im WIDE-Projekt will Baayen auch ein Computermodell zur Formung von Wörtern in der gesprochenen Sprache ohne den Einsatz von buchstabenähnlichen Lauteinheiten entwickeln.
Der Projektname „WIDE“ hebt einen zweiten Aspekt hervor, in dem das Projekt eine radikale Abkehr von gängigen Ansätzen in der Linguistik und bei der Erforschung der Verarbeitung natürlicher Sprache vornimmt: Statt tiefe vielschichtige lernende Netzwerke zu verwenden, konzentriert sich Baayen auf das Potenzial ‚weiter‘, ausgedehnter, aber nur zweischichtiger Netzwerke mit Zehntausenden von Ein- und Ausgangseinheiten.
Rolf Harald Baayen, 1958 in den USA geboren, kam 2011 als Alexander von Humboldt-Professor an die Universität Tübingen. Er hat den damals zusätzlich geschaffenen Lehrstuhl für Quantitative Linguistik am Seminar für Sprachwissenschaft der Philosophischen Fakultät inne. Baayen forschte zuvor am Department of Linguistics der University of Alberta, Edmonton, in Kanada. Er gilt als einer der international besten und innovativsten Forscher auf dem Gebiet der Wortschatzforschung und der quantitativen Linguistik. Er ist einer der Pioniere der computergestützten und empirischen Sprachforschung und Psycholinguistik und hat grundlegende Beiträge etwa zum Verständnis der menschlichen Sprachfähigkeit und zur Rolle des Gedächtnisses bei der Sprachverarbeitung geleistet.
Mit dem Advanced Grant unterstützt der Europäische Forschungsrat etablierte, aktive Wissenschaftlerinnen und Wissenschaftler mit einer herausragenden wissenschaftlichen Leistungsbilanz. Jedes Projekt eines Advanced Grants, der in allen Wissenschaftsbereichen vergeben werden kann, wird mit bis zu 2,5 Millionen Euro über maximal fünf Jahre finanziert.
Janna Eberhardt