Pressemitteilungen

23.09.2015

Forscher verfolgen Verwandtschaft von Sprachen bis zurück in die Mittelsteinzeit

Methoden aus der Bioinformatik helfen, ganze Sprachfamilien einem gemeinsamen Ursprung zuzuordnen

In der historischen Sprachwissenschaft haben Forscherinnen und Forscher in den vergangenen 200 Jahren die Verwandtschaftsgeschichte menschlicher Sprachen rekonstruiert. Sie identifizierten weltweit mehr als 200 Sprachfamilien, die jeweils mehrere Jahrtausende alt sind. Um noch weiter, über 10.000 Jahre hinaus, in die Geschichte der Sprachen zu blicken, hat Professor Gerhard Jäger vom Seminar für Sprachwissenschaft der Universität Tübingen mit seiner Forschungsgruppe einen neuen Ansatz gewählt: Er wendet Methoden zur Abstammungsforschung aus der Bioinformatik an, um einen riesigen Datenbestand zum Kernvokabular von 6.000 Sprachen auf die Ähnlichkeit bestimmter Wortformen zu untersuchen. Die Ergebnisse bestätigen frühere Vermutungen, dass sowohl Eurasiatisch als auch Austro-Tai sogenannte Makro-Familien bilden, die jeweils mehrere Sprachfamilien umfassen. Eurasiatisch umfasst unter anderem die altaischen, tschuktscho-kamtschadalischen, indo-europäischen und uralischen Sprachen. Austro-Tai besteht aus den austronesischen und den Tai-Kadai-Sprachen Südostasiens. Die Studie wird im Journal Proceedings of the National Academy of Sciences (PNAS) veröffentlicht.

Mit vergleichbaren Studien wurde bisher vor allem die Verwandtschaft spezifischer Wortformen untersucht. Solche Informationen liegen jedoch nur für eine kleine Zahl von Sprachfamilien vor. Daher nutzte Gerhard Jäger für seine Untersuchungen die Daten des Automated Similarity Judgement Program, einer Datenbank, die das Kernvokabular von mehr als 6.000 Sprachen in phonetischer Transkription enthält. Verwandtschaftsanalysen in der Bioinformatik liegen häufig die DNA-Sequenzen der Lebewesen zugrunde, in deren Abfolge verschiedener Basen ähnlich wie in den Buchstaben von Wörtern die Erbinformation kodiert ist. Computer vergleichen Abschnitte der DNA-Sequenzen verschiedener Arten miteinander und erfassen die Ähnlichkeit in numerischen Werten. Aus zahlreichen solcher Vergleiche lassen sich Stammbäume zeichnen, in denen die Distanz zweier Nachbararten zueinander oder die Entstehung aus einem gemeinsamen Vorfahr sichtbar wird.

Einem ähnlichen Verfahren unterzog Jäger 1.161 eurasische Sprachen und Dialekte. Statt DNA-Sequenzen wurde hier jedoch paarweise zwischen Sprachen beziehungsweise Dialekten die Ähnlichkeit einzelner Wortformen untersucht – und die Unähnlichkeit. Letztere bildet beim Vergleich zweier Wortlisten ein gutes Maß für die Entscheidung, ob Ähnlichkeiten durch eine Sprachverwandtschaft bestehen oder zufällig entstanden sind. Aus den zahlreichen Vergleichen leitete der Wissenschaftler ein numerisches Maß für die Distanz zweier Sprachen beziehungsweise Dialekte ab. Ähnlich wie bei einem Stammbaum von Lebewesen entstand aus riesigen Datenmengen und zahlreichen Vergleichen ein Stammbaum für die Sprachen Eurasiens.

Dabei kristallisierten sich mehrere wahrscheinliche Makro-Familien heraus. Die Ergebnisse der computergestützten Studie tragen wesentlich dazu bei, die Rekonstruktion der Sprachgeschichte weiter als bisher in die Vergangenheit zurück zu treiben, so Gerhard Jäger, der zurzeit als Fellow am Netherlands Institute for Advanced Study arbeitet.

Publikation:

Gerhard Jäger: Support for linguistic macrofamilies from weighted sequence alignment. Proceedings of the National Academy of Sciences (PNAS), Online-Vorabveröffentlichung in der Woche vom 21. September 2015, DOI 10.1073/pnas.1500331112.

Kontakt:

Prof. Dr. Gerhard Jäger

Universität Tübingen

Philosophische Fakultät

Seminar für Sprachwissenschaft

bis 31. Oktober 2015:

Netherlands Institute for Advanced Study in the Humanities

Wassenaar / Niederlande

Telefon +31 7051 22767

gerhard.jaeger[at]uni-tuebingen.de

Zurück