Seminar für Sprachwissenschaft

Was ist Computerlinguistik?

Computerlinguistik ist eines der Hauptanwendungsgebiete an der Schnittstelle zwischen Mensch und Computer

Das Fach Computerlinguistik ist eine eher junge Disziplin, die sehr stark mit den Entwicklungen in der Informationstechnologie verbunden ist: flexible Suchmaschinen, automatisierte Dialogsysteme, durch Sprache bedienbare Büromaschinen und Werkzeuge, e-learning Unterrichtsmaterial... Die Entwicklung und Verbesserung dieser Anwendung hängt in hohem Grad ab von der gelungenen Integration sprachlicher bzw. linguistischer Datenstrukturen. Und genau darin liegt das Hauptinteresse der Computerlinguistik, nämlich linguistische Datenstrukturen so zu modellieren, dass menschliche Sprache(n) von Computern verarbeitet und verstanden werden.

Wenige Dinge haben einen so starken Einfluss auf unseren Alltag wie Sprache und Kommunikation.

Sprache ist das wichtigste Mittel zur Kommunikation und Interaktion zwischen Menschen. Obwohl Sprache äußerst komplex ist und einige sprachliche Phänomene äußerst schwer zu erklären sind, wird sie in einem äußerst kurzen Zeitraum erworben und ist eng verknüpft mit dem Denken. Auf diese Weise ist die menschliche Sprache zu einer der erstaunlichsten  Erfindungen innerhalb der kulturellen Entwicklung geworden. Dafür steht auch der außerordentliche Reichtum an Sprachen, Dialekten, und Sondersprachen (bspw. Zeichensprachen), die in den vergangenen Jahrtausenden entstanden sind.

Der Computer und die moderne Kommunikation.

Im Rückblick auf die kulturelle Entwicklung des 20. Jahrhunderts kann der Computer als eine der entscheidenden Erfindungen angesehen werden, die einen nachhaltigen und in letzter Konsequenz noch nicht absehbaren Einfluss auf unser Berufs- und Freizeitleben ausgeübt hat. Wurden Computer anfänglich noch als Rechenmaschinen angesehen, richtete sich schon nach kurzer Zeit das Interesse auf Daten, die über den reinen Zahlenbereich hinausgingen: die menschliche Sprache in geschriebener und gesprochener Form. Und da Sprache ein äußerst effizientes Mittel zur Kommunikation ist, wird sie auch als entscheidend für die Weiterentwicklung von Computern und modernen Kommunikationsmitteln angesehen: einerseits für die Übertragung einer Sprache in eine andere Sprache, Form oder ein anderes Medium, andererseits als Interaktionsmittel zwischen Menschen und Maschinen.

Worin besteht die größte Herausforderung der Computerlinguistik?

Menschen benutzen zur Kommunikation sog. "natürliche Sprachen", ein äußerst komplexes System aus Lauten und Zeichen, das einem ständigen Wandel unterliegt und ausreichend robust ist, um in äußerst vielen, störanfälligen Situationen gebraucht zu werden. Computer hingegen sind auf sog. "formale Sprachen" beschränkt, die anfällig sind gegenüber Mehrdeutigkeit, Veränderungen und Spontanität. Die wichtigste Aufgabe der Computerlinguistik besteht demnach darin, adäquate formale Modelle bereitzustellen, die diese besonderen und gegensätzlichen Eigenschaften natürlicher Sprachen innerhalb der formalen Einschränkungen von Rechnersprachen erfassen.

Computerlinguistik ist mehr als eine Verbindung zweier Disziplinen

Auf den ersten Blick erscheint Computerlinguistik häufig als Verbindung der Disziplinen Linguistik und Informatik; jedoch ist das Spektrum der Wissenschaften, die für die Computerlinguistik von Belang sind, weitaus vielfältiger. Es bestehen enge Verbindungen zur Kognitiven Psychologie, zur Mathematik, zu den Einzelphilologien und letztlich zur Philosophie. Der Stoff mit dem sich Studierende der Computerlinguistik auseinandersetzen können, reicht durchaus von den frühesten Überlegungen zur menschlichen Sprache (bspw. den ersten Sanskrit-Grammatiken) bis hin zu den neuesten Entwicklungen der Informationstechnologie (bspw. dem Simputer).

"Fremde Federn": Computerlinguistik definiert von der "Association of Computational Linguistics - ACL":

"Vereinfacht gesagt, ist Computerlinguistik das wissenschaftliche Studium der Sprache aus der Perspektive des Computers. Die Computerlinguistik ist von daher darin interessiert, unterschiedlichste sprachliche Phänomene so zu modellieren, dass sie durch Computer verarbeitet werden künnen. Diese Modelle können wissensbasiert und von Hand eingegeben oder datenorientiert, d.h. statistischer bzw. empirischer Natur sein. Arbeiten in der Computerlinguistik sind in einigen Fällen aus einer wissenschaftlichen Perspektive motiviert, derart, dass versucht wird, eine formal-rechnerische Erklärung für ein besonderes linguistisches oder psycholinguistisches Phänomen zu geben. In anderen Fällen ist die Motivation rein technologischer Natur, indem eine Komponente für eine sprachbasiertes Systeme erstellt wird. In der Tat ist die Arbeit von Computerlinguisten in vielen erprobten Systemen zu finden, u.a. Spracherkennern, Modulen zur Sprachsynthese, automatisierten Dialogsystemen, Suchmaschinen, Text-Editoren, Sprachlehrmaterialien usw." (Übersetzung von der "What is CL?"-Webseite der "Association for Computational Linguistics" - ACL)