CLARIN ist eines von fünf Projekten aus den Geistes- und Sozialwissenschaften, die zur europäischen Roadmap gehören, die 2007 erstellt wurde: Das ist eine Art Masterplan, mit dem die Europäische Union (EU) Forschungsinfrastrukturen auf europäischer Ebene stärken will. Bei den naturwissenschaftlichen Disziplinen geht es hier meist um Großgeräte oder Gebäude, in den Geisteswissenschaften um die Vernetzung zentraler Einrichtungen. So will CLARIN relevante Institutionen vernetzen, die Sprachressourcen beheimaten oder Werkzeuge für deren Bearbeitung bereitstellen, zum Beispiel Archive, Bibliotheken oder Forschungseinrichtungen. Dazu gehören bei CLARIN-D unter anderen die Berlin-Brandenburgische Akademie der Wissenschaften mit ihrem Textarchiv, das Institut für Deutsche Sprache (IDS) in Mannheim, das Bayerische Archiv für Sprachsignale (BAS) und das Max-Planck-Institut für Psycholinguistik.
CLARIN richtet sich an alle geistes- und sozialwissenschaftlichen Disziplinen, die mit Sprachdaten zu tun haben und kann für Spitzenforschung wie auch die Lehre verwendet werden. Wir stellen eine „virtuelle Forschungsumgebung“ zur Verfügung, das heißt Wissenschaftler können künftig von ihrem Arbeitsplatz aus im Netz auf die umfangreichen Datensammlungen zurückgreifen. Dazu entwickeln wir Werkzeuge, automatische computerlinguistische Verfahren, mit denen sich die Ressourcen intelligent durchsuchen und verwerten lassen. Letzteres ist eine Tübinger Spezialität: Wir haben eine Reihe von Diensten entwickelt, wie zum Beispiel den Service „WebLicht“. Mit diesem bringen wir Analysewerkzeuge für Sprache auf eine gemeinsame Plattform und in ein gemeinsames Datenformat. Eine benutzerfreundliche Oberfläche erlaubt es, die Tools im Netz abzurufen und automatisch miteinander zu verknüpfen. Damit haben wir wissenschaftliches Neuland betreten, das wird sehr stark nachgefragt.
Wir haben eine Anfrage des kunsthistorischen Museums Florenz, das seine Bibliotheksbestände in verschiedenen Sprachen verschlagworten möchte. Wir können dies für alle Sprachen, die für diese Bestände relevant sind, automatisch durchführen. Ein Gießener Wissenschaftler möchte den Roman „In Stahlgewittern“ von Ernst Jünger auf Wortarten und -häufigkeiten hin untersuchen lassen. Mit unserem Werkzeug werden die Wörter im Computer auf Stammformen reduziert und automatisch eine Konkordanz mit Worthäufigkeiten des Textes erstellt. Eine Doktorandin in Südtirol untersucht Regionalismen in der Deutschen Gegenwartssprache. Wir ermöglichen ihr, verschiedene Textsammlungen in Wien, Bozen, in der Schweiz und in Deutschland gleichzeitig zu durchsuchen und Statistiken zu Worthäufigkeiten zu erstellen. Eine portugiesische Doktorandin hat angefragt; sie untersucht in Barcelona die Rezeption der portugiesischen Revolution durch die Franco-Presse. In CLARIN haben wir feinkörnige Metadaten aufbereitet, die zu jedem einzelnen Zeitungsartikel Datum, Autor und Medium liefern ‒ so ergibt sich eine zeitliche Tiefenschärfe, die ohne diesen Filter nicht möglich wäre. Insgesamt werden solche Angebote verstärkt von Nachwuchswissenschaftlerinnen und Nachwuchswissenschaftlern genutzt, gerade von ihnen bekommen wir oft Anregungen, wo die Bedürfnisse liegen.
Tübingen hat die gesamte Koordination für Deutschland, das heißt, ein Team von acht Personen ist Vollzeit mit CLARIN beschäftigt. Auf europäischer Ebene wurde im April in den Niederlanden das „European Research Infrastructure Consortium (ERIC)“ gegründet, hier werden sich wiederum die CLARIN-Zentren der Mitgliedsländer vernetzen. Zu den acht Gründungsländern kommen im Lauf des Jahres zehn weitere hinzu, so dass alle in Europa beheimateten Sprachfamilien vertreten sein werden. Wir sind überzeugt, dass CLARIN die geisteswissenschaftliche Forschung mittelfristig verändert, weil es Quellen und Werkzeuge, mit denen diese erschlossen wurden, transparenter macht. Es gibt auch Kritik an dieser „Technisierung“ der Geisteswissenschaften. Aber ich denke, in manchen Bereichen ist sie wichtig, um Ergebnisse reproduzierbar zu machen. Es gibt nichts Schlimmeres als Datenfriedhöfe, die nicht mehr zugänglich sind.
Weitere Informationen: www.clarin-d.de
Auf unserer Webseite werden Cookies verwendet. Einige davon werden zwingend benötigt, während es uns andere ermöglichen, Ihre Nutzererfahrung auf unserer Webseite zu verbessern. Ihre getroffenen Einstellungen können jederzeit bearbeitet werden.
oder
Essentiell
in2cookiemodal-selection
Erforderlich, um die Benutzerauswahl der Cookie-Einstellungen zu speichern.
3 Monate
be_lastLoginProvider
Benötigt, damit TYPO3 beim Backend-Login den Zeitpunkt des letzten Logins feststellen kann.
3 Monate
be_typo_user
Dieses Cookie teilt der Webseite mit, ob ein Besucher oder eine Besucherin zugleich im TYPO3-Backend angemeldet ist und die Rechte besitzt, die Webseite zu verwalten.
Sitzungsende
ROUTEID
Diese Cookies werden gesetzt, um den Benutzer oder die Benutzerin immer zum gleichen Server zu leiten.
Sitzungsende
fe_typo_user
Ermöglicht Frontend-Login.
Sitzungsende
Videos
iframeswitch
Wird verwendet, um eingebettete externe Inhalte Dritter anzuzeigen.
3 Monate
yt-player-bandaid-host
Wird verwendet, um YouTube-Videos anzuzeigen.
Beständig
yt-player-bandwidth
Wird verwendet, um die optimale Videoqualität basierend auf den Geräte- und Netzwerkeinstellungen des Besuchers oder der Besucherin zu bestimmen.
Beständig
yt-remote-connected-devices
Speichert die Einstellungen des Videoplayers des Benutzers oder der Benutzerin unter Verwendung von eingebettetem YouTube-Video.
Beständig
yt-remote-device-id
Speichert die Einstellungen des Videoplayers des Benutzers oder der Benutzerin unter Verwendung von eingebettetem YouTube-Video.
Beständig
yt-player-headers-readable
Sammelt Daten über die Interaktion der Besucher mit den Videoinhalten der Website - Diese Daten werden verwendet, um die Relevanz der Videoinhalte der Website für den Besucher zu erhöhen.
Beständig
yt-player-volume
Wird verwendet, um die bevorzugte Lautstärke der YouTube-Videos zu speichern.
Beständig
yt-player-quality
Wird verwendet, um die bevorzugte YouTube Wiedergabequalität zu speichern.
Beständig
yt-remote-session-name
Speichert die Einstellungen des Videoplayers des Benutzers oder der Benutzerin unter Verwendung von eingebettetem YouTube-Video.
Sitzungsende
yt-remote-session-app
Speichert die Einstellungen des Videoplayers des Benutzers oder der Benutzerin unter Verwendung von eingebettetem YouTube-Video.
Sitzungsende
yt-remote-fast-check-period
Speichert die Einstellungen des Videoplayers des Benutzers oder der Benutzerin unter Verwendung von eingebettetem YouTube-Video.
Sitzungsende
yt-remote-cast-installed
Speichert die Benutzereinstellungen beim Abruf eines auf anderen Webseiten integrierten YouTube-Videos.
Sitzungsende
yt-remote-cast-available
Speichert die Benutzereinstellungen beim Abruf von integrierten YouTube-Videos.
Sitzungsende
ANID
Wird für Targetingzwecke verwendet, um ein Profil der Interessen der Website-Besucher zu erstellen, um relevante und personalisierte Google-Werbung anzuzeigen.
2 Jahre
SNID
Google Maps - Google verwendet diese Cookies, um Benutzereinstellungen und Informationen zu speichern, wenn Sie Seiten mit Google Maps aufrufen.
1 Monat
SSID
Wird verwendet, um Informationen darüber zu speichern, wie Sie die Website nutzen und welche Werbung Sie vor dem Besuch dieser Website gesehen haben, und um die Werbung auf Google-Ressourcen anzupassen, indem Sie sich an Ihre letzten Suchanfragen, Ihre früheren Interaktionen mit Anzeigen oder Suchergebnissen eines Werbetreibenden und Ihre Besuche auf einer Website eines Werbetreibenden erinnern.
6 Monate
1P_JAR
Dieses Cookie wird verwendet, um die Werbedienste von Google zu unterstützen
1 Monat
SAPISID
Wird für Targetingzwecke verwendet, um ein Profil der Interessen der Website-Besucher zu erstellen, um relevante und personalisierte Google-Werbung anzuzeigen.
6 Monate
APISID
Wird für Targetingzwecke verwendet, um ein Profil der Interessen der Website-Besucher zu erstellen, um relevante und personalisierte Google-Werbung anzuzeigen.
6 Monate
HSID
Beinhaltet verschlüsselte Einträge Ihres Google Accounts und der letzten Login-Zeit um vor Attacken und Datendiebstahl aus Formulareinträgen zu schützen.
2 Jahre
SID
Wird zu Sicherheitszwecken verwendet, um digital signierte und verschlüsselte Aufzeichnungen der Google-Konto-ID eines Nutzers und der letzten Anmeldezeit zu speichern, die es Google ermöglichen, Nutzer zu authentifizieren, eine betrügerische Verwendung von Anmeldeinformationen zu verhindern und Benutzerdaten vor Unbefugten zu schützen. Dies kann auch für Targetingzwecke genutzt werden, um relevante und personalisierte Werbeinhalte anzuzeigen.
6 Monate
SIDCC
Dieses Cookie speichert Informationen über Nutzereinstellungen und -informationen für Google Maps.
3 Monate
NID
Das NID-Cookie enthält eine eindeutige ID, die Google verwendet, um Ihre Einstellungen und andere Informationen zu speichern.
6 Monate
CONSENT
Dieses Cookie verfolgt, wie Sie eine Website nutzen, um Ihnen Werbung zu zeigen, die für Sie interessant sein könnte.
18 Jahre
__Secure-3PAPISID
Dieses Cookie wird verwendet, um die Werbedienste von Google zu unterstützen
2 Jahre
__Secure-3PSID
Dieses Cookie wird verwendet, um die Werbedienste von Google zu unterstützen
2 Jahre
__Secure-3PSIDCC
Dieses Cookie wird verwendet, um die Werbedienste von Google zu unterstützen.
6 Monate