CLARIN ist eines von fünf Projekten aus den Geistes- und Sozialwissenschaften, die zur europäischen Roadmap gehören, die 2007 erstellt wurde: Das ist eine Art Masterplan, mit dem die Europäische Union (EU) Forschungsinfrastrukturen auf europäischer Ebene stärken will. Bei den naturwissenschaftlichen Disziplinen geht es hier meist um Großgeräte oder Gebäude, in den Geisteswissenschaften um die Vernetzung zentraler Einrichtungen. So will CLARIN relevante Institutionen vernetzen, die Sprachressourcen beheimaten oder Werkzeuge für deren Bearbeitung bereitstellen, zum Beispiel Archive, Bibliotheken oder Forschungseinrichtungen. Dazu gehören bei CLARIN-D unter anderen die Berlin-Brandenburgische Akademie der Wissenschaften mit ihrem Textarchiv, das Institut für Deutsche Sprache (IDS) in Mannheim, das Bayerische Archiv für Sprachsignale (BAS) und das Max-Planck-Institut für Psycholinguistik.
CLARIN richtet sich an alle geistes- und sozialwissenschaftlichen Disziplinen, die mit Sprachdaten zu tun haben und kann für Spitzenforschung wie auch die Lehre verwendet werden. Wir stellen eine „virtuelle Forschungsumgebung“ zur Verfügung, das heißt Wissenschaftler können künftig von ihrem Arbeitsplatz aus im Netz auf die umfangreichen Datensammlungen zurückgreifen. Dazu entwickeln wir Werkzeuge, automatische computerlinguistische Verfahren, mit denen sich die Ressourcen intelligent durchsuchen und verwerten lassen. Letzteres ist eine Tübinger Spezialität: Wir haben eine Reihe von Diensten entwickelt, wie zum Beispiel den Service „WebLicht“. Mit diesem bringen wir Analysewerkzeuge für Sprache auf eine gemeinsame Plattform und in ein gemeinsames Datenformat. Eine benutzerfreundliche Oberfläche erlaubt es, die Tools im Netz abzurufen und automatisch miteinander zu verknüpfen. Damit haben wir wissenschaftliches Neuland betreten, das wird sehr stark nachgefragt.
Wir haben eine Anfrage des kunsthistorischen Museums Florenz, das seine Bibliotheksbestände in verschiedenen Sprachen verschlagworten möchte. Wir können dies für alle Sprachen, die für diese Bestände relevant sind, automatisch durchführen. Ein Gießener Wissenschaftler möchte den Roman „In Stahlgewittern“ von Ernst Jünger auf Wortarten und -häufigkeiten hin untersuchen lassen. Mit unserem Werkzeug werden die Wörter im Computer auf Stammformen reduziert und automatisch eine Konkordanz mit Worthäufigkeiten des Textes erstellt. Eine Doktorandin in Südtirol untersucht Regionalismen in der Deutschen Gegenwartssprache. Wir ermöglichen ihr, verschiedene Textsammlungen in Wien, Bozen, in der Schweiz und in Deutschland gleichzeitig zu durchsuchen und Statistiken zu Worthäufigkeiten zu erstellen. Eine portugiesische Doktorandin hat angefragt; sie untersucht in Barcelona die Rezeption der portugiesischen Revolution durch die Franco-Presse. In CLARIN haben wir feinkörnige Metadaten aufbereitet, die zu jedem einzelnen Zeitungsartikel Datum, Autor und Medium liefern ‒ so ergibt sich eine zeitliche Tiefenschärfe, die ohne diesen Filter nicht möglich wäre. Insgesamt werden solche Angebote verstärkt von Nachwuchswissenschaftlerinnen und Nachwuchswissenschaftlern genutzt, gerade von ihnen bekommen wir oft Anregungen, wo die Bedürfnisse liegen.
Tübingen hat die gesamte Koordination für Deutschland, das heißt, ein Team von acht Personen ist Vollzeit mit CLARIN beschäftigt. Auf europäischer Ebene wurde im April in den Niederlanden das „European Research Infrastructure Consortium (ERIC)“ gegründet, hier werden sich wiederum die CLARIN-Zentren der Mitgliedsländer vernetzen. Zu den acht Gründungsländern kommen im Lauf des Jahres zehn weitere hinzu, so dass alle in Europa beheimateten Sprachfamilien vertreten sein werden. Wir sind überzeugt, dass CLARIN die geisteswissenschaftliche Forschung mittelfristig verändert, weil es Quellen und Werkzeuge, mit denen diese erschlossen wurden, transparenter macht. Es gibt auch Kritik an dieser „Technisierung“ der Geisteswissenschaften. Aber ich denke, in manchen Bereichen ist sie wichtig, um Ergebnisse reproduzierbar zu machen. Es gibt nichts Schlimmeres als Datenfriedhöfe, die nicht mehr zugänglich sind.
Weitere Informationen: www.clarin-d.de
Our website uses cookies. Some of them are mandatory, while others allow us to improve your user experience on our website. The settings you have made can be edited at any time.
or
Essential
in2cookiemodal-selection
Required to save the user selection of the cookie settings.
3 months
be_lastLoginProvider
Required for the TYPO3 backend login to determine the time of the last login.
3 months
be_typo_user
This cookie tells the website whether a visitor is logged into the TYPO3 backend and has the rights to manage it.
Browser session
ROUTEID
These cookies are set to always direct the user to the same server.
Browser session
fe_typo_user
Enables frontend login.
Browser session
Videos
iframeswitch
Used to show all third-party contents.
3 months
yt-player-bandaid-host
Is used to display YouTube videos.
Persistent
yt-player-bandwidth
Is used to determine the optimal video quality based on the visitor's device and network settings.
Persistent
yt-remote-connected-devices
Saves the settings of the user's video player using embedded YouTube video.
Persistent
yt-remote-device-id
Saves the settings of the user's video player using embedded YouTube video.
Persistent
yt-player-headers-readable
Collects data about visitors' interaction with the site's video content - This data is used to make the site's video content more relevant to the visitor.
Persistent
yt-player-volume
Is used to save volume preferences for YouTube videos.
Persistent
yt-player-quality
Is used to save the quality settings for YouTube videos.
Persistent
yt-remote-session-name
Saves the settings of the user's video player using embedded YouTube video.
Browser session
yt-remote-session-app
Saves the settings of the user's video player using embedded YouTube video.
Browser session
yt-remote-fast-check-period
Saves the settings of the user's video player using embedded YouTube video.
Browser session
yt-remote-cast-installed
Saves the user settings when retrieving a YouTube video integrated on other web pages
Browser session
yt-remote-cast-available
Saves user settings when retrieving integrated YouTube videos.
Browser session
ANID
Used for targeting purposes to profile the interests of website visitors in order to display relevant and personalized Google advertising.
2 years
SNID
Google Maps - Google uses these cookies to store user preferences and information when you view pages with Google Maps.
1 month
SSID
Used to store information about how you use the site and what advertisements you saw before visiting this site, and to customize advertising on Google resources by remembering your recent searches, your previous interactions with an advertiser's ads or search results, and your visits to an advertiser's site.
6 months
1P_JAR
This cookie is used to support Google's advertising services.
1 month
SAPISID
Used for targeting purposes to profile the interests of website visitors in order to display relevant and personalized Google advertising.
2 years
APISID
Used for targeting purposes to profile the interests of website visitors in order to display relevant and personalized Google advertising.
6 months
HSID
Includes encrypted entries of your Google account and last login time to protect against attacks and data theft from form entries.
2 years
SID
Used for security purposes to store digitally signed and encrypted records of a user's Google Account ID and last login time, enabling Google to authenticate users, prevent fraudulent use of login credentials, and protect user data from unauthorized parties. This may also be used for targeting purposes to display relevant and personalized advertising content.
6 months
SIDCC
This cookie stores information about user settings and information for Google Maps.
3 months
NID
The NID cookie contains a unique ID that Google uses to store your preferences and other information.
6 months
CONSENT
This cookie tracks how you use a website to show you advertisements that may be of interest to you.
18 years
__Secure-3PAPISID
This cookie is used to support Google's advertising services.
2 years
__Secure-3PSID
This cookie is used to support Google's advertising services.
6 months
__Secure-3PSIDCC
This cookie is used to support Google's advertising services.
6 months