Seminar für Sprachwissenschaft

Projekte

CLARIAH-DE

Projektleiter:   Erhard Hinrichs
Mitarbeiter:   Thorsten Trippel, Roberta Toscano, Dominique Rose 
Homepage:   http://www.clariah.de/

 

Absicht

Das Ziel dieses Projekts ist es, die beiden etablierten Forschungsinfrastrukturen CLARIN-D und DARIAH DE zusammenzuführen. Auf diese Weise soll Forscherinnen und Forschern aus den Geistes- und Kulturwissenschaften die wissenschaftliche Arbeit mit komplexen digitalen Werkzeugen und speziellen Datenbeständen wesentlich erleichtert werden. Das Projekt wird vom Bundesministeriums für Bildung und Forschung (BMBF) gefördert und möchte einen Beitrag zur Weiterentwicklung der nationalen Forschungsinfrastrukturen leisten. CLARIN-D und DARIAH-DE verbindet ein gemeinsames Interesse an der digitalen Erforschung textlicher und sprachlicher Quellen aus Sicht der Geistes- und Kulturwissenschaften. Dabei haben sich die beiden Verbünde über jeweils gut ein Jahrzehnt auf bestimmte Forschungsbereiche spezialisiert. Die Zusammenführung der Infrastrukturen beider Verbünde zu CLARIAH-DE ist eine wichtige Wegmarke hin zu einem gemeinsamen Raum zur kooperativen digital gestützten Forschung in den Geistes-, Kultur- und Sozialwissenschaften in Deutschland und Europa.

CLARIN

Projektleiter:   Erhard Hinrichs
Mitarbeiter:   Thorsten Trippel
Homepage:   http://www.clarin.eu

 

Absicht

CLARIN (Common Language Resources and Technology Infrastructure) möchte Geistes- und Sozialwissenschaftlern einen unkomplizierten und nachhaltigen Zugang zu digitalen Sprachdaten ermöglichen, die geschrieben, gesprochen, als Video oder in multimodaler Form vorliegen. Zusätzlich will CLARIN moderne Werkzeuge zur Verfügung zu stellen, die es erlauben, die Sprachdaten aufzufinden, zu erforschen, zu verwerten, zu analysieren oder zu kombinieren, unabhängig davon, wo sie sich befinden. Zu diesem Zweck baut CLARIN einen vernetzten Verbund europäische Datenarchive, Servicezentren und Fachzentren auf, die für die Mitglieder der akademischen Fachdisziplinen aller teilnehmenden Länder durch Einmalanmeldung zugänglich sind. Sowohl Werkzeuge als auch Daten der Zentren sind interoperabel, so dass Datensammlungen miteinander kombiniert und mit Werkzeugen unterschiedlicher Herkunft komplexe Aufgaben verrichtet werden könnenund den Forschern auf diese Weise die Arbeit erleichtert werden kann.

Der Koordinator von CLARIN in Deutschland ist Professor Dr. Erhard Hinrichs. Mit ihm und seiner Arbeitsgruppe ist Tübingen in vielen CLARIN Arbeitsgruppen und Gremien vertreten, unter anderem im Forum der nationalen Koordinatoren, im ständigen Ausschuss der CLARIN Zentren und im CLARIN Board of Directors.

Die Aufbauphase von CLARIN begann im Jahr 2012 in der Rechtsform eines ERIC (European Research Infrastructure Consortium).

CLARIN-D

Projektleiter(in):   Erhard Hinrichs
 
Mitarbeiter:   Thorsten Trippel
Roberta Toscano
Marie Hinrichs
Emanuel Dima
Ben Campbell
Alexandr Chernov
 
 Homepage:   https://www.clarin-d.net/de/ 

 
 

Absicht

Das Ziel des Projektes CLARIN-D ist der Aufbau eines Zentrenverbunds als Rückgrat einer Forschungs¬infrastruktur insbesondere für WissenschaftlerInnen in den Geistes- und Sozial¬wissenschaften. Diese Infrastruktur ist mit verschiedenen Fachdisziplinen eng verbundenen, wodurch ein breites Spektrum der Geisteswissenschaften abgedeckt wird, für die Sprachressourcen eine zentrale Rolle in der Forschung spielen. Die wichtigste Funktion der CLARIN-D-Zentren besteht darin, Daten und Werkzeuge in einer integrierten, interoperablen und skalierbaren Infrastruktur bereitzustellen, die für unterschiedliche Fach¬disziplinen in den Geistes- und Sozialwissenschaften einschlägig und erforderlich sind, um die Möglichkeiten einer digitalen Infrastruktur systematisch und einfacher als bisher nutzen zu können. 

Der Zentrenverbund kann sich auf einschlägige Vorarbeiten in der CLARIN-Präparationsphase auf EU-Ebene und im Projekt D-SPIN auf nationaler Ebene stützen. 

Tübingen, als Koordinator des CLARIN-D Projekts, partizipiert an fast allen Arbeitspaketen des Projekts.

EoSC-Hub

Projektleiter(in):   Erhard Hinrichs
Mitarbeiter:  

Claus Zinn

 

Absicht

EOSC-hub hat zum Ziel, zum zentralen Kontaktpunkt für Europäische Wissenschaftler und Innovatoren zu werden, wenn es um das Auffinden, Nutzen, und Wiederverwenden von Ressourcen zur datengetriebenen Forschung geht. Es soll den wissenschaftlichen Entdeckungsprozess sowie die Disziplin-übergreifende Forschung fördern. Existierende Infrastrukturen wie the EDI Federation, EUDAT CDI und INDIGO DataCloud kooperieren um einen einheitlichen Katalog für Forschungsdaten, Dienste und Software zur Verfügung zu stellen.

Das Tübinger Team bringt das Language Resource Switchboard (siehe https://switchboard.clarin.eu) in das Projekt ein und wird es entsprechend weiterentwickeln.

EoSC-hub wird von der Europäischen Union (Horizon 2020) gefördert und läuft von Januar 2018 bis Dezember 2020 (Grant Agreement 777536)

LappsGrid

Transatlantische Kollaboration zwischen LAPPS and CLARIN: Semantische, Technische und Infrastrukturelle Interoperabilität von NLP Diensten.

Projektleiter(in):   Erhard Hinrichs
Mitarbeiter:  

Mohammad Fazleh Elahi, Marie Hinrichs

Absicht

Die Zusammenarbeit zwischen CLARIN (insbesondere LINDAT/CLARIN und WebLicht/Tübingen) und dem LAPPS Grid hatte zum Ziel, ihre jeweiligen Sprachtechnologien und -dienste miteinander interoperabel und gegenseitig zugreifbar zu machen.

Die Kollaboration leistete einen wichtigen Beitrag zur Harmonisierung von in Europa und in den USA entwickelter Software und erstellter Datenmengen. Innerhalb des Projektes wurde prototypische Software entwickelt, die es ermöglicht, WebLicht-Dienste innerhalb des LAPPS Grid, sowie LAPPS Grid Dienste aus WebLicht heraus aufzurufen.

Eine Fortführung des Projektes wird derzeit angestrebt. Dies soll eine Implementierung der bereits konzeptuell erstellten single-signon Strategie ermöglichen. Hiermit könnten US-amerikanische Wissenschaftler CLARIN-Dienste innerhalb des Europäischen Trust Netwerks nutzen.

Das Projekt startete am 01.10.2016 und wurde zum 31.12.2018 abgeschlossen.

MoKo

MoKo: Modellierung lexikalisch-semantischer Beziehungen von Kollokationen

Projektleiter(in):   Erhard Hinrichs
Mitarbeiter:  

Erhard Hinrichs,

Yana Strakatova

Absicht

Gegenstand des Projektes ist die lexikalisch-semantische Modellierung und Beschreibung unterschiedlicher Aspekte von Kollokationen.  Die wesentlichen Forschungsfragen in diesem Projekt lauten:

a) auf welche Weise und in welchem theoretischen Rahmen die lexikalisch-semantische Gruppierung von Kollokanten zu einer Kollokationsbasis gruppiert und beschrieben werden können;

b) ob und in welcher Weise Kollokanten, die mehreren Kollokationsbasen auf einer paradigmatischen Achse gemeinsam sind, zu einer generalisierten Beschreibung dieser Kollokationsbasen beitragen können. 

Im Rahmen dieses Projekts werden die Meaning-Text Theorie von Igor Melauk, besonders die Lexikalischen Funktionen, und die Theorie des Generativen Lexikons von James Pustejovsky, besonders die Qualiarollen, als gemeinsamer Rahmen zusammengeführt. Es wird untersucht, ob eine angemessene Modellierung oben beschriebener Aspekte von Kollokationen mit einer Synthese der beiden genannten theoretischen Ansätze möglich ist.  Ein zentrales Ergebnis des Projektes wird eine Handreichung für die Modellierung von Kollokationen mit den aus dem Übergreifenden theoretischen Rahmen abgeleiteten Beschreibungsmitteln sein.

Projektlaufzeit: 01/10/2016 bis 30/09/2019.

PARTHENOS

Projektleiter(in):   Erhard Hinrichs
Mitarbeiter:    Thorsten Trippel,  Marie Hinrichs, Claus Zinn
Homepage:  

http://www.parthenos-project.eu

Absicht

PARTHENOS (Pooling Activities, Resources and Tools for Heritage E-research Networking, Optimization and Synergies) ist ein Konsortium nationaler Forschungsorganisationen, Kulturerbeinstitutionen, und Forschungsinfrastrukturen. Es hat zum Ziel existierende Infrastrukturen miteinander zu verknüpfen und die Interoperabilität ihrer Dienste zu erhöhen. Dazu zählen die Entwicklung gemeinsamen Datenstandards, die Koordinierung gemeinsamer Forschungsprojekte, und das Pooling von Diensten und Software. Parthenos wird gefördert von der Europäischen Union (Horizon 2020).

SFB 833 - Projekt A3

Projektleiter(in):   Erhard Hinrichs
 
Mitarbeiter:   Corina Dima, Researcher
 
Homepage:   https://uni-tuebingen.de/de/9920

 
 

Absicht

A3: Desambiguierung von Diskurskonnektoren mit korpusinduzierten semantischen Relationen

Diskurskonnektoren wie nachdemwährend oder aber weisen einen hohen Grad an Bedeutungsvariabilität auf, der sich nur in Abhängigkeit vom jeweiligen Diskurskontext auflösen lässt. Ausgehend von klassischen Annahmen zur Strukturierung eines Diskurses, wie sie in der Textlinguistik u.a. von Halliday & Hasan (1976) unter dem Begriff der Kohäsion subsumiert werden, hat das Projekt zum Ziel, diese genuin sprachwissenschaftlichen Konzepte mithilfe von maschinellen Lernverfahren datenorientiert zu approximieren. Eine derartige Approximation bildet eine geeignete Grundlage, um die Bedeutungsvariabilität von Diskurskonnektoren im Kontext abzubilden.

SFB 833 - Projekt INF

Projektleiter(in):   Erhard Hinrichs
Mitarbeiter:   Thorsten Trippel, Researcher
Claus Zinn, Researcher
Homepage:   https://uni-tuebingen.de/de/9884

 

Absicht

Heterogene Forschungsprimärdaten des SFB 833 – Repräsentation und Verarbeitung

Ziel des Infrastrukturprojekts INF ist es, die im SFB 833 in den Einzelprojekten erarbeiteten Daten in einer möglichst einheitlichen Form nachhaltig vorzuhalten und zu archivieren. Dies dient zum einen dem Zweck der Wiederverwendbarkeit erarbeiteter Daten in der Forschung in neuen Fragestellungen und zum anderen der konsequenten Nachvollziehbarkeit und Verifizierbarkeit veröffentlichter Ergebnisse über den gesamten Weg ihrer Erarbeitung.

SSHOC

SSHOC: Social Sciences & Humanities Open Cloud 

Projektleiter(in) (EKUT):   Erhard Hinrichs
Mitarbeiter:  

N.N.

Homepage:  

Not yet available.

 

Absicht

Das SSHOC Projekt hat das Ziel, ein Europäisches Open Cloud Ökosystem für die Sozial- und Geisteswissenschaften zu entwickeln. SSHOC wird Daten, Werkzeuge sowie Lern- und Trainingskurse für Sozial- und Geistenwissenschaftler vorhalten und zur Verfügung stellen. Es wird sichere Umgebungen zum gegenseitigen Austausch und gemeinsamer Nutzung sensitiver und vertraulichen Daten bereitstellen, Beiträge zur Open Science Agenda leisten und mithelfen, die Realisierung der Europäischen Open Science Cloud (EOSC) voranzutreiben.

Das Projekt wird von der Europäischen Kommission gefördert (Horizon 2020 Framework Programme) und startet ihre Aktivitäten im Januar 2019 (mit einer Laufzeit von 40 Monaten). Dem Projekt SSHOC gehören die 5 Europäischen Forschungsinfrastrukturkonsortien CESSDA, ESS, SHARE, CLARIN, und DARIAH an; ausserdem wirken 14 Partnerinstitute aus ganz Europa mit.