Zentrum für Datenverarbeitung (ZDV) (data center)

Individuelle eSciDoc-Solutions

Bisher wurden insgesamt vier Solutions (siehe Erklärung des eSciDoc-Schichtenmodells) implementiert, die in den folgenden Abschnitten beschrieben werden. Um Daten aller Art in eSciDoc einspeisen zu können, wurde ein generischer eSciDoc-Datenbrowser implementiert (siehe Solution 1). Weiterhin wurden zwei klassische, individuelle eSciDoc-Solutions entwickelt, um die genannten Daten lesend abzufragen und grafisch aufzubereiten (siehe Solution 2 und Solution 3) . Des weiteren wurde eSciDoc als Backend in WebLicht, eine bereits bestehende Web2.0-Anwendung, eingebunden (siehe Solution 4).

Solution 1: Generischer eSciDoc-Datenbrowser

Da eSciDoc zum jetzigen Zeitpunkt keine Schnittstelle für Endbenutzer zur Verfügung stellt, wurde im Rahmen des BW-eSci(T)-Projekts einen prototypischer generischer eSciDoc-Datenbrowser implementiert. Mit diesem können Daten aller Art in eSciDoc eingespeist werden und in einem Browserinterface verwaltet werden. So ist es beispielsweise möglich, Organizational Units, Contexts, Containers und Items einer Organisationshierarchie hinzuzufügen, Elemente zu bearbeiten, zu entfernen, sowie deren Metadaten zu verwalten (siehe Abbildung). Zusätzlich ermöglicht der generische eSciDoc-Datenbrowser das Anschauen individueller Items sowie die Lebenszyklus-Verwaltung der in eSciDoc gespeicherten Komponenten.

 

Solution 2: Bulgarische Dialekte

Die zweite eSciDoc-Solution stellt eine browserbasierte Benutzerschnittstelle für phonetische Dialektdaten dar, die im Rahmen des Buldialects-Projekts erstellt wurden. Sie enthält die gesammelten und phonetisch transkribierten Primärdaten des Projekts. Diese können auf verschiedene Weisen gegliedert ausgegeben werden (nach Ort der Aufnahme, Wortlisten etc.). Die Integration der Google-Maps-Funktionalität erlaubt ein sofortiges und intuitives Einordnen der ausgewählten Daten in den jeweiligen geographischen Kontext. Des Weiteren wurde eine Frequenzanalyse erstellt, die die quantitative Verteilung der einzelnen phonetischen Elemente über den geographischen Raum visualisiert. Ebenso wurden die Inhalte der Homepage des Projekts integriert. Somit enthält die vorliegende eSciDoc-Solution nicht nur die eigentlichen Primärdaten des Projekts, sondern übernimmt auch die Präsentation des Projekts nach außen. Ein Bildschirmfoto ist in folgender Abbildung zu sehen:

Solution 3: GermaNet

Eine andere eSciDoc-Solution, die im Rahmen des Projektes entwickelt wurde, ist eine web-basierte Schnittstelle zum Suchen und Abfragen von GermaNet. Für diese Solution wurden die GermaNet-Daten mit Hilfe des generischen eSciDoc-Datenbrowsers (siehe Solution 1) in eSciDoc gespeichert und es wird Benutzern ermöglicht, nach einem Wort in GermaNet zu suchen. Es werden semantische Information über dieses Wort sowie Relationen zu anderen zurückgegeben.

In nachstehender Abbildung wurde eine Suche für das Wort brauchen ausgeführt. Als Ergebnis sind alle verschiedenen Lesarten des Wortes zusammen mit den jeweiligen Synonymen sowie weiteren Informationen wie Beispielsätzen, die die verschiedenen Lesarten verdeutlichen, aufgelistet.

Solution 4: WebLicht

Diese eSciDoc-Solution unterscheidet sich von Solutions 2 und 3 insbesondere in der Benutzung der Daten. Die beiden vorher beschriebenen Solutions verwenden eSciDoc, um Daten abzufragen. Diese Solution wird jedoch zum Abspeichern dynamisch mit WebLicht erzeugter Benutzerdaten eingesetzt. WebLicht (Web-Based Linguistic Chaining Tool) wurde im Kontext des CLARIN-Projekts entwickelt. Es ist eine service-orientierte Architektur (SOA), die verteilte linguistische Tools individuell miteinander verbindet und als Kettenprozess ausführen kann. Mit Hilfe von WebLicht können Benutzer automatisch annotierte Textkorpora erstellen und visualisieren. Die Web2.0-Anwendung kann über einen Webbrowser aufgerufen werden, so dass Benutzer keine Tools herunterladen oder auf ihren lokalen Computern installieren müssen. Jedoch werden die Daten, die mittels WebLicht erstellt werden, den Benutzern dynamisch und bisher nicht persistent zur Verfügung gestellt. Um den Nachteil der nicht-persistenten Datenhaltung zu beheben, wurde im Rahmen dieses ersten Projektjahres als weitere Komponente eSciDoc in die WebLicht-SOA integriert. Dadurch haben Benutzer Zugriff auf ihren persönlichen Speicherplatz in eSciDoc, in denen sie die automatisch generierten Textkorpora online direkt nach eSciDoc speichern können (siehe „Save to eSciDoc“-Button in folgender Abbildung).