eScience-Center

Forschungsdaten - Sicherheit

Forschungsdatensicherheit

Der verantwortungsbewusste Umgang mit Forschungsdaten bedingt, dass diese vor Datenverlust und Missbrauch geschützt werden. Neben der eigenständigen Aufnahme von Sicherungsmechanismen (Passwortschutz etc.) sollte die Sicherung der Daten auf dafür vorgesehenen zentralen Strukturen des Rechenzentrums der Universität Tübingen erfolgen. Diese Dienste erlauben einen vertraulichen und zugriffsgeschützten Umgang mit Ihren Forschungsdaten. Dabei werden ihre gesicherten und archivwürdigen Daten georedundant an zutrittskontrollierten Standorten aufbewahrt. Dies umfasst insbesondere die Dienste zu den Arbeitsgruppenlaufwerken, die für eine Mehrpersonennutzung innerhalb eines Projektes bzw. Projektverbundes an der Universität Tübingen geeignet sind. Über den Standort hinaus und in Zusammenarbeit mit internationalen Kollegen bieten sich Cloud-Lösungen an, wie zum Beispiel Microsoft 365.
Die Standard-Arbeitsgruppenlaufwerke ermöglichen ein kollaboratives Arbeiten und Organisieren der Forschungsdaten unabhängig vom Arbeitsplatz, jedoch mit einem universitären Benutzeraccount. Sie sind somit ideal für den Einsatz in Projektstrukturen (z.B. Sonderforschungsbereiche) mit einem hohen Anteil von außeruniversitärer Forschungsarbeit geeignet zum Beispiel standortübergreifende Quellen- bzw. Archivrecherche, Geländearbeiten, Home Office etc. Die so bereitgestellten Daten ermöglichen ein kollaboratives Arbeiten und eine gemeinsame Datendokumentation über die eigene Arbeistumgebung hinaus und erhöhen damit die spätere Zugänglichkeit bzw. das Verständnis der erfassten Grundlagendaten zum Beispiel im Prozess der Archivierung und helfen ihnen dabei den Durchblick zu behalten, sowie Zeit und Nerven zu sparen.
Sollten über den Standort hinaus weitere Sicherungsmaßnahmen notwendig sein, können in Absprache mit dem ZDV ihre Daten auf zentrale Speichereinheiten (Bandlaufwerke) in Ulm gesichert werden.
Diese Dienste werden im Hintergrund auf der festgelegten Datenstruktur des Arbeitsgruppenlaufwerks ausgeführt. Die Speicherung erfolgt regelmäßig. Für ihre Daten wird eine sogenannte Historie über Snapshots realisiert, das bedeutet, dass der Zustand ihrer Daten zu einer bestimmten Zeit gespeichert und für eine definierte Zeit vorgehalten wird.
Sie können bei der Einrichtung des Arbeitsgruppenlaufwerks für die Verwaltung der Zugriffsberechtigungen verschiedene Service-Levels beim ZDV beantragen. Dabei besteht die Möglichkeit zwischen der Verwaltung durch das ZDV und einer weitestgehend unabhängigen eigenständigen Administrierung zu wählen. Der Leistungsumfang auf einen Blick:

Speicherplatz Standardmäßig 50GB, auf Anfrage erweiterbar
Zugang ZDV Login-IDs müssen für die Windowsdienste freigeschaltet sein.
Betreuung: Anfragen und Support über die Hotline des ZDV
Backup Snapshots: wöchentlich (bis zu 18 Wochen); die jüngsten 6 Tage täglich.
Restore Selbstständig durch den Benutzer, bzw. unterstützt durch das ZDV
Verfügbarkeit Georedundant

Weitere Informationen erhalten sie unter Dienste des Rechenzentrums der Universität. Haben Sie Fragen können Sie sich gern zunächst an die Mitarbeiter des eScience-Centers wenden. Gern stellen wir den Kontakt zu den für Sie relevanten Diensten des Rechenzentrums her beziehungsweise unterstützen die Einrichtung für Ihr Projekt.
 

Begriffserläuterungen
Was ist Georedundanz?

Das Rechenzentrum der Universität Tübingen unterhält, nicht nur für die Speicherung von Forschungsdaten, an mindestens zwei unterschiedlichen geographisch voneinander getrennten Standorten eine redundante identische Auslegung der Speicherstruktur des Rechenzentrums vor. Die Auswahl der Standorte bezieht gängige Katastrophenszenarien ein. Dies spielt zum Beispiel für die Hochverfügbarkeit eine wichtige Rolle, auch werden Wartungsarbeiten, Stromausfälle und die Arbeiten an defekter Hardware somit kompensiert und ausfallfrei während des Betriebes ermöglicht.

Was bedeutet kollaboratives Arbeiten?

Die in der heutigen digitalisierten Wirtschaftswelt schon zum Alltag zählende Arbeitsweise ermöglicht die gemeinsame Erstellung von Forschungsdaten und -analysen in einer Gruppe. Dieses Arbeiten unterstützt zusätzlich den ortsungebundenen Austausch und die gemeinsame Dokumentation von Forschungsinhalten. Mit der Unterstützung von Versionsverwaltungsregularien bzw. -tools (manuell über Dokumentation der Arbeitsschritte und Versionierung der Dateiebenen; automatisch über z.B. Softwaretools wie GitHub) können Arbeitsschritte nachvollziehbar und nicht nur für Dritte verständlich die Arbeitsorganisation unterstützen.

Was sind Bandlaufwerke?

Für die Aufnahme von großen Datenmengen geeignete Speicher bzw. Speichervarianten, die zumeist an größeren zentralen Standorten realisiert werden. In Baden-Württemberg ist das Rechenzentrum in Ulm für die zentrale Speicherung auf Bandlaufwerken verantwortlich. Diese Form der Speicherung ist sehr robust. Auf Bandlaufwerken werden die Daten sequentiell abgelegt, die Wiederherstellung erfolgt über die Identifikation der Datensequenz durch eine komplette Suche von Anfang des Bandes an bis zum entsprechenden Datum.

Was ist ein Snapshot?

Dabei wird ein virtuelles Abbild zum Beispiel des Arbeitsgruppenlaufwerks (Storage Snapshot) erstellt. Änderungen der Daten nach dem Snapshot bleiben jedoch unberücksichtigt. Je nach entsprechendem Service-Level wird der Prozess der Wiederherstellung vom ZDV unterstützt bzw. kann eigenständig selbst realisiert werden. Gängige Szenarien sind zum Beispiel Intervalle in Form einer Snapshot-Erstellung alle 4 Stunden, die dann für 7 Tage vorgehalten werden, die in Kombination mit einem täglichen Snapshot der 30 Tage vorgehalten wird eingerichtet werden kann. Diese Snapshots werden auf dem primären System und auf der georedundanten Kopie vorgehalten und können bei Bedarf vom Nutzer zur Wiederherstellung genutzt werden.