Der Aufschwung der Open-Data-Bewegung in den vergangenen Jahren führte zu einer Vielzahl von Daten-Publikationen und öffentlichen Datenbanken mit wissenschaftlichen Rohdaten. Diese Datensätze bieten für sich betrachtet ein wichtiges Archiv für zukünftige Forschungsfragen. Ungleich mehr Potential liefert jedoch die Verschneidung dieser einzelnen Datensätze. Auch können die Daten häufig nicht in ihrem inhaltlichen Kontext durchsuchbar gemacht und visualisiert werden.
NeolithicRC hat sich zum Ziel gesetzt, eine Zusammenführung von unter Open-Data-Richtlinien veröffentlichten Datenbanken mit Radiokohlenstoffdatierungen zu liefern und diese in einer Suchmaske sowie einem WebGIS recherchierbar zu mache. Die Software besteht dabei aus zwei Teilen: einem Backend sowie der Web-App.
Das Backend, welches für alle Abläufe inklusive eines automatischen Datenimportes verantwortlich ist, wurde in der Statistikprogrammiersprache R entwickelt. Die Web-App wurde unter Nutzung des Frameworks Shiny ebenfalls in R programmiert. Die gesamte Software steht unter einer Open-Source-Lizenz und wird mittels einer verteilten Versionsverwaltung (Git) entwickelt - der komplette Quelltext ist auf der Entwicklerplattform GitHub verfügbar: github.com/nevrome/neolithicR.
Um eine maximale Übersichtlichkeit und Nachnutzbarkeit zu gewährleisten, wurde die Anwendung so gut wie möglich modularisiert. Jeder Arbeitsschritt ist in Form eines separaten Skripts/Moduls abgebildet. Eine ausführliche Dokumentation (im Aufbau) befindet sich auf unserer GitHub-Seite.
Da den veröffentlichten Datensätzen unterschiedliche Schemata der Datenhaltung zugrunde liegen, wurde für jede Quelle ein individuelles Import-Modul entwickelt, das eine Vereinheitlichung der Daten vornimmt. Unser eigenes Schema orientiert sich dabei an der 14C-Datenbank CALPAL, die einer von uns (BW) in langjähriger Arbeit zusammengestellt hat. Die den einzelnen Datensätzen zugeordneten Meta-Daten (z. B. datiertes Material) werden durch einen Thesaurus vereinheitlicht.
Die Web-App spricht eine synchronisierte Datenbank an und wird auf den Servern des eScience-Center der Eberhard Karls Universität Tübingen bereitgestellt: www.neolithicrc.de.
Maßgeblich für die Entwicklung verantwortlich sind Clemens Schmid, Dirk Seidensticker und Bernhard Weninger. Die Anwendung befindet sich in stetiger Weiterentwicklung und über Anregungen und Ideen würden wir uns freuen.