Universitätsbibliothek

Projekt OCR-BW

Mit Volltexten angereicherte Digitalisate bieten der Wissenschaft einen umfassenden Zugang zu Quellenmaterial und können als Grundlage für Anwendungen im Bereich der „Data Science“ bzw. der „Digital Humanities“ dienen. Das 2019 mit Unterstützung des Ministeriums für Wissenschaft, Forschung und Kunst Baden-Württemberg als Service der Universitätsbibliotheken Tübingen und Mannheim neu eingerichtete Kompetenzzentrum OCR-BW unterstützt Wissenschaftler/innen, Bibliotheken und Archive in Baden-Württemberg bei der Anwendung von automatischer Texterkennungs- und Transkriptionssoftware und steht als Ansprechpartner bei Fragen bereit.

Die UB Mannheim stellt mehrere Open-Source Softwareprodukte wie z.B. Tesseract aus dem Bereich OCR als nutzerfreundliche und systemunabhängige Anwendung für historische Drucke zur Verfügung. Die UB Tübingen testet die Einsatzmöglichkeiten der Transkriptionsplattform Transkribus für die automatische Handschriften- und Druckerkennung. Zusammen kann so ein breites Spektrum an Materialien und Schriften abgedeckt werden. Das Kompetenzzentrum erarbeitet sich dabei ein umfassendes Knowhow im Bereich der automatischen Volltexterkennung und vermittelt dieses weiter.

Wenn Sie für Ihre Forschung bzw. Ihre Projekte größere Mengen an Scans von Handschriften, Archivalien oder alten Drucken bearbeiten wollen und nach einer Möglichkeit suchen, diese leichter und effizienter les- und durchsuchbar zu machen, beraten wir Sie gerne in Hinblick auf die Einsatzmöglichkeiten von Transkribus und Tesseract.  

Die im Projektkontext bearbeiteten Bestände aus Universitätsbibliothek und  -archiv stellen wir sukzessiv als Digitalisat und Volltext auf unserer Präsentationsplattform zur Verfügung:

  • Tagebücher der Tendaguru-Expedition des Tübinger Geologen und Paläontologen Edwin Hennig (1909-1911)
  • Tagebücher des Tübinger Altphilologen Martin Crusius (1573-1604)
  • Griechische Predigtnachschriften von Martin Crusius (1563-1604)
  • ausgewählte Bände der juristischen Konsilien (1602-1879)
  • ausgewählte Bände der Senatsprotokolle (1524-1912)
  • Handschriften und Drucke in Malayalam

Weitere Informationen erhalten Sie auf unserer Homepage, bei Informationsveranstaltungen und Schulungsangeboten sowie über unsere Mailingliste.