TüBa-D/DP release 5
TüBa-D/DP ist eine maschinell annotierte Baumbank des Deutschen mit Dependenzstruktur. TüBa-D/DP bietet qualitativ hochwertige syntaktische Annotationen für eine große Menge zeitgenössischer deutscher Texte. Die Annotationen orientieren sich dabei so eng wie möglich an den Annotationsrichtlinien der TüBa-D/Z UD (Çöltekin et al., 2017).
Die Annotationsebenen in TüBa-D/DP enthalten Informationen über:
- Wortarten ('universal' oder 'STTS' Schema)
- Morphologie (UD und TüBa-D/Z)
- Lemmas
- Topologische Felder
- Dependenzrelationen (UD)
Eine ausführlichere Beschreibung der Annotationsrichtlinien ist im Stylebook zu finden.
Subcorpora
Anschauen und Durchsuchen
Einige Teilkorpora der TüBa-D/DP Baumbank (Europarl, Wikipedia, political speeches) können über die Webanwendung TüNDRA durchsucht und abgefragt werden.
Lizenzen
- Das Europarl-Korpus wird von Philipp Koehn und als Teil von OPUS zur Verfügung gestellt. Die Nutzungsbedingungen sind auf der Europarl-Website beschrieben
- Das Korpus 'German Political Speeches' wird von Adrien Barbaresi unter der Creative Commons Attribution-ShareAlike 4.0 International License zur Verfügung gestellt.
- Das Wikipedia-Teilkorpus steht unter der Creative Commons Attribution-ShareAlike 3.0 Unported License.
- Der im Korpus verwendete Rohtext der 'Die Tageszeitung' unterliegt dem Copyright der 'contrapress media GmbH', Berlin. Lizenzen werden von Fall zu Fall nach dem Ermessen des Copyright-Inhabers erteilt und können Gebühren oder Einschränkungen für die Datennutzung enthalten. Bitte kontaktieren Sie tuebadz-info für weitere Informationen.
Referenz
Sofern Sie die TüBa-D/DP Baumbank im Rahmen eines Forschungsthemas oder einer wissenschaftlichen Arbeit verwenden, möchten wir Sie bitten folgendes Paper zu zitieren:
TüBa-D/DP stylebook, Daniël de Kok and Sebastian Pütz, 2019, Seminar für Sprachwissenschaft, University of Tübingen