Tübinger Partiell Geparstes Korpus des Deutschen / Zeitungskorpus - TüPP-D/Z
TüPP-D/Z ist eine Sammlung von Artikeln aus der Zeitung "die tageszeitung" (taz), die automatisch hinsichtlich Satzstruktur, topologischen Feldern und Chunks annotiert wurden, aufbauend auf morphosyntaktischer Annotation und morphologischen Ambiguitätsklassen.
Die Daten des aktuellen Release der TüPP-D/Z entstammen der Wissenschaftsausgabe der taz von 1999. Die Artikel stammen aus dem Zeitraum vom 2. September 1986 bis zum 7. Mai 1999 und umfassen mehr als 200 Millionen Wörter.