Zu dieser Seite
Diese Seite wurde vom Lehrstuhl für slavische Sprachenwissenschaft der Universität Tübingen (Prof. Dr. Tilman Berger) in Kooperation mit dem Lehrstuhl für Slavische Philologie (Sprachwissenschaft) der Universität Freiburg (Prof. Dr. Achim Rabus) erstellt und wird von beiden weiter "gepflegt". Wenn Sie Korpora kennen, die bei uns nicht aufgeführt sind, melden Sie sich bitte unter tberger at uni-tuebingen.de!
Parallelkorpora
- InterCorp (über das Tschechische Nationalkorpus zugänglich)
https://korpus.cz
Ostslavische Sprachen
1. Russisch
- Nacional’nyj korpus russkogo jazyka
http://www.ruscorpora.ru/ - BOKR (The Russian Reference Corpus)
http://bokrcorpora.narod.ru/index-en.html - GICR (General Internet-Corpus of Russian) – ГИКРЯ (Генеральный Интернет-Корпус Русского Языка)
http://www.webcorpora.ru/ - AOT - Avtomatičeskaja obrabotka teksta
http://www.aot.ru/ - Chanko - Chel'sinskij annotirovannyj korpus
http://www.ling.helsinki.fi/projects/hanco/ - Korpus russkogo literaturnogo jazyka
http://narusco.ru/ - Sammlung russischer Korpora
http://corpus.leeds.ac.uk/ruscorpora.html - Korpus russkoj ustnoj reči
http://russpeech.spbu.ru/ - Ustja River Basin Corpus
http://www.parasolcorpus.org/Pushkino - Corpus of Rogovatka dialect
http://www.parasolcorpus.org/Rogovatka - Corpus of Malinino dialect
https://lingconlab.ru/malinino - Corpus of Russian spoken in Daghestan
http://www.parasolcorpus.org/dagrus/ - Corpus of Russian spoken in Chuvashia
http://lingconlab.ru/ChuvashRus/ - Corpus of Spiridonova Buda dialect
http://lingconlab.ru/SpiridonovaBuda/ - Russian Learner Corpus
http://web-corpora.net/RLC/ - Томский диалектный корпус
http://losl.tsu.ru/?q=corpus/demo
2. Ukrainisch
- Корпус української мови
http://www.mova.info/corpus.aspx?l1=209 - General Regionally Annotated Corpus of Ukrainian
http://uacorpus.org/ - Corpus of Ukrainian Texts
http://lang.org.ua/uk/corpora/
3. Weißrussisch
- Corpus Albaruthenicum
http://grid.bntu.by/corpus/ - Weißrussisches Bibelkorpus
http://biblija.bnkorpus.info/ - Belaruski N-korpus
http://bnkorpus.info/ - Oldenburger Korpus zur weißrussisch-russischen gemischten Rede
https://uol.de/ok-wrgr/
4. Russinisch
- Corpus of Spoken Rusyn
www.russinisch.uni-freiburg.de/corpus
5. Historische Korpora
- Ruthenisches Korpus DiaUk
https://korpling.org/annis/diauk
6. Mehrsprachige Dialektkorpora
- TriMCo Dialectal Corpus
http://www.trimcocorpus.de/spoco/
Westslavische Sprachen
1. Polnisch
- Narodowy Korpus Języka Polskiego
http://nkjp.pl/ - Korpus Języka Polskiego Wydawnictwa Naukowego PWN
https://sjp.pwn.pl/korpus - Wyszukiwarka korpusowa Monco
http://monco.frazeo.pl/ - Korpus dyskursu parlamentarnego
https://kdp.nlp.ipipan.waw.pl/query_corpus/ - Elektroniczny korpus tekstów polskich z XVII i XVIII w. (do 1772 r.)
http://korba.edu.pl/ - Korpus Spiski
https://www.spisz.ijp.pan.pl/ - Elektroniczny Korpus Tekstów Gwarowych z Maćkowiec na Podolu
https://mackowce.ijp.pan.pl/query_corpus/ - SpokesWeb (conversational data)
http://spokes.clarin-pl.eu/ - LangGener Spoken Corpus
https://langgener.ijp.pan.pl/#!/ - Hamburg Corpus of Polish in Germany (HamCoPoliG)
https://corpora.uni-hamburg.de/hzsk/de/islandora/object/spoken-corpus:hamcopolig
2. Tschechisch
- Český národní korpus
https://www.korpus.cz/ - Staročeská textová banka
https://korpus.vokabular.ujc.cas.cz/first_form?corpname=STB-1.1.14.1 -
Český biblický překlad v diachronním pohledu: Databáze pozdně středověkých biblických textů
http://www.diabible.com/
3. Slovakisch
- Slovenský národný korpus
http://korpus.juls.savba.sk/
4. Obersorbisch
- Hornjoserbski tekstowy korpus
http://www.serbski-institut.de/os/Hornjoserbski-tekstowy-korpus/ - Hornjoserbski tekstowy korpus HOTKO
https://www.korpus.cz/kontext/query?corpname=hotko - Korpus des gesprochenen Obersorbischen
https://pangloss.cnrs.fr/corpus/Sorabe%20sup%C3%A9rieur%20(courant)
5. Niedersorbisch
- Dolnoserbski tekstowy korpus
http://www.dolnoserbski.de/korpus/ - Korpus GENIE – GEsprochenes NIEdersorbisch/Wendisch
http://genie.coli.uni-saarland.de/cgi-bin/start.html
6. Schlesisch
- Korpus Ślōnskij Mowy
https://silling.org/
Südslavische Sprachen
1. Serbisch
- Korpus savremenog srpskog jezika na Matematičkom fakultetu Univerziteta u Beogradu
http://www.korpus.matf.bg.ac.rs/prezentacija/korpus.html
2. Kroatisch
- Hrvatski nacionalni korpus
http://filip.ffzg.hr/cgi-bin/run.cgi/first_form - Hrvatska jezična riznica
http://riznica.ihjj.hr/
3. Bosnisch
- The Oslo Corpus of Bosnian Texts
http://www.tekstlab.uio.no/Bosnian/Corpus.html
4. Slovenisch
- Gigafida-Korpus
http://www.gigafida.net/ - Nova beseda
http://bos.zrc-sazu.si/a_beseda.html
5. Bulgarisch
- Българският национален корпус
http://dcl.bas.bg/balgarskiyat-natsionalen-korpus/ - Transdanubian Electronic Corpus – Supplement to Bulgarian Dialects in Romania
http://www.corpusbdr.info/?goto=home - Bulgarian Dialectology as Living Tradition
http://bulgariandialectology.org
6. Makedonisch
- Македонски јазичен портал
http://drmj.eu/literature/search/%D0%B0
7. Burgenlandkroatisch
- Corpus croate du Burgenland
https://pangloss.cnrs.fr/corpus/Croate%20du%20Burgenland
8. Krašovanisch
9. Moliseslavisch
- Korpus der Sprache von Acquaviva
https://pangloss.cnrs.fr/corpus/Na-na%C5%A1u%20(Acquaviva%20Collecroce) - Korpus der Sprache von Montemitro
https://pangloss.cnrs.fr/corpus/Na-na%C5%A1u%20(Montemitro) - Korpus der Sprache von San Felice del Molise
https://pangloss.cnrs.fr/corpus/Na-na%C5%A1u%20(San%20Felice%20del%20Molise)
10. Ägäis-Mazedonisch
- Corpus bulgaro-macédonien
https://pangloss.cnrs.fr/corpus/Bulgaro-Mac%C3%A9donien
11. Pomakisch
- Corpus nashta
https://pangloss.cnrs.fr/corpus/Nashta
12. Banater Bulgarisch
- Videoaufnahmen mit phonologischer Transkription
https://www.oeaw.ac.at/vlach/collections/bulgarian-varieties/banat-bulgarian
13. Bessarabisches Bulgarisch
- Videoaufnahmen mit phonologischer Transkription
https://www.oeaw.ac.at/vlach/collections/bulgarian-varieties/bessarabian-bulgarian
Vormoderne Varietäten
- Великие Минеи Четьи
http://www.vmc.uni-freiburg.de/Mens/ - Cyrillomethodiana: Текстов корпус
http://histdict.uni-sofia.bg/textcorpus/list - Annotated Corpus of Pre-Standardized Balkan Slavic Literature
https://www.clarin.si/repository/xmlui/handle/11356/1441
Slavische Webkorpora
Webkorpora der "Aranea-Familie" (Zugang über das Tschechische Nationalkorpus)
-
Allgemeine Informationen auf der Seite "Aranea A Family of Comparable Gigaword Web Corpora" (http://ucts.uniba.sk/aranea_about/index.html)
-
Bohemicum Minus, Maius & Maximum 15.04
-
Polonicum Minus & Maius 15.02
-
Russicum Minus & Maius 15.02, Maximum 16.04
-
Slovacum Minus & Maius 15.11, Maximum 16.01
Webkorpora der "TenTen Corpus Family" (Zugang über Sketch Engine)
- beTenTen – Belarusian corpus from the web
- bgTenTen – Bulgarian corpus from the web
- csTenTen – Czech corpus from the web
- plTenTen – Polish corpus from the web
- ruTenTen – Russian corpus from the web
- skTenTen: Corpus of the Slovak Web
- slTenTen – Slovenian corpus from the web
- ukTenTen – Ukrainian corpus from the web