Český mluvený korpus ORAL2006

Mluvený korpus ORAL2006 je v pořadí třetím mluveným korpusem, který je dostupný v rámci projektu Český národní korpus. Zachycuje mluvenou češtinu z celé oblasti českých nářečí v užším slova smyslu. Jedná se o přepis 221 nahrávek z let 2002 - 2006. Všechny nahrávky vznikaly v neformálních situacích, to znamená, že se mluvčí vzájemně znali a měli k sobě přátelský vztah. Celkem bylo nahráno 6 693 minut, tj. asi 111 a půl hodiny, a v jejich rámci zaznamenáno 1 000 798 slov od 754 mluvčích.

Způsob pořizování nahrávek, jejich přepis a označování probíhalo v souladu se zásadami předchozích mluvených korpusů PMK a BMK. Z tohoto důvodu bylo zachováno i označování sociolingvistických kategorií mluvčích: pohlaví muž (M) a žena (Z), věk do 35 let (I) a věk 35 let a více (V), vzdělání základní a středoškolské (B) a vysokoškolské, a to i započaté (A). Navíc lze o mluvčích v tomto korpusu zjistit jejich přesný věk, vzdělání (ZŠ, SŠ, VŠ) a nářeční oblast jejich pobytu v dětství - tedy v době, kdy se formuje základ jejich individuálního jazykového úzu. V korpusu se vyskytují mluvčí z následujících nářečních oblastí (podle Běličova dělení): středočeská, severovýchodočeská, jihozápadočeská, přechodná oblast česko-moravská a české pohraničí.

Všechny nahrávky jsou z neformálních situací, přesto zachováváme označení neformálnosti jako v předchozích korpusech - je vyjádřeno posledním písmenem v označení sondy - N. První dvojčíslí v názvu sondy označuje rok pořízení nahrávky, další kombinace písmene a čísel je vlastním číslem sondy.

Na pořizování a přepisu nahrávek se podíleli především studenti pražských vysokých škol a další spolupracovníci ÚČNK.


Marie Kopřivová
Martina Waclawičová

hlavní koordinátorky