Žákovské korpusy a co s nimi

Mgr. Svatava Škodová, Ph.D.

Ing. Alexandr Rosen, Ph.D.

 

Online účastníci workshopu se mohou připojit přes následující link:

https://cuni-cz.zoom.us/j/8545042941

 

Workshop je určen všem, které zajímá jazyk nerodilých mluvčích a možnosti jeho zachycení, zobrazení a analýz pomocí tzv. žákovských korpusů. Zaměříme se na žákovský korpus češtiny CzeSL (Czech as a Second Language).

Worskhop je rozdělen do tří samostatných celků, ve kterých se pokusíme osvětlit a ukázat následující:

Část 1:

Obecné představení žákovských korpusů a jejich využití. Porovnání rozdílů mezi žákovským korpusem a korpusy jazyka rodilých mluvčích, vymezení jedinečných rysů žákovského korpusu. Budování žákovského korpusu CzeSL: specifika korpusu s ohledem na získávání textů a tzv. metadata k těmto textům a jejich autorům. Zpracování textů včetně jejich přepisu. Představení chybové a lingvistické anotace použité pro CzeSL.

Část 2:

Představení jednotlivých verzí žákovského korpusu CzeSL, resp. korpusy CzeSL-plain, CzeSL-SGT a CzeSL-man. Možnosti a omezení hledání v jednotlivých verzích, včetně vytváření statistik v rozhraní KonText.

Část 3:

Představení verze žákovského korpusu CzeSL v prostředí TEITOK, možnosti hledání a vytváření statistik v prostředí TEITOK. Vytváření vlastního korpusu v prostředí TEITOK.

Výklad bude vycházet z praktických příkladů, účastníci si budou moci vše sami vyzkoušet. Před tutoriálem budou připravené uživatelské příručky k jednotlivým korpusům.

 

Odkazy:

http://utkl.ff.cuni.cz/learncorp/

https://dspace.cuni.cz/handle/20.500.11956/123103 (Rosen, A., Hana, J., Hladká, B., Jelínek, T., Škodová, S., and Štindlová, B. (2020). Compiling and annotating a learner corpus for a morphologically rich language – CzeSL, a corpus of non-native Czech. Karolinum, Charles University Press, Praha)

 

Úvod > Žákovské korpusy a co s nimi