Online účastníci workshopu se mohou připojit přes následující link:
https://cuni-cz.zoom.us/j/8545042941
Workshop je určen všem, které zajímá jazyk nerodilých mluvčích a možnosti jeho zachycení, zobrazení a analýz pomocí tzv. žákovských korpusů. Zaměříme se na žákovský korpus češtiny CzeSL (Czech as a Second Language).
Worskhop je rozdělen do tří samostatných celků, ve kterých se pokusíme osvětlit a ukázat následující:
Část 1:
Obecné představení žákovských korpusů a jejich využití. Porovnání rozdílů mezi žákovským korpusem a korpusy jazyka rodilých mluvčích, vymezení jedinečných rysů žákovského korpusu. Budování žákovského korpusu CzeSL: specifika korpusu s ohledem na získávání textů a tzv. metadata k těmto textům a jejich autorům. Zpracování textů včetně jejich přepisu. Představení chybové a lingvistické anotace použité pro CzeSL.
Část 2:
Představení jednotlivých verzí žákovského korpusu CzeSL, resp. korpusy CzeSL-plain, CzeSL-SGT a CzeSL-man. Možnosti a omezení hledání v jednotlivých verzích, včetně vytváření statistik v rozhraní KonText.
Část 3:
Představení verze žákovského korpusu CzeSL v prostředí TEITOK, možnosti hledání a vytváření statistik v prostředí TEITOK. Vytváření vlastního korpusu v prostředí TEITOK.
Výklad bude vycházet z praktických příkladů, účastníci si budou moci vše sami vyzkoušet. Před tutoriálem budou připravené uživatelské příručky k jednotlivým korpusům.
Odkazy:
http://utkl.ff.cuni.cz/learncorp/
https://dspace.cuni.cz/handle/20.500.11956/123103 (Rosen, A., Hana, J., Hladká, B., Jelínek, T., Škodová, S., and Štindlová, B. (2020). Compiling and annotating a learner corpus for a morphologically rich language – CzeSL, a corpus of non-native Czech. Karolinum, Charles University Press, Praha)