Korpus HOTKO

HOTKO (HOrnjoserbski Tekstowy KOrpus) je korpus horní lužické srbštiny připravovaný v Lužickosrbském institutu v Budyšíně. Korpus obsahuje publicistické, beletristické, náboženské a vědecké texty od poloviny 19. století až do současnosti. Největší část tvoří publicistika (57 %) a beletristika (23 %), zahrnuta je též řada slovníků (12 %). Co se časového zařazení týče, pochází více než polovina textů z nedávné doby po politickém převratu 1989/1990 (54 %). Většina textů byla naskenována a prošla OCR, avšak nebyla zkorigována. Malá část korpusu je prezentována v historickém pravopisu. Korpus není morfologicky anotován ani lematizován, což může komplikovat vyhledávání.

Podrobnější informace o korpusu najdete na stránce http://www.serbski-institut.de/cms/os/48/hornjoserbski.

HOTKO je nereferenční korpus, v plánu je jeho průběžné vylepšování, rozšiřování a aktualizace. Další upozornění se týká přístupu ke korpusu: z technických důvodů se korpus HOTKO neobjevuje v nabídce klasického Bonita 1, je přístupný pouze přes webové rozhraní.