Michal Křen

kontakt

Studies

• 1991–1996: Informatics, Faculty of Mathematics and Physics, Charles University, Prague (Mgr.)
• 2005–2012: Philology – Mathematical linguistics, Faculty of Arts, Charles University, Prague (Ph.D.)

Research interests

• corpus design
• corpus linguistics
• computational linguistics
• collocations
• language variation and change
• general linguistics
• East-European and Balkan languages

Corpora (participation in design and compilation)

SYN, SYN2015, SYN2013PUB, SYN2010, SYN2009PUB, SYN2006PUB, SYN2005, SYN2000, FSC2000
ORAL2013, ORAL2008
InterCorp (earlier versions)

Selected bibliography:

Books

Křen, M. (2013): Odraz jazykových změn v synchronních korpusech. Praha: NLN. ISBN 978-80-7422-265-8.

Čermák, F. – Křen, M. (et al.) (2011): Frequency Dictionary of Czech: Core Vocabulary for Learners. London: Routledge. ISBN 978-0-415-57661-1.

Čermák, F. – Křen, M. (et al.) (2004): Frekvenční slovník češtiny. Praha: NLN. ISBN 80-7106-676-1.

Articles

Cvrček, V. – Čermáková, A. – Křen, M. (2016): Nová koncepce synchronních korpusů psané češtiny. Slovo a slovesnost, 77 (2), 83–101. ISSN 0037-7031.

Křen, M. – Cvrček, V. – Čapka, T. – Čermáková, A. – Hnátková, M. – Chlumská, L. – Jelínek, T. – Kováříková, D. – Petkevič, V. – Procházka, P. – Skoumalová, H. – Škrabal, M. – Truneček, P. – Vondřička, P. – Zasina, A. (2016): SYN2015: Representative Corpus of Contemporary Written Czech. In: Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC'16), pp. 2522–2528. Portorož: ELRA. ISBN 978-2-9517408-9-1.

Křen, M. (2015): Czech conditional conjunctions: a corpus-based study of development tendencies. Prace Filologiczne, tom LXVII, 215–232. ISSN 0138-0567.

Benešová, L. – Křen, M. – Waclawičová, M. (2015): Korpus spontánní mluvené češtiny ORAL2013. Časopis pro moderní filologii, 97 (1), 42–50. ISSN 0008-7386.

Hnátková, M. – Křen, M. – Procházka, P. – Skoumalová, H. (2014): The SYN-series corpora of written Czech. In: Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), pp. 160–164. Reykjavík: ELRA. ISBN 978-2-9517408-8-4.

Benešová, L. – Waclawičová, M. – Křen, M. (2014): Building a Data Repository of Spontaneous Spoken Czech. In: Best Practices for Spoken Corpora in Linguistic Research. Ruhi, Ş. – Haugh, M. – Schmidt, T. – Wörner, K. (eds), pp. 128–141. Newcastle upon Tyne: Cambridge Scholars Publishing. ISBN 978-1-4438-6033-8. (revised version of the LREC 2012 paper)

Machálek, T. – Křen, M. (2013): Query interface for diverse corpus types. In: Natural Language Processing, Corpus Linguistics, E-learning, pp. 166–173. Lüdenscheid: RAM Verlag. ISBN 978-3-942303-18-7.

Válková, L. – Waclawičová, M. – Křen, M. (2012): Balanced data repository of spontaneous spoken Czech. In: Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12), pp. 3345–3349. İstanbul: ELRA. ISBN 978-2-9517408-7-7.

Křen, M. – Waclawičová, M. (2011): Database Framework for a Distributed Spoken Data Collection Project. In: Explorations across Languages and Corpora. Goźdź-Roszkowski, S. (ed.), pp. 83–93. Frankfurt am Main: Peter Lang. ISBN 978-3-631-61677-2.

Křen, M. – Rosen, A. – Štourač, M. – Vavřín, M. – Vondřička, P. (2011): Paralelní korpus InterCorp po sedmi letech. In: Korpusová lingvistika Praha 2011, 2 Výzkum a výstavba korpusů. Čermák, F. (ed.), str. 105–115. Praha: NLN. ISBN 978-80-7422-115-6.

Křen, M. (2009): The SYN Concept: Towards One-Billion Corpus of Czech. In: Proceedings of the Corpus Linguistics Conference. Mahlberg, M. – González-Díaz, V. – Smith, C. (eds). Liverpool. ISSN 1747-9398.

Waclawičová, M. – Křen, M. (2008): ORAL2008: New Balanced Corpus of Spoken Czech. In: Труды международной конференции "Корпусная лингвистика – 2008", с. 105–112. Санкт-Петербург: Издательство СПбГУ. ISBN 978-5-288-04769-5.

Křen, M. – Hlaváčová, J. (2008): Corpus as a Means for Study of Lexical Usage Changes. In: Proceedings of the 13th EURALEX International Congress. Bernal, E. – DeCesaris, J. (eds), pp. 437–447. Barcelona. ISBN 978-84-96742-67-3.

Křen, M. (2008): Compilation of the Dictionary of Karel Čapek. In: Corpus Linguistics, Computer Tools, and Applications – State of the Art. Lewandowska-Tomaszczyk, B. (ed.), pp. 469–481. Frankfurt am Main: Peter Lang. ISBN 978-3-631-58311-1.

Křen, M. (2006): Kolokační míry a čeština: srovnání na datech Českého národního korpusu. In: Kolokace. Čermák, F. – Šulc, M. (eds), str. 223–248. Praha: NLN. ISBN 80-7106-863-2.

Křen, M. (2006): Frequency Dictionary of Czech: A Detailed Processing Description. In: Insight into Slovak and Czech Corpus Linguistics. Šimková, M. (ed.), pp. 16–25. Bratislava: Veda 2006. ISBN 80-224-0880-8.

Čermák, F. – Křen, M. (2005): New Generation Corpus-Based Frequency Dictionaries: The Case of Czech. International Journal of Corpus Linguistics, 10 (4), 453–467. ISSN 1384-6655.

Čermák, F. – Křen, M. (2005): Large Corpora, Lexical Frequencies and Coverage of Texts. In: Proceedings of the Corpus Linguistics Conference. Danielsson, P. – Wagenmakers, M. (eds). Birmingham. ISSN 1747-9398.

Talks
Frekvenční slovníky češtiny. ÚJČ AV ČR Praha, 30.11.2016 (Akademický slovník současné češtiny a software pro jeho tvorbu).
Asociační míry v KonTextu a jejich použití pro hledání kolokací. Výjezdní zasedání SNK JÚĽŠ SAV, 09.06.2016.
Rozhraní KonText: aktuální a perspektivní možnosti využití. Výjezdní zasedání SNK JÚĽŠ SAV, 09.06.2016.
Paralelní korpus InterCorp. Jazykovědné sdružení ČR, pobočka Hradec Králové, Pedagogická fakulta UHK, 17.03.2016.
Recent Developments in the Czech National Corpus. Lancaster, 20.07.2015 (CMLC-3, Corpus Linguistics conference).
SynKorp: prostředí pro správu a zpracování textů. Praha, 17.09.2014 (Korpusová lingvistika Praha conference).
ORAL2013: representative corpus of informal spoken Czech. Olomouc, 07.06.2014 (OLINCO conference).
Jazyk a jeho proměny ve světle korpusových dat. Pražský lingvistický kroužek, 10.02.2014.
Odraz jazykových změn v synchronních korpusech. Slovenská jazykovedná spoločnosť pri JÚĽŠ SAV Bratislava, 25.06.2013.
Czech National Corpus as a research infrastructure. ISZiP UW Warszawa, 21.05.2013.
The Czech National Corpus: Recent developments and future orientation. Dubrovnik, 13.09.2011 (Slavicorp conference).
Accessing the Czech National Corpus. Warszawa, 22.11.2010 (Slavicorp conference).
Frequency Dictionary of Czech: The processing procedure. MNSZ Budapest, 03.11.2005.
Technical background of the Czech National Corpus. LEP FF Beograd, 29.09.2004.
Příprava frekvenčního slovníku. JÚĽŠ SAV Bratislava, 13.01.2003.


2016-12-02 12:09:31