Slovenský národný korpus: Nástroj pre výskum a výučbu slovenčiny
Slovenský národný korpus predstavuje rozsiahly a systematicky budovaný zdroj jazykových dát, ktorý je neoceniteľný pre výskum slovenského jazyka, jeho výučbu a aplikácie v oblasti spracovania prirodzeného jazyka.
Tvorbou, skvalitňovaním, spravovaním a sprístupňovaním uvedených zdrojov je poverený kolektív Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra SAV aktuálne na základe Zmluvy o združení prostriedkov na tvorbu a rozvoj Slovenského národného korpusu (č. 0323/2017) uzavretej medzi Ministerstvom školstva, vedy, výskumu a športu SR, Ministerstvom kultúry SR, SAV, JÚĽŠ SAV.
Čo je Slovenský národný korpus?
Slovenský národný korpus je rozsiahly súbor textov v slovenskom jazyku, ktorý slúži ako reprezentatívna vzorka jazyka v jeho rôznych podobách. Je to cenný nástroj pre lingvistov, učiteľov, prekladateľov a všetkých, ktorí sa zaoberajú slovenským jazykom.
V súčasnosti sú online dostupné odborníkom aj širokej verejnosti na vyhľadávanie jazykových informácií, na využitie v oblasti počítačového spracovania prirodzeného jazyka a vo výučbe slovenčiny ako materinského i cudzieho jazyka, od roku 2002.
Typy korpusov
Používateľom sú k dispozícii rôzne korpusy súčasných textov vrátane paralelných korpusov, hovorený korpus, nárečový korpus, historický korpus, ako aj morfologická databáza a terminologická databáza. Na ich tvorbu sa vyvíjajú vlastné alebo sa využívajú existujúce počítačové nástroje.
- Korpusy súčasných textov: Obsahujú širokú škálu textov z rôznych oblastí, ako je beletria, publicistika, odborná literatúra a internetové zdroje.
- Paralelné korpusy: Obsahujú texty v slovenskom jazyku a ich preklady do iných jazykov, čo je užitočné pre prekladateľov a lingvistov zaoberajúcich sa porovnávacou lingvistikou.
- Hovorený korpus: Obsahuje prepisy hovoreného jazyka z rôznych situácií, ako sú rozhovory, diskusie a prednášky.
- Nárečový korpus: Zaznamenáva rozdiely v slovenských nárečiach.
- Historický korpus: Umožňuje sledovať vývoj jazyka v čase.
- Morfologická databáza: Obsahuje informácie o tvarosloví slovenského jazyka.
- Terminologická databáza: Zameriava sa na odbornú terminológiu.
Využitie Slovenského národného korpusu
Slovenský národný korpus má široké spektrum využitia:
- Jazykový výskum: Umožňuje skúmať jazykové javy, ako sú frekvencia slov, gramatické štruktúry a štylistické vlastnosti textov.
- Výučba slovenčiny: Poskytuje autentické jazykové materiály pre výučbu gramatiky, slovnej zásoby a štylistiky. Publikácia umožňuje predstaviť možnosti využitia korpusov v školskej praxi pri príprave konkrétnych úloh alebo ukážok preberaného učiva.
- Prekladateľstvo: Pomáha prekladateľom nájsť správne ekvivalenty slov a fráz v cieľovom jazyku.
- Spracovanie prirodzeného jazyka: Je zdrojom dát pre vývoj systémov na automatické spracovanie textu, ako sú automatické prekladače a systémy na rozpoznávanie reči.
Učebnica Slovenský národný korpus - Používanie, príklady, postupy
Učebnica naväzuje na publikáciu Slovenský národný korpus Texty, anotácie, vyhľadávania, je určená lingvistom, učiteľom slovenského jazyka a cudzích jazykov na všetkých stupňoch škôl, prekladateľom, študentom a všetkým záujemcom o korpusové a jazykové databázy.
Rámcovým cieľom autorov je predstavenie čo najviac spôsobov vyhľadávania v istej postupnosti aj podľa poznaných potrieb a daností doterajších používateľov a zároveň poukázať na pestrosť jazyka a jeho dynamiku.
Publikácia umožňuje predstaviť možnosti využitia korpusov v školskej praxi pri príprave konkrétnych úloh alebo ukážok preberaného učiva.
tags: #slovenský #národný #korpus


