Slovenský národný korpus (SNK): Využitie a prístup
Slovenský národný korpus (SNK) je rozsiahla databáza textov, ktorá slúži na vedecké, výskumné a učebné účely v oblasti jazykovedy. Jeho zaradenie do korpusových databáz je možné len na základe licenčnej zmluvy, v ktorej sa Jazykovedný ústav Ľ. Štúra SAV, v. v. i. zaväzuje autorom či majiteľom autorských práv, že tieto texty nebude poskytovať tretím osobám a že sa z nich používateľom zobrazí len bezprostredný kontext hľadaného jazykového javu.
Prístup ku korpusom SNK
Jednoduché vyhľadávanie je možné aj bez registrácie prostredníctvom webového rozhrania, ale s veľmi obmedzeným prístupom ku korpusom (prim-6.0-public-all, r-mak-3.0 a iné), bez možnosti vytvárania podkorpusov. Využitie na vedecko-výskumné ciele je bezplatné, prístup na vyhľadávanie dostane používateľ po zaregistrovaní. Používateľom ostáva k dispozícii aj predchádzajúca verzia korpusu prim-10.0 v rozsahu vyše 1,68 mld. tokenov. Jej využitie na vedecko-výskumné ciele je bezplatné. Na požiadanie je možné povoliť prístup aj k starším verziám.
Prehľad dostupných korpusov SNK:
- Hlavný korpus písaných textov SNK
- Ručne morfologicky anotovaný korpus SNK
- Ďalšie korpusy súčasných písaných textov SNK
- Paralelné korpusy SNK
- Webový korpus SNK
- Korpusy textov z Wikipédie (a Necyklopédie)
- Špecializované korpusy SNK
- Súbor korpusov Omnia
- Časovo vymedzené korpusy
- Korpus textov z r. 864 - 1843
- Korpus textov z r. 1843 - 1954
- Korpus textov denníka SME z r.
Frekvenčné zoznamy lem, tvarov slov a slovných druhov z dostupných korpusov SNK sú taktiež k dispozícii.
Aktuálna verzia korpusu prim-11.0 bola vytvorená 26. 2. 2025 a sprístupnená 11. 4. 2025 v rozsahu vyše 1,85 mld. tokenov.
Registrácia a podmienky používania
Na získanie plného prístupu do databáz Slovenského národného korpusu je potrebná registrácia prostredníctvom vyplnenia webového registračného formulára. Po jeho vyplnení a odoslaní treba počkať niekoľko sekúnd, kým bude vo Vašom počítači vygenerovaný dokument Podmienky používania SNK, ktorý je potrebné podpísať a doručiť poštou alebo osobne na adresu: Slovenský národný korpus, Jazykovedný ústav Ľ. Štúra SAV, v. v. i.
Súhlas s podmienkami používania korpusov (najmä obmedzený rozsah citovania konkrétneho textu) a v rámci nich záväzok korektného prístupu k dátam je preto nevyhnutné potvrdiť vlastnoručným, nie elektronickým a ani skenovaným podpisom. Zároveň sa registrovaný používateľ svojím vlastnoručným, nie elektronickým a ani skenovaným podpisom zaväzuje, že sa nebude úmyselne usilovať o znefunkčnenie infraštruktúry Slovenského národného korpusu a ani o neoprávnené získavanie dát z korpusových databáz nad rámec poskytovaného rozsahu.
Pred začatím používania webového rozhrania si treba prečítať a odsúhlasiť nasledujúce podmienky:
Texty sa do Slovenského národného korpusu (SNK) získavajú priamo od autorov alebo vlastníkov autorských či distribučných práv na základe zmluvy o inom, t. j. nekomerčnom použití v súlade so zákonom o autorských právach.
Ako používateľ sa zaväzujem, že texty budem používať len na vedecké, výskumné, učebné alebo iné nekomerčné ciele. Budem citovať všetky údaje získané zo Slovenského národného korpusu (kontexty, frekvencie a iné údaje zo všetkých alebo z vybraných textov) podľa príslušnej verzie a časti SNK. Pri citovaní konkrétneho diela (novín, časopisu, knihy, článku atď.) uvediem SNK ako hlavný zdroj, takisto uvediem citáciu daného textu podľa bibliografickej normy.
Ak ste zaslali požadované údaje a prihlasovacie údaje vám doteraz neprišli, kontaktujte administrátorov SNK.
| Korpus | Verzia | Veľkosť | Dátum vytvorenia | Dátum sprístupnenia |
|---|---|---|---|---|
| prim | 11.0 | 1,85 mld. tokenov | 26. 2. 2025 | 11. 4. 2025 |
| prim | 10.0 | 1,68 mld. tokenov | N/A | N/A |


