Slovenský národný korpus (SNK): Využitie a prístup

Slovenský národný korpus (SNK) je rozsiahla databáza textov, ktorá slúži na vedecké, výskumné a učebné účely v oblasti jazykovedy. Jeho zaradenie do korpusových databáz je možné len na základe licenčnej zmluvy, v ktorej sa Jazykovedný ústav Ľ. Štúra SAV, v. v. i. zaväzuje autorom či majiteľom autorských práv, že tieto texty nebude poskytovať tretím osobám a že sa z nich používateľom zobrazí len bezprostredný kontext hľadaného jazykového javu.

Prístup ku korpusom SNK

Jednoduché vyhľadávanie je možné aj bez registrácie prostredníctvom webového rozhrania, ale s veľmi obmedzeným prístupom ku korpusom (prim-6.0-public-all, r-mak-3.0 a iné), bez možnosti vytvárania podkorpusov. Využitie na vedecko-výskumné ciele je bezplatné, prístup na vyhľadávanie dostane používateľ po zaregistrovaní. Používateľom ostáva k dispozícii aj predchádzajúca verzia korpusu prim-10.0 v rozsahu vyše 1,68 mld. tokenov. Jej využitie na vedecko-výskumné ciele je bezplatné. Na požiadanie je možné povoliť prístup aj k starším verziám.

Prehľad dostupných korpusov SNK:

  • Hlavný korpus písaných textov SNK
  • Ručne morfologicky anotovaný korpus SNK
  • Ďalšie korpusy súčasných písaných textov SNK
  • Paralelné korpusy SNK
  • Webový korpus SNK
  • Korpusy textov z Wikipédie (a Necyklopédie)
  • Špecializované korpusy SNK
  • Súbor korpusov Omnia
  • Časovo vymedzené korpusy
    • Korpus textov z r. 864 - 1843
    • Korpus textov z r. 1843 - 1954
    • Korpus textov denníka SME z r.

Frekvenčné zoznamy lem, tvarov slov a slovných druhov z dostupných korpusov SNK sú taktiež k dispozícii.

Aktuálna verzia korpusu prim-11.0 bola vytvorená 26. 2. 2025 a sprístupnená 11. 4. 2025 v rozsahu vyše 1,85 mld. tokenov.

Registrácia a podmienky používania

Na získanie plného prístupu do databáz Slovenského národného korpusu je potrebná registrácia prostredníctvom vyplnenia webového registračného formulára. Po jeho vyplnení a odoslaní treba počkať niekoľko sekúnd, kým bude vo Vašom počítači vygenerovaný dokument Podmienky používania SNK, ktorý je potrebné podpísať a doručiť poštou alebo osobne na adresu: Slovenský národný korpus, Jazykovedný ústav Ľ. Štúra SAV, v. v. i.

Súhlas s podmienkami používania korpusov (najmä obmedzený rozsah citovania konkrétneho textu) a v rámci nich záväzok korektného prístupu k dátam je preto nevyhnutné potvrdiť vlastnoručným, nie elektronickým a ani skenovaným podpisom. Zároveň sa registrovaný používateľ svojím vlastnoručným, nie elektronickým a ani skenovaným podpisom zaväzuje, že sa nebude úmyselne usilovať o znefunkčnenie infraštruktúry Slovenského národného korpusu a ani o neoprávnené získavanie dát z korpusových databáz nad rámec poskytovaného rozsahu.

Pred začatím používania webového rozhrania si treba prečítať a odsúhlasiť nasledujúce podmienky:

Texty sa do Slovenského národného korpusu (SNK) získavajú priamo od autorov alebo vlastníkov autorských či distribučných práv na základe zmluvy o inom, t. j. nekomerčnom použití v súlade so zákonom o autorských právach.

Ako používateľ sa zaväzujem, že texty budem používať len na vedecké, výskumné, učebné alebo iné nekomerčné ciele. Budem citovať všetky údaje získané zo Slovenského národného korpusu (kontexty, frekvencie a iné údaje zo všetkých alebo z vybraných textov) podľa príslušnej verzie a časti SNK. Pri citovaní konkrétneho diela (novín, časopisu, knihy, článku atď.) uvediem SNK ako hlavný zdroj, takisto uvediem citáciu daného textu podľa bibliografickej normy.

Ak ste zaslali požadované údaje a prihlasovacie údaje vám doteraz neprišli, kontaktujte administrátorov SNK.

Korpus Verzia Veľkosť Dátum vytvorenia Dátum sprístupnenia
prim 11.0 1,85 mld. tokenov 26. 2. 2025 11. 4. 2025
prim 10.0 1,68 mld. tokenov N/A N/A

tags: #snk #korpus #slovensky

Populárne príspevky: