Kdo pozna vse besede?

Who knows all the words?

Objavljeno dne/Published on: 02.05.2013
Avtor članka/Article Author: dr. Mojca Stritar

Še ena iz tipičnega slovenističnega vsakdana (no, ali pa vsaj vsakotednika).Očitno si ljudje okrog mene predstavljajo, da se ob večerih na pamet učim Slovar slovenskega knjižnega jezika in ga dopolnjujem s prebiranjem gasilskih, čebelarskih, jamarskih, fizikalnih in drugih slovarčkov. Kadar sem bolj raziskovalne volje, pa brskam za zaprašenimi besedami, ki so izumrle že kmalu zatem, ko so bile okorno natisnjene v trubarjevskih spisih, ali tiholazim med spedenanimi najstniki in na vse pretege vlečem na ušesa, kateri slengovski štosi so med njimi najaktualnejši ta teden ... Ampak to seveda ni res.

"Do you know what gročiti means?" "I have no clue. " "How? Don't you study the Slovene language? You should know that! " Just another example from daily life of a person who studies the Slovene language. People around me obviously think that I spend all my evenings learning the Slovene language dictionary by heart and in addition read through firefighing, beekeeping, caving, physical and other glossaries. When I feel more like researching, however, I browse through dusty words which have become extinct shortly after being clumsily printed in Trubar's files, or eavesdrop on cool teenagers and try hard to catch this week's most popular slang expressions... Of course, none os this is true.

Poznavanje vsega, kar je kdaj kdo izustil v slovenščini, ni niti moja naloga niti moj smoter, zato brez težav priznam, da za vsako slovensko besedo pač ne vem, kaj pomeni. To bi bilo nemogoče in celo majčkeno nepotrebno – zakaj bi se utrujala z nečim, kar zame solidno opravljajo slovarji in jezikovni korpusi?

Korpusi!? Tega pojma verjetno ne poznate, ker se še rad zadržuje v ekskluzivnem krogu jezikoslovnih izbrancev in še ni odločneje zakoračil med širše množice. Ampak ustavimo se najprej pri slovarjih. V časih, ko so bili računalniki stvar znanstvene fantastike, je bil tako vseveden slovar, kakršen je denimo naš »najsvetejši«, Slovar slovenskega knjižnega jezika, po domače SSKJ, resen nacionalni podvig. Kar dve desetletji je cela vojska sodelavcev na listke izpisovala primere iz literature, časopisov in drugih besedil. Teh listkov se je nabralo za šest milijonov in vse je bilo treba urediti, označiti in razložiti. Če ste iz katere od generacij, ki se je mučila z zamudnim ročnim brskanjem po klasičnih, papirnatih katalogih v knjižnicah, si predstavljate, kakšno delo je bilo opravljeno, da je iz nepregledne množice papirja nastala smiselna, urejena in vsebinsko bogata celota.

»Dajte že enkrat popravit ta slovar,« pa se danes pogosto sliši, ko nekdo prvič pobrska po SSKJ in ugotovi, da v njem ni računalniške miške, zloglasne zgoščenke ali vseprisotnih blogov. Ja, od začetka 90. let, ko je bil SSKJ zaključen, je svet zdrvel v globalizirano (tudi to besedo boste tam zaman iskali) dobo interneta, v katerem lahko Mojca iz Slovenije, če jo to slučajno zanima, vsako jutro prebere svež zapisek o tem, kaj je tisti dan jedel Salvador iz Mehike, in kjer vsak dan nastane več besedil kot verjetno prej v celotnem srednjem veku skupaj. Debele, desetletja nastajajoče knjižne izdaje slovarjev poblaznelemu pisarjenju na vseh koncih in krajih naenkrat ne zmorejo več slediti. Na srečo nam v časih, ko navaden telefon zmore več kot superračunalniki starejših različic Jamesa Bonda, pri razvozlavanju, kaj neka beseda pomeni ali kako se uporablja, pomagajo čudeži računalništva.

Prvi korak je, da neznano besedo preprosto poguglamo (če ne veste, kaj je to, v spletni iskalnik Google vpišite guglati ...). Lahko pa se po odgovor zatečemo k jezikovnim korpusom, brez katerih si marsikateri sodobni jezikoslovec, prevajalec, učitelj ali lektor ne zna več predstavljati dela. Gre za velikanske zbirke besedil iz časopisov, revij, interneta, literature in tako naprej, ki s pomočjo bolj ali (včasih tudi) manj enostavnih vmesnikov omogočajo najrazličnejša iskanja. Če nas recimo zanima beseda slovenščina, jo vpišemo v iskalnik korpusa in takoj dobimo izstreljenih nekaj tisoč, če ne celo nekaj deset tisoč stavkov, v katerih je bila napisana. Te stavke potem pregledujemo, prebiramo, razčlenjujemo, ugotavljamo, v katerih sklonih se uporablja beseda, katere besede so pogosto ob njej (recimo lepa ali polomljena slovenščina), ali se pogosteje uporablja v časopisih, na internetu in tako naprej. Šest milijonov listkov iz SSKJ za korpuse ni noben bavbav – še več, če v največjem slovenskem korpusu Gigafida preštejemo vsako besedo v vsakem besedilu, jih je skupaj kar ena milijarda. Z njimi lahko v manj kot sekundi pridemo do večje količine podatkov, kot bi jo prej v kakem mesecu sproducirala četica strokovnjakov.

Marsikdo je razočaran, ko ugotovi, da korpus seveda še ni slovar. V njem samo vidimo besede v besedilih, razlage in vsa ostala opozorila pa si moramo ob njih kovati uporabniki sami. Korpusno gradivo torej ne ponuja vnaprej pripravljenih odgovorov in od uporabnika zahteva več truda, vendar je vseeno precej aktualnejše kot v slovarjih, natisnjenih pred desetimi ali še več leti. Če je neka beseda vsaj za odtenek več kot samo privatna domislica skupinice prijateljev, obstaja precejšnja verjetnost, da se bo v tako gigantskem korpusu, kot je Gigafida,vsaj nekajkrat pojavila. Meni brskanje po korpusu kar naprej odkriva, da so nekatere stvari drugačne, kot mi pravi moj zmotljivi občutek za jezik. Presenečen bi bil tudi ugledni slovenski jezikoslovec, ki je oni dan suvereno zatrdil, da je v slovenščini tisti, ki je odvisen od mamil, džanki, medtem ko ženska oblika tega samostalnika ne obstaja. Škoda. Če bi vprašal Gigafido, bi videl, da džankica ni samo muha enodnevnica.

Toda niti korpusi ne vedo vsega. V Gigafidi besede gročiti, ki so se je menda domislili v reviji o računalniških igricah, znani po ustvarjalnem, nezadržanem izmišljanju novih izrazov, nisem našla. Šele Wikislovar mi je povedal, da naj bi šlo za intuitivno razumeti kako stvar brez razmišljanja o njej ali v popolnosti dojeti in razumeti kako stvar. Hm. Pa da jo poskusim uporabiti: ali s pomočjo korpusov bolj gročite jezik?

Nazaj na prejšnjo vsebinoNatisni članek