V tokratnem prispevku pod drobnogledom prednosti in slabosti velikih jezikovnih modelov, kot so ChatGPT, Gemini in DeepSeek, ki z vsakim dnem bolj postajajo naši sogovorniki, prijatelj ter osebni pomočniki. Vsak model prinaša svoje tehnične značilnosti in inovacije, doba umetne inteligence pa z njimi vedno večji zalet. Ne le ameriška in kitajska tehnološka podjetja, tudi slovenski strokovnjaki razvijajo lasten jezikovni model GaMS.

Foto: Freepik
Kaj nam ponuja svetovni trg?
1. Najbolj znan in trenutno tudi najbolj popularen velik jezikovni model je ChatGPT, ki ga je razvilo podjetje OpenAI. Tako kot tudi nekateri drugi jezikovni modeli, temelji na uporabi povratnega procesa, imenovanega reinforcement learning (RL), pri katerem se tehnologija uči iz interakcije z ljudmi. Na podlagi teh povratnih informacij lahko ChatGPT izboljšuje svoje rezultate. Model vključuje široko bazo podatkov, vključno s knjigami, spletnimi besedili in članki iz Wikipedije. Njegova glavna sposobnost je generiranje besedil, ki so zelo podobna človeškemu pisanju, zato se najbolje odreže pri pisnih nalogah in klepetu, solidno pa rešuje tudi matematične probleme in programerske izzive. Nekaj težav sicer lahko zaznamo pri generiranju daljših in kompleksnejših besedil. ChatGPT tudi že upošteva zahteve glede varovanja osebnih podatkov (t. i. GDPR), saj uporabniki lahko izklopijo možnost, da bi se njihovi vnosi (osebni podatki, zanimanja, vprašanja) uporabljali za nadaljnje učenje modela. Pri ChatGPT Teams, plačljivi različici, namenjeni predvsem podjetjem, je ta funkcija že vnaprej izklopljena, tako da podatki ekipe nikoli ne prispevajo k izboljšanju modela, s čimer se zmanjša tveganje za nenamerno deljenje podatkov ter poslovnih skrivnosti.
Na spletni strani OpenAI dostopamo do brezplačne različice, nadgradnjo in s tem napredne funkcije pa si lahko zagotovimo z mesečnim plačilom v višini 23 evrov.
2. Gemini je drug jezikovni model, ki ga je razvilo podjetje Google. Zasnovan je za multimodalne naloge, ko želimo združevati besedilo s slikami ali drugimi podatkovnimi tipi, odlikuje pa se pri nalogah sklepanja in analizi velikih dokumentov. Po nekaterih raziskavah Gemini Pro (plačljiva različica) dosega natančnost, ki je blizu plačljivemu modelu Chat GPT-3.5 Turbo. Vendar pa naj bi imel nekatere pomanjkljivosti, kot so težave pri matematičnem sklepanju z večjim številom števk in občutljivost na vrstni red odgovorov pri vprašanjih z več možnimi odgovori.
Brezplačna različica ne nudi možnosti generiranja slikovnega gradiva (za razliko od modela ChatGPT, ki nudi omejene možnosti generiranja slikovnega gradiva), za plačljivo pa je treba odšteti 21,99 evrov na mesec.
3. DeepSeek je zadnje predstavljeni veliki jezikovni model, ki prihaja s Kitajske in uporabnikom omogoča analizo velikih podatkovnih zbirk in pridobivanje ključnih vpogledov v odnose med podatki. Zlasti v zapletenih podatkovnih okoljih njegovi algoritmi umetne inteligence in strojnega učenja podatke obdelujejo hitro in natančno. Njegova prednost je cenovna dostopnost. Kitajsko podjetje je namreč za učenje svojih modelov uporabilo slabše grafične kartice, kar pomeni nižje stroške tudi za končnega uporabnika. Čeprav še vedno govorimo o tehnično naprednem modelu, pa je DeepSeek omejen z zakonodajo kitajske vlade, ki cenzurira odgovore na občutljiva politična vprašanja. Poleg tega se njegov model vedno uči iz uporabniških vnosov, kar pomeni, da ni možnosti, da bi uporabniki preprečili uporabo svojih podatkov za izboljšanje sistema.
Brezplačna različica DeepSeek-R1 naj bi kljub uporabi slabših tehnoloških komponent dosegala zmogljivost na ravni sofisticiranih modelov z lastniškimi licencami. Za vse, ki si želijo uporabljati napredne funkcije modela, je namesto mesečne naročnine na voljo zakup razmeroma ugodnih namenskih žetonov.
4. Svoj model ponuja tudi podjetje Meta, imenovan LLaMA, ki je zaradi odprtokodne narave najbolj uporaben za raziskovalne projekte in akademske namene, saj dosega konkurenčne rezultate brez uporabe lastniških podatkov. Njegova šibkost je, da zahteva visoko zmogljivo računalniško opremo, ki je navadnim uporabnikom povečini nedostopna, prav tako pa je zaradi svoje odprtokodne narave nekoliko manj zaščiten in zato bolj dovzeten za nepreverjene informacije.
Tako kot DeepSeek ima tudi ta model na voljo brezplačno različico ali nadgradnjo z zakupom namenskih žetonov.
5. Model Claude podjetja Anthropic daje prednost varnosti in etičnim vidikom, kar ga naredi primernega za obdelavo osebnih in občutljivih podatkov. Zaradi previdnosti pri delovanju je nekoliko skromnejši pri svoji bazi podatkov ter pri zagotavljanju najnovejših informacij.
Brezplačna različica, tako kot vsi ostali modeli, zahteva, da ustvarimo uporabniški račun, za nadgradnjo pa bomo odšteli dobrih 17 evrov mesečno.
Tu so še modeli Mistral, Ernie, Bart, BLOOM, Turing-NLG, Cohere, xAI, EleutherAI in mnogi drugi, vsak s svojimi tehničnimi zmogljivostmi in posebnostmi. Pričakujemo lahko še veliko večjo ponudbo in izboljšave, saj bo tovrstni globalni trg z velikimi vlaganji in širitvijo leta 2030 predvidoma težak okoli 250 milijard evrov, kar pomeni skokovito rast od leta 2023, ko naj bi bila njegova skupna vrednost okoli 1,4 milijarde evrov.
Umetna inteligenca sicer skrbi tudi za ustrezno posodobitev podatkov v spletnih in mobilnih aplikacijah. Kar 750 milijonov spletnih in mobilnih aplikacij trenutno uporablja jezikovne modele, kar pomeni, da se na ta način avtomatizira polovica digitalnega »dela«, ki ga moramo za nemoteno delovanje zagotoviti aplikaciji.
Slovenija z GaMS-om proti vrhu umetne inteligence

Foto: www.povejmo.si
Tudi pri nas potekajo prizadevanja za razvoj velikih jezikovnih modelov, prilagojenih slovenskemu jeziku. V okviru Projekta PoVeJMo, ki ga financirata Javna agencija za raziskovalno in inovacijsko dejavnost (ARIS) ter Evropska unija, se razvija veliki slovenski jezikovni model GaMS (Generativni model slovenščine, natančneje GaMS-1B-Chat). Trenutno je v fazi zbiranja obsežnega slovenskega besedišča, saj vsi veliki jezikovni modeli pri učenju zahtevajo ogromne količine besedil. V Sloveniji je bilo do zdaj zbranih približno 10 milijard besed, cilj pa je doseči 40 milijard, da bi oblikovali model, primerljiv z drugimi svetovno znanimi modeli. Na voljo za preizkus je njegova brezplačna različica.
Cilj razvijalcev projekta je, da bi nam orodje v prihodnosti pomagalo na številnih področjih, kot so medicina, humanistika, industrija, pri razvoju programske opreme ipd.
Nahranite slovenskega GaMS-a
Če želite prispevati svoj košček v mozaik slovenskega GaMS-a, lahko besedila prispevate tukaj. Dobrodošle so seminarske naloge, kratke zgodbe, eseji, prav tako tudi korespondenca elektronske pošte, saj vsako besedilo šteje.
Nova tehnologija – nova tveganja

Foto: Freepik
Vedno večja ponudba velikih jezikovnih modelov pomeni večjo sposobnost in učinkovitost opravljanja specifičnih nalog. Pomembno je spremljati razvojne trende umetne inteligence in razumeti, kako lahko ti modeli prispevajo k različnim področjem ter kakšne so njihove omejitve. Zavedati se moramo, da jih je mogoče zlorabiti tudi za manj plemenite namene. Sposobnost ustvarjanja prepričljivega besedila lahko postane orodje za širjenje dezinformacij, phishing napadov ter teorij zarot, kar ogroža zaupanje v medije in zmanjšuje verodostojnost informacij. Poleg tega umetna inteligenca odpira vprašanja varstva osebnih podatkov in zasebnosti ter prinaša izzive v izobraževanju in etičnih vprašanjih. Zato je ključnega pomena sodelovanje med medijskimi strokovnjaki in razvijalci, da tehnologijo uporabljamo odgovorno in etično.
Odgovornost za varno uporabo nove tehnologije pa je tudi v rokah uporabnikov. Potrebno se je namreč zavedati, da večina netočnih informacij, ki jih srečamo pri uporabi jezikovnih modelov, ni in ne bo posledica samega modela, temveč njegove nepravilne uporabe. Če uporabniki postavimo nejasno ali zavajajoče vprašanje, lahko prejmemo odgovor, ki ni povsem točen. To pomeni, da bodo napačne interpretacije in dezinformacije v tem primeru posledica človeških napak in ne tako naučene umetne inteligence. Zato je ključno preverjanje virov, natančno oblikovanje vprašanj in razumevanje delovanja jezikovnih modelov, pri čemer so nam lahko v pomoč tudi naše kompetence medijske pismenosti.
Razvoj tehnologije in vpliv na okolje
Če visoko zmogljivi čipi ne bodo več nujni, kar je nedavno dokazalo podjetje DeepSeek z uporabo manj zmogljivih grafičnih kartic, bi to lahko imelo pomemben vpliv na varovanje okolja. Podatkovni centri, v katere so ZDA nameravale vložiti stotine milijard dolarjev, so namreč izjemno energetsko potratni, zato ameriška podjetja celo razmišljajo o lastnih jedrskih elektrarnah za oskrbo z energijo.
Ali ste naprimer vedeli, da računalniški procesorji za svoje hlajenje pri generiranju enega srednje dolgega besedila porabijo plastenko vode?
Poleg izpostavljenih tveganj se nam pri uporabi novih tehnologij porajajo še številna druga vprašanja. Tako denimo na področju njihove uporabe pri otrocih ali pa kako naj jo v delo z njimi vključujejo učitelji in drugi pedagoški delavci. Odgovore na zastavljena vprašanja in vpogled v obravnavo še nekaterih drugih tveganj lahko najdete med vsebinami na portalu MiPi:
► Vodnik po ChatGPT, hitro rastoči zvezdi umetne inteligence,
► Kdo stoji za orodji umetne inteligence?