Stop lažima: Kako RAG tehnologija popravlja AI odgovore
Vjerujete svom AI asistentu? To je vaša prva greška. Ako ste ikada dobili odgovor koji zvuči savršeno, ali je čista izmišljotina, osjetili ste onaj specifičan miris pregrijane logike – miris digitalne halucinacije. ChatGPT i slični modeli nisu enciklopedije; oni su statističke mašine koje pogađaju sljedeću riječ. Bez kontrole, oni su kao majstor koji nema metar pa mjeri ‘od oka’. Rezultat je uvijek krivo isječen materijal. Ako želite da vaš AI prestane lagati o vašim podacima, trebate RAG (Retrieval-Augmented Generation). To nije samo ‘dodatak’, to je digitalna stega koja drži podatke na mjestu dok model radi svoj posao.
Zašto tvoj AI halucinira kao pijanac: Mit o sveznanju
AI modeli imaju ‘rok trajanja’ podataka poznat kao cutoff date. Sve nakon toga za njih ne postoji, pa počinju popunjavati praznine maštom. RAG (Retrieval-Augmented Generation) funkcioniše tako što prisiljava AI da prvo pogleda u vašu bazu podataka, ‘pročita’ relevantne dijelove, pa tek onda sastavi odgovor. Zamislite to kao otvoren ispit: umjesto da student (AI) odgovara iz glave, vi mu dajete udžbenik i kažete ‘citiraj odavde’. Ako ne primijenite ovo, vaša automatizacija će prije ili kasnije proizvesti katastrofalan ‘code smell’ u poslovnim procesima.

Da li je RAG komplikovaniji od običnog promptovanja?
Da, ali razlika je u pouzdanosti. Običan prompt je kao da vičete upute s drugog kraja radionice. RAG je nacrt zalijepljen na radni stol. Zahtijeva postavljanje vektorske baze podataka, ali dugoročno štedi stotine sati ispravljanja grešaka koje nastaju kada AI ‘zaboravi’ historiju ili pravila firme. Hallucination smanjenje je ključno za bilo koji ozbiljan biznis u 2026. godini.
Materijali za gradnju: Šta ti zapravo treba za RAG pipeline?
Ne kupujte gotova rješenja dok ne shvatite osnove. Za postavljanje vlastitog RAG sistema, trebaju vam tri komponente. Prvo, vaš ‘sirovi materijal’ – PDF-ovi, Excel tabele ili baze podataka. Drugo, ‘drobilica’ podataka (Embedding model) koja pretvara tekst u brojeve. Treće, ‘skladište’ (Vektorska baza) kao što su Pinecone, Chroma ili lokalni Qdrant. Zaboravite na skupe pretplate; možete početi sa open-source alatima na svom PC-u. Čak i ako planirate postaviti AI pipeline za vikend, bez dobrog ‘chunking’ algoritma, vaš sistem će biti smeće.
WARNING: Nikada ne šaljite nešifrirane privatne podatke klijenta na javne API-je bez maskiranja. Curenje podataka kroz AI promptove može uzrokovati trajne pravne posljedice prema EU AI Act-u. Testirajte sistem lokalno prije nego što ga spojite na internet.
Nauka o materijalu: Zašto ‘Chunking’ određuje čvrstoću odgovora?
U radionici ne siječete dasku od 4 metra ako vam treba tipl. Slično je u RAG-u. ‘Chunking’ je proces sjeckanja vaših dokumenata na manje komade. Ako su komadi preveliki, AI će se ‘ugušiti’ u nebitnim informacijama. Ako su premali, izgubit će kontekst. Idealna veličina je obično oko 500 do 1000 tokena sa preklapanjem (overlap) od 10%. To je kao spajanje dasaka: trebate malo preklapanja da bi spoj bio čvrst. Ako preskočite ovaj korak, dobit ćete odgovore koji su tehnički tačni, ali potpuno neupotrebljivi jer su izvučeni iz konteksta. Osjetit ćete tu grubost u svakom generisanom izvještaju.
Anatomija promašaja: Kako uništiti RAG sistem u tri koraka
Vidio sam ovo stotinu puta. Ljudi ubace hiljade dokumenata u bazu bez čišćenja. Rezultat? AI počne citirati zastarjele cjenovnike iz 2019. godine jer su se našli u istom folderu. To je kao da u kutiju sa novim šarafima ubacite rđave eksere. Vaš AI će posegnuti za prvim što mu je ‘blizu’ u vektorskom prostoru. Ako ne implementirate ‘Data Governance’, vaš RAG će postati digitalni deponij. Čišćenje podataka je dosadno. Ruke će vam biti prljave od meta-podataka i tagovanja. Ali ako to ne uradite, šest mjeseci kasnije, vaš chatbot će klijentu obećati popust koji više ne postoji. To je trenutak kada shvatite da ste bacili novac na struju i GPU sate.
Mogu li koristiti Excel kao bazu za RAG?
Tehnički možete, ali to je kao da pokušavate zabiti ekser odvijačem. Excel nije dizajniran za semantičku pretragu. Koristite namjenske alate za analizu podataka bez Excela ako želite brzinu i preciznost. Vektorska baza traži značenje, a ne samo ključne riječi.
Code Reality Check: Standardi za 2026. godinu
Prema novim smjernicama za sigurnost podataka, svaki RAG sistem mora imati ‘Human-in-the-loop’ fazu za kritične odgovore. Ne možete dopustiti mašini da sama donosi odluke o ugovorima. Kao što NEC standardi nalažu specifične osigurače za mokre čvorove, tako i vaša AI arhitektura mora imati ‘osigurač’ koji provjerava izvor (source attribution). Svaki odgovor mora imati link do originalnog dokumenta iz kojeg je podatak izvučen. Ako AI ne može pokazati ‘prstom’ gdje je to pročitao, ne vjerujte mu. Uloga čovjeka u AI odlukama ostaje nezaobilazna.
Finansijska realnost: Koliko košta ‘istina’?
Izgradnja RAG sistema na oblaku (Cloud) može vas koštati od 50 do 500 eura mjesečno samo za vektorsku bazu i embeddinge. Međutim, ako koristite lokalne modele poput Llama 3 ili Mistral na sopstvenom hardveru, trošak je samo struja. Jedan moj klijent je uštedio 3.000 eura godišnje prelaskom sa GPT-4 API-ja na lokalni RAG sistem. Investicija u dobru grafičku karticu (npr. RTX 4090) se isplati za manje od pola godine ako imate veliku količinu podataka. Ne bacajte novac na tokene ako možete posjedovati mašinu. Budite pametni, budite škrti s resursima, ali darežljivi s preciznošću. Na kraju, jedino što vrijedi je tačan odgovor koji ne zahtijeva ponovno provjeravanje. To je majstorstvo.

