Bot laže? Ubaci RAG i daj mu svoje podatke u 3 koraka [2026]

Bot laže? Ubaci RAG i daj mu svoje podatke u 3 koraka [2026]

Vaš bot je patološki lažov (i to vas košta para)

Prestanite vjerovati marketingu koji vam obećava ‘pametne’ asistente odmah po instalaciji. Istina je brutalna: vaš LLM (Large Language Model) ne zna ništa o vašem biznisu, vašim PDF-ovima ili vašim cijenama. On samo predviđa sljedeći najvjerovatniji token. Bez RAG-a (Retrieval-Augmented Generation), vi zapravo puštate pijanog glumca da odgovara na pozive vaših klijenata. Ako želite da vaš AI asistent zapravo šljaka kako treba, morate mu ugraditi eksternu memoriju. Danas to radimo ručno, u tri koraka, bez milosti prema lošem kodu. Ako ste mislili da je pravljenje Custom GPT-a kraj priče, prevarili ste se. Ovo je ozbiljan rad u radionici.

Zašto vaš AI ‘izmišlja’ činjenice (Surova matematika u pozadini)

Modeli haluciniraju jer su istrenirani na internetu, a internet je pun smeća. Kada mu postavite pitanje o vašem internom pravilniku, on ne kaže ‘ne znam’. On izmisli odgovor koji zvuči uvjerljivo. To je fundamentalna mana arhitekture. RAG (Retrieval-Augmented Generation) rješava ovo tako što prvo pretraži vašu bazu podataka, izvuče relevantne pasuse, i onda ih ‘ugura’ u prompt kao kontekst. To je kao da studentu na ispitu dozvolite da koristi knjigu. Bez knjige, on će lagati da bi prošao. Sa knjigom, on citira. Jednostavno. Ali, ako su vaše ‘knjige’ loše formatirane, sistem će se raspasti brže nego jeftina iverica na kiši.

WARNING: Nikada ne šaljite osjetljive podatke poput lozinki ili matičnih brojeva u javne vektorske baze bez enkripcije. 120-bitni ključevi su minimum; sve ispod toga je pozivnica za hakere. Provjerite sigurnosne protokole prije nego što krenete.

Alatnica: Šta vam treba za ovaj zahvat

Zaboravite na skupe SaaS platforme koje vam uzimaju procenat po upitu. Mi gradimo na čvrstim temeljima. Treba vam Python (3.11 ili noviji), LangChain ili LlamaIndex biblioteka, i jedna vektorska baza podataka. Ja koristim ChromaDB jer je lokalna, besplatna i ne šalje vaše podatke u oblak bez potrebe. Ako imate više od 10.000 dokumenata, prebacite se na Pinecone, ali za početak, Chroma je majka. Pripremite svoje podatke. Ako su u PDF-u, ostružite ih. Očistite tekst od nepotrebnih headera i footera. Prljavi podaci znače glup AI. Kratko i jasno.

Detaljan prikaz ugradnje RAG sistema u AI model na radnom stolu

Korak 1: Drobljenje podataka – ‘Chunking’ bez milosti

Ne možete samo ‘istresti’ PDF od 200 stranica u model. Kontekstni prozor će puknuti. Morate isjeći tekst na komade (chunks). Idealna veličina? Oko 500 do 1000 tokena po komadu, sa preklapanjem (overlap) od 10-15%. Zašto preklapanje? Da ne biste presjekli rečenicu na pola i izgubili smisao. Zamislite to kao spajanje cijevi – svaki spoj mora malo da preklapa da voda ne bi curila. Koristite RecursiveCharacterTextSplitter. On je pametan. On zna gdje su paragrafi. Ako ovo uradite loše, vaš bot će izvlačiti informacije van konteksta. Velika greška. Vaša ruka će utrnuti od čišćenja podataka, ali ako ovo preskočite, model će vam pucati u najgorem trenutku.

Korak 2: Vektorsko skladište (Mozak vašeg bota)

Sada te komade teksta pretvaramo u brojeve – vektore. To radimo pomoću ‘Embedding’ modela (npr. OpenAI text-embedding-3-small). Ovi vektori su koordinate u višedimenzionalnom prostoru. Kada korisnik postavi pitanje, sistem pretvori to pitanje u vektor i traži najbliže vektore u bazi. To se zove Cosine Similarity. To je matematika koja stoji iza ‘razumijevanja’. Ako pogriješite embedding model, vaša pretraga će biti netačna kao navigacija na starom telefonu. Nemojte štedjeti na kvaliteti embeddinga. To je srce sistema. Loš embedding je kao tupa testera – samo ćete se umoriti, a rezultat će biti očajan.

Zašto cosine similarity zapravo radi? (Nauka iza haube)

U višedimenzionalnom prostoru, riječi ‘čekić’ i ‘ekser’ su bliže jedna drugoj nego riječi ‘čekić’ i ‘sladoled’. Embedding model dodjeljuje brojeve ovim konceptima na osnovu toga koliko se često pojavljuju zajedno u ljudskom jeziku. Kada vaš bot traži ‘kako popraviti krov’, on ne traži te tačne riječi, on traži ‘prostor’ u bazi gdje se nalaze koncepti krova, curenja i popravke. To je razlika između pretrage po ključnim riječima (koja je mrtva) i semantičke pretrage. Ako planirate karijeru u AI sektoru, ovo morate znati u pola noći.

Korak 3: Spajanje cijevi i finalno testiranje

Zadnji korak je kreiranje ‘Chain-a’. Kada korisnik pita: ‘Kolika je garancija na naš proizvod?’, sistem radi sljedeće: 1. Pretvara pitanje u vektor. 2. Nalazi top 3 pasusa u vašoj bazi. 3. Šalje te pasuse i originalno pitanje LLM-u. Prompt tada izgleda ovako: ‘Koristeći samo ove informacije: [DOKUMENTI], odgovori na pitanje: [PITANJE]’. Ako informacija nije u dokumentima, natjerajte bota da kaže ‘Ne znam’. To sprečava laži. Bez ovog uslova, on će opet početi da mašta. Testirajte sistem agresivno. Pitajte ga stvari koje nisu u bazi. Ako pokuša da izmisli, vratite se na kodiranje prompta. Don't skip this. Dosadno je, ali neophodno.

Anatomija zezancije: Gdje sve ide dođavola

Desilo mi se prošlog utorka. Sistem je radio savršeno dok nisam ubacio novi katalog. Odjednom, na svako pitanje o popustima, bot je davao cijene iz 2023. godine. Problem? Zaboravio sam očistiti stare vektore. Baza je bila ‘zagađena’ starim podacima. Uvijek, ali uvijek, implementirajte sistem za verziranje podataka. Ako vaš bot vuče stare informacije, on je beskoristan. Još jedna stvar: pazite na ‘top-k’ parametar. Ako izvučete previše pasusa (npr. k=10), LLM će se pogubiti u šumi informacija. Ako izvučete premalo (k=1), propustićete bitne detalje. Nađite zlatnu sredinu, obično je to k=3 ili k=4. Prljavo, naporno, ali šljaka.

Code Check: Lokalni propisi i standardi

Napomena: Prema EU AI Actu iz 2026. godine, svaki bot koji koristi RAG za pružanje pravnih ili finansijskih savjeta mora imati jasno vidljiv ‘Human-in-the-loop’ disclaimer. Ne igrajte se sa ovim. Kazne su astronomske. Ako vaš sistem donosi odluke koje utiču na budžet klijenata, osigurajte da svaki odgovor ima citat izvornog dokumenta. To nije samo dobra praksa, to je zakon. Pogledajte kako AI alati mogu uštedjeti novac, ali samo ako su legalni i tačni. Budite pametni, ne budite meta inspekcije.

Slični tekstovi

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *