Supervizovano učenje vs nesupervizovano: Šta odabrati?
Prestani vjerovati marketingu: AI se ne uči ‘sam’
Prestani slušati ljude koji kažu da se vještačka inteligencija magično uči sama od sebe. To je laž koja će ti spržiti budžet za servere i ostaviti te s modelom koji ne razlikuje bitno od nebitnog. Ti moraš razumjeti zupčanike ispod haube—supervizovano i nesupervizovano učenje—prije nego što baciš još jedan sat na loše podatke. Ako planiraš postati AI stručnjak 2026. godine, moraš znati kada trebaš biti strogi šef, a kada pustiti algoritam da luta po mraku tvoje baze podataka. Razlika nije samo teoretska; to je razlika između alata koji radi i onoga koji samo troši struju i živce.
WARNING: Nikada ne ubacuj osjetljive podatke klijenata u javne modele bez prethodne anonimizacije. 120v struje te može ubiti, ali curenje podataka u 2026. godini će ti ubiti firmu brže nego što stigneš reći ‘GDPR’.
Supervizovano učenje: Strogi šef koji traži etikete
Uguraj označene podatke u algoritam ako želiš precizan rezultat. Supervizovano učenje je kao da učiš dijete da prepozna čekić tako što mu pokažeš 500 slika i svaki put kažeš: ‘Ovo je čekić’. Ti si taj koji daje etikete (labels). Ako su tvoje etikete pogrešne, tvoj model će biti smeće. Često se dešava da ljudi griješe kod učenja AI-a jer misle da je dovoljno samo ubaciti bilo šta. Nije. Treba ti čista, ‘izbrušena’ baza podataka. Osjetit ćeš miris ‘pregrijanog’ procesora dok tvoj model pokušava naći korelaciju između ulaza i tvog očekivanog izlaza. To je naporan rad. Zahtijeva vrijeme. Ali, daje odgovore tipa ‘da’ ili ‘ne’.
U svijetu razlika između supervizovanog i nesupervizovanog učenja postaje jasna onog momenta kada shvatiš da ovdje ti držiš kontrolu. Koristiš ga za klasifikaciju (je li ovo spam?) ili regresiju (kolika će biti cijena drva u decembru?). Ako želiš da tvoj Shopify sistem preporuka radi, moraš ga nahraniti podacima o tome šta su ljudi stvarno kupili, a ne šta su samo gledali. To je suština.

Nesupervizovano učenje: Divlji tragač u mraku podataka
Pusti algoritam da sam kopa kroz planinu podataka kada nemaš pojma šta zapravo tražiš. Ovdje nema etiketa. Nema šefa. Algoritam traži obrasce, grupiše podatke koji mu ‘liče’ jedni na druge. To se zove klasterizacija. Zamisli da imaš punu kantu šarafa, podloški i matica, sve pomiješano i prekriveno mašću. Nesupervizovano učenje će ih razvrstati u tri hrpe na osnovu oblika, iako ne zna kako se te stvari zovu. Miris teških metala i prljavštine u podacima je ovdje stvaran. Često ćeš dobiti rezultate koji nemaju smisla. Ali, ponekad ćeš otkriti grupu kupaca za koju nisi ni znao da postoji.
Ovo je ključno ako želiš uraditi samostalni AI audit firme. Algoritam može primijetiti anomaliju u tvojim troškovima koju ljudsko oko nikada ne bi vidjelo jer se ne uklapa u uobičajene šeme prevare. Ali pazi, nesupervizovano učenje je kao mačka—radi šta hoće i kad hoće. Ne možeš ga natjerati da nađe specifičan odgovor ako on nije urezan u samu strukturu podataka.
Da li je nesupervizovano učenje lakše jer nema označavanja?
Ne. To je zabluda. Iako štediš vrijeme na označavanju, gubiš ga na podešavanju hiperparametara i interpretaciji rezultata. Bez etiketa, ti moraš biti taj koji će reći: ‘Aha, ova grupa podataka predstavlja korisnike koji će nas napustiti’. To zahtijeva duboko poznavanje materije, a ne samo kliktanje po Python skripti.
Anatomija katastrofe: Kada model ‘poludi’
Dozvoli da ti objasnim kako sam jednom uništio sistem za preporuke jer sam izabrao pogrešan pristup. Koristio sam nesupervizovanu klasterizaciju na bazi koja je imala previše šuma (dirty data). Rezultat? Model je počeo grupisati ljude na osnovu toga u koje doba dana su kliktali, a ne šta su tražili. Prodaja je pala za 30% u tri dana. To je ono što se desi kada zaboraviš na ‘fiziku’ podataka. Ako koristiš pogrešan alat, tvoj model će postati ‘brljiv’. Popravljanje tog haosa traje sedmicama jer moraš resetovati cijelu logiku učenja. Natjeraj model da uči na greškama, ali nemoj mu ti biti najveća greška u startu.
Nauka o materijalima: Zašto tvoji podaci ‘trunu’?
Jednom kad pustiš model u rad, on počinje da stari. U svijetu inženjeringa, to se zove degradacija. Podaci koje si koristio u januaru možda više ne važe u junu. Supervizovani modeli pate od ‘concept drift-a'—kada se veza između ulaza i etikete promijeni. Na primjer, ako tvoj model uči da prepozna ‘luksuznu robu’, a inflacija udari, definicija luksuza se mijenja. Podaci gube svoju oštrinu kao stari brusni papir. Moraš ih stalno mijenjati i dopunjavati. Ako želiš uštedjeti, koristi transfer learning kako ne bi svaki put kretao od nule. To je kao da koristiš stari okvir prozora za novu kuću—štedi vrijeme i materijal.
Koji algoritam je bolji za početnike?
Uvijek kreni sa supervizovanim učenjem. Jasnije je. Lakše ćeš vidjeti gdje si pogriješio. Nesupervizovano učenje ostavi za momenat kada tvoj ‘workshop’ postane ozbiljan i kada budeš imao toliko podataka da ih ljudsko oko više ne može ni prelistati.
DIY Vodič: Kako odabrati u 3 koraka
1. Definiši cilj: Ako znaš tačno šta tražiš (npr. prepoznavanje lica na zaštiti prava na lik), koristi supervizovano. Ako samo želiš ‘vidjeti šta ima u bazi’, biraj nesupervizovano.
2. Provjeri resurse: Imaš li ljude koji će sjediti 40 sati i označavati slike? Ako nemaš, ili si u škripcu s parama, nesupervizovano je tvoj jedini put, uz rizik nepreciznosti.
3. Testiraj na malom uzorku: Nemoj odmah slati 10 TB podataka na AWS. Uzmi par hiljada redova, vidi kako se algoritam ponaša. Ako se ‘guši’, promijeni pristup.
Kao što bi ti rekao svaki stari majstor u IT-u: ‘Mjeri dvaput, sijeci jednom’. AI nije magija, to je statistika sa strujom. Ako ne znaš koji šaraf zavrćeš, nemoj se čuditi kad ti cijela konstrukcija padne na glavu. Sretno u radionici.
