Prepoznaj objekte uz AI: Klasifikacija u 3 koraka
Prestanite bacati sate na ‘copy-paste’ tutorijale koji vam obećavaju magiju. AI klasifikacija slika nije vještačka inteligencija iz filmova; to je digitalna stolarija gdje su podaci vaše daske, a algoritmi vaša glodala. Ako mislite da će vam model raditi savršeno jer ste skinuli nasumičnu bazu slika s interneta, u zabludi ste. Vaš kod će prepoznavati sjenke, a ne objekte, a vi ćete izgubiti vikend gledajući u ekran koji izbacuje smeće.
Zašto vaš model ‘vidi’ mrlju umjesto mačke: Istina o digitalnoj sirovini
Prvi problem kod većine DIY projekata u mašinskom učenju je tekstura podataka. Da, podaci imaju teksturu. Loše rezolucije su kao vlažno drvo – možete ih obrađivati, ali će rezultat biti iskrivljen i neupotrebljiv. Kada učitavate slike, morate osjetiti otpor koda. Ako se model trenira prebrzo, nešto nije u redu. Vjerovatno ste zaboravili na normalizaciju. Očistite podatke prije nego što uopšte pomislite na dugme ‘Train’.
UPOZORENJE: Ne pokrećite trening modela na laptopu koji stoji na ćebetu. GPU temperatura će skočiti na 90°C u roku od 60 sekundi. Termalno prigušenje (throttling) će vam uništiti brzinu obrade, a rizikujete i trajno oštećenje matične ploče. Držite hardver na tvrdoj podlozi, idealno uz dodatno hlađenje.
Za početak vam ne treba super-kompjuter. Možete koristiti Google Colab ili stari desktop sa bar 8GB VRAM-a. Sve manje od toga je mučenje. Ako želite ozbiljan rezultat, hiperparametri moraju biti precizno zategnuti kao šarafi na motoru. Jedan krivi ‘learning rate’ i vaš model će ‘proklizati’ pored rješenja.

Korak 1: Sortiranje krša – Priprema baze bez milosti
Uzmite svoje slike. Ako ih imate 50 po kategoriji, odustanite odmah. Treba vam bar 500 kvalitetnih uzoraka po objektu da bi model počeo ‘hvatati’ ivice. Slike moraju biti ‘gritty’ – iz različitih uglova, pod lošim svjetlom, sa šumom. Ako su sve slike savršene, vaš model će biti beskoristan u stvarnom svijetu. To je kao da učite zanat na simulatoru, a onda prvi put uzmete pravu motornu pilu u ruke. Šok će vas paralisati.
Prljav posao ovdje je anotacija. Svaka slika mora biti označena (labeled). To je dosadno. Boljeće vas prsti od klikanja. Ali, ako ovdje pogriješite, vaš AI će biti ‘pijan’. Zamislite da klasifikujete senzore na njivi. Podesite senzore ispravno u bazi, ili će dron prskati kamenje umjesto korova. Kratko i jasno: Smeće unutra, smeće vani. Bez izuzetaka.
Koliko slika mi zapravo treba za precizan model?
Odgovor je uvijek: Više nego što misliš. Za osnovnu klasifikaciju (pas vs. mačka), 1000 slika po klasi je minimum. Ako radite kompleksnije stvari, poput prepoznavanja mikro-pukotina na betonu, brojka skače na desetine hiljada. Iskoristite ‘Data Augmentation’ – rotirajte, sjecite i rastežite postojeće slike da vještački povećate bazu. To je legalan hak koji spašava projekat.
Korak 2: Izbor arhitekture – Ne izmišljajte toplu vodu
Nemojte pisati svoju neuronsku mrežu od nule. To je kao da pokušavate sami izliti čelik za svoje vijke. Uzmite ‘Pre-trained’ model poput ResNet-a ili MobileNet-a. Ovi modeli su već ‘vidjeli’ milione slika. Vi ih samo trebate ‘doškolovati’. To se zove transfer learning. To je najbrži put od nule do funkcionalnog sistema.
Ubacite svoj ‘head’ na vrh mreže. To su zadnja dva-tri sloja koji odlučuju šta je na slici. Zamislite to kao montiranje glave sjekire na već gotovu dršku. Drška je ResNet (stabilna, testirana), a oštrica je vaš specifični problem. Ako radite prepoznavanje lica ili objekata u pokretu, naučite razliku između AI i deep learninga jer će vam trebati dublji slojevi za kompleksne teksture.
Korak 3: Trening i ‘The Forensic Failure’ test
Pritisnite ‘Run’. Sada čekate. Miris zagrijane elektronike je normalan, miris paljevine nije. Pratite ‘loss’ funkciju. Ako ‘loss’ ne pada, vaš model je glup. Ako pada prebrzo, vaš model je samo zapamtio slike napamet (overfitting). To je kao učenik koji zna odgovore, ali ne razumije gradivo. Izvešće vas na tanak led čim mu pokažete sliku koju ranije nije vidio.
Šta ako model griješi na očiglednim stvarima?
To se dešava stalno. Možda vaš AI prepoznaje boju pozadine umjesto objekta. Ako su sve slike traktora na zelenoj travi, AI će misliti da je trava traktor. Natjeraj model da uči na greškama tako što ćeš mu ubaciti slike trave bez traktora. To je surova škola, ali jedina koja radi.
Anatomija promašaja: Zašto će vaš sistem ‘puknuti’ za 6 mjeseci
Ako ne planirate ‘model drift’, propali ste. Podaci se mijenjaju. Kamera se zaprlja. Svjetlo u radionici postane žuće. Vaš model koji je danas precizan 99%, za pola godine će biti na 70%. Ako niste ostavili prostora za re-trening, moraćete sve ispočetka. Ja sam jednom izgubio cijelu bazu jer nisam radio ‘version control’ na datasetu. Najveća greška koju možete napraviti. Ne kvari bazu – čuvaj svaku verziju kao da ti život zavisi o tome. Koristi git za kod i DVC za podatke. Bez toga si samo amater koji se igra vatrom u drvenoj šupi.
Code Check: Standardi za 2026.
Napomena: Prema industrijskim standardima za 2026. godinu, svaki AI model koji radi sa slikama ljudi mora proći strogu provjeru privatnosti. Zakon o zaštiti podataka o ličnosti zahtijeva da anonimizirate lica u trening setu ako nemate izričitu dozvolu. Ne igrajte se s ovim; kazne su veće od cijene vašeg cijelog IT setupa. Budite majstor koji poštuje zanat, ali i pravila igre.

