Puca ti model? Normalizacija podataka u 5 minuta [2026]

Ekran je zaledio. Ventilator na tvom laptopu vrišti kao da pokušava poletjeti, a loss funkcija na tvom monitoru pokazuje ‘NaN’. Gledaš u te cifre, srčeš treću hladnu kafu i shvataš: tvoj model nije glup, on se guši. Ako si u bazu ubacio sirove podatke bez skaliranja, to je kao da pokušavaš ugurati motor od kamiona u fiću bez da si izmjerio šarafe. Imaš pet minuta da ovo popraviš prije nego što ti server baci totalni ‘kernel panic’.

Zašto tvoj model ‘povraća’ cifre i kako to zaustaviti

Normalizacija nije estetika, to je čista matematika preživljavanja za tvoj algoritam. Zamisli da jedan tvoj podatak predstavlja starost korisnika (0-100), a drugi godišnji prihod (0-100.000). Bez skaliranja, tvoj model će misliti da je prihod 1000 puta važniji od starosti. Rezultat? Model koji ignoriše bitne faktore jer su brojčano ‘mali’. Moramo to poravnati, odmah. Prije nego što kreneš dalje, baci pogled na kako gradient descent zapravo uči, jer upravo tu normalizacija pravi razliku između uspjeha i totalnog kolapsa.

WARNING: Nikada, ali apsolutno nikada nemoj raditi ‘fit’ skalera na cijelom datasetu odjednom. Ako tvoj testni set ‘procuri’ u trening kroz parametre skaliranja, tvoj model će lagati samog sebe. To se zove data leakage i uništiće ti karijeru brže nego što loš kod uništi bazu.

Min-Max skaliranje: Brzi flaster koji često šljaka

Min-Max skaliranje gura sve tvoje vrijednosti u uski okvir između 0 i 1. To je najbrži način da ukrotiš divlje cifre. Formula je prosta: oduzmeš minimum i podijeliš sa rasponom. Ali pazi, ovaj metod je osjetljiv na autlajere kao mačka na usisivač. Jedna pogrešna cifra (recimo neko upisao platu od 10 miliona greškom) i cijeli tvoj set podataka će se zbiti u mikroskopski male razlike oko nule. Ako ti je tacnost i dalje problem, možda trebaš podesiti grid search da nađeš bolji pristup.

Da li stvarno moram skalirati baš svaki podatak?

Ne moraš. Ako koristiš stabla odlučivanja (Decision Trees) ili Random Forest, njih baš briga za razmjere jer oni cijepaju podatke na osnovu pragova, a ne euklidske udaljenosti. Ali ako koristiš Neuralne mreže, SVM ili KNN, bez skaliranja si gotov. Jednostavno je: ako model koristi ‘udaljenost’ između tačaka da bi učio, normalizacija je obavezna oprema, a ne opcija.

Standardizacija (Z-Score): Kad podaci postanu divlji

Z-Score ne sabija podatke u fiksni okvir, već ih centrira oko nule sa standardnom devijacijom od 1. Ovo je ‘heavy-duty’ alat za ozbiljne majstore. Koristi ga kada tvoji podaci prate normalnu distribuciju (ono kad liče na zvono). Za razliku od Min-Maxa, Z-score može podnijeti poneki ekstremni podatak a da ne pokvari cijelu seriju. Osjetićeš kako model lakše ‘diše’ kad su mu svi ulazi na istoj talasnoj dužini. To je osnova za sve osnove AI i mašinskog učenja koje planiraš savladati.

Anatomija jednog ‘Screw-Upa’: Zašto mi je model pao na produkciji?

Desilo mi se prošle zime. Model je na mom laptopu radio savršeno, ali čim smo ga pustili ‘u divljinu’, rezultati su bili smeće. Greška? Zaboravio sam sačuvati parametre skaliranja (mean i std) sa treninga. Primijenio sam novo skaliranje na produkcijskim podacima koristeći njihove sopstvene parametre. To je kao da mjeriš visinu zida metrom koji svaki dan mijenja dužinu centimetra. Uvijek, ali uvijek snimi svoj skaler kao ‘pickle’ fajl zajedno sa modelom. Bez toga, tvoj model u produkciji je slijep. Ako želiš da tvoji rezultati izgledaju prirodnije, nauči i kako da podesiš top-k sampling za izlazne podatke.

Zašto ovo radi: Fizika iza brojeva

Kada normalizuješ podatke, ti zapravo ‘peglaš’ pejzaž kroz koji se tvoj algoritam kreće. Bez normalizacije, taj pejzaž je pun uskih, dubokih kanjona i previsokih planina. Gradient descent se zaglavi pokušavajući da nađe put dole. Kada su svi podaci na istoj skali, pejzaž postaje blaga dolina gdje tvoj model lako klizi prema rješenju. To je čista energetska efikasnost koda. Ne gubi vrijeme na besmisleno čekanje treninga koji nikad neće konvergirati. Skaliraj, provjeri, pusti. Štedi struju, štedi živce.

Slični tekstovi

Osnove AI i Mašinskog Učenja
Šta je supervizovano učenje? Osnove za početnike
ByMarko Ilić 21 Marta, 2026
Plaćeni AI kursevi danas koštaju i do 3.500 KM. To je čista pljačka. Prodaju vam prepakovane YouTube tutorijale dok vi sjedite i čekate da vam znanje padne s neba. Istina je surovija: AI ne uči magijom, nego onako kako vi učite šegrta u radionici – pokazivanjem. Ako znate razliku između hrasta i bukve jer vam…
Read More Šta je supervizovano učenje? Osnove za početnike
Osnove AI i Mašinskog Učenja
Mašinsko učenje u browseru: Pokreni prvi model bez instalacije
ByMarko Ilić 20 Februara, 2026
Prestanite vjerovati u laž da vam za vještačku inteligenciju treba NVIDIA grafička kartica od tri hiljade eura i server soba sa klimom koja zuji kao mlazni avion. To je marketing. Istina je mnogo grublja i direktnija: vaš browser, taj isti u kojem trenutno čitate ovaj tekst, već posjeduje svu snagu potrebnu da pokrene ozbiljne modele…
Read More Mašinsko učenje u browseru: Pokreni prvi model bez instalacije
Osnove AI i Mašinskog Učenja
Veštačka inteligencija objašnjena na jednostavan način: Osnove i primene
ByMarko Ilić 28 Decembra, 2025
Uvod Veštačka inteligencija (VI) je područje koje me fascinira već godinama, jer nam omogućava da razumemo kako računari mogu da oponašaju ljudsku inteligenciju i donose odluke. U ovom tekstu, želim da prenesem svoje iskustvo i stečeno znanje o osnovama i primenama VI, koristeći jasne primere i stručne analize. Cilj mi je da vam približim ovu…
Read More Veštačka inteligencija objašnjena na jednostavan način: Osnove i primene
Osnove AI i Mašinskog Učenja
Puca ti model? Normalizacija podataka u 5 minuta [2026]
ByMarko Ilić 21 Aprila, 2026
Gubiš 500 KM mjesečno na nepotrebno treniranje modela jer su ti podaci u haosu Gubiš novac. Ako tvoj GPU vrti cikluse na podacima gdje jedna kolona ima vrijednosti od 1 do 10, a druga od 10.000 do 1.000.000, tvoj model ne uči – on se bori za život. Čak 80% neuspjelih AI projekata u 2026….
Read More Puca ti model? Normalizacija podataka u 5 minuta [2026]
Osnove AI i Mašinskog Učenja
AlphaGo dokumentarac: Analiza pobjede nad ljudskim umom
ByMarko Ilić 24 Marta, 2026
Prestanite vjerovati da je AlphaGo pobijedio jer je ‘brži’ od čovjeka. To je marketinška laž koja vam prodaje pogrešnu sliku o vještačkoj inteligenciji. Istina je mnogo grublja: AlphaGo je pobijedio jer je Lee Sedol, jedan od najvećih mozgova naše ere, udario u zid čiste statističke surovosti koju ljudski neuro-biološki sistem ne može procesuirati. Ako planirate…
Read More AlphaGo dokumentarac: Analiza pobjede nad ljudskim umom
Osnove AI i Mašinskog Učenja
Koji su najvažniji alati za učenje mašinskog učenja na Pythonu
ByMarko Ilić 27 Decembra, 2025
U svetu veštačke inteligencije, alati za učenje mašinskog učenja na Pythonu su ključni za svakoga ko želi da napravi iskorak u ovoj oblasti. Kao iskusni stručnjak, koristim kriterijume poput funkcionalnosti, jednostavnosti korišćenja, podrške zajednice i cene da bih ocenjivao ove alate. Ovaj vodič će vas upoznati sa najvažnijim alatima koji će vam pomoći da brže…
Read More Koji su najvažniji alati za učenje mašinskog učenja na Pythonu