Logistička regresija u Excelu: Napravi prediktivni model
Eksterni konsultant će ti naplatiti 2.500 KM da ti napravi model predviđanja odlaska kupaca koji ti možeš sklopiti u Excelu za jedno popodne. Excel licenca košta par maraka mjesečno. Razlika od preko dvije hiljade maraka je čist novac koji ostaje u tvom džepu ako naučiš kako da sam ‘uprljaš ruke’ podacima. Ti kontrolišeš matematiku, ti kontrolišeš ishod. Zaboravi na skupe AI platforme koje su ništa drugo nego ušminkani interfejsi za ono što Excel radi decenijama. Ako znaš koristiti filtere i osnovne formule, spreman si za ovaj projekat. Danas ćemo rasklopiti logističku regresiju, dio po dio, i sastaviti je ponovo tako da predviđa budućnost tvoje prodaje sa hirurškom preciznošću.
Zašto ti treba Solver, a ne skupi softver
Prva greška koju svi prave je što misle da Excel nije dovoljno ‘pametan’ za mašinsko učenje. To je laž. Problem nije u Excelu, nego u tome što većina ljudi ne zna gdje se nalazi kutija sa alatom. Za logističku regresiju ti treba Solver Add-in. To je onaj teški ključ u tvom digitalnom setu alata koji radi sav prljavi posao optimizacije. Ako ga nemaš aktiviranog, ideš na File -> Options -> Add-ins i uključiš ga. Bez ovoga, tvoja tabela je samo hrpa mrtvih brojeva. Kao i kod svakog DIY projekta, alat mora biti spreman prije nego što prva kap ulja, ili u ovom slučaju podataka, padne na radni sto. Asfaltiranje puta do prediktivnog modela počinje ovdje. Ako ti Solver ne radi, tvoj model je mrtav u vodi. Provjeri to odmah.
Čišćenje ‘rđe’ sa tvojih podataka
Ne možeš napraviti vrhunski sto od trule hrastovine. Isto tako, ne možeš napraviti prediktivni model od prljavih podataka. Ako u tvojoj koloni sa godinama stoji '25’ i ‘nepoznato’, tvoj model će se srušiti brže od loše sastavljene police iz diskonta. Logistička regresija je izbirljiva; ona želi brojeve, ne priče. Sve kategorijalne podatke (poput ‘Muško/Žensko’ ili ‘Da/Ne’) moraš pretvoriti u binarne kodove: 1 i 0. To se zove ‘dummy coding’ i to je temelj.
Uradi to ručno ako treba. Očisti prazne ćelije. Ako imaš ekstremne vrijednosti koje nemaju smisla, poput kupca koji ima 150 godina, izbaci ih. To nije cenzura, to je inženjering. Tvoj cilj je čista, linearna struktura spremna za obradu. Više o sređivanju tabela možeš naučiti kroz ovaj vodič za analizu prodaje, jer ako uđe smeće, izaći će smeće. To je zakon radionice.
Matematika iza haube: Zašto koristimo Logit?
WARNING: Nemoj pokušavati koristiti običnu linearnu regresiju za predviđanje binarnih ishoda (da/ne). Linearna regresija može predvidjeti vjerovatnoću od 150% ili -20%, što je fizički nemoguće u realnom svijetu. Šok od 220V će te spržiti, a loša formula će ti spržiti biznis plan.
Zašto logistička? Zato što ona koristi Sigmoidnu funkciju. Zamisli je kao S-krivu koja sve tvoje ulazne podatke ‘sabija’ u prostor između 0 i 1. To je tvoja vjerovatnoća. Da li će kupac kupiti? 0.85 znači 85% šanse. To je nauka, a ne nagađanje. Jednačina izgleda strašno na papiru, ali u Excelu je to samo kombinacija EXP funkcije i tvojih koeficijenata. Mi ne pogađamo, mi računamo otpor materijala. 
Korak po korak: Sklapanje modela
Prvo, postavi kolonu sa početnim koeficijentima. Stavi nule za početak. To su tvoji ‘šarafi’ koje će Solver kasnije zatezati. Zatim, izračunaj Logit vrijednost za svaki red podataka koristeći formulu z = b0 + b1*x1 + b2*x2.... Nakon toga, pretvori taj Logit u vjerovatnoću koristeći =1/(1+EXP(-z)).
Ali evo gdje većina amatera odustane: Maximum Likelihood Estimation (MLE). Zvuči komplikovano, ali je zapravo jednostavno. Želimo da naši koeficijenti daju najveću vjerovatnoću za ono što se zapravo desilo u prošlosti. Napravi kolonu ‘Likelihood’ i koristi logaritamsku funkciju da izračunaš koliko se tvoj model poklapa sa stvarnošću. Saberite te vrijednosti u jednu ćeliju – to je tvoj ‘Total Log-Likelihood’. To je meta koju Solver mora pogoditi. Ako ti je ovo previše koda, uvijek možeš koristiti generativni AI da ti napiše funkciju, ali ti moraš znati šta ona radi.
Kako podesiti Solver za logističku regresiju?
Idite na Data -> Solver. Set Objective je tvoja ćelija sa ‘Total Log-Likelihood’. Postavi na ‘Max’ (jer želimo maksimalnu podudarnost). ‘By Changing Variable Cells’ su tvoji koeficijenti (one nule koje smo postavili na početku). Klikni ‘Solve’. Gledaj kako Excel vrti hiljade kalkulacija u sekundi. To je zvuk motora koji radi sinhronizovano. Ako Solver ne nađe rješenje, vjerovatno imaš previše ‘šuma’ u podacima ili su ti varijable previše slične.
Da li model zaista radi?
Nemoj vjerovati modelu samo zato što je izbacio brojeve. Testiraj ga. Napravi ‘Confusion Matrix’. To je tabela 2×2 koja ti govori koliko puta je model bio u pravu, a koliko puta je ‘slagao’. Ako ti je preciznost ispod 70%, tvoj model je kao klimav sto – može poslužiti, ali nemoj stavljati ništa teško na njega. Provjeri ovaj test za greške u modelima da vidiš gdje si pogriješio.
Anatomija katastrofe: Zašto modeli propadaju
Imao sam projekat gdje je model predviđao 99% tačnosti. Zvuči super? Bio je to totalni promašaj. Problem je bio overfitting. Model je naučio podatke napamet, umjesto da nauči trendove. To je kao da napraviš ključ koji otvara samo jednu bravu na svijetu, a tebi treba onaj koji otvara cijelu seriju.
Druga stvar je ‘Multikolinearnost’. Ako u model ubaciš dvije varijable koje govore istu stvar (npr. ‘prihod u KM’ i ‘prihod u EUR’), Solver će poludjeti. To je kao da pokušavaš zategnuti dva šarafa koji su zavareni jedan za drugog. Ne ide. Izbaci jednu i nastavi dalje. Često je manje zapravo više u svijetu predikcije. Ako te zanima kako se ovi procesi dokumentuju da ne zaboraviš šta si uradio, pogledaj ovaj sablon za dokumentaciju.
Fizika neuspjeha: Šta ako su podaci ‘nagnuti’?
Ako pokušavaš predvidjeti rijedak događaj (recimo, kvar mašine koji se desi jednom u 1000 dana), logistička regresija u Excelu će imati problema. Ona će jednostavno reći ‘nikad se neće desiti’ i bit će u pravu u 99.9% slučajeva, ali će promašiti onaj jedan put koji je bitan. To se zove ‘Imbalanced Data’. U radionici to rješavamo tako što vještački povećavamo uzorak kvarova ili smanjujemo uzorak normalnog rada. Moraš balansirati vagu prije nego što počneš mjeriti.
Primjena u 2026. godini
Iako smo u 2026. godini i svi pričaju o kvantnim procesorima, osnova je ista. Logistička regresija u Excelu je i dalje najbrži način da dobiješ uvid u podatke bez trošenja hiljada maraka na Azure ili AWS resurse. Za male biznise, ovo je jedini put. Ako želiš ići korak dalje i povezati Excel sa modernijim alatima, pročitaj o tome kako jeftino hostovati modele, ali se uvijek vrati bazi.
Tvoj model nije samo tabela. To je tvoj digitalni radar. Ako ga održavaš, čistih od rđe i pogrešnih pretpostavki, služit će te godinama. Nemoj dopustiti da te uplaše termini poput ‘stohastički gradijent’. To su samo komplikovana imena za zatezanje šarafa dok sve ne sjedne na svoje mjesto. Sad uzmi te podatke i nateraj ih da ti kažu šta će se desiti sutra.
