Osnove AI i Mašinskog U0denja: Vodi0d Za Poetnike u 2024.
Prosječna konsultantska satnica za implementaciju vještačke inteligencije u 2024. godini iznosi preko 150 eura, dok tebi za osnovni model treba samo stari laptop i tvrdoglavost da ne odustaneš kad kod baci grešku. Ti možeš platiti drugome da ti prodaje maglu, ili možeš sam shvatiti kako ovi digitalni mišići zapravo rade. Ovaj vodič ti daje znanje koje drugi naplaćuju hiljadama, pod uslovom da si spreman isprljati ruke kodom i logikom.
Arhitektura tvog digitalnog mozga: Šta je zapravo ML?
Mašinsko učenje (ML) nije magija; to je čista statistika na steroidima koja koristi procesorsku snagu da pronađe obrasce koje ljudsko oko propušta. Zamisli to kao učenje djeteta da razlikuje vijak od eksera – ne objašnjavaš mu matematičku formulu spirale, već mu pokažeš hiljadu primjera dok mu ‘ne klikne’. U tvom računaru, taj ‘klik’ je promjena težinskih faktora u matrici. Osjetit ćeš kako ti se mozak napreže dok prvi put pokušaš vizualizirati višedimenzionalni prostor podataka. To je normalno. Hardver se grije, ventilatori vrište, a tvoji podaci se polako slažu u logičke cjeline. Ne kupuj skupe kurseve. Sve što ti treba je Python i razumijevanje da je model pametan onoliko koliko su čisti podaci koje mu ‘serviraš’.
WARNING: Nikada ne unosi osjetljive poslovne podatke ili lozinke direktno u javne API modele poput osnovnog ChatGPT-a bez enkripcije. Curenje podataka u trening setove može dovesti do trajnog gubitka intelektualne svojine i kršenja GDPR-a što rezultira kaznama od kojih se firma ne oporavlja.
Zašto ti treba Python, a ne ‘No-Code’ igračke?
Python je tvoj osnovni alat, tvoj čekić i dlijeto. Možeš koristiti ‘no-code’ platforme, ali to je kao da pokušavaš sagraditi kuću od gotovih Lego kockica – izgleda lijepo dok ne poželiš pomjeriti zid. Python ti omogućava da uđeš ‘pod haubu’ i ručno podesiš hiperparametre. Fokusiraj se na biblioteke poput Pandas za čišćenje smeća od podataka i Scikit-learn za tvoje prve algoritme. Čišćenje podataka je prljav posao. Bukvalno ćeš provoditi 80% vremena brišući duple redove, popunjavajući rupe u tabelama i psujući onoga ko je bazu podataka punio bez validacije. Ali bez toga, tvoj model je smeće. Čisto smeće. 
Moram li biti matematički genije za ovo?
Ne moraš, ali moraš razumjeti linearnu algebru barem toliko da te ne uplaši riječ ‘matrica’. Ako znaš kako funkcioniše nagib prave u koordinatnom sistemu, već si na pola puta da shvatiš gradijentni pad (gradient descent). To je proces u kojem tvoj model ‘silazi niz brdo’ tražeći najnižu stopu greške. Što je nagib strmiji, to su korekcije veće. Ali pazi, ako si prebrz, preskočit ćeš dno i model će postati nestabilan. Sporo je sigurno.
Koji računar mi zapravo treba u 2024. godini?
Ne bacaj pare na najnovije grafičke kartice odmah. Za početak, tvoj postojeći CPU je dovoljan za učenje na malim setovima podataka. Tek kada pređeš na duboko učenje (Deep Learning) i neuronske mreže, trebat će ti NVIDIA GPU sa CUDA jezgrima. Zašto NVIDIA? Zato što je njihov softverski sloj standard u industriji. Kupovina AMD-a za AI u ovom trenutku je kao kupovina egzotičnog automobila za koji niko u gradu nema ključ – mučit ćeš se sa drajverima više nego sa kodom.
Anatomija jednog ‘Screw-Up’-a: Prekomjerno prilagođavanje (Overfitting)
Najveća greška koju ćeš napraviti je Overfitting. To je situacija kada tvoj model nauči tvoje podatke ‘napamet’, umjesto da nauči pravila. Zamisli da učiš za ispit tako što zapamtiš redoslijed odgovora (A, B, C, A), umjesto da naučiš gradivo. Na testu ćeš dobiti 100%, ali čim ti neko postavi pitanje iz stvarnog svijeta sa malo drugačijim redoslijedom, pasti ćeš. Vidio sam modele koji predviđaju cijene nekretnina sa 99% tačnosti na starim podacima, a onda totalno promaše realnost jer su se ‘zakačili’ za nebitne šumove poput imena vlasnika kuće. Ako tvoj model radi savršeno u laboratoriji, a očajno na terenu, negdje si pogriješio. Smanji broj parametara. Dodaj malo ‘šuma’ da ga natjeraš da razmišlja. To boli, ali je neophodno.
Materijalna nauka: Kako neuronske mreže zapravo ‘osjećaju’ podatke?
Neuronska mreža radi na principu slojeva. Prvi sloj vidi samo grube ivice, dok dublji slojevi prepoznaju kompleksne oblike. To je kao da rukama opipavaš nepoznat predmet u mraku. Prvo osjetiš hladnoću metala (ulazni podaci), zatim oštre uglove (prvi sloj), pa težinu i balans, dok tvoj mozak ne spoji sve te signale u sliku ‘ključa’. U vještačkoj inteligenciji, ti signali su brojevi između 0 i 1. Ako je signal slab, neuron se ne aktivira. Ako je jak, on prenosi informaciju dalje. Čitava nauka je u tome da podesiš te pragove (bias) i težine (weights) tako da cijeli sistem rezonuje sa stvarnošću. To je digitalna hemija. Jedna kap pogrešnih podataka i cijela reakcija propada.
DIY Projekt: Tvoj prvi model na ‘prljavim’ podacima
Uzmi CSV fajl o potrošnji struje u svojoj zgradi. Prvo ćeš vidjeti da pola podataka nedostaje. To je tvoj test izdržljivosti. Nemoj koristiti prosjek da popuniš rupe; to je lijenost koja kvari model. Koristi medijanu ili, još bolje, k-najbližih susjeda. Kada očistiš bazu, pokreni linearnu regresiju. Osjetit ćeš onaj mali trijumf kada tvoja skripta predvidi račun za idući mjesec sa greškom manjom od 5 KM. To nije sreća, to je inženjering. Tvoj model je upravo ‘shvatio’ kako tvoji komšije troše energiju. Nemoj stajati tu. Gurni model na limit. Pokušaj predvidjeti kvar bojlera na osnovu skokova napona. Tu počinje prava zabava. Mašinsko učenje u 2024. godini nije za one koji žele kliknuti na dugme, već za one koji žele razumjeti zašto to dugme radi. Postani onaj koji gradi, a ne onaj koji samo troši. Kreni odmah. Ne čekaj ponedjeljak.
