Nauči Python za AI za jedan vikend: Plan rada
Skupa data science obuka košta u prosjeku 3.000 KM. Laptop koji već imaš ispred sebe koštao je možda isto toliko, a sada služi samo za skrolovanje. Vaša investicija za ovaj vikend je nula maraka, ali je ulog vaše vrijeme i mentalna snaga. Ako mislite da vam treba diploma fakulteta da biste napisali prvi skript, lažu vas oni koji prodaju te diplome. Za 48 sati nećete postati inženjer u Google-u, ali ćete prestati biti posmatrač. Prvi korak je prestati instalirati ‘sve i svašta’ i fokusirati se na ‘željezo’ koje pokreće kod.
Zašto ti ne treba najnoviji MacBook: Hardver koji zapravo gura kod
Za AI razvoj vam ne treba NASA-in računar, ali vam treba RAM memorija. Minimalno 8GB, ali ako planirate iole ozbiljniji rad sa lokalnim modelima, 16GB je donja granica ispod koje računar počinje da ‘kašlje’ i guši se pod teretom podataka. Osjetićete to pod prstima – tastatura će postati vrela, a ventilator će vrištati kao da polijeće. To je zvuk fizike koja se bori sa lošim kodom. Prva stvar koju treba da uradite je da provjerite resurse. Nemojte kupovati ništa novo dok ne iscrpite staro. Ako niste sigurni odakle početi, provjerite gdje učiti AI besplatno prije nego što izvadite karticu. 
Subota ujutro: Instalacija okruženja i izbjegavanje ‘pakla zavisnosti’
Prvi sat posvetite instalaciji VS Code-a i Pythona. Nemojte koristiti IDLE koji dolazi uz Python; to je kao da pokušavate graditi kuću švajcarskim nožićem. Treba vam pravi alat. Instalirajte Python 3.11 ili noviji. Upozorenje: Nikada, ali nikada nemojte instalirati biblioteke direktno u sistemski Python. Koristite virtualna okruženja (venv). Ako to ne uradite, za tri mjeseca ćete morati formatirati cijeli sistem jer će se verzije biblioteka potući među sobom. To se zove ‘Dependency Hell’. Izbjegnite ga odmah.
WARNING: Pri radu sa API ključevima za modele poput GPT-4, nikada ih ne upisujte direktno u kod (hardcoding). Ako taj kod postavite na GitHub, botovi će vam isprazniti račun za manje od 30 sekundi. Koristite .env datoteke.
Subota popodne: Logika, petlje i miris zagrijane elektronike
Python sintaksa je varljivo jednostavna. Čini se kao engleski jezik, ali uvlačenje (indentation) je ono gdje početnici ginu. Jedan pogrešan razmak i vaš model će raditi pogrešno, a vi nećete znati zašto. To je onaj osjećaj frustracije kada kod izgleda savršeno, ali se ‘ruši’ bez jasne greške. Fokusirajte se na liste, rječnike i petlje. AI nije ništa drugo nego beskonačno mnogo matematičkih operacija nad listama brojeva. Ako savladate kako da ‘izvučete’ podatak iz rječnika, savladali ste 50% posla. Ako zapnete, pogledajte kako generativni AI pomaže u programiranju da vam objasni grešku. Ali nemojte mu vjerovati na slijepo.
Zašto je NumPy bitan?
NumPy je biblioteka za rad sa nizovima. Bez nje, Python je spor kao puž. NumPy koristi C kod u pozadini, što znači da je brzina obrade podataka hiljadu puta veća. Zamislite to kao razliku između ručnog miješanja maltera i miješalice. Radite pametnije.
Nedjelja ujutro: Pandas i čišćenje digitalnog smeća
Podaci su prljavi. U realnom svijetu, podaci koje dobijete su puni rupa, duplikata i pogrešnih formata. Nedjelju ujutro posvetite Pandasu. To je alat za manipulaciju tabelama. Naučite kako da učitate CSV fajl i kako da popunite prazna polja. Ako ne očistite podatke, vaš AI model će biti beskoristan. GIGO princip – Garbage In, Garbage Out. Smeće unutra, smeće vani. Pročitajte više o tome kako normalizacija podataka za ML zapravo radi da ne biste pravili početničke greške.
Nedjelja popodne: Prvi model i suočavanje sa realnošću
Sada, kada imate podatke, vrijeme je za Scikit-Learn. Napravite jednostavnu linearnu regresiju. To nije ‘magija’, to je statistika na steroidima. Vidjećete kako računar pronalazi obrazac tamo gdje ljudsko oko vidi samo haos. To je onaj ‘aha!’ momenat koji opravdava sav trud. Ali, budite oprezni. Modeli često haluciniraju ili daju lažne rezultate ako su podaci loše postavljeni. Saznajte zašto AI laže i kako to popraviti prije nego što svoj rad pokažete bilo kome.
Anatomija jednog kvara: Zašto će tvoj prvi projekat propasti
Većina početnika zaboravi dokumentovati svoj rad. Za šest mjeseci, nećete imati pojma šta je radio onaj skript ‘test_final_v2_stvarno_final.py’. To je digitalna verzija kutije sa neoznačenim vijcima u radionici. Izgubićete sate pokušavajući da rekonstruišete sopstvenu logiku. Pišite komentare. Odmah. Čak i ako vam se čini očigledno. Nije.
Da li mi treba diploma za posao?
Kratak odgovor: Ne. Dug odgovor: Treba vam portfolio koji dokazuje da znate ‘uprljati ruke’. Niko vas neće pitati za ocjenu iz matematike ako im pokažete funkcionalan model koji predviđa prodaju ili automatizuje dosadan posao. Naučite kako da napravite portfolio koji donosi posao i počnite ga graditi već u nedjelju naveče.
Fizika koda: Zašto Python ‘jede’ memoriju
Python je interpreterski jezik. Svaki put kada definišete varijablu, on zauzima više memorije nego što bi to uradio jezik poput C-a. Zamislite to kao pakovanje alata u ogromne stiroporne kutije; alat je mali, ali kutija zauzima cijelu policu. Ako radite sa velikim datasetovima (milioni redova), vaš RAM će ‘ispucati’. Zato učite tehnike poput ‘chunking’-a – učitavanje podataka u malim zalogajima umjesto pokušaja da odjednom progutate cijelu bazu. To je razlika između profesionalca i amatera. Vikend je gotov. Vaša leđa će vjerovatno biti ukočena, a oči crvene. Ali ako ste pratili ovaj plan, sada imate osnovu koju 90% ljudi nikada neće steći jer su previše zauzeti traženjem ‘savršenog’ kursa. Pali mašinu i kucaj dalje.
