Napravi data scientist portfolio koji donosi posao u 2026.
Zaboravi na ‘savršene’ tutorijale: Zašto tvoj portfolio iz 2024. ide pravo u smeće
Prestanite lizati svoje Jupyter Notebookove kao da su porculan. To je marketinška laž koja će vas ostaviti na birou rada u 2026. godini. Ako tvoj portfolio izgleda kao niz kopiranih rješenja sa Kaggle-a, regruter ga neće ni pogledati. U svijetu gdje AI agenti pišu kod brže od tebe, tvoja jedina šansa je da pokažeš gritty, prljavu stvarnost rješavanja problema koji bole. Ti ne gradiš galeriju slika; ti gradiš dokaz da možeš ukrotiti haos podataka bez da zapališ server. Većina ‘stručnjaka’ ti kaže da središ LinkedIn. Ja ti kažem da središ svoju logiku i pokažeš ožiljke sa produkcije. Do 150. riječi ovog vodiča, znat ćeš tačno koji ti alati trebaju – i ne, nije ti dovoljan samo Python i dobra volja.
Alatnica za 2026: Šta moraš imati u svojoj digitalnoj torbi
Prije nego što uopšte dotakneš tastaturu, moraš shvatiti da je Data Science u 2026. godini 70% inženjering, a 30% statistika. Zaboravi na besciljno lutanje kroz Pandas dokumentaciju. Potreban ti je hardver i softver koji vrišti ‘profesionalac’.
- Docker i Kubernetes: Ako tvoj model ne može preživjeti u kontejneru, on ne postoji. Tačka.
- MLOps framework (DVC ili MLflow): Praćenje eksperimenata je miris svježe piljevine u radionici. Bez toga, ti si samo amater koji se igra s brojevima.
- Cloud provider (Azure ili AWS): Hostovanje modela košta, ali pokazivanje da znaš kako jeftino hostovati na Azure-u je razlika između juniora i seniora.
- Senzori i API-ji: Prestani koristiti CSV fajlove. Poveži se na real-time stream. Osjeti kako podaci pulsiraju pod tvojim prstima.

Čuješ li taj tihi zuj ventilatora na tvom laptopu? To je zvuk trošenja resursa. Ako ne znaš optimizovati svoj kod, taj zvuk će postati tvoja noćna mora na intervjuu. Don't skip this. Postavljanje okruženja je pola posla.
Projekat 1: Detekcija kvarova u realnom vremenu (The ‘Fix-It’ Approach)
Umjesto predviđanja ko je preživio na Titanicu, napravi sistem koji predviđa kada će crknuti motor u fabrici namještaja. To je ono što firme plaćaju. Prvi korak je prikupljanje podataka. Nemoj ih skidati; ukradi ih (legalno). Koristi scrapere, koristi senzore, koristi šta god moraš da dobiješ sirovu, neobrađenu ‘mast’.
Zašto ti treba normalizacija podataka, a ne ‘čišćenje’?
Mnogi početnici misle da je brisanje praznih polja dovoljno. Velika greška. Normalizacija je kao brušenje drveta – ako to uradiš pogrešno, boja (tvoj model) nikada neće uhvatiti kako treba. Nauči kako se radi normalizacija prije nego što uništiš distribuciju svojih podataka. Osjeti teksturu distribucije; da li je gausovska ili je nakrivljena kao loša polica? Ako je nakrivljena, tvoj model će lagati.
WARNING: Nikada, ali nikada ne ubacuj testne podatke u trening set (Data Leakage). To je kao da ostaviš uključenu brusilicu na stolu – kad-tad će te udariti po džepu i ugledu. Shvati da je 120v struja opasna, ali lažna preciznost modela od 99% je opasnija za tvoju karijeru.
Projekat 2: LLM Agent za lokalni biznis (The ‘Smart Integrator’ Lens)
U 2026. niko ne želi samo ‘AI model’. Žele agente koji rade posao. Uzmi lokalnu pekaru i napravi im bota koji ne samo da odgovara na pitanja, nego i predviđa koliko kifli treba ispeći na osnovu vremenske prognoze i lokalnih praznika. Koristi LangChain ili AutoGPT. Poveži to sa bazom podataka. To je pravi DIY rad.
Kako spriječiti da tvoj bot postane idiot?
Halucinacije su rak rana AI sistema. Popravi halucinacije kroz RAG (Retrieval-Augmented Generation). Nemoj samo slati upite OpenAI-u; izgradi mu ogradu od tvojih podataka. To je joinery u digitalnom svijetu – precizno spajanje znanja i generativne moći.
Anatomija katastrofe: Kako sam uništio model za 5 minuta
Jednom sam pokušao trenirati model za predviđanje cijena nekretnina bez da sam provjerio inflaciju. Model je radio savršeno na papiru, ali u praksi je davao cijene koje su bile 40% niže od tržišnih. Big mistake. Moj klijent je skoro izgubio ugovor. Problem je bio u tome što sam ignorisao vanjske faktore. Nauči iz mojih grešaka: model bez konteksta je kao čekić bez drške. Možeš njime udarati, ali ćeš samo sebi razbiti prste. Uvijek dodaj ‘sanity check’ sloj u svoj kod. Provjeri da li su rezultati logični za ljudsko biće, a ne samo za procesor.
Why It Works: Fizika ‘skrivenog sloja’
PVA ljepilo prodire u vlakna drveta i stvara vezu jaču od samog drveta. Slično tome, tvoje razumijevanje Activation Functions (aktivacionih funkcija) stvara vezu između ulaznih podataka i predviđanja. Ako koristiš pogrešnu funkciju, tvoj ‘gradijent’ će nestati kao voda u pustinji. Podesi svoje neurone tako da ne ‘umru’ tokom treninga. Ovo nije magija; ovo je matematika koja se znoji pod haubom tvog koda.
Code Reality Check: Propisi i privatnost
U 2026. godini, zakoni o privatnosti su strožiji nego ikad. Ako tvoj portfolio ne pominje AI Impact Assessment, ti si u problemu. Popuni taj assessment i pokaži regruteru da razmišljaš o etici. Niko ne želi zaposliti nekoga ko će firmi donijeti milionsku kaznu jer je ‘slučajno’ koristio privatne podatke kupaca za trening bota.
Da li moram znati SQL u 2026?
Da. Bez diskusije. SQL je kao metar u tvojoj radionici. Možeš ti nagađati, ali bez preciznog upita, tvoji podaci će biti krivi. SQL se nije promijenio decenijama s razlogom – radi. Don't buy the hype da će AI sve pisati sam. Ti moraš znati pročitati taj kod i reći ‘ovo je smeće, popravi to’.
Završni premaz: Dokumentacija koja ne smrdi na robota
Tvoj README fajl na GitHubu ne smije biti generički. On mora mirisati na trud. Ubaci slike, ubaci grafikone koji pokazuju greške, a ne samo uspjehe. Priznaj gdje je sistem pao i kako si ga zakrpio. To je ono što seniori traže – osobu koja zna popraviti stvari kad se sve raspadne. Dokumentuj svoje mašinsko učenje kao da pišeš uputstvo za upotrebu motorne pile. Jasno, glasno i sa fokusom na sigurnost.
Izgradnja portfolija je naporan posao. Boljet će te leđa od sjedenja, oči će ti biti crvene od koda u 3 ujutro. Ali kada dobiješ taj poziv za intervju jer je neko vidio tvoj ‘prljavi’ ali funkcionalni projekat, znat ćeš da se svaki minut isplatio. Sad uzmi tu tastaturu, prestani čitati i počni kucati. Make something that works.
