Pokreni prvi AI model na AWS-u u 5 koraka [2026]
Najam gotovog AI rješenja od ‘enterprise’ provajdera koštaće vaš biznis preko 15.000 KM godišnje. Ako sami pokrenete model na AWS-u, to vas košta oko 0,40 KM po satu. Razlika od 14.000 KM je zapravo ‘porez na neznanje’ koji plaćate jer se bojite konzole. Vi to možete sami. Ne treba vam tim inženjera, treba vam par sati fokusa i spremnost da zaprljate ruke kodom. Do kraja 150. riječi ovog vodiča, znaćete tačno koju instancu da zakupite kako ne biste spržili budžet do sutra ujutro.
Zašto ti treba IAM korisnik, a ne Root (I kako ne bankrotirati odmah)
Prva greška koju ćete napraviti je korištenje ‘root’ naloga. To je kao da hodate gradom sa otključanim sefom punim zlata. AWS je brutalan prema početnicima. Jedan procurio API ključ i hakeri će na vašem računu rudariti kriptovalute dok ne ostanete bez prebijene pare.
CRVENA ZONA (SIGURNOST): Odmah aktivirajte MFA (Multi-Factor Authentication). Ako vam neko ukradne lozinku bez fizičkog tokena ili aplikacije na telefonu, vaš račun je gotov. Šok od 120V u radionici je ništa naspram šoka kada vidite AWS račun od 5.000 dolara za resurse koje niste ni koristili.
Prvo što radimo je kreiranje IAM korisnika sa minimalnim privilegijama. To je vaš osigurač. Ako planirate ozbiljan rad, pročitajte kako sakriti API ključeve od hakera prije nego što ijednu liniju koda pošaljete u oblak. 
Korak 1: Izbor ‘Gvožđa’ – Zašto L4 instance pobjeđuju P5 u 2026.
Izbor instance je kao biranje motora za auto. Možete uzeti P5 instancu koja košta kao garsonjera, ali vam ne treba. Za prvi model, tražite g6e.xlarge ili barem stariju g4dn.xlarge. One koriste NVIDIA L4 ili T4 grafičke procesore. To su radni konji koji ne koštaju bogatstvo. Zašto ovo radi? AWS koristi virtualizaciju hardvera gdje vi zapravo iznajmljujete dio masivnog servera. L4 kartice imaju 24GB VRAM-a, što je dovoljno da ‘ugurate’ Llama 3 ili sličan model bez da se sistem zaguši. Ako osjetite da konzola ‘laguje’, to je zvuk vašeg novca koji isparava jer niste podesili Spot instance.
Da li su Spot instance stvarno sigurne?
Da, ali uz rizik. Spot instance su višak kapaciteta koji AWS prodaje u bescjenje (do 90% jeftinije). Ali, ako Amazonu zatreba taj server, uzeće ga nazad u roku od dvije minute. Za učenje – idealno. Za produkciju – rizično.
Korak 2: Slathering the OS – Priprema AMI-ja
Ne gubite vrijeme na instalaciju drajvera od nule. To je mazohizam. Koristite Deep Learning AMI (Ubuntu 22.04). To je ‘gunk-free’ slika sistema koja već ima instaliran CUDA, PyTorch i TensorFlow. Kada pokrenete instancu, osjetićete onaj specifičan miris digitalne svježine – sve je spremno. The 120-Grit Mistake: Nemojte birati Amazon Linux ako ste početnik. Većina tutorijala na internetu je pisana za Ubuntu. Ako krenete težim putem, provešćete sate ispravljajući greške u zavisnostima umjesto da trenirate model. To će vas iscrpiti. Ruke će vas boljeti od kucanja beskorisnih komandi.
Korak 3: Storage i ‘Physics of Regret’
Veličina diska (EBS) je bitna. AI modeli su masivni. Llama 3 od 70B parametara zauzima preko 40GB samo u fajlovima. Podesite barem 100GB gp3 storage-a. Zašto gp3? Zato što omogućava da podesite IOPS (brzinu čitanja) nezavisno od veličine diska. Ako model ‘starvuje’ za podacima, vaša skupa grafička karta će stajati besposlena. To je kao da imate Ferrari, a sipate lož ulje kroz slamku.
Korak 4: Ugurajte model u RAM uz ‘Hugging Face’
Sada koristimo Hugging Face biblioteku. To je skladište za AI modele. Koristite komandu huggingface-cli login da povežete instancu. Anatomy of a Screw-Up: Prošle godine sam zaboravio da provjerim verziju drajvera i model se srušio nakon 4 sata rada. Izgubio sam 15 eura i cijelo popodne. Provjerite nvidia-smi odmah nakon logovanja. Ako ne vidite tabelu sa procesima, vaša grafička je ‘mrtva’ i trošite novac na obični procesor.
Korak 5: Pokretanje i ‘Dirty’ Debugging
Zadnji korak je pokretanje Python skripte. Koristite screen ili tmux. Zašto? Jer ako vam pukne internet konekcija, vaš proces na AWS-u će se ugasiti. To ne želite. Želite da model živi u pozadini. Physics of Regret: Voda se širi za 9% kad se smrzne i puca cijevi. AI model širi vašu memoriju dok ne pukne sistem. Ako dobijete ‘Out of Memory’ (OOM) grešku, moraćete primijeniti kvantizaciju – to je proces smanjivanja preciznosti modela kako bi stao u RAM. To je digitalno ‘tesanje’ viška materijala. Pogledajte kako smanjiti troškove biznisa dodatnom optimizacijom procesa.
Zašto je ovo bolje od gotovih rješenja?
Kada sami složite svoj server, imate potpunu kontrolu. Možete automatizovati pipeline koristeći GitHub Actions. Nema skrivenih naknada. Nema čekanja u redu za API koji stalno pada. Ovo je vaš digitalni radni sto. Prljav je, ima koda svuda, ali radi tačno onako kako ste ga vi ‘zavarili’.
Često postavljana pitanja: Koliko košta učenje?
Ako koristite g4dn.xlarge Spot instancu, sat vremena vas košta manje od kafe u Sarajevu. Ugasite instancu čim završite. ‘Terminate’ je vaša omiljena komanda. Ako ostavite instancu upaljenu preko vikenda, to će vas koštati 50 KM. To je skupa lekcija koju ne morate naučiti na teži način. Budite disciplinovani. Zapišite podsjetnik na papir i zalijepite ga na monitor. DIY nije samo gradnja, to je i održavanje.

![Podesi AI navigaciju u autu i izbjegni gužve [2026 Vodič]](https://aiskola.org/wp-content/uploads/2026/02/Podesi-AI-navigaciju-u-autu-i-izbjegni-guzve-2026-Vodic.jpeg)