Ne bacaj pare na Cloud: Kako podesiti AI resurse [2026]
Plaćaš 20 dolara mjesečno za ChatGPT? Plus još 20 za Claude? Do kraja godine, bacio si skoro 500 maraka na nešto što tvoj kompjuter, uz malo vještine i par pravih šarafa, može sam odraditi. Ako imaš solidnu grafičku karticu koja skuplja prašinu dok igraš igrice, bukvalno sjediš na rudniku zlata. Ti posjeduješ hardver, ali dozvoljavaš korporacijama da ti iznajmljuju njihovu pamet na kašičicu. To prestaje danas. Ne treba ti diploma programera, treba ti volja da zaprljaš ruke pod haubom svog operativnog sistema. 
Zašto je ‘Cloud’ zapravo rupa bez dna za tvoj novčanik
Svi ti pričaju da je AI komplikovan i da zahtijeva super-kompjutere. To je laž. Marketing je tu da te ubijedi kako ti treba pretplata da bi ‘seamlessly’ (kako oni vole reći, a ja mrzim) pristupio inteligenciji. Prava istina? Većina modela koje koristiš može raditi na lokalnoj mašini ako znaš kako da ih ‘uguraš’ u VRAM. Kada prestaneš plaćati, gubiš pristup. Kada ugasiš internet, tvoj AI je mrtav. Lokalni setup je tvoja digitalna sloboda. Plus, niko ne čita tvoje upite. Tvoji podaci ostaju tvoji, a ne hrana za njihove algoritme.
Hardverski minimum: Ne kupuj Mac ako imaš staru Nvidiju
Prva stvar koju moraš razumjeti nije procesor (CPU), nego grafička (GPU). To je srce tvoje AI kovačnice. Ako planiraš ozbiljno raditi, gledaj VRAM. To je prostor u kojem tvoj AI model ‘diše’. Ako imaš manje od 8GB VRAM-a, biće čupavo. 12GB je slatka tačka za početnike, dok je 24GB (čuvena RTX 3090 ili 4090) sveti gral za nas koji ne želimo čekati vječnost na odgovor. Osjetićeš miris vrele elektronike i čućeš zujanje ventilatora kao da uzlijeće avion. To je zvuk uštede.
Zašto je VRAM bitniji od brzine procesora?
Zamisli da pokušavaš sastaviti ormar u ostavi od dva kvadrata. Bez obzira koliko si brz, prostor te ograničava. VRAM je tvoja radna površina. Ako model ne stane u nju, sistem će pokušati da koristi obični RAM, a tada sve postaje sporo kao puž.
Instalacija: Kako ‘natjerati’ mašinu da razmišlja
Zaboravi na komplikovano kucanje koda satima. Danas imamo alate kao što su Ollama ili LM Studio. To su tvoji digitalni odvijači. Slather (namaži) svoj sistem ovim alatima i gledaj kako se stvari pokreću. 1. Skini Ollama instalaciju. 2. Otvori terminal (da, moraš se malo praviti važan). 3. Ukucaj ‘ollama run llama3’. I to je to. Model se skida direktno na tvoj disk. Bez kartica, bez pretplata, bez ‘outage’ problema kada OpenAI serveri odluče da odu na kafu. Ali, pazi. Podesi temperature parametar odmah, inače će tvoj AI početi da bulazni gluposti koje nemaju veze s vezom.
Anatomija promašaja: Zašto tvoj lokalni AI može ‘umrijeti’ za šest mjeseci
Ako misliš da ćeš samo instalirati softver i završiti posao, varaš se. Najveća greška koju ljudi prave je ignorisanje hlađenja. AI opterećuje grafičku kartu na 100% konstantno. Ako tvoje kućište nema protok vazduha, spržićeš hardver od hiljadu maraka da bi dobio odgovor na mail. Vidio sam ljude kako stavljaju PC u zatvorene stolove. To je recept za katastrofu. Kondenzatori će nabubriti, pasta na čipu će se stvrdnuti kao beton, i tvoja mašina će postati skupi teg za papir.
WARNING: Nikada ne ostavljaj lokalni model da trenira preko noći ako nemaš adekvatno hlađenje i stabilan napon. Skok napona može probiti kroz jeftina napajanja i ubiti tvoju matičnu ploču u milisekundi. 120v ili 220v, nebitno je—struja ne prašta amaterizam.
Physics of Regret: Nauka iza kvantizacije
Zašto model od 70 milijardi parametara ne može stati na tvoju karticu od 8GB? Zato što su podaci ‘debeli’. Tu uskače kvantizacija. To je proces ‘mršavljenja’ modela gdje žrtvujemo mrvicu preciznosti za ogromnu uštedu prostora. To je kao da pokušavaš spakovati 10 litara vode u flašu od 2 litra—moraš je zalediti i pod pritiskom ugurati (figurativno). Koristi 4-bitnu ili 5-bitnu kvantizaciju. Razliku u inteligenciji jedva ćeš primijetiti, ali će brzina biti deset puta veća.
Šta NE raditi: Nemoj instalirati sve što vidiš na GitHubu
Internet je pun smeća. Postoje skripte koje obećavaju ‘besplatan pristup svemu’, a zapravo instaliraju rudare kriptovaluta na tvoj PC. Drži se provjerenih izvora. Spriječi curenje podataka tako što ćeš blokirati pristup internetu aplikaciji koja pokreće tvoj model. Ako radi lokalno, zašto bi mu trebala veza sa vanjskim svijetom?
Budžetski trik: Gdje naći jeftine resurse?
Ne kupuj novo u prodavnici. Traži polovne radne stanice iz firmi koje se gase. Često možeš naći stare Tesle ili Quadro kartice za bagatelu. One nisu za igrice, ali za AI su brutalne jer imaju ogromnu količinu VRAM-a. Ja sam prošle sedmice našao staru karticu za 300 maraka koja ‘jede’ ChatGPT za doručak u specifičnim zadacima analize podataka.
Da li mi stvarno treba lokalni AI?
Da, ako ti je stalo do privatnosti. Da, ako ne želiš da tvoj posao zavisi od hira neke firme iz Silicijske doline. Analiziraj podatke lokalno i mirno spavaj.
Računica: Koliko si zapravo uštedio?
Pretplata: 40 KM mjesečno. Za 3 godine: 1.440 KM. Za taj novac možeš sklopiti mašinu koja će 2029. godine i dalje raditi, dok će cijene pretplata samo rasti. Plus, tvoj hardver ima preprodajnu vrijednost. Pretplata nema. To je bačen novac. Nemoj biti ovca koju šišaju svakog prvog u mjesecu. Uzmi odvijač, instaliraj Linux (ili bar nauči terminal u Windowsu) i kreni u akciju. Tvoja armija digitalnih asistenata čeka u mraku tvog hard diska. Probudi ih.

![Ne bacaj pare na Cloud: Kako podesiti AI resurse [2026]](https://aiskola.org/wp-content/uploads/2026/03/Ne-bacaj-pare-na-Cloud-Kako-podesiti-AI-resurse-2026.jpeg)


