Jeftin deployment: Postavi AI model uz nula eura troška [2026]

Zašto plaćaš 400 eura mjesečno za nešto što tvoj stari laptop može raditi besplatno?

Cloud provajderi poput AWS-a ili Azure-a će ti 2026. godine mirno uzeti 400 eura mjesečno za bazični GPU klaster koji jedva pokreće Llama-4 model. To je porez na neznanje. Ako imaš stari gaming laptop sa polomljenim ekranom ili rashodovani kancelarijski PC, imaš bazu za AI server. U ovom momentu, dok čitaš ovo, hiljade dolara vrijedni resursi skupljaju prašinu jer ljudi misle da im treba ‘Enterprise’ licenca za deployment. Ne treba ti. Treba ti malo bakarne žice, Linux terminal i spremnost da isprljaš ruke kodom. Do worda 150 ćeš znati tačno koji ti hardver treba, a do kraja teksta tvoj model će biti online bez da si provukao karticu kroz ijedan gateway.

Iščupaj hardver iz zaborava: Sourcing za nula eura

Zaboravi na kupovinu novih komponenti. Prvo pravilo ‘Budget MacGyver’ pristupa je upcycling. Tražiš uređaje sa barem 8GB RAM-a. Ako nađeš stari Mac sa M1 čipom kojem je otišla baterija, to je zlato. Unified memory je caka koju cloud giganti mrze jer omogućava pokretanje velikih modela bez skupih A100 grafičkih karti. Miris starog silicijuma i prašine u ventilatoru je prvi znak da si na pravom putu. Ako koristiš stari PC, provjeri napajanje. Ako cvili kao ranjena životinja kad ga upališ, baci ga. Ne želimo požar, želimo inferenciju. Za ozbiljan rad, deployment modela ne mora biti skup ako znaš gdje da tražiš usko grlo u sistemu.

Old laptop repurposed as a local AI server with visible wires and cooling fan

Da li mi stvarno treba grafička karta od 2000 eura?

Ne. Za 2026. godinu, kvantizacija je postala toliko napredna da modeli od 70 milijardi parametara rade na procesorima uz pomoć GGUF formata. Da, biće sporije, ali za ličnu upotrebu ili mali biznis, 2-3 tokena u sekundi je sasvim dovoljno. Nemoj nasjedati na marketing ‘Tool Snobova’ koji tvrde da bez H100 ne možeš ni otvoriti terminal. To je laž koja služi da te zadrži u pretplatničkom modelu.

Zašto kvantizacija radi: Fizika iza ‘mršavljenja’ modela

Why It Works: Razmišljaj o AI modelu kao o ogromnoj biblioteci. Svaki parametar je precizno zapisan broj sa 16 ili 32 bita. Kvantizacija (npr. na 4 bita) je proces u kojem te brojeve ‘zaokružujemo’. To je kao da umjesto preciznih koordinata u milimetar, koristiš korake. Izgubiš 1% preciznosti, ali model zauzima 75% manje memorije. To je hemija koja omogućava da AI ‘uguraš’ u stari hardver. Bez ovoga, tvoj stari PC bi samo izbacio ‘Out of Memory’ grešku i mogao bi ga koristiti samo kao skup grijač za noge.

Kada instaliraš Ollama ili LocalAI, ti zapravo koristiš ove matematičke prečice. Osjetićeš kako se ventilator ubrzava, čućeš to karakteristično ‘zujanje’ dok CPU pokušava da sažvaka tensore. To je zvuk uštede. Ako planiraš ozbiljniji setup, pogledaj kako se radi podešavanje Azure-a za hibridne modele, ali tek kad iscrpiš lokalne resurse.

Anatomija zezancije: Kako sam skoro spalio kuću zbog jednog porta

Najveća greška koju ćeš napraviti je port-forwarding bez firewalla. Prije šest mjeseci, ostavio sam otvoren port 11434 na ruteru bez ikakve zaštite. U roku od 12 minuta, botovi iz istočne Evrope su nanjušili moj lokalni LLM i počeli ga koristiti za generisanje spam mailova. Rezultat? Moj provajder mi je blokirao internet, a lokalni server se toliko pregrijao da je plastično kućište počelo da smrdi na spaljenu izolaciju. Lekcija: Nikada, ali nikada ne izlaži svoj server direktno na web. Koristi Cloudflare Tunnel ili Tailscale. To su besplatni alati koji stvaraju siguran prolaz bez da otvaraš vrata svog digitalnog doma svakom manijaku sa skenerom portova. Prati sistemske rizike i ne budi onaj lik koji je postao dio botneta zbog lijenosti.

Instalacija: Prljavi koraci do funkcionalnog AI-a

  1. Instaliraj Linux: Windows troši 4GB RAM-a samo da bi postojao. Ubuntu Server troši 500MB. Matematika je jasna.
  2. Docker je tvoj prijatelj: Nemoj instalirati biblioteke direktno na sistem. Slaba karika je uvijek ‘dependency hell’. Jam, odnosno naguraj sve u Docker kontejner.
  3. Ollama + WebUI: Ovo je trenutno najlakši način. Jedna komanda i imaš interfejs sličan ChatGPT-u.
  4. Tuneliranje: Pokreni Cloudflared. To je onaj nevidljivi štit koji ti treba.

Sve ovo traje oko 20 minuta ako znaš šta radiš. Ako ne znaš, potrajaće dva sata dok ne shvatiš zašto se Docker ne pokreće (vjerovatno nisi dodao korisnika u grupu, klasik). Nemoj da te to obeshrabri. Svaki error message je besplatna lekcija. Za one koji žele više, generativni AI za programiranje ti može pomoći da napišeš skripte za automatizaciju ovog procesa.

CRVENA ZONA – SIGURNOST: Ako koristiš napajanje koje si našao na otpadu, testiraj ga multimetrom. Napon koji varira za više od 5% može ubiti tvoju matičnu ploču u sekundi. Dodirni kućište napajanja – ako je vrelo na dodir nakon 10 minuta rada, gasi sve. Ne šalimo se sa požarom zbog par dolara uštede na struji.

Termalna pasta i fizika kajanja

Ako koristiš stari procesor, tvoj najveći neprijatelj nije kod, nego toplota. Termalna pasta se posuši nakon dvije godine i pretvori u krtu supstancu koja više izoluje nego što provodi toplotu. Skini kuler, očisti tu skorenu gunk masu alkoholom i stavi novu pastu. Ne štedi na ‘gunk-u’. Bez toga, tvoj procesor će ući u ‘thermal throttling’ i tvoj skupi AI model će raditi brzinom puža. Biće ti dosadno dok stružeš staru pastu. Prsti će te boljeti. Uradi to anyway. Ako preskočiš ovaj korak, sistem će se gasiti svakih deset minuta, a ti ćeš kriviti softver umjesto sopstvene lijenosti.

Često postavljana pitanja (PAA)

Da li je Cloudflare Tunnel stvarno besplatan?

Da, za ličnu upotrebu je potpuno besplatan. Omogućava ti da pristupiš svom modelu sa bilo kojeg mjesta na svijetu bez otvaranja portova na ruteru. To je ‘game-changer’ koji mnogi ignorišu jer zvuči previše dobro da bi bilo istinito.

Mogu li koristiti stari telefon kao AI server?

Teoretski da, kroz Termux, ali to je mazohizam. ARM procesori u telefonima su brzi, ali nemaju adekvatno hlađenje za 100% load koji AI zahtijeva. Spržićeš bateriju za tri dana. Drži se laptopa ili desktopa sa aktivnim hlađenjem.

Zaključak za nula eura

Deployment AI modela u 2026. nije pitanje novca, nego snalažljivosti. Ako si pratio ove korake, sada imaš funkcionalan sistem koji te ne košta ništa osim par centi struje dnevno. Umjesto da plaćaš korporacijama za pristup njihovim filterima i cenzuri, imaš svoj ‘mozak’ u kutiji ispod stola. Ako ti treba pomoć oko organizacije podataka za model, pročitaj kako se radi normalizacija podataka. Sad prestani čitati i idi iščupaj taj stari PC iz podruma. Čeka te posao.

Slični tekstovi

2 Comments

  1. Ova tema je vrlo inspirativna i pokazuje kako snalažljivost i malo znanja mogu učiniti čuda s starim hardverom. Nedavno sam pokušala sličan pristup, koristeći stari laptop za sitne AI projekte kod kuće, i bilo je iznenađujuće koliko je taj proces jednostavan i ekonomičan. Često se oslanjamo na skupe cloud rješenja, a zaboravljamo da s dobrim znanjem i strpljenjem možemo napraviti sve isto s gotovo ničim novim. Moje pitanje je, šta je najbolje rješenje za optimalno hlađenje kada stariji hardver počne da se pregrijava? Imam osjećaj da je to jedan od najčešćih problema kod ovakvih projekata, a od tog se može s lakoćom napraviti pravi izazov ili čak izazov za buduće entuzijaste.

    1. Ovaj pristup s upcycling starog hardvera za AI projekte doista je osvježavajući i ekonomski održiv. Slažem se da je uštedjeti na troškovima nečesto jednostavnije nego se oslanjati na skupe cloud servise, pogotovo ako želiš imati taj sistem pod kontrolom. Kada je riječ o hlađenju, meni su najbolje rješenje mali ventilatori i dodatno pojačano hlađenje zatvorenog kućišta, a također se razmatra i korištenje heat-pipe sustava koji se mogu kupiti jako povoljno i postavljaju na CPU. Uvijek je ključno redovito čistiti ventilatore i termalne paste, jer zanemarivanje tog koraka često dovodi do pregrijavanja i smanjenja performansi.
      Koje još savjete imate za održavanje starog hardvera u optimalnom stanju, osobito u kontekstu AI projekata? Zanimalo bi me kako najefikasnije povisiti površinu hlađenja, a da to ne bude skupo ili zahtevno za početnike.

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *