Napravi vlastiti AI server kod kuće za manje od 500€
Plaćate li i dalje 20 dolara mjesećno za ChatGPT Plus? To je 240 dolara godišnje za alat koji može ugasiti vaš nalog kad god poželi. Za manje od 500 eura možete sastaviti sopstveni AI server koji radi lokalno, ne cenzuriše vaše upite i ne prodaje vaše podatke trećim stranama. Ako znate koristiti odvrtku i instalirati Linux, ovaj vodič će vam uštedjeti hiljade eura u narednim godinama. Zaboravite na skupe pretplate; vrijeme je da postanete vlasnik svoje inteligencije. Do kraja ovog teksta znaćete taćno koje polovne dijelove da jurite na oglasima i kako da sve to sklopite u mašinu koja vrti Llama 3 modele dok vi spavate.
Zašto je 12GB VRAM-a magićna granica za vaš budžet?
VRAM (Video RAM) je najvažniji resurs za pokretanje velikih jezičkih modela jer on direktno određuje koliki model možete ‘ugurati’ u grafičku kartu. Ako kupite kartu sa 8GB, bićete ogranićeni na male modele koji ćesto griješe. Sa 12GB, ulazite u zonu gdje modeli poput Llama 3 8B rade glatko kao podmazani.
U svijetu DIY AI projekata, najpametniji potez je nabavka polovne NVIDIA RTX 3060 12GB. Zašto? Zato što nudi najbolji omjer cijene i memorije na tržištu polovne opreme. Dok se profesionalci tuku oko kartica od 2000 eura, vi možete smanjiti AI troškove clouda drastično koristeći hardver koji gejmeri više ne žele. Miris spaljene prašine iz starog kućišta možda nije prijatan, ali zvuk ventilatora koji se vrti dok vaš lokalni model generiše kod je muzika za uši svakog makera.
Da li mi treba najnoviji procesor za AI server?
Ne, procesor je ovdje samo ‘saobraćajac’. Većinu posla odrađuje grafička karta (GPU). Možete koristiti stari Intel i5 ili i7 8. generacije koji možete naći u rashodovanim kancelarijskim računarima. Fokusirajte se na to da matična ploća podržava barem 32GB RAM-a (sistemske memorije) kako bi operativni sistem imao dovoljno prostora za disanje. 
Lista materijala: Gdje pronaći komponente i ne biti prevaren
Nabavka dijelova zahtijeva strpljenje i oko sokolovo za detalje na oglasima. Umjesto da kupujete sve novo u prodavnici, koristite strategiju ‘Scavenger’ (skupljač).
- GPU: NVIDIA RTX 3060 12GB (Polovna, oko 250€) – Srce sistema.
- Baza: Polovni Dell Optiplex ili HP Elitedesk (Tower verzija, ne SFF! – oko 100€).
- Napajanje (PSU): Novo, barem 600W (oko 60€). Nikada ne koristite staro napajanje za AI rad, spalit ćete GPU.
- Disk: 500GB NVMe SSD (oko 40€).
- RAM: Nadogradnja na 32GB (oko 50€).
VAŽNO: Većina brendiranih računara (Dell/HP) koristi specifične konektore za napajanje. Ako kupujete polovnu bazu, provjerite treba li vam adapter za novo napajanje. Pogrešno spajanje može izazvati kratak spoj koji će vam spržiti matičnu ploću u milisekundi.
Instalacija softvera: Od nule do prvog upita
Prvi korak je instalacija operativnog sistema. Preporučujem Ubuntu 22.04 LTS zbog najbolje podrške za NVIDIA drajvere. Instalacija Linuxa može biti frustrirajuća, posebno kada se borite sa ‘Secure Boot’ postavkama u BIOS-u koje vas blokiraju. Ali ne odustajte. Osjećaj kada prvi put kucate nvidia-smi i vidite svoju kartu na ekranu je neprocjenjiv.
Nakon što sredite sistem, vaš najbolji prijatelj postaje Ollama. To je alat koji vam omogućava da pokrenete modele jednom komandom. Ako se pitate kako poćeti, najbolje je da se prvo instalira Python za AI jer će vam trebati za naprednije skripte kasnije. Zatim posjetite vodič za Hugging Face modele kako biste naučili kako preuzeti najnovije modele direktno na svoj novi server.
Zašto moj model ‘halucinira’ i kako to popraviti?
Halucinacije se dešavaju kada model nema dovoljno konteksta ili su parametri temperature podešeni previsoko. Na vašem lokalnom serveru, vi imate potpunu kontrolu nad ovim. Možete podesiti sistem tako da bude striktan i precizan. Postoje 3 načina da dobijete taćan odgovor koje možete implementirati u svoj API poziv.
Anatomija promašaja: Kako sam skoro spalio kuću zbog 10 eura uštede
Najveća greška koju možete napraviti je korištenje adaptera sa SATA na 8-pin za grafičku kartu. Jeftini kineski kablovi nisu dizajnirani za konstantno opterećenje koje AI modeli prave. Tokom treniranja modela ili dugih sesija generisanja, ovi kablovi se mogu bukvalno istopiti. Vidio sam konektore koji su postali crni i ljepljivi od toplote. Nemojte biti taj tip. Kupite kvalitetno napajanje sa direktnim PCIe kablovima.
DIY nije samo o spajanju dijelova; to je o razumijevanju rizika. Ako planirate da vaš server radi 24/7, pobrinite se da imate protok vazduha. Nagurajte dodatni ventilator u kućište, makar ga vezali vezicama (zip-ties). Estetika nije bitna, stabilnost jeste. Ako se vaš GPU pregrije iznad 85°C, poćeće ‘thermal throttling’ i vaš skupi server će raditi sporije od starog kalkulatora.
Nauka iza VRAM-a: Zašto se model ne može samo ‘učitati’?
Mnogi misle da se AI modeli učita sa hard diska dok rade. To je zabluda. Cijeli model mora biti učitan u VRAM grafičke karte da bi procesiranje bilo trenutno. Ako je model velik 10GB, a vi imate 8GB VRAM-a, sistem će pokućati koristiti ‘swap’ (obični RAM), što je i do 100 puta sporije. To je kao da pokušavate piti okean kroz slamku.
Zato je kvantizacija (kompresija) kljućna. Koristeći GGUF format, možete ‘stisnuti’ velike modele tako da stanu u vaših 12GB bez vidljivog gubitka u inteligenciji. Ovo je prava magija DIY AI inženjeringa. Možete naučiti više o tome kako da prilagodite model svojim potrebama kroz fine-tuning, ali za poćetak, samo učitavanje dobro kvantizovanog modela je pobjeda.
Zaključak: Budućnost je lokalna
Izgradnja sopstvenog AI servera za manje od 500 eura je ultimativni maker projekt u 2026. godini. Osim što ćete uštedjeti novac, steći ćete vještine koje su danas nevjerovatno plaćene. Možda ćete poćeti kao hobi, ali ubrzo ćete shvatiti da možete postati prompt inženjer bez diplome koristeći sopstvenu opremu za ućenje. Nemojte ćekati da cijene hardvera ponovo skoće. Krenite u potragu za dijelovima već danas, slather-ujte termalnu pastu na taj procesor i pokrenite svoju lokalnu AI revoluciju. Vaš novćanik (i vaša privatnost) će vam biti zahvalni.

