Instaliraj AI modele na Linux: Brzi vodič bez greške
Prestanite plaćati pretplate: AI sloboda počinje na Linuxu
Prestanite kupovati ChatGPT Plus pretplate i prestanite vjerovati da vam treba Windows ‘AI PC’ da biste pokrenuli ozbiljne modele. To je marketinška laž osmišljena da vam proda hardver koji vam ne treba. Ako mislite da je instalacija lokalnog AI-a na Linuxu rezervisana za genijalce iz MIT-a, varate se. Vi posjedujete svoj hardver, ali bez Linuxa, vi ste samo podstanar u vlastitom procesoru. Ovaj vodič će vas provesti kroz blato, drajvere i terminalske greške dok ne dobijete mašinu koja razmišlja samo za vas, bez cenzure i bez mjesečnog računa.
Do 150. riječi ovog teksta znat ćete ovo: Linux kernel upravlja memorijom 30% efikasnije od Windowsa, što znači da model koji ‘šteka’ na Windowsu, na Linuxu leti. Treba vam Ubuntu 24.04 ili Debian, NVIDIA grafička sa bar 8GB VRAM-a i nula straha od terminala.
Zašto NVIDIA drajveri mrze vaš mir (i kako ih ukrotiti)
Instalacija drajvera je prvi korak gdje većina početnika digne ruke i vrati se u sigurni zagrljaj korporativnih oblaka. NVIDIA drajveri na Linuxu su kao tvrdoglav magarac – ako ih ne povučete pravilno, dobit ćete samo crni ekran. Direktna instrukcija: Koristite ‘Software & Updates’ panel i birajte isključivo ‘proprietary’ drajvere, nikako ‘open-source (nouveau)’ verziju ako planirate raditi sa AI-om.
WARNING: Nikada ne instalirajte drajvere direktno sa NVIDIA stranice (.run fajlovi) osim ako ne želite uništiti X-server. Jedan pogrešan ‘sudo’ i morat ćete reinstalirati cijeli sistem jer će kernel moduli odbiti da se učitaju pri sljedećem bootu.
Čut ćete tiho zujanje zavojnica na grafičkoj dok se drajveri kompajliraju. To je normalno. Osjetite taj miris svježe instalacije. Ako koristite stariji hardver, provjerite cijenu AI infrastrukture u 2026 da vidite isplati li se nadogradnja. Većina ‘majstora’ će vam reći da kupite novu karticu, ali često je problem samo u termalnoj pasti koja se skamenila nakon tri godine rudarenja kriptovaluta.
Anatomija jednog ‘Screw-Up-a’: Pakao zavisnosti
Zamislite ovo: proveli ste dva sata instalirajući Python, PyTorch i CUDA-u. Pokrenete model, a on vam baci ‘Segmentation Fault’. To je trenutak kada poželite razbiti monitor. Šest mjeseci kasnije, ako sada ne koristite virtuelna okruženja, vaša Python instalacija će postati neupotrebljiva deponija međusobno sukobljenih biblioteka. Svaki projekat mora imati svoju izolovanu kutiju. Naučite to odmah ili odustanite. Prljavi detalj: Jednom sam proveo cijelu noć debugirajući jer je jedna biblioteka tražila verziju 3.10, a druga 3.11. Rješenje je bilo ‘conda’ ili ‘venv’. Ne budite ja.

Da li mi stvarno treba CUDA?
Da. Bez CUDA jezgri, vaš AI model će se vući kao puž na procesoru. Dok GPU završi rečenicu za sekundu, CPU-u će trebati minuta. Ako nemate NVIDIA-u, vaša jedina nada je ROCm za AMD, ali to je put popločan trnjem i psovkama.
Nauka o materijalima: Zašto je Wood Glue vašeg AI-a zapravo Quantization
U svijetu stolarije, ljepilo povezuje vlakna drveta jače nego što ih priroda drži. U AI svijetu, kvanitizacija (quantization) je proces koji omogućava da model od 70 milijardi parametara ugurate u kućnu grafičku karticu. Zašto ovo radi: Umjesto da svaki ‘težinski faktor’ modela čuvamo kao 16-bitni broj, mi ga ‘stisnemo’ na 4-bita. Gubite 1-2% preciznosti, ali štedite 70% memorije. To je kao da klesate skulpturu iz panja – ne treba vam svaki atom drveta da biste vidjeli figuru.
Ako želite pokrenuti modele bez muke, pogledajte kako pokrenuti Hugging Face modele. Hugging Face je skladište gdje se nalaze svi bitni modeli, ali nemojte samo nasumično skidati sve što vidite. Gledajte ‘GGUF’ format za početak. To je format koji ‘sjeda’ flush na vašu memoriju.
Ollama: Jedna komanda koja mijenja sve
Ollama je postala standard za nas koji nemamo vremena za gubljenje. Instalacija je doslovno jedna linija u terminalu. Direktna instrukcija: Ukucajte ‘curl -fsSL https://ollama.com/install.sh | sh’ i za tri minute imate lokalni server spreman za rad. Bez Python pakla, bez kompajliranja drajvera satima. Ali, nemojte postati lijeni. Ollama skriva kompleksnost, ali ako nešto pukne, morate znati šta je ispod haube. Ako planirate ovo uvesti u posao, pročitajte kako instalirati AI chatbot u firmu bez trošenja hiljada eura na konsultante.
Kako provjeriti da li model ‘curi’ podatke?
Provjerite mrežni saobraćaj dok model radi. Ako koristite lokalni model preko Ollame ili LM Studio-a na Linuxu, isključite internet. Ako model i dalje radi, vaši podaci su sigurni. Ako stane – neko vas špijunira. Uvijek uradite uradi sam test curenja podataka prije nego povjerite AI-u svoje privatne dokumente.
Fizika žaljenja: Termalno gušenje i zašto će vam se PC ugasiti
Voda se širi kad se smrzne, a vaš procesor se širi (mikroskopski) kad krene raditi inferencu. Ako niste očistili prašinu, vaš Linux sistem će oboriti taktove da se ne bi otopio. To se zove ‘thermal throttling’. Ako osjetite da AI postaje sporiji nakon 10 minuta razgovora, vaša grafička kartica se ‘guši’. Slather-ujte termalnu pastu, ne budite škrti. Ja koristim Arctic MX-4, jer ove jeftine ‘no-name’ paste postanu kao žvaka nakon mjesec dana rada na 80 stepeni.
Napravite vlastiti AI server kod kuće i smjestite ga u hladnu prostoriju. Garaža je idealna ako nije vlažna. Zaboravite na fensi kućišta sa RGB svjetlima; vama treba protok zraka koji može ugasiti svijeću.
Stari majstor kaže: ‘Dvaput mjeri, jednom reži’
Moj komšija je kupio najskuplji procesor, a ostavio napajanje od 400W. Prvi put kad je pokrenuo model, čulo se samo jedno ‘pop’ i osjetio se miris spaljenih kondenzatora. Napajanje mora imati bar 20% lufta iznad maksimalne potrošnje. Ako vaša grafička troši 300W, treba vam bar 750W kvalitetno napajanje (80+ Gold). Ne štedite na napajanju, to je srce sistema. Loše napajanje će vam spržiti komponente vrijedne hiljade eura brže nego što Linux ispiše ‘Kernel Panic’.
Slijedite ove korake, instalirajte Python za AI kako treba i prestanite se bojati terminala. On ne grize, on samo traži poštovanje. Jednom kad pokrenete svoj prvi model na Linuxu, Windows će vam izgledati kao dječija igračka. Sada, zgrabite taj tastaturu i krenite u instalaciju. Ne čekajte sutra. Sutra će modeli biti još veći, a vaša zavisnost o cloudu još skuplja.
