Skupi AI serveri? Sreži troškove infrastrukture 2026.
Plaćate porez na neznanje: Zašto su računi za GPU u 2026. suludi
Račun od 15.000 KM mjesečno za zakup H100 klastera nije investicija; to je pljačka vašeg budžeta ako ne znate šta radite. Vi plaćate nečiju tuđu struju, prostor i maržu od 300%. Prosječan inženjer danas samo klikne ‘deploy’ na Cloudu, dok vi, ako želite preživjeti 2026., morate naučiti kako da iščupate performanse iz gvožđa koje već posjedujete. Ako vaš server troši više od 2kW po satu dok ‘odmara’, nešto ste gadno zabrljali u arhitekturi. Skupi AI serveri nisu jedina opcija, a ovaj vodič će vam pokazati kako da ih zaobiđete koristeći mozak umjesto kreditne kartice.
Hardware Scavenging: Gdje naći ‘sirovu snagu’ bez bankrota
Ne kupujte nove sisteme. Idite na sekundarno tržište i tražite A100 kartice kojima je istekla garancija ili lokalne data centre koji gase stare rack-ove. Možete proći 70% jeftinije ako ste spremni da rvemo se sa kablovima i sami zamijenite termalnu pastu. Najveća greška je kupovina brendiranih servera sa ‘AI’ naljepnicom. To je porez na budale. Provjerite stvarne cijene servera u 2026. godini prije nego što potpišete bilo kakav ugovor. Hardver mora da miriše na ozon i vreli bakar, a ne na fensi marketing prezentaciju. Jam-ujte što više VRAM-a u jedan slot; propusni opseg je jedino što je bitno kada krene inferencija.

Anatomija zajeba: Zašto vaš model troši resurse kao stari dizelaš
U narednih šest mjeseci, vaš model će postati trom ako ga ne utegnete. Najveći ‘screw-up’ koji viđam je ostavljanje modela u punoj preciznosti (FP32) za obične chatbot aplikacije. To je kao da koristite bager da otvorite konzervu tunjevine. Rezultat? Vaš VRAM se guši, a ventilatori vrište. Ako ne uradite quantization na 4-bit ili 8-bit, vaša infrastruktura će puknuti pod pritiskom prvih hiljadu korisnika. Česte greške kod tuninga vas koštaju hiljade maraka u izgubljenom vremenu procesora. Gledajte kako se memorija troši: ako vidite stalne ‘spajkove’, vaš batch size je pogrešan. Sreži to odmah. Mala greška ovdje znači da će se u januaru, kada vlažnost padne a statički elektricitet poraste, vaše ploče grijati preko 90 stepeni, skraćujući im životni vijek za pola.
Zašto VRAM propusni opseg pobjeđuje sirovu brzinu procesora?
To je prosta fizika. Možete imati najbrži procesor na svijetu, ali ako podaci ne mogu stići do njega dovoljno brzo, on samo ‘vrti palčeve’ dok troši struju. To je kao da imate Ferrari, a put vam je od makadama. Uvijek birajte kartice sa širim memorijskim busom, čak i ako su starije generacije. Bolje je imati 80GB sporije memorije nego 24GB najbrže ako radite sa velikim LLM modelima.
WARNING: Nikada ne spajajte dva napajanja na istu matičnu ploču bez zajedničkog uzemljenja. Razlika u potencijalu može izazvati varničenje koje će spržiti GPU slotove u milisekundi. 1200W napajanja nisu igračka; jedan loš spoj i miris paljene plastike će vam biti jedini rezultat rada.
Zeleni AI: Kako da vam server ne istopi osigurače
Struja je skriveni ubica profita. Ako ne optimizujete potrošnju, vaša ‘jeftina’ infrastruktura će postati rupa bez dna. Naučite kako da koristite metode za smanjenje potrošnje struje. To podrazumijeva undervolting GPU-a i agresivno gašenje jezgara koja ne rade ništa. Isključite nepotrebne servise u Linuxu. Svaki sistemski proces koji ‘drži’ CPU na 2% je neprijatelj. Slather-ujte termalnu pastu precizno; zračni džepovi su izolatori koji zadržavaju toplotu tamo gdje je najmanje želite. Ako vaš server zvuči kao mlazni motor, niste dobro podesili krive hlađenja. Tišina je znak efikasnosti. Koristite hyperparameter tuning da skratite vrijeme treniranja; svaki sat manje na strujnoj mreži je novac u džepu. Budite grubi prema svom kodu, ali nježni prema hardveru.
Da li mi stvarno treba vodeno hlađenje za AI rack?
Kratak odgovor: Ne, osim ako ne radite u prostoru bez ventilacije. Vazdušno hlađenje je pouzdanije. Pumpa može crknuti, crijevo može procuriti i ‘gunk’ se može nakupiti u blokovima. Dobar protok vazduha (push-pull konfiguracija) je majka sigurnosti za svaki DIY server. Ne komplikujte tamo gdje ne morate.
Audit i preživljavanje: Nađite rupe prije nego što vas pojedu troškovi
Svakih 30 dana morate uraditi samostalni audit sistema. Provjerite logove. Ako vidite da model ‘razmišlja’ predugo o jednostavnim upitima, vaša keš memorija je gubava. Očistite je. Bacite stare checkpoint-ove modela koji samo skupljaju digitalnu prašinu i troše prostor na skupim NVMe diskovima. Yank-ujte diskove koji pokazuju SMART greške odmah. Nema čekanja. U DIY svijetu, vi ste i radnik i direktor. Ako vi ne brinete o gvožđu, niko neće. Skupi AI serveri su za one koji imaju više novca nego pameti. Vi imate ovaj vodič. Iskoristite ga da sagradite nešto što traje, što je hladno na dodir i što ne pravi rupu u novčaniku svaka 24 sata.

![Ne gubi vrijeme na sastancima: Neka AI piše zapisnik [DIY]](https://aiskola.org/wp-content/uploads/2026/02/Ne-gubi-vrijeme-na-sastancima-Neka-AI-pise-zapisnik-DIY.jpeg)