Šta je AI infrastructure i koliko košta mali server?

Šta je AI infrastructure i koliko košta mali server?

Najam H100 GPU-a na cloudu košta oko 2 dolara po satu, što znači da ako ostaviš skriptu da radi cijeli mjesec, spalio si 1.400 dolara na tuđi hardver koji nikada nećeš posjedovati. Ti možeš sklopiti sopstvenu mašinu koja vrti lokalne modele za manje od tog iznosa. Ako želiš potpunu kontrolu nad svojim podacima i nula pretplata, moraš prestati razmišljati o softveru i početi razmišljati o gvožđu, bakru i silikonu. Ovaj vodič ti daje tačne specifikacije i cijene da tvoj AI server ne postane skupi uteg za papir.

Arhitektura tvog AI podruma: Šta je zapravo infrastruktura?

AI infrastruktura je skup hardverskih komponenti — procesora, grafičkih kartica, memorije i mreže — koje su optimizovane za paralelno procesiranje podataka. Za razliku od tvog starog laptopa koji se guši dok otvori Chrome, AI server mora biti spreman da gura milijarde parametara kroz slojeve neuralne mreže svake sekunde. Prvi put kada upališ lokalni Large Language Model (LLM), osjetićeš miris zagrijane termalne paste i čućeš zujanje ventilatora koje zvuči kao mlazni avion. To je zvuk rada. Infrastruktura nije ništa drugo nego tvoja sposobnost da obezbijediš dovoljno struje i hlađenja za GPU koji pokušava da ‘razmišlja’. Ako planiraš ozbiljan rad, zaboravi na Wi-Fi; tvoj server mora biti vezan Ethernet kablom direktno za ruter.

Zašto ne kupuješ novo: Pravilo Scavenger majstora

Kupovina nove RTX 4090 kartice u radnji je za ljude sa viškom novca i manjkom strpljenja. Ako si ‘scrapper’, tražiš polovne enterprise kartice poput NVIDIA Tesla P4 ili RTX 3060 sa 12GB VRAM-a. Zašto baš 12GB? Zato što je VRAM (Video RAM) jedina valuta koja se pika u AI svijetu. Ako model ne može stati u tvoju grafičku memoriju, on se preliva na sistemski RAM i sve postaje nepodnošljivo sporo. Nađi polovnu radnu stanicu, poput HP Z440 ili Dell Precision serije, na lokalnim oglasima za sitne pare. Te mašine imaju napajanja od 700W ili više, što je ključno jer AI operacije povlače struju u naglim skokovima koji gase jeftine uredske kompjutere.

CRVENA ZONA – SIGURNOST: Nikada, ali apsolutno nikada ne otvaraj kućište napajanja (PSU) da bi ‘očistio prašinu’. Kondenzatori unutra mogu držati smrtonosnu dozu struje danima nakon što isključiš kabal. Ako napajanje zuji ili smrdi na spaljenu plastiku, baci ga. Požar u stanu košta više od bilo kojeg servera.

Unutrašnjost lokalnog AI servera sa fokusom na grafičku karticu i hlađenje

Zašto to radi: Nauka o VRAM propusnosti

Možda se pitaš zašto tvoj procesor sa 16 jezgri ne može da vrti AI efikasno. Odgovor leži u fizici. Procesor (CPU) je kao jedan genije koji rješava teške jednačine jednu po jednu, dok je GPU kao deset hiljada radnika koji rade jednostavne operacije istovremeno. Da bi AI model dao odgovor, on mora prebaciti gigabajte podataka iz VRAM-a u jezgra kartice. Ako je tvoja memorija spora (nizak bandwidth), ti radnici sjede besposleni. Zato je bitno da tvoja matična ploča podržava barem PCIe Gen 3 ili Gen 4 standard. Bez brzog protoka, tvoj ‘pametni’ bot će mucati dok piše rečenice. To je razlika između odgovora koji dobiješ odmah i onog koji čekaš tri minute dok piješ kafu.

GPU je srce, ali napajanje je krvotok

Većina početnika napravi istu grešku: kupe skupu karticu, a onda je spoje na jeftino kinesko napajanje. AI radno opterećenje nije kao igranje igrica. Dok se igraš, potrošnja varira. Dok treniraš model ili vršiš intenzivnu inferenciju, tvoj GPU vuče maksimalnu snagu satima. Ako tvoji kablovi postanu vreli na dodir, gasi sve. To je znak da su žice pretanke za amperažu koju vučeš. Potreban ti je PSU sa 80+ Gold sertifikatom. Ne štedi tih 50 maraka razlike. Jedan strujni udar zbog loše regulacije napona može spržiti memorijske čipove na kartici, a onda možeš samo plakati nad spaljenim silikonom.

Anatomija fijaska: Zašto ti se server ugasio u 3 ujutru?

Desiće ti se. Ostavio si server da obrađuje podatke, otišao si spavati, a ujutru te dočeka crn ekran. Najčešći razlog je termalni throttling. Kada GPU dostigne 85-90 stepeni Celzijusa, on sam sebi obori performanse da ne bi izgorio. Ako nemaš dobar protok zraka u kućištu, toplota se nakuplja dok komponente ne počnu da ‘vrište’. Ja sam jednom zaboravio skinuti plastičnu foliju sa novog hladnjaka. Rezultat? Miris rastopljene plastike koji se uvukao u zidove i server koji se ugasio nakon deset minuta. Uvijek testiraj sistem pod punim opterećenjem barem dva sata dok si u sobi. Osjeti toplotu rukom. Ako peče, dodaj još jedan ventilator.

Koliko tačno košta taj sport? Cifre za 2026. godinu

Za pristojan mali server, budžet izgleda ovako. Polovna radna stanica (kućište, ploča, CPU, 32GB RAM): 400 – 500 KM. Polovna NVIDIA RTX 3060 12GB: 450 – 550 KM. NVMe SSD od 1TB (za brzi load modela): 150 KM. Ukupno: oko 1.100 KM. To je cijena jednog boljeg mobitela, a imaš mašinu koja može da vrti privatni AI, lektoriše tekstove ili čak pomaže u pisanju koda bez da iko vidi tvoje podatke. Ako želiš skalirati, cijena raste eksponencijalno jer ti trebaju skuplje ploče i više GPU-ova.

Može li AI server raditi na starom laptopu?

Može, ali ćeš biti razočaran. Laptopi nemaju adekvatno hlađenje za kontinuiran rad GPU-a. Većina će se ugasiti ili drastično usporiti nakon 5 minuta rada. AI zahtijeva ‘sirovu snagu’ koju samo desktop kućište sa velikim hladnjacima može pružiti. Ako baš moraš, koristi laptop samo kao terminal da se povežeš na pravi server koji stoji u garaži.

Koliko struje troši mali AI server mjesečno?

Ako tvoj server vuče prosječno 200W i radi 10 sati dnevno, to je 2 kWh dnevno. Na mjesečnom nivou, to je oko 60 kWh. Zavisno od tarife, to je trošak od 10 do 15 KM na računu za struju. To je zanemarivo u poređenju sa cloud pretplatama koje koštaju stotine dolara. Pametno podešavanje potrošnje energije može ti uštedjeti još više ako koristiš skripte za automatsko gašenje kada server ne obrađuje ništa.

Zadnji korak: Softverski ‘Gunk’

Kada sklopiš hardver, nemoj instalirati Windows. Windows troši previše resursa na pozadinske procese i telemetriju. Instaliraj Ubuntu Server ili neku drugu laganu Linux distribuciju. Nauči osnove Dockera. To će ti omogućiti da ‘uguraš’ AI modele u izolovane kontejnere bez da ti se sistem zbrka sa različitim verzijama Python biblioteka. Prvi put kada tvoj lokalni server izbaci prvi token teksta, shvatićeš da se trud isplatio. Nema cenzure, nema mjesečnog računa i niko te ne špijunira. To je tvoja infrastruktura. Tvoja pravila. Samo pazi na te temperature i ne guraj prste u ventilatore dok rade.

Slični tekstovi

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *