Podesi AWS server za AI model u 10 minuta [Step-by-Step]

Iznajmljivanje gotovih AI rješenja košta vas i do 500 KM mjesečno za osnovne funkcije. Isti taj proces na vlastitom AWS serveru košta manje od 40 KM ako znate šta radite. Ostalih 460 KM plaćate tuđem znanju. Ovaj vodič vam daje to znanje besplatno, pod uslovom da znate kako koristiti terminal bez da obrišete cijelu bazu podataka. Prsti će vas boljeti od kucanja, ali novčanik će vam biti zahvalan.

UPOZORENJE: AWS naplaćuje resurse po sekundi. Ako ostavite instancu sa GPU-om uključenu preko vikenda bez potrebe, račun će vas ošamariti jače od strujnog udara. Provjerite budžet prije nego što kliknete ‘Launch’.

Zašto vam treba g3s.xlarge, a ne najskuplji ‘p’ model

Većina tutoriala će vam reći da uzmete najnoviji NVIDIA H100 klaster. To je laž. To je kao da kupujete bager da biste posadili jednu saksiju cvijeća na balkonu. Za rad sa modelima kao što su Llama 3 ili Stable Diffusion, potrebna vam je g5 ili barem starija g4dn instanca. Kao što je navedeno u tekstu o postavljanju sigurne AI infrastrukture, hardver je pola bitke. Miris zapaljene plastike u virtuelnom svijetu ne postoji, ali miris spaljenog novca je stvaran. Osjetićete ga u e-mailu od AWS-a krajem mjeseca. Koristite Spot Instance. To je hardver koji AWS-u ‘preostane’ i daju ga u bescijenje, ali ga mogu ugasiti u bilo kojem trenutku. Za testiranje modela, to je savršeno. Setting up an AI server on AWS terminal manually

Guranje koda kroz SSH: Hammer i ekseri cloud svijeta

Zaboravite na fensi dashboarde. Pravi posao se radi u terminalu. Prvi put kad se povežete, čućete tiho zujanje ventilatora u svojoj glavi – to je adrenalin. Ako koristite Windows, instalirajte PuTTY ili koristite WSL. SSH ključ (.pem fajl) čuvajte kao oči u glavi. Ako ga izgubite, vaša instanca postaje cigla. To je nepopravljivo.

Kada ste unutra, prva komanda je uvijek sudo apt update. Osjetite kako se podaci slijevaju niz ekran. To je ritam mašine. Ako ovdje pogriješite sa verzijom Pythona, cijeli sistem će se srušiti kao loše sklopljena polica iz Ikee. Ne skačite na instalaciju odmah. Prvo izolujte prostor. Virtualenv nije luksuz, to je higijena. Bez njega, biblioteke će se ‘potući’ i dobićete greške koje niko na Stack Overflowu ne razumije.

Zašto je VRAM bitniji od vaše plate?

Ovo je sekcija ‘Zašto ovo radi’. GPU memorija (VRAM) je rezervoar vašeg AI-ja. Ako model ima 8 milijardi parametara, on treba oko 15 GB VRAM-a za normalan rad. Ako pokušate ugurati 15 GB u karticu od 8 GB, server će se ‘zagrcnuti’. To se zove OOM (Out of Memory) error. To je digitalni ekvivalent pokušaja da ulijete pet litara vode u flašu od dvije litre. Rezultat je haos na podu garaže.

Anatomija jednog ‘Screw-Upa’: Kako sam spalio 200 dolara za jednu noć

Desilo se svakome. Zaboravite isključiti instancu. To izgleda ovako: ujutro se probudite, skuhate kafu, otvorite AWS Billing, i vidite crvenu cifru. Da biste to izbjegli, postavite ‘CloudWatch’ alarm. Ako server radi duže od dva sata bez 10% opterećenja procesora – neka ga AWS sam ubije. Brutalno, ali efikasno. Slične trikove za uštedu možete naći na ovom linku o smanjenju AWS računa. Ne budite lijeni. Postavite alarm.

Da li je AWS sigurniji od lokalnog servera?

Jeste, ako ne ostavite port 22 otvoren za cijeli svijet. Ako vaš Security Group dozvoljava ‘0.0.0.0/0’, očekujte goste iz Rusije i Kine u roku od tri minute. Zaključajte pristup samo na svoju IP adresu. To je digitalni katanac. Ne igrajte se sa ovim. Kao što piše u vodiču o zaključavanju AI botova, sigurnost počinje na nivou servera, a ne aplikacije.

Instalacija modela: Slather the glue on thick

Kada je server spreman, koristite ‘Ollama’ ili ‘HuggingFace’ CLI. To su alati koji rade težak posao umjesto vas. Komanda ollama run llama3 će povući gigabajte podataka. Gledajte kako postotak raste. Ako veza pukne, ne paničite. Nastavite tamo gdje ste stali. AWS mreža je brza, ali čak i ona ima svoje loše dane.

Kada model napokon odgovori na vaš prvi ‘Hello’, to je onaj osjećaj kada prvi put upalite motor koji ste sami sastavili. Malo dimi, malo drhti, ali radi. Sada možete podesiti AI tutora ili vlastiti generator slika. Sve to na vašem terenu, po vašim pravilima.

Koliko košta održavanje servera u 2026. godini?

Cijene struje i hardvera diktiraju cloud tarife. Od 2026. godine, AWS uvodi nove ‘green’ popuste ako servere palite u satima kada ima viška solarne energije. Iskoristite to. To je scrap-logic primijenjena na najmoderniju tehnologiju. Ako ste pametni, vaš AI će raditi besplatno dok sunce sija.

Zaključak: Da li se isplati?

Isplati se svake sekunde koju provedete učeći. DIY cloud server nije samo način da uštedite pare, to je način da posjedujete svoju tehnologiju. Niste samo korisnik pretplate; vi ste vlasnik infrastrukture. Ako se server pregrije ili skripta pukne, vi ste taj koji drži ključ. To je sloboda. Sad uzmite taj terminal i zakucajte prvi ekser.

Slični tekstovi

Komentariši

Vaša email adresa neće biti objavljivana. Neophodna polja su označena sa *