Mašinsko učenje u browseru: Pokreni prvi model bez instalacije
Prestanite vjerovati u laž da vam za vještačku inteligenciju treba NVIDIA grafička kartica od tri hiljade eura i server soba sa klimom koja zuji kao mlazni avion. To je marketing. Istina je mnogo grublja i direktnija: vaš browser, taj isti u kojem trenutno čitate ovaj tekst, već posjeduje svu snagu potrebnu da pokrene ozbiljne modele mašinskog učenja. Ako znate kako da ga upregnete, postajete digitalni zanatlija koji ne zavisi od clouda, pretplata ili tuđih servera. Vi posjedujete kod, vi posjedujete procesor, vi kontrolišete rezultat.
Zašto ti ne treba Python za ovaj projekat
Python je sjajan u laboratoriji, ali u stvarnom svijetu, on je spor i težak za distribuciju. Da bi vaš komšija vidio vaš AI model u Pythonu, mora instalirati 2GB biblioteka koje će se vjerovatno sudariti sa njegovim sistemom. U browseru? Samo mu pošaljete link. Koristimo TensorFlow.js jer on direktno komunicira sa vašom grafičkom karticom preko WebGL-a ili WebGPU-a. Osjetit ćete toplinu na dnu laptopa čim model počne da ‘žvaće’ podatke—to je miris digitalnog rada. To je znak da vaša mašina zapravo nešto radi, a ne samo da renderuje slike mačaka. Razumijevanje ovog procesa je ključno, a ako vas zanima dublja pozadina, istražite razlika izmedju ai masinskog učenja i dubokog učenja kako biste znali šta tačno vaša skripta radi.
TensorFlow.js: Mozak u tvom Chrome-u
Ovo nije igračka. TensorFlow.js je alat koji dozvoljava da učitate gotove modele ili trenirate svoje koristeći JavaScript. Zaboravite ‘seamless’ integracije o kojima pričaju tech blogeri; ovdje ćete se boriti sa asinkronim učitavanjem i memorijskim curenjima ako niste pažljivi. Prvo pravilo: model se učitava jednom, koristi hiljadu puta. Ako ga budete učitavali unutar petlje, vaš browser će ‘puknuti’ brže nego jeftina šperploča pod teretom. Morate razumjeti kako mašina zapravo razumije tekst, što je detaljno objašnjeno u vodiču o nlp logici.

Fizika digitalnog rada: Zašto ovo radi?
WARNING: Nikada ne ostavljajte petlje za predviđanje (inference) da rade bez ograničenja (requestAnimationFrame). Ako forsirate GPU na 100% bez pauze, browser će zamrznuti cijeli operativni sistem, a u ekstremnim slučajevima na starijim laptopima, termalna zaštita će nasilno ugasiti računar.
Vjerovatno se pitate kako jedan običan skriptni jezik može raditi ono što rade super-računari. Odgovor leži u matricama. Vaša grafička kartica je dizajnirana da crta milione trouglova u sekundi za video igre. Mašinsko učenje su samo množenja ogromnih tabela brojeva. Mi krademo tu snagu igara da bi radili matematiku. To je čisto hakovanje hardvera. Da biste ovo radili kako treba, morate shvatiti logiku predviđanja, baš kao što smo opisali u tekstu kako radi predviđanje tokena.
Anatomija jednog ‘faila’: Gdje početnici griješe
Najveća greška koju ćete napraviti je pokušaj da učitate model od 500MB u browser korisnika koji je na mobilnom internetu. To je amaterski potez. Vaš sajt će se učitavati vječno, korisnik će otići, a vi ćete ostati sa praznim analitikama. U browseru koristite ‘quantized’ modele—to su modeli koji su ‘stisnjeni’ tako da gube 1% preciznosti, ali su 10 puta manji. Ja sam jednom proveo četiri sata debagujući zašto moj AI bot za prepoznavanje lica ne radi, samo da bih shvatio da nisam dozvolio pristup kameri u manifestu. Glupost. Čista, skupa glupost. Uvijek provjerite dozvole prije nego što optužite kod. Ako planirate koristiti ovo za ozbiljnije stvari, obavezno pogledajte kako se koristi AI sa humanim nadzorom.
Da li mi treba poseban browser?
Kratko: Ne. Dugo: Za najbolje performanse trebate Chrome ili Edge verzije 113+ jer oni podržavaju WebGPU, što je kao da ste sa starog dizela prešli na električni motor od 500 konja. Firefox i Safari još uvijek kaskaju, ali će raditi preko WebGL-a. Sporije, ali će raditi.
Mogu li trenirati modele u browseru?
Da, ali nemojte. Trening zahtijeva sate i sate ‘prženja’ procesora. Browser je tu za ‘inference'—to znači da uzmete mozak koji je neko već istrenirao i samo ga natjerate da misli. To je efikasno, jeftino i pametno. Za one koji žele više kontrole, preporučujem kako funkcioniše fine-tuning.
Skaliranje bez troškova clouda
Kada pokrenete model u browseru, vaš trošak servera je nula. Nula maraka, nula eura. Vi samo servirate statički fajl, a korisnikov procesor plaća struju za računanje. To je ultimativni ‘hustle’ za developere. Ako ikada planirate praviti servis, ovo je način da izbjegnete bankrot zbog Azure računa. O tome kako uštedjeti na cloudu smo pisali u smanji ai troskove clouda. Mašinsko učenje u browseru je sloboda. Iskoristite je prije nego što se sjetite da instalirate Python ponovo.
