Nauči Few-Shot i Zero-Shot učenje (Brzi DIY primjer)
Prestanite vjerovati u marketinšku laž da vam treba deset hiljada označenih slika i data centar veličine Zenice da biste napravili nešto korisno sa vještačkom inteligencijom. To je priča koju vam prodaju klaud provajderi da bi vam izvukli zadnju marku za procesorsko vrijeme. Ako imate iole pristojan računar u radionici i znate držati tastaturu kao što znate držati francuski ključ, možete natjerati model da radi upravo ono što vi želite koristeći ‘Few-Shot’ i ‘Zero-Shot’ učenje. Vi ste gazda ovdje, ne algoritmi.
Gvožđe i Logika: Zašto je tvoj Prompt obično smeće
Većina ljudi pristupa promptovanju kao da pišu pismo Djeda Mrazu. To ne radi. AI modeli su kao pripravnici u radionici – ako im ne pokažeš tačno kako se drži brusilica, ostaće bez prstiju. Zero-shot učenje je situacija gdje modelu ne daješ nikakve primjere. Kažeš mu: ‘Klasifikuj ovaj mail kao spam ili prodaju’. To je kao da baciš čovjeka u mrak i vičeš mu da nađe izlaz. Može on to, ali će se slupati deset puta.
S druge strane, Few-shot učenje je ono gdje se dešava prava magija. Tu mu daješ par ‘šuteva’ – primjera koji služe kao šablon. Čuješ li onaj zvuk ventilatora na grafičkoj dok se model muči da shvati kontekst? To je toplota koja stvara inteligenciju. Ako želiš da tvoj sistem stvarno radi, moraš ga uvezati u vlastiti lokalni AI server kako ne bi zavisio od tuđih hirova.
Da li mi stvarno treba Zero-Shot?
Zero-shot je koristan samo kada imaš modele poput GPT-4 ili Llama 3 koji su već ‘progutali’ cijeli internet. Oni imaju opšte znanje, ali nula specifičnog znanja o tvom biznisu ili tvom specifičnom DIY projektu. Ako mu kažeš da prepozna rđu na šarafima, a on nikad nije vidio tvoj konkretni tip gvožđa, promašiće. To je rizik koji ne želiš preuzeti.
Anatomija jednog ‘Screw-Up-a’: Kako uništiti model u tri koraka
Najveća greška koju ćete napraviti je davanje kontradiktornih primjera u few-shot promptu. Vidio sam to stotinu puta. Čovjek stavi tri primjera gdje je ton formalan, a onda četvrti gdje koristi sleng. Model se zbuni, izlaz postane ‘gunk’ – neupotrebljiva kaša riječi. Za šest mjeseci, tvoj automatizovani sistem za odgovaranje kupcima će početi psovati ljude jer si mu ubacio smeće u bazu. Nemoj to raditi. Red. Disciplina. Preciznost. Ako ne znaš kako da kreneš, počni tako što ćeš napisati svoju prvu Python skriptu koja će filtrirati te primjere prije nego odu u model.
UPOZORENJE: Nikada, ali nikada ne unosite osjetljive lozinke ili privatne podatke firme u javne API-je dok testirate few-shot primjere. To je kao da ostaviš ključeve od radionice u bravi sa vanjske strane. 120v strujni udar je ništa naspram curenja podataka.
Zašto Wood Glue i Few-Shot učenje imaju istu hemiju?
Razmislite o PVA ljepilu za drvo. Ono ne stoji samo na površini; ono ulazi u celulozna vlakna i pravi vezu koja je jača od samog drveta. Few-shot učenje radi identično. Ti ne treniraš model iznova (to bi bilo kao da sadiš drvo iz sjemena svaki put kad ti treba daska). Ti koristiš ‘Transfer Learning’ – model već ima ‘mišiće’, ti mu samo daješ ‘smjer’. Ti primjeri koje ubaciš prodiru u latentni prostor modela i usmjeravaju njegove težine ka tvom cilju. To je čista fizika informacija. Ako to savladaš, možeš postati ozbiljan prompt engineer i naplaćivati svoje znanje onima koji još uvijek misle da je AI magija.
Koliko primjera je previše?
Obično je 3 do 5 primjera dovoljno. Ako odeš na 20, ulaziš u zonu gdje model počinje da prepisuje, a ne da zaključuje. Izgubiš generalizaciju. Ostane ti samo skupi papagaj koji ponavlja tvoje greške. Fokusiraj se na kvalitetu, ne na kvantitetu. Osjeti tekst pod prstima, neka bude čist, bez suvišnih pridjeva i ‘seamlessly’ gluposti.
Code Reality Check: IBC i Standardi
Iako softver ne podliježe građevinskim inspekcijama (još), tvoj kod mora imati strukturu. Ako tvoj AI sistem donosi odluke o hardveru, moraš poštovati standarde sigurnosti podataka. Koristi izolovanu sredinu. Testiraj. Ako tvoj prompt failuje, neka failuje sigurno (‘fail-safe’). Nemoj dozvoliti da model ‘halucinira’ naredbu koja može fizički oštetiti tvoje mašine. Scrape-uj stare podatke, očisti ih od gline i rđe, i tek onda ih gurni u few-shot šablon. Armija programera troši milione na ovo, a ti možeš to uraditi u subotu popodne uz par dobrih uputstava. Budi precizan. Budi grub prema svom kodu. On nema osjećanja, ali tvoj novčanik ima.


Ovaj post mi je baš ispravno otvorio oči u vezi sa realnom uporabom AI i prompt engineeringom. Često sam se susretala s tim da ljudi misle da je sve potrebno trenirati na desetine hiljada slika ili podataka, a realnost je da sa dobrim promptima i minimalnim setom primjera možemo mnogo postići. Posebno mi je bilo korisno razmišljanje o ‘transfer learningu’ kao nečemu što ulazi u vlakna modela, baš kao PVA ljepilo. To mi je dalo drugačiji uvid u način kako da efikasno postavim primjere za svoj projekat. Ono što želim da pitam je, kako vi u praksi birate koji primjeri su najefikasniji, posebno kad imate više različitih scenarija? Koje su vaše preporuke za održavanje kvaliteta primjera, da bi model ostao fokusiran i koristan na duge staze?