Fine-tuning za specifične zadatke: Priručnik za 2026. godinu

ByMarko Ilić 22 Januara, 2026

Uvod: Priznanje neuspjeha i evolucija fine-tuninga

Kada sam prvi put pokušao uraditi fine-tuning Llama-2 modela za specifičnu analizu bh. pravnog sistema 2023. godine, napravio sam katastrofalnu grešku u formatiranju JSONL datoteke. Zaboravio sam očistiti duplikate i pogrešno sam postavio ‘stop tokens’. Rezultat? Model je počeo generisati besmislice koje su zvučale kao pravni tekst, ali su bile čista halucinacija, trošeći mi 200 dolara na AWS-u u roku od pola sata. Napisao sam ovaj priručnik za 2026. godinu kako biste vi izbjegli te skupe greške i savladali moderni workflow fine-tuninga.

Prerequisites (Stack koji vam je potreban)

U 2026. godini, fine-tuning više nije samo za naučnike sa Stanforda. Da biste počeli, potreban vam je sljedeći ‘stack’:

OS: Linux i AI su nerazdvojni. Preporučujem Ubuntu 24.04 ili noviji sa optimizovanim kernelom za NVIDIA Blackwell arhitekturu.
Infrastructure: Amazon Web Services (AWS) ostaje standard. Trebaće vam p5.48xlarge instanca ako planirate puni fine-tuning, ili g6e instance za efikasniji QLoRA pristup.
Data Preparation: Ako radite sa audio podacima, stt speech to text srpski/bosanski modeli (poput Whisper v5) su neophodni za pretvaranje vaših arhiva u tekstualne datasete.
Znanje: Razumijevanje fundamentalne razlike između diskriminativnog i generativnog AI. Dok diskriminativni modeli klasifikuju, naši generativni modeli koje treniramo moraju naučiti distribuciju vaših specifičnih podataka.

Konfiguracija: Korak-po-korak workflow

1. Priprema podataka i pravni okvir

Prije nego što uopšte pokrenete skriptu, morate riješiti pravo na lik i delo. U 2026. godini, zakonska regulativa nalaže da svaki podatak koji se koristi za fine-tuning mora imati jasno porijeklo (provenance). Ako trenirate model na glasovima ili likovima stvarnih ljudi, osigurajte digitalni potpis saglasnosti.

[Visual Cue]: Uđite u vašu AWS SageMaker konzolu, idite na Data Wrangler i provjerite integritet vaših JSONL fajlova. Svaki red mora biti validan JSON objekt.

{ "instruction": "Analiziraj ugovor", "input": "Tekst ugovora...", "output": "Pravna analiza..." }

2. Odabir algoritma: Od SVM-a do Transformer-a

Mnogi me pitaju: Kako funkcioniše SVM (Support Vector Machine) u eri LLM-ova? Iako je SVM zastario za generisanje teksta, on se i dalje koristi u 2026. za brzu klasifikaciju podataka prije samog fine-tuninga. Ipak, za specifične zadatke koristimo PEFT (Parameter-Efficient Fine-Tuning).

[Code Snippet]: Inicijalizacija LoRA adaptera u Pythonu:

from peft import LoraConfig, get_peft_model
config = LoraConfig(r=64, lora_alpha=128, target_modules=["q_proj", "v_proj"], lora_dropout=0.05)
model = get_peft_model(base_model, config)

Primjena: Kako se koristi AI za predictive maintenance

Jedan od najtraženijih zadataka u 2026. je kako se koristi AI za predictive maintenance u industriji. Umjesto opšteg modela, radimo fine-tuning na telemetrijskim podacima mašina. Model uči specifične obrasce vibracija i temperature koji prethode kvaru. Fine-tuning omogućava modelu da prepozna anomalije koje generički GPT-5 model nikada ne bi primijetio jer su specifične za vaš hardver.

Troubleshooting i Česte greške

Ako dobijete Error 502: Out of Memory na Linuxu, problem je vjerovatno u veličini batch-a. U 2026. godini koristimo Flash Attention 3 koji drastično smanjuje potrošnju VRAM-a, ali i dalje morate biti oprezni sa ‘context window’ dužinom. Takođe, nemojte trošiti novac na upitne izvore; ako ne znate gde kupiti promptove koji su testirani za vašu industriju, radije ih generišite sami koristeći ‘synthetic data generation’ tehnike.

Optimizacija: Brzina i preciznost

Za kraj, optimizacija je ključ. Kvantizacija modela na 4-bita (bitsandbytes biblioteka) omogućava vam da pokrenete moćne modele na kućnom hardveru, ali za produkciju u 2026. preporučujemo FP8 format koji podržavaju nove AWS instance. Ovo balansira brzinu i preciznost bez gubitka nijansi u jeziku, što je posebno bitno za kompleksne jezike poput našeg.

Osnove AI i Mašinskog Učenja
Zašto AI laže? Popravi halucinacije uz ove postavke [2026]
ByMarko Ilić 2 Februara, 2026
Prestanite vjerovati svemu što vam ChatGPT servira: Brutalna istina o digitalnim lažima Vjerujete da je AI pametan? Varate se. On je samo statistički prediktor koji pokušava pogoditi sljedeću riječ. Ako ga ne obuzdate, lagat će vam u lice o vašim vlastitim podacima, a vi ćete to platiti vremenom ili novcem. Prestanite koristiti ‘paint and primer…
Read More Zašto AI laže? Popravi halucinacije uz ove postavke [2026]
Osnove AI i Mašinskog Učenja
Otvoreni kod vs Zatvoreni kod AI: Prednosti i mane za razvoj inovacija
ByMarko Ilić 2 Januara, 2026
Otvoreni kod vs Zatvoreni kod AI: Prednosti i mane za razvoj inovacija Panika. Znamo taj osjećaj. Stojiš ispred table, kredom ispisana dilema: Otvoreni ili zatvoreni kod za tvoj AI projekat? Znoje ti se dlanovi, pogled klizi. Strah. Nije neobično. Svaki put kad novi val tehnologije zapljusne naše obale, donosi i taj talas neizvjesnosti. Koji put…
Read More Otvoreni kod vs Zatvoreni kod AI: Prednosti i mane za razvoj inovacija
Osnove AI i Mašinskog Učenja
Šta je Hyperparameter Tuning: Kompletni Vodič za Optimizaciju AI Modela
ByMarko Ilić 13 Januara, 2026
Šta je Hyperparameter Tuning: Kompletni Vodič za Optimizaciju AI Modela Zamislite ovo: sjedite, buljite u ekran, vaš AI model radi… nešto. Brojevi idu gore-dolje. Rezultati? Ništa impresivno. Frustracija. Osjećaj da bacate strelice u mraku, nadajući se da će nešto pogoditi centar. To je poznata borba. Mnogi odustaju, misleći da je optimizacija modela magija ili rezervisana…
Read More Šta je Hyperparameter Tuning: Kompletni Vodič za Optimizaciju AI Modela
Osnove AI i Mašinskog Učenja
RNN Objašnjen: Recurrent Neural Networks i njihova primena danas
ByMarko Ilić 31 Decembra, 2025
RNN Objašnjen: Recurrent Neural Networks i njihova primena danas Zamislite. Sjedite, gledate u monitor, i pokušavate razumjeti kako to vještačka inteligencija ‘pamti’ prošlost. Osjećate taj stisak anksioznosti, zar ne? Svi ti dijagrami, matematičke formule, obećanja o predviđanju budućnosti. Recurrent Neural Networks, RNN-ovi, zvuče kao nešto iz naučne fantastike, daleki, nedostižni. Mnogi su se spotaknuli na…
Read More RNN Objašnjen: Recurrent Neural Networks i njihova primena danas
Osnove AI i Mašinskog Učenja
Zašto Vaš Biznis Mora Razumjeti Povezanost 5G i AI Revolucije
ByMarko Ilić 11 Januara, 2026
Zašto Vaš Biznis Mora Razumjeti Povezanost 5G i AI Revolucije Strah. Često ga osjećam u očima vlasnika biznisa dok mi govore o novim tehnologijama, naročito kada se spomenu 5G i vještačka inteligencija. Nije to strah od neuspjeha samog, više je strah od nerazumijevanja, od prevelike složenosti, od osjećaja da vlak prolazi, a oni ostaju na…
Read More Zašto Vaš Biznis Mora Razumjeti Povezanost 5G i AI Revolucije
Osnove AI i Mašinskog Učenja
Kako RNN mreže rade? Nauči osnove uz ovaj primer [DIY]
ByMarko Ilić 30 Januara, 2026
Zaboravi magiju: Zašto je tvoj AI model samo niz zarđalih zupčanika s pamćenjem Prestani vjerovati marketinškim lažima da je AI neka vrsta digitalnog mozga koji ‘razmišlja’. To je gomila statike. Ako misliš da neuronska mreža razumije tvoju rečenicu kao ljudsko biće, u velikoj si zabludi. Obične neuronske mreže su kao tvoj stari komšija koji zaboravi…
Read More Kako RNN mreže rade? Nauči osnove uz ovaj primer [DIY]

2 Comments

Maja Kovačević kaže:
1 Februara, 2026 u 1:20 pm
Ovaj priručnik za fine-tuning u 2026. izgleda kao must-have za svakog AI entuzijastu, pogotovo sa elementima poput provjere validnosti JSONL fajlova direktno u AWS SageMaker-u. Kod nas u Bosni često se susrećemo s izazovima prikupljanja i provjere podataka, posebno u pravnim i tehničkim oblastima, pa mi ovo djeluje kao vrlo praktičan vodič. Posebno mi je zanimljiva diskusija o PEFT i LoRA adapterima, jer su mi dosad bili nepoznati, ali vidim da mogu znatno olakšati složenije projekte na malom hardveru. Neko od vas je ranije koristio ove tehnike? Kakvi su vaši utisci? Takođe, zanima me, koja je vaša strategija za izbjegavanje halucinacija pri generisanju pravnih tekstova—da li ste isprobavali dodatne filtere ili post-processing?
Komentariši
1. Alih Salkić kaže:
  6 Februara, 2026 u 1:10 am
  Priznajem, čak i sa svim ovim naprednim workflow-ovima i alatima, problem halucinacija kod pravnih tekstova i dalje ostaje izazov. U mom iskustvu, dodavanje slojeva filtera ili post-processinga pomaže, ali najviše se oslanjam na fine-tuning sa specifičnim setovima podataka koji su pažljivo pripremljeni i verificirani. Takođe, ključ je u iterativnom prilagođavanju modela — često je potrebno više vakcina nego što smo planirali, da bi model naučio prave granice i zadatke. Interesuje me, kako vi balansirate između dubine modela i njegove interpretabilnosti, posebno u reguliranim industrijama poput pravde? Da li koristite neke od najnovijih tehnika za interpretaciju odgovora ili možda neku vrstu audita modela?
  Komentariši