Posao transkripcije: Kako zaraditi uz AI u 2026. godini
Sat vremena sirove audio snimke nekada je značio šest sati grbljenja nad tastaturom za sitniš. U 2026. godini, ako i dalje kucaš svaku riječ ručno, gubiš tačno 18 KM po satu koje bi tvoj procesor mogao zaraditi dok ti piješ kafu. Ti ne prodaješ svoje prste; prodaješ tačnost, a tvoj najveći neprijatelj nije AI, nego tvoja tvrdoglavost da koristiš alate iz 2015. Za ovaj posao ti ne treba diploma, ali ti treba ‘nos’ za tehnologiju i nulta tolerancija na loš zvuk.
Hardver koji ne štuca: Zašto tvoj laptop iz 2020. više ne pije vode
Prvo pravilo radionice: ne koristi tupi alat. Ako misliš da ćeš ozbiljnu transkripciju raditi u browseru, spremi se na frustraciju. AI modeli za prepoznavanje govora u 2026. godini, poput naprednih verzija Whispera, zahtijevaju lokalnu procesorsku snagu ako ne želiš da ti podaci cure na tuđe servere. Osjetit ćeš toplinu koja izbija iz kućišta dok grafička karta ‘žvače’ audio frekvencije. To je miris zarade. Ventilatori moraju da zuje. Ako je tišina, znači da tvoj model stoji. Za maksimalnu efikasnost, moraš srezati troškove infrastrukture tako što ćeš optimizovati modele da rade na tvojoj mašini, a ne na skupom cloudu.
Anatomija katastrofe: Kako jedan pogrešan ‘timestamp’ uništava ugovor
Opisat ću ti šta se desi kada se ulijeniš. Radio sam na transkripciji sudskog saslušanja od 4 sata. AI je odradio 98% posla, ali je na jednom mjestu ‘progutao’ negaciju zbog šuma u pozadini. Umjesto ‘optuženi nije priznao’, napisao je ‘optuženi je priznao’. Da nisam ručno provjerio taj dio, klijent bi izgubio slučaj, a ja bih dobio tužbu tešku 10.000 KM. To se zove ‘halucinacija modela’. Ako ne znaš kako da natjeraš model da uči na greškama, ti si samo skupi daktilograf koji čeka otkaz. Big mistake. Nikada ne vjeruj botu bez nadzora. 
Zašto ti treba ‘JIS’ pristup transkripciji (A ne obični Phillips)
U svijetu majstora, pogrešan šrafciger uništi glavu vijka. U transkripciji, pogrešan ‘prompt’ uništi kontekst. Moraš postati prompt inženjer za audio podatke. To znači da modelu ne kažeš samo ‘prepiši ovo’, već mu daš listu govornika, specifične stručne termine i ton dokumenta. Ako je u pitanju medicinski izvještaj, tvoj AI mora ‘znati’ razliku između hipertenzije i hipotenzije prije nego što pritisneš ‘start’.
WARNING: Nikada ne učitavaj osjetljive podatke klijenata na javne GPT modele. Kršenje Zakona o zaštiti podataka o ličnosti u 2026. godini znači automatsko gašenje obrta i astronomske kazne. Koristi isključivo lokalne, enkriptovane instance.
Fizika zvuka: Zašto AI ‘halucinira’ na 16kHz
Ovdje većina početnika griješi. Uzmu snimak sa WhatsAppa, pun šuma i odjeka, i čude se što AI izbacuje kineske znakove. Audio nije samo ‘zvuk’; to je talasna dužina. Ako je sampling rate nizak, gubiš visoke frekvencije koje su ključne za razlikovanje suglasnika poput ‘s’ i ‘f’. Prije nego što uopšte pustiš transkripciju, moraš očistiti tekst (i audio) koristeći alate za uklanjanje pozadinske buke. Osjetit ćeš pod prstima razliku u kvalitetu kada provučeš fajl kroz dobar filter. Zvuk postane kristalno čist, gotovo ‘suv’. Tek tada je spreman za procesor.
Šesto čulo za zaradu: Gdje naći klijente koji plaćaju u 2026.
Zaboravi na Upwork i fiksne cijene od 5 dolara. To je za amatere. Prave pare leže u specifičnim nišama:
- Lokalni sudski vještaci: Njima treba tačnost, a ne brzina.
- AI Research timovi: Njima trebaju ‘ground truth’ podaci da bi trenirali svoje modele.
- Podcasteri: Njima treba optimizacija za pretragu, što znači transkripcija bogata ključnim riječima.
Ako želiš da ti klijenti dolaze dok spavaš, moraš postaviti AI prodajne botove koji će skenirati LinkedIn za objave o potrebama za obradom podataka.
The ‘Why It Works’ Callout: Fizika iza Whispera
Zašto AI danas može ono što nije mogao prije pet godina? Ključ je u arhitekturi zvanoj Transformer. Umjesto da obrađuje zvuk dio po dio, AI gleda cijelu rečenicu odjednom (pa čak i cijeli pasus). On predviđa vjerovatnoću sljedeće riječi na osnovu miliona sati prethodno ‘preslušanog’ materijala. To je matematička igra vjerovatnoće. Kada razumiješ kako rade probabilistički modeli, prestaneš se ljutiti na kompjuter kada pogriješi. Shvatiš da mu samo treba bolji ‘kontekstualni prozor’.
Micro-Vignette: Pouka iz stare škole
Moj mentor, stari tonac iz Sarajeva, uvijek je govorio: ‘Ako ti je ulazni signal smeće, ne očekuj da će ti algoritam izbaciti sevdalinku.’ To pravilo važi i danas. Ne prihvataj poslove gdje je zvuk sniman telefonom u kafani. Izgubit ćeš deset sati na popravljanje nečega što se ne može popraviti. Tvoje vrijeme je tvoj jedini resurs. Ščepaj samo one projekte koji imaju jasnu audio sliku.
Finansijski ubod: Cijena neznanja
Prosječan freelancer u BiH troši 40% svog radnog vremena na administraciju i ispravljanje banalnih grešaka. To je čist gubitak. Ako ne naučiš kako da koristiš AI za skraćivanje radne nedelje, ostat ćeš zarobljen u 20. vijeku. U 2026. godini, razlika između bogatog transkriptora i onog koji jedva spaja kraj s krajem je u tome što prvi koristi skripte za automatizaciju, a drugi koristi ‘backspace’ taster. Izbor je tvoj. Radi pametnije, ne jače.
