Rješavanje data imbalance problema: Kako očistiti AI podatke
Moje prvo iskustvo sa razvojem modela za detekciju bankovnih prevara bilo je totalni fijasko. Model je ponosno prijavio preciznost od 99,9%, ali u stvarnosti nije uspio identifikovati niti jednu jedinu stvarnu prevaru. Zašto? Jer su podaci bili katastrofalno neuravnoteženi (data imbalance) — u uzorku od 100.000 transakcija, samo 100 je bilo maliciozno. Model je jednostavno…


