De ce fluctuează precizia validării

Am un CNN cu patru straturi pentru a prezice răspunsul la cancer folosind datele RMN. Folosesc activările ReLU pentru a introduce neliniarități. Precizia și pierderea trenului cresc și scad, respectiv, monoton. Dar, precizia testului meu începe să fluctueze extrem de mult. Am încercat să schimb rata de învățare, să reduc numărul de straturi. Dar asta nu oprește fluctuațiile. Am citit chiar și acest răspuns și am încercat să urmez instrucțiunile din acest răspuns, dar fără noroc din nou. M-ar putea ajuta cineva să-mi dau seama unde greșesc?

După cum înțeleg definiția preciziei, precizia (% din punctele de date clasate corect) este mai puțin cumulativă decât să spunem MSE (eroare pătrată medie). Acesta este motivul pentru care vedeți că pierderea dvs. crește rapid, în timp ce precizia fluctuează.

Intuitiv, aceasta înseamnă practic că unele dintre exemple sunt clasificate la întâmplare, ceea ce produce fluctuații, deoarece numărul de presupuneri aleatorii corecte fluctuează întotdeauna (imaginați-vă precizia când piesa trebuie întotdeauna să returneze „capete”). Practic, sensibilitatea la zgomot (atunci când clasificarea produce un rezultat aleatoriu) este o definiție comună a supraadaptării (vezi Wikipedia):

În statistici și învățare automată, una dintre cele mai frecvente sarcini este de a încadra un „model” într-un set de date de antrenament, astfel încât să puteți face predicții fiabile cu privire la datele generale neinstruite. Suprapunerea, un model statistic descrie o eroare aleatorie sau un zgomot în locul relației de bază