Cum se interpretează „pierdere” și „precizie” pentru un model d; învățare automată

Când îmi antrenez rețeaua neuronală cu Theano sau Tensorflow, ei vor raporta o variabilă numită „pierdere” pe epocă.

Cum ar trebui să interpretez această variabilă? Pierderile mai mari sunt mai bune sau mai rele sau ce înseamnă asta pentru performanța finală (acuratețea) rețelei mele neuronale?

Cu cât sunt mai multe pierderea este scăzut , cu atât modelul este mai bun (cu excepția cazului în care modelul este prea potrivit pentru datele de instruire). Pierderea se calculează când Instruire si ceva validare iar interacțiunea sa este performanța modelului pentru aceste două seturi. Spre deosebire de precizie, pierderea nu este un procent. Aceasta este o sumă a erorilor făcute pentru fiecare exemplu din seturile de instruire sau validare.

În cazul rețelelor neuronale, pierderea este de obicei o probabilitate de log negativă și o sumă reziduală de pătrate pentru clasificare și respectiv regresie. Apoi, în mod firesc, obiectivul principal al unui model de antrenament este de a reduce (minimiza) valoarea funcției de pierdere în raport cu parametrii modelului prin modificarea valorilor vectorului de greutate prin diferite metode de optimizare, cum ar fi decât propagarea înapoi în rețelele neuronale.