Învățare profundă pentru fotbal Viziunea computerizată (Partea I)

În această serie de articole vom vedea cum se folosește învățarea profundă în fotbal. Mai degrabă decât să faci un simplu.

În această serie de articole vom vedea cum se folosește învățarea profundă în fotbal. În loc să facem un catalog simplu cu ceea ce se face, vom pune mâna în sus și vom construi un sistem real de analiză a performanței. Primele două articole vor fi dedicate construirii unui sistem de detectare a jucătorilor din teren cu tehnici de viziune computerizată.

Viziunea computerizată sau viziunea computerizată este una dintre principalele utilizări ale învățării automate.

Până în 2017, progresele înregistrate în acest domeniu au fost impresionante. În ciuda unui declin în ultimii ani, avem deja sisteme care ne permit să facem o mulțime de lucruri interesante. În acest articol vă prezint YOLO: arăți o singură dată.

Introducere în detectarea automată a obiectelor: viziune computerizată

Pentru ochiul uman detectarea obiectelor dintr-o imagine este o acțiune foarte simplă, pentru un computer sarcina este mult mai complexă. Până de curând, detectarea obiectelor se făcea folosind metode de gradient de imagine. Cu excepția faptului că aceste metode sunt foarte scumpe și mult mai puțin fiabile, rezultatul este un sistem lent și nu foarte utilizabil.

Apariția învățării profunde și apariția unor modele precum rețelele neuronale convoluționale au dus viziunea computerizată la o nouă dimensiune.

Mai mult, viziunea computerizată este una dintre componentele esențiale ale mașinii autonome. Aceasta este una dintre aplicațiile care a contribuit la menținerea entuziasmului pentru acest domeniu.

Astăzi, sistemele de viziune computerizată sunt extrem de dezvoltate și au atins niveluri impresionante de performanță. Astfel, AI au depășit performanța medicilor pentru diagnosticarea cancerului.

Chiar dacă ultimii câțiva ani par a fi un platou pentru viziunea computerizată cu puține descoperiri majore, cercetarea este încă foarte activă și avem instrumente foarte robuste. YOLO este exemplul perfect.

Cum funcționează YOLO ?

YOLO este un sistem open source de viziune pe computer care, când a fost creat în 2016, oferea o abordare inovatoare a problemei. Permite detectarea într-o imagine sau într-un videoclip a obiectelor prezente și a locului în care se află.

În cazul analizei unui videoclip, secvența este împărțită în mai multe imagini. Ideea este apoi să analizăm imaginea cu o rețea neuronală. Imaginea este apoi tăiată în mai multe regiuni mici și sistemul de detectare este aplicat de fiecare dată.

Sistemul încadrează regiunea, îi oferă o etichetă din datele de instruire pe care le-a studiat și calculează un scor de încredere pentru predicție.

Cum funcționează YOLO pentru detectarea obiectelor dintr-o imagine

YOLO a devenit esențial în special datorită performanței și vitezei sale. Permite analiza imaginilor instantaneu.

Mai mult, această abordare face posibilă și optimizarea performanței rețelelor de convoluție utilizate. În loc să procesăm obiectele unul după altul cu date dedicate de instruire de fiecare dată (așa cum am făcut pentru Fashion MNIST), abordăm problema într-un mod mai global.

YOLO este un proiect urmat de mulți ingineri și cercetători în învățarea automată. Acest lucru asigură actualizări recurente. De fapt, versiunea 5 a fost lansată recent și vă permite să mergeți și mai repede fără a pierde eficiența! Cât de departe vom merge ?