Noul AI Google poate denumi caloriile din fotografiile cu alimente de pe Instagram

Diverse aplicații de sănătate se bucură de o popularitate mare pe dispozitivele mobile și numeroși utilizatori încearcă să-și urmărească dieta cu ajutorul contoarelor de calorii. Dar câtă energie adaugă cineva în corp cu o masă? Pentru produsele din supermarket, acest lucru este scris pe ambalaj și în toate celelalte situații un algoritm dezvoltat de angajatul Google Kevin Murphy ar putea ajuta.

google

„Im2Calories” este numele instrumentului său, pe care l-a prezentat recent la Summit-ul Rework Deep Learning din Boston. La eveniment, dezvoltatorii vor face schimb de idei despre programe care, cu algoritmi de auto-învățare și diverse metode de analiză, sunt capabili să facă față sarcinilor abstracte din ce în ce mai bine. Aplicația lui Murphy funcționează pe un principiu foarte simplu: utilizatorul îi oferă o fotografie a mesei sale și recuperează valoarea caloriilor pe care le conține, relatează Smithsonian Magazine.

Cu toate acestea, în spatele acestui mecanism de sunet simplu se află metode extrem de complexe de analiză a imaginii. Sistemul trebuie să îndepărteze fotografia prezentată atât de bine încât să recunoască la primul pas ce componente individuale ale unei mese pot fi văzute. Nu mai puțin complex este al doilea pas, în care este necesar să se estimeze cantitatea fiecărui produs alimentar pe farfurie pe baza diferitelor caracteristici care pot fi utilizate pentru comparație.

Acesta din urmă este relativ ușor dacă sistemul recunoaște un ou sau o felie de cârnați în imagine. Devine mai dificil cu o porție de cartofi prăjiți care a fost drapată în jurul unui burger. După cum a subliniat dezvoltatorul, fotografia mesei nu trebuie să fie nici măcar la cea mai bună rezoluție posibilă pentru a fi analizată cu succes. Este complet suficient să alimentați algoritmul cu numeroasele fotografii alimentare care sunt publicate în mod regulat pe Instagram de numeroși utilizatori.

Potrivit lui Murphy, calculele caloriilor sunt în prezent corecte la aproximativ 20%. Având în vedere complexitatea sarcinii, acest lucru este destul de remarcabil. Cu toate acestea, acesta este un proiect din domeniul învățării profunde - software-ul este conceput în așa fel încât să se îmbunătățească automat dacă este informat despre calcule incorecte.

Dezvoltatorul dorește acum să facă software-ul accesibil unui grup de mai mulți utilizatori după testele inițiale. Ca urmare, în viitorul apropiat ar trebui să curgă în mod semnificativ mai multe feedback-uri, iar performanța ar trebui să crească semnificativ. Google pare să aibă încredere că algoritmul dezvoltatorului său va funcționa bine și că utilizatorii vor fi interesați. Cel puțin unul a solicitat deja un brevet pentru acest proces. Fast Ring, Produse alimentare, Hamburger Jeshoots (CC0)