1,2 secunde pentru a trece un cub Rubik ... cu un AI - Sciences et Avenir

Postat pe 26.07.2019 la 22:00

Acest proiect al unei echipe de cercetători de la Universitatea din California la Irvine (SUA) a folosit un algoritm de învățare a întăririi. Metoda este foarte populară pentru a programa inteligențe artificiale destinate redării.

Probabil că trebuia să se întâmple. Cercetătorii în informatică și statistici de la Universitatea California din Irvine (Statele Unite) s-au confruntat cu o inteligență artificială (AI) în puzzle cu peste 43 de quintilioane (10 30) de combinații pentru o singură soluție, cea care constă în obținerea fețelor cu nouă pătrate de o singură culoare. Articolul care detaliază acest proiect a fost publicat în iulie 2019 în revista Nature. Algoritmul numit DeepCubeA a reușit în medie în 1,2 secunde când înregistrarea, pentru un om, este, conform ultimelor știri, de 3,47 secunde.

AI încearcă și începe din nou, până se îmbunătățește

Este un algoritm care combină „învățarea profundă” și învățarea prin întărire. Prima metodă permite o analiză pe straturi succesive a datelor transmise acestuia. Al doilea este utilizat pe scară largă atunci când doriți să „jucați” un AI. AlphaGo Zero de la DeepMind, conceput pentru a juca Go, a fost instruit, de exemplu, prin învățarea prin întărire. Lumea vehiculelor autonome începe să se impună.

Principiul de bază este să procedăm prin încercare și eroare. Algoritmul încearcă o soluție și i se returnează un semnal pozitiv (numit recompensă) sau negativ. Reîncepe pe baza feedback-ului primit, primește un nou semnal etc. Până când se îmbunătățește treptat și obține rezultatul dorit. Algoritmul progresează astfel singur.