Ianuarie 2017; Știri pe Internet

Inteligența artificială va pune capăt pokerului ?

Din moment ce Alphago a „spart” jocul go, mai există un joc care să reziste avansului inteligenței artificiale? De fapt, spre deosebire de șah și Go, pokerul, cel puțin în formele sale mai complexe, a rezistat până acum oricărei încercări de automatizare. Motivul pentru aceasta este că este un joc de „informații incomplete”. Cu alte cuvinte, aparatul nu cunoaște toate cărțile deținute de adversarul său. Ceea ce implică o nouă formă de algoritm. Există mai multe variante ale pokerului, dar cea care îi interesează cel mai mult pe cercetători este cea numită Heads Up Texas hold'em, în care unele cărți sunt vizibile și altele sunt cunoscute doar de jucător (heads up înseamnă față în față, ceea ce înseamnă că jocul este doar de doi jucători). Această variantă este disponibilă și în două versiuni: „cu limite” și „fără limite”. În al doilea, jucătorii pot mări pariuri pe tot parcursul jocului. „Nelimitatul” are 10.160 de posibilități de joc diferite, adică IEEE Spectrum ne amintește, poate mai mult decât numărul de atomi din univers. Un bot numit Cepheus a câștigat deja versiunea „cu limite”, care oferă doar 10 14 posibilități.

Pokerul a câștigat atenția presei comerciale în ultimele zile datorită a două anunțuri diferite, de la două echipe care au încercat să rezolve complexitatea „fără limite”. În primul rând, o echipă de la Universitatea Carnegie Mellon, condusă de Tuomas Sandholm, își testează software-ul împotriva jucătorilor profesioniști de top: competiția a început pe 11 ianuarie și se va încheia pe 30 (este posibil să urmăriți progresul acestui meci în realitate timp pe acest site).

În același timp, un alt grup, condus de Michael Bowling la Universitatea din Alberta, a propus un nou program, Deepstack (.pdf). Cercetătorii spun că și-au jucat programul împotriva a 33 de jucători profesioniști, fiecare jucând în jur de 3.000 de jocuri împotriva mașinii, iar Deepstack ar fi fost la nivelul adversarilor săi. Practic, cele două echipe concurente se bazează pe două teorii diferite. Primul, cel din centrul Libratus, este o formă „clasică” de inteligență artificială. Al doilea, pe care se bazează Deepstack, este faimosul Deep Learning.

Oamenii sub presiune

Mică problemă, ne reamintește IEEE Spectrum, chiar și un supercomputer nu poate acoperi cele 10.160 potențialități ale variantei nelimitate a holdemului Texas. Prin urmare, Sandholm și echipa sa au găsit o modalitate de a reduce dimensiunea acestui copac și, de asemenea, spre deosebire de ceea ce făcea Claudico, de a învăța din greșelile sale.

Experimentul cu Claudico s-a încheiat cu victoria oamenilor. Principala cauză ar fi legată de adaptabilitatea acestuia din urmă, care a înțeles foarte repede strategia robotului - în timp ce robotul nu a putut să se adapteze strategiei umane. Sandholm a spus despre acești jucători: "Am fost foarte impresionat de adaptarea lor rapidă, au învățat foarte repede dintr-un număr foarte mic de mâini".

Se va întâmpla același lucru cu Libratus? Prea devreme pentru a judeca, desigur (competiția nu se va încheia până pe 30 ianuarie). După o primă fază în care Libratus era în frunte, oamenii au urcat apoi pe pârtie pe 17 ianuarie. Dar tweet-ul lui Jason Les, unul dintre jucătorii care concurează împotriva programului, menționează pe 18 că aparatul a preluat.

Dar oamenii au un avantaj. După terminarea jocului, jucătorii discută și se gândesc la strategiile de adoptat. Oliver Roeder, pe fivethirtyeight.com (celebrul site web condus de statisticianul Nate Silver), relatează una dintre aceste sesiuni de informare:

„După sesiunea zilei, un jurnal al fiecărei mâini jucate este furnizat digital jucătorilor. Miercurea aceasta, în timp ce acestea încarcă datele, numerele colorate, hărțile de căldură, graficele liniare și probabilitățile clipesc în fereastra software-ului de analiză (...). Au trecut prin toate cele mai mari mâini ale zilei, digerându-le aproape instantaneu, la fel cum un maestru de șah putea juca un joc în cap în câteva secunde. Au căutat să stabilească defectele propriei strategii și să le atace pe cele ale robotului. Încet, dar sigur, părea că demontează metoda de joc a lui Libratus. "

Ceea ce este interesant la acest lucru este că descoperim că și jucătorii folosesc acum computere și algoritmi pentru a-și face planurile. Cu alte cuvinte, ideea jucătorilor „pur umani” care se opun mașinilor pare să fie deja în mare măsură un mit ...

Totuși, o potențială victorie a lui Libratus ar putea afecta grav viitorul pokerului online. Deja, ne spune triblive.com, jucătorii încep să fie atenți la interacțiunile virtuale pentru a prefera întâlnirile față în față: pe internet, nu știu dacă se luptă cu un om sau cu un bot. În plus, lumea pokerului online este în criză de câțiva ani, după ceea ce s-a numit Black Friday în 2011, când cele trei mari platforme de poker online au fost închise pentru fraudă. Nu ar mai fi suficienți bani și jocuri disponibile pentru ca jucătorii profesioniști să își câștige existența. Astăzi, potrivit fivethirtyeight.com, situația este deosebit de dificilă pentru adepții heads-up Texas hold'hem fără limită, deoarece există, potrivit lui Jason Les, doar aproximativ 20 de jucători buni în lume. Dacă Libratus câștigă competiția, jocul ar putea muri ...

Învățare profundă pentru salvare

Rețelele neuronale, Deep Learning, pot juca un rol important în rezolvarea problemelor cu informații incomplete? Potrivit lui Wired, Deepstack începe, la fel ca programele mai tradiționale, prin construirea unui copac al posibilităților. Dar nu ajunge până la capăt. El analizează fiecare mână în funcție de context și ia decizia în funcție de pariurile făcute.

Cercetătorii compară tehnica de aproximare a lui DeepStack cu instinctul unui jucător uman atunci când un adversar blufează sau ține o mână câștigătoare, chiar dacă mașina trebuie să își bazeze evaluarea pe modul în care adversarul pariază mai degrabă decât pe limbajul lor. „Această estimare poate fi luată ca intuiție DeepStack”, scriu ei.

Dar Wired subliniază că Deepstack are o importanță suplimentară. Dacă se dovedește că metoda utilizată este eficientă pentru un joc precum pokerul, algoritmul ar putea fi extins la alte domenii mult mai importante, cum ar fi economia, războiul sau tranzacționarea.

Însă Deep Learning nu este singurul cu această ambiție. Și Tumoas Sandholm consideră programul său Libratus un punct de plecare pentru rezolvarea tuturor tipurilor de situații care implică informații incomplete.

Cu alte cuvinte, jucătorii de poker AI s-ar apropia de IA reală, capabil să gestioneze situațiile complexe pe care le întâmpină ființele umane ... Cazinourile vor fi poarta de intrare în Singularitate ?

Putem înarma „transparența” algoritmilor ?

Roger Taylor (@rtayloropendata) este fondatorul rețelei de servicii publice deschise la Royal Society of Arts. El este, de asemenea, autorul, alături de Tim Kelsey, directorul agenției australiene de sănătate digitală (după ce a fost cel al NHS britanic și responsabil pentru deschiderea și transparența datelor în Cabinet Office), al Transparenței și societății deschise. Într-un forum remarcabil pentru Discover Society, el a revenit la problemele transparenței.