Moment istoric in domeniul IA: AlphaGo Zero a invatat singur si a devenit cel mai bun jucator de Go din lume

Moment istoric in domeniul IA: AlphaGo Zero a invatat singur si a devenit cel mai bun jucator de Go din lume

DeepMind, subsidiara din Londra a unitatii pentru Inteligenta Artificiala a celor de la Google, a anuntat acesta ultima descoperire din domeniul IA la mai putin de doi ani de zile dupa dezvoltarea algoritmului AlphaGo, primul calculator ce a invins campionul uman al acestui vechi joc, originar din Asia. Cu toate ca jocul Go este extrem de complex, existand mai multe mutari posibile decat atomi in intregul Univers, intr-un alt sens este un joc simplu pentru ca este un joc cu informatie perfecta - sansa nu joaca niciun rol, precum in jocurile de carti sau cu zaruri, iar strategia de joc este determinata doar de pozitia pieselor pe plansa de joc.

acum 76 luni (19 Oct 2017)

DeepMind, subsidiara din Londra a unitatii pentru Inteligenta Artificiala a celor de la Google, a anuntat acesta ultima descoperire din domeniul IA la mai putin de doi ani de zile dupa dezvoltarea algoritmului AlphaGo, primul calculator ce a invins campionul uman al acestui vechi joc, originar din Asia. Versiunile anterioare ale AlphaGo invatau sa joace acest joc prin analizarea a mii de jocuri dintre jucatorii de top umani pentru a descoperi mutarile castigatoare. "In acest mod, a depasit imediat nivelul uman de joc si a invins versiunea anterioara AlphaGo cu scorul de 100 la 0. David Silver, liderul proiectului AlphaGo, a adaugat ca "prin ne-utilizarea cunostintelor umane in niciun fel, poate ajunge la informatii noi, la cunoastere de unul singur, pornind de la zero informatii". In doar cateva zile, computerul nu doar ca a invatat Go de la zero, dar a depasit mii de ani de strategie si intelepciune umana acumulate. Echipa de cercetatori a dezvoltat un nou mecanism de invatare pentru AlphaGo Zero, ce combina analiza simularilor mutarilor viitoare cu o retea neurala care decide care mutari ii ofera cea mai ridicata probabilitate de a castiga. Reteaua este updatata in mod constant dupa milioane de jocuri de antrenament, ce produce astfel un sistem superior dupa fiecare joc. Daca lui AlphaGo i-au trebuit luni intregi pentru a ajunge la punctul de a invinge campionul uman la Go, lui AlphaGo Zero i-au fost suficiente doar trei zile, utilizand doar o mica parte a puterii de procesare.

Cu toate ca jocul Go este extrem de complex, existand mai multe mutari posibile decat atomi in intregul Univers, intr-un alt sens este un joc simplu pentru ca este un joc cu informatie perfecta - sansa nu joaca niciun rol, precum in jocurile de carti sau cu zaruri, iar strategia de joc este determinata doar de pozitia pieselor pe plansa de joc. Demis Hassabis a identificat anticiparea structurii moleculelor de proteina - un aspect important in descoperirea de medicamente noi - drept ... Citeste intreg articolul pe adevarul.ro