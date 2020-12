Si chiama “MuZero” l’ultima Intelligenza Artificiale (IA) di DeepMind, azienda inglese controllata da Alphabet, la holding USA a cui fa capo Google. I suoi predecessori AlphaGo, AlphaGo Zero e AlphaZero, conoscendo le regole degli scacchi o dei giochi orientali Go e Shogi, battevano regolarmente i migliori giocatori umani, ma anche la console di videogiochi Atari. MuZero, invece, ha imparato tutto da solo, senza conoscere prima le regole, ma è altrettanto capace, se non addirittura migliore. “Il mondo reale è disordinato e complicato e nessuno ci fornisce un regolamento su come funzioni – ha detto alla BBC David Silver, il principale ricercatore di DeepMind -. Eppure gli esseri umani sono in grado di formulare piani e strategie su cosa fare”.

Dal nulla

Con MuZero “per la prima volta abbiamo un sistema in grado di costruire la propria comprensione di come funziona il mondo” e “inizia dal nulla. Solo attraverso tentativi ed errori scoprire le regole del mondo, che gli consentono di pianificare e di capire quale sarà la strategia più efficace. Vogliamo avere algoritmi che funzionino nel mondo reale e il mondo reale è complicato, disordinato e sconosciuto. Ovviamente stiamo cercando modi per applicare MuZero ai problemi del mondo reale e ci sono alcuni risultati iniziali incoraggianti”. La prima idea sembra essere quella di far risparmiare dati a YouTube, la piattaforma web di video sharing di Google: “Forse qualcosa come il 5% percento dei bit utilizzati per la compressione di un video”. In prospettiva, spiega ancora Silver, “penso a un sistema che possa aiutarti come utente a raggiungere i tuoi obiettivi nel modo più efficace possibile. Un sistema davvero potente che guarda a lungo termine e potrebbe per esempio fornire una soluzione sanitaria personalizzata. Ci sono questioni di privacy ed etiche che devono essere affrontate, ma tutto ciò cambierà il volto della medicina e la qualità della vita delle persone”.

Algoritmo

Insomma, MuZero “sta costruendo il proprio modello. Sta iniziando a capire come funziona il mondo, a immaginare le cose. E il modo in cui puoi effettivamente sfruttare le sue capacità di calcolo per iniziare a guardare avanti, immaginare cosa potrebbe accadere dopo”. Secondo quanto illustrato in un articolo sulla rivista Nature, i ricercatori di IA hanno cercato di creare un algoritmo in grado di adattarsi a una situazione di cui non conosce tutte le regole che governano una simulazione, ma utilizzando un approccio chiamato ricerca lookahead la ‘macchina’ apprende nuove abilità attraverso un processo di tentativi ed errori, ricevendo “ricompense” per il successo piuttosto che sentirsi dire cosa fare. In un certo senso, sottolinea Silver, MuZero “piuttosto che voler controllare tutto, cerca solo di considerare quei fattori che sono importanti per prendere una decisione. Quando la maggior parte delle persone guarda fuori dalla finestra e vede delle nuvole scure all’orizzonte, generalmente pensare a cose come la condensazione o la formazione dei fronti atmosferici. Pensano a come restare asciutti se escono, a prendere un ombrello”. Le applicazioni pratiche delle ultime ricerche di DeepMind potrebbero essere rivoluzionare. Tuttavia la strada de percorrere dalle capacità di apprendimento di MuZero è ancora molta, ad esempio i tentativi precedenti hanno avuto difficoltà ad affrontare la complessità delle sfide “visivamente ricche”, come quelle poste da uno dei più popolari videogiochi degli anni Ottanta del secolo passato, il mitico Ms. Pac-Man.

(foto Gerd Altmann da Pixabay)