Video: "The Power and Limits of Deep Learning" with Yann LeCun (Novembre 2024)
In un seminario sull'IA e il futuro del lavoro all'inizio di questo mese, Yann LeCun, direttore della ricerca sull'intelligenza artificiale su Facebook e direttore fondatore del Centro di scienza dei dati della New York University, ha parlato di "potere e limiti dell'apprendimento profondo". LeCun, che ha aperto la strada alle reti neurali convoluzionali che sono al centro di molti dei recenti progressi nell'intelligenza artificiale, era sia entusiasta dei progressi che il campo ha fatto negli ultimi anni sia realista su ciò che tali sistemi possono e non possono fare.
Ci sono state più ondate di intelligenza artificiale, ha detto LeCun, e ha osservato che mentre l'attuale ondata si è concentrata sull'apprendimento profondo, ciò che verrà è la "percezione", con i più grandi esempi di applicazioni come l'imaging medico e le auto a guida autonoma. Quasi tutte queste applicazioni utilizzano l'apprendimento supervisionato e la maggior parte utilizza reti neurali convoluzionali, che LeCun ha descritto per la prima volta nel 1989 e che sono state implementate per la prima volta nel riconoscimento dei caratteri negli sportelli automatici nel 1995. LeCun ha dichiarato che il brevetto su tali reti è scaduto nel 2007.
Sono i grandi set di dati con campioni di grandi dimensioni e gli enormi aumenti della potenza di calcolo (aiutati dal lavoro di Geoffrey Hinton nel capire come utilizzare le GPU per il riconoscimento delle immagini) che hanno portato il maggior cambiamento negli ultimi anni. Anche per LeCun, i progressi nel riconoscimento delle immagini sono stati "nientemeno che stupefacenti". Sebbene la percezione "funzioni davvero", ciò che manca ancora è il ragionamento.
LeCun ha parlato di tre diversi tipi di approcci e dei limiti di ciascuno di essi. L'apprendimento per rinforzo richiede un numero enorme di campioni. È ottimo per i giochi, poiché il sistema può eseguire milioni di prove e migliorare sempre meglio, ma è difficile da usare nel mondo reale, poiché non vuoi guidare un'auto da una scogliera 50 milioni di volte, ad esempio, e il tempo reale è un fattore nel mondo reale.
L'apprendimento supervisionato, che è la maggior parte di ciò che vediamo ora, richiede una quantità media di feedback e funziona bene. Tuttavia, l'apprendimento automatico supervisionato presenta alcuni problemi. LeCun ha affermato che tali sistemi riflettono i pregiudizi nei dati, sebbene sia ottimista sul fatto che questo problema possa essere superato e ritiene che sia più facile rimuovere i pregiudizi dalle macchine rispetto alle persone. Ma è anche difficile verificare l'affidabilità di tali sistemi e difficile spiegare le decisioni prese sulla base degli output di tali sistemi, e LeCun ha parlato delle domande di prestito come esempio di questo.
L'apprendimento non supervisionato o predittivo, attualmente in fase di ricerca per cose come la previsione di frame futuri in un video, richiede molti feedback. L'apprendimento senza supervisione comporta la previsione del passato, del presente o del futuro da qualsiasi informazione disponibile, o in altre parole, la capacità di riempire gli spazi vuoti, che LeCun ha affermato che è effettivamente ciò che chiamiamo buonsenso. Ha osservato che i bambini possono farlo, ma che ottenere macchine per farlo è stato molto difficile, e ha parlato di come i ricercatori stanno lavorando su tecniche come le reti generative contraddittorie (GAN) per le previsioni fatte in condizioni incerte. Siamo lontani dall'avere una soluzione completa, ha detto.
LeCun ha parlato dei tre tipi di apprendimento come parti di una torta: l'apprendimento per rinforzo è la ciliegina sulla torta, l'apprendimento supervisionato la glassa e l'apprendimento predittivo è la parte principale della torta.
LeCun ha previsto che l'IA cambierà il modo in cui le cose vengono valutate, con prodotti costruiti da robot che costano meno e che le autentiche esperienze umane costano di più, e ha detto che ciò potrebbe significare che esiste "un futuro luminoso per musicisti jazz e artigiani".
Nel complesso, LeCun ha affermato che l'IA è una tecnologia di uso generale (GPT) come il motore a vapore, l'elettricità o il computer. In quanto tale, interesserà molte aree dell'economia, ma ci vorranno 10 o 20 anni prima di vedere un effetto sulla produttività. LeCun ha affermato che l'intelligenza artificiale porterà alla sostituzione di posti di lavoro, ma ha osservato che la distribuzione della tecnologia è limitata dalla velocità con cui i lavoratori possono addestrarsi per questo.
Per quanto riguarda una "vera rivoluzione dell'IA", LeCun ha affermato che ciò non accadrà fino a quando le macchine non acquisiranno il buon senso e la determinazione dei principi per costruirla potrebbe richiedere due, cinque, venti o più anni; oltre a ciò, ci vorranno anni per sviluppare una pratica tecnologia AI basata su questi principi. Dopotutto, ha osservato, ci sono voluti venti anni perché le reti convoluzionali diventassero importanti. E questo è tutto basato sul presupposto che i principi siano semplici; diventa molto più complicato se "l'intelligenza è un kludge".