Casa Attività commerciale 7 consigli per il successo dell'apprendimento automatico

7 consigli per il successo dell'apprendimento automatico

2024

Sommario:

1. Non dimenticare la logistica
2. Mente i tuoi dati
3. Gli algoritmi non sono proiettili magici
4. Utilizzare un set di strumenti diverso
5. Sperimenta con l'apprendimento ibrido
6. Economico non significa cattivo
7. Non chiamarlo AI

Video: 7 consigli per costruire e mantenere un'azienda di successo (Novembre 2024)

La prima parte della nostra Business Guide to Machine Learning (ML) ha analizzato come il concetto ombrello di ML sia molto più sfumato in un ambiente aziendale. Le strategie più efficaci guardano alla ML in senso pratico, impiegando sia tecniche di deep learning complesse che tecniche di "apprendimento economico" meno intensive per ottimizzare i processi aziendali e acquisire informazioni concrete sulla business intelligence (BI).

L'obiettivo di distribuire ML all'interno delle applicazioni aziendali è migliorare i profitti o aumentare il vantaggio competitivo dell'azienda. Ma nel più ampio schema della tua organizzazione, sfruttare al massimo il tempo e le risorse che investi in questo processo va ben oltre gli algoritmi. I responsabili delle decisioni IT nella tua azienda devono assicurarsi che tutto ciò che riguarda il factoring nella tua implementazione ML, dai dati e dalla logistica al modo in cui stai interagendo con gli utenti, lavori insieme per massimizzare l'efficacia.

Ted Dunning, Ph.D., è Chief Application Architect presso MapR, una società di software aziendale che offre varie distribuzioni di Big Data e strumenti di gestione dei dati. Dunning ha anche scritto due libri su quello che lui chiama "Apprendimento automatico pratico" e ha sviluppato tecnologie ML per diverse aziende nel corso degli anni, tra cui il sistema di rilevamento delle frodi ID Analytics (acquistato da LifeLock) e il software Musicmatch Jukebox, che in seguito divenne Yahoo Music. Attualmente ricopre anche il ruolo di Vice President of Incubation per Apache Software Foundation.

Dunning ha assistito all'evoluzione dello spazio ML nel corso di decenni e ha imparato molto su ciò che funziona e cosa non funziona in un ambiente aziendale pratico. Di seguito, Dunning espone sette best practice da seguire quando si sviluppano soluzioni di business radicate nella ML.

1. Non dimenticare la logistica

Il successo di ML non riguarda solo la scelta dello strumento o dell'algoritmo giusto. Dunning ha detto che devi anche capire quale approccio è adatto e progettarlo per la situazione particolare che stai affrontando. Ad esempio, Dunning ha parlato di ML in una campagna di marketing online rispetto a scenari molto più complicati come gli algoritmi che guidano un'auto autonoma. Spendere le tue risorse per un miglioramento dell'algoritmo incrementale vale la pena per l'auto, ma nello scenario di marketing, vedresti un ritorno molto migliore dall'ottimizzazione di tutta la logistica circostante.

"Spesso, per le aziende, è la logistica, non l'apprendimento, che ti dà il valore. Questa è la parte su cui dovresti dedicare tempo e risorse", ha detto Dunning. "Regolare l'algoritmo ti darebbe un piccolo miglioramento. Ma aggiustare quei dati, la GUI e il modo in cui ascolti e interagisci con i tuoi utenti potrebbe facilmente darti un miglioramento del 100 percento. Trascorrere del tempo a modificare l'algoritmo vale una frazione di tanto per le imprese quanto per l'ascolto dei tuoi utenti ".

Per illustrare questo punto, Dunning ha spiegato come una volta ha creato un modello per identificare la frode dell'applicazione (apertura di account falsi con identità rubate) nel database dei clienti di un'azienda. Il modello che costruì ottenne grandi risultati, ma Dunning notò che pesava molto sul genere del richiedente.

Si è scoperto che la logistica era disattivata. Nel modo in cui ha funzionato il processo di candidatura, il richiedente ha compilato il proprio genere solo dopo essere diventato un cliente e aver superato una serie di passaggi di screening per filtrare i truffatori. Quindi, utilizzando il campo del genere, il modello ML stava ingannando la logistica dell'intero processo di frode. Ciò non ha nulla a che fare con l'algoritmo e tutto a che fare con il modo in cui la società stava ottenendo i suoi dati in primo luogo.

2. Mente i tuoi dati

Dunning è pieno di bocconcini orecchiabili di saggezza. Dopo aver iniziato con "è la logistica, non l'apprendimento", ha detto che l'altra metà di quell'idea è "sono i dati, non gli algoritmi". Gran parte della garanzia che i tuoi algoritmi ML forniscano informazioni preziose sta assicurando che stai fornendo loro i dati giusti. Dunning ha detto, se non stai ottenendo il risultato per cui stai cercando, il più delle volte è perché non stai usando i dati giusti.

"Le persone sono completamente coinvolte e legate all'ego a particolari algoritmi, ma al giorno d'oggi, a causa degli strumenti disponibili, tutti e la loro madre possono e stanno inventando ogni sorta di nuovi algoritmi", ha detto Dunning. "I dati sono molto più importanti e ti daranno molta più spinta che modificare continuamente i tuoi algoritmi. Se stai lavorando su un problema difficile come il riconoscimento vocale o la visione del computer, questa è una cosa. Ma questo è un campo basato sui dati. Nella maggior parte degli scenari, trarrai maggiori benefici dalla regolazione di quali dati stai ricevendo e dalla modifica della domanda ".

Questo è quello che ha fatto Dunning a metà degli anni 2000 quando ha creato un motore di raccomandazione video presso una società chiamata Veoh Networks. Il team stava lavorando per identificare coppie di video generati dagli utenti su cui le persone hanno fatto clic più del previsto, ma l'algoritmo non funzionava. Stavano pensando in termini di musica, in cui gli utenti conoscono i loro artisti e le canzoni preferite per nome. Quindi hanno cambiato la domanda modificando l'interfaccia utente senza toccare l'algoritmo stesso.

"Nei video generati dagli utenti, nessuno sa che gli artisti e molti video avevano titoli davvero spammati per ottenere più visualizzazioni. Ciclare sulle modifiche dell'algoritmo non ci avrebbe mai dato buoni risultati", ha detto Dunning. "Quello che abbiamo fatto è stato cambiare l'interfaccia utente per emettere un segnale beacon ogni 10 secondi. Abbiamo scoperto che se avessimo usato il beacon anziché i clic per i dati grezzi del raccomandatore, avremmo ottenuto risultati fantastici. L'ascensore per questo cambiamento è stato diverso miglioramento del 100% nell'impegno grazie alle raccomandazioni, senza cambiamenti algoritmici ".

3. Gli algoritmi non sono proiettili magici

Le implementazioni ML prosperano in continui tentativi ed errori. Non importa quanto siano buoni i tuoi algoritmi, se il tuo sistema interagisce con gli umani, allora dovrà essere adattato nel tempo. Dunning ha sottolineato che le aziende dovrebbero costantemente misurare l'efficacia complessiva della loro implementazione e identificare i cambiamenti e le variabili che lo stanno migliorando e peggiorando. Questo può sembrare banale, ma Dunning ha detto, nonostante sia ovvio, pochissime persone lo fanno o lo fanno bene.

"Molte persone vogliono implementare un sistema o agire, e vogliono che il loro algoritmo funzioni perfettamente per sempre", ha detto Dunning. "Nessun algoritmo sarà un proiettile magico. Nessun progetto di interfaccia utente rimarrà per sempre. Nessun metodo di raccolta dei dati non sarà mai superato. Tutto ciò può e succederà, e le aziende devono misurare, valutare e rivalutare con attenzione come il loro il sistema funziona ".

4. Utilizzare un set di strumenti diverso

Ci sono dozzine di strumenti ML disponibili, molti dei quali puoi usare gratuitamente. Hai librerie di framework open source popolari come Caffe, H20, Shogun, TensorFlow e Torch e librerie ML in numerosi progetti della Apache Software Foundation (ASF) tra cui Mahout, Singa e Spark. Quindi ci sono opzioni basate su abbonamento tra cui Amazon Machine Learning, BigML e Microsoft Azure Machine Learning Studio. Microsoft ha anche un Cognitive Toolkit gratuito.

Ci sono innumerevoli risorse disponibili. Dunning ha parlato con numerose aziende, data scientist e professionisti della ML, e chiede loro sempre quanti diversi framework e strumenti usano. In media, Dunning ha affermato che la maggior parte ha affermato di utilizzare un minimo di 5-7 strumenti e spesso molto di più.

"Non puoi essere incollato a uno strumento. Dovrai usarne diversi e, come tale, faresti meglio a costruire il tuo sistema in modo agnostico", ha detto Dunning. "Chiunque cerchi di convincerti che questo strumento è l'unico di cui avrai mai bisogno ti sta vendendo una distinta base.

"Qualcosa potrebbe accadere la prossima settimana che sconvolge il carrello delle mele, e al ritmo di innovazione che stiamo vedendo, che continuerà ad accadere per almeno altri 5-10 anni", ha continuato Dunning. "Guarda un esempio di apprendimento economico in cui forse stai riutilizzando un classificatore di immagini esistente per analizzare le immagini in un catalogo. È un apprendimento profondo con la visione del computer inserita. Ma ci sono strumenti là fuori che hanno impacchettato tutto. Devi per misurare, valutare e vacillare tra strumenti diversi e la tua infrastruttura deve essere accogliente."

5. Sperimenta con l'apprendimento ibrido

Dunning ha detto che puoi anche mescolare insieme l'apprendimento economico e profondo in qualcosa di ibrido. Ad esempio, se si prende un modello di visione artificiale esistente e si ricostruiscono i primi pochi livelli in cui viene presa una decisione, è possibile cooptare un framework esistente per un caso d'uso completamente nuovo. Dunning ha indicato una competizione Kaggle in cui i concorrenti hanno fatto proprio questo; hanno preso un set di dati e hanno scritto un nuovo algoritmo per aiutare un computer a distinguere i gatti dai cani.

"Distinguere cani e gatti è una cosa molto sottile per un algoritmo ML. Pensa alla logica: i gatti hanno orecchie appuntite ma anche i pastori tedeschi. I cani non hanno macchie, tranne i dalmati, ecc. Che può essere piuttosto difficile da riconoscere in sé e per sé "disse Dunning. "Il ragazzo che ha vinto ha sviluppato un sistema che ha fatto questo con una precisione del 99 percento. Ma sono rimasto più colpito dalla persona che è arrivata terza. Invece di costruire da zero, ha preso un programma di riconoscimento delle immagini esistente da un compito diverso, ha tolto il strato superiore e ha inserito un semplice classificatore. Gli ha dato alcuni esempi e presto è stata precisa al 98 percento nel differenziare i gatti dai cani. L'intero processo ha richiesto al ragazzo tre ore."

6. Economico non significa cattivo

Nonostante la connotazione palese, Dunning ha detto che l'apprendimento economico non significa cattivo apprendimento. Il tempo che dedichi a un'implementazione ML non è direttamente correlato al suo valore commerciale. La qualità più importante, ha detto, è assicurarsi che il processo sia ripetibile e affidabile. Se l'azienda è in grado di raggiungere questo obiettivo senza investire una quantità eccessiva di risorse, allora è tanto meglio.

"Economico non significa male. Se funziona, funziona. Se è economico e funziona, è grandioso. Ma lo sforzo che fai nella costruzione non definisce il valore. Questo è un errore di somma-costo", ha detto Dunning. "Ciò che definisce il valore è il modo in cui migliora il business. Se migliora i profitti o diminuisce i costi o migliora la tua situazione competitiva. È l'effetto, non lo sforzo."

7. Non chiamarlo AI

Dunning ha sottolineato che, quando si parla di queste tecniche, le aziende dovrebbero usare la terminologia precisa: ML, computer vision o deep learning. Tutto ciò tende a rientrare nel termine generico "intelligenza artificiale" ma, per Dunning, la definizione di AI è semplicemente "roba che non funziona ancora".

"La migliore definizione che io abbia mai sentito per AI è che sono le cose che non possiamo ancora spiegare. Le cose che non abbiamo capito", ha detto Dunning. "Ogni volta che riusciamo a far funzionare qualcosa, la gente dice 'Oh, non è AI, è solo un software. È solo un motore di regole. In realtà è solo una regressione logistica.' Prima di capire qualcosa, la chiamiamo AI. Successivamente, la chiamiamo sempre qualcos'altro. In molti modi, l'IA è meglio usata come parola per la prossima frontiera e nell'IA ci sarà sempre una prossima frontiera. dove stiamo andando, non dove abbiamo già raggiunto ".