Il termine Machine Learning è ormai entrato nel linguaggio quotidiano di chi si occupa di analisi avanzate dei dati. Proviamo a comprendere nel concreto cosa significa far uso di questo insieme di metodologie.
Che cosa significa Machine Learning e analisi avanzata dei dati
Un sistema di Machine Learning, in italiano apprendimento automatico, è un sistema in grado di apprendere dall’esperienza, o meglio dai dati che man mano vengono inseriti nel sistema, evitando di affidarsi a regole statiche e deterministiche. A partire da questa definizione generale, è chiaro che ricadono nel Machine Learning diverse metodologie e a loro volta diverse tecniche di analisi. Vediamole nel dettaglio.
I tre principali modelli di apprendimento automatico
Una prima distinzione che è necessario chiarire è legata alla differenza tra apprendimento supervisionato e apprendimento non supervisionato. Questa differenza è connessa alla conoscenza pregressa che è possibile fornire al sistema sui dati da analizzare. Nel dettaglio:
- Apprendimento supervisionato: in questo caso, si forniscono al modello dati già etichettati – ovvero dati di input di cui si conoscono anche i risultati delle variabili di output – di modo che il modello di Machine Learning possa ricostruire la funzione di collegamento che dati determinati valori in input restituisce gli output desiderati;
- Apprendimenti non supervisionato: in questa situazione si forniscono dati non etichettati, è quindi il modello stesso a dover indagare le relazioni tra le variabili e a dover estrarre delle regole che poi valgano per predire risultati futuri, applicabili su altri dati disponibili.
- Apprendimento per rinforzo (più conosciuto con il termine inglese, reinforcement learning): si tratta di una terza via applicata ad alcune tipologie di progettualità. Ciò che accade in questo contesto è che l’agente impara a raggiungere un obiettivo per tentativi ed errori, ossia ricevendo delle ricompense per azioni corrette e penalità per azioni errate. Di fatto, la macchina affronta il problema in un modo simile ad un gioco, con l’obiettivo di massimizzare la ricompensa totale.
Le tecniche di Machine Learning
A partire dai modelli teorici appena raccontati, possiamo identificare diverse tecniche utilizzate nel concreto ormai da molte aziende con diverse finalità progettuali.
Nell’ambito dell’apprendimento supervisionato, le tecniche più note sono:
- Classificazione: tecnica che si pone l’obiettivo di discriminare osservazioni che ricadono in un determinato gruppo o meno. L’esempio più classico è il filtro anti-spam, ovviamente si fa sempre riferimento ad un filtro a suo modo “intelligente”, ossia non basato soltanto su regole deterministiche specifiche. Un altro ambito progettuale molto rilevante è legato alla classificazione della propria base clienti, identificando ad esempio i cosiddetti “churner”, ossia coloro che più probabilmente potrebbero abbandonare il brand.
- Regressione: questa tecnica è sicuramente molto nota, si pone l’obiettivo di stimare il valore di una variabile dipendente (cosiddetta Y) a partire da una serie di valori di variabili indipendenti e di coefficienti, ossia di pesi che identificano l’impatto della singola variabile sulla Y. Questa tecnica è applicabile principalmente nel caso di risposte continue. Un esempio di applicazione è la previsione della domanda di un prodotto, a partire dall’analisi di un insieme di condizioni esterne.
Nel secondo ambito, quello dell’apprendimento non supervisionato, possiamo citare principalmente le tecniche di Clustering. Da non confondere con la classificazione, in questo caso ci si trova davanti ad un insieme di osservazioni da suddividere in un numero di gruppi (definito a priori o meno) in base a determinate caratteristiche. In quest’ambito, applicare il Machine Learning permette di ridurre la componente a-priori dell’analisi, lasciando che sia il sistema stesso ad identificare quelle variabili maggiormente discriminanti.
Infine, i casi di applicazione dell’apprendimento per rinforzo riguardano principalmente situazioni in cui la macchina deve imparare a svolgere un compito specifico, ad esempio camminare o guidare. È davvero interessante come grazie a queste tecniche, dei sistemi sempre più intelligenti possono apprendere come svolgere contemporaneamente attività quali identificazione o riconoscimento dell’oggetto, classificazione dell’oggetto, previsione dei movimenti degli oggetti che interagiscono con essi.
Gli utilizzi di 3rdPlace del Machine Learning
3rdPlace, tech company del gruppo Datrix, si occupa ormai da diversi anni di Machine Learning applicando questo insieme di tecniche a diversi ambiti progettuali. Per concludere questo articolo con alcuni esempi, approfondiamone due:
- Manutenzione predittiva: a partire da una rete di sensori esistenti, è stata costruita una infrastruttura unificata in grado di immagazzinare dati quasi real-time. Da qui, attraverso diversi algoritmi di Machine Learning, si è intervenuti per monitorare il funzionamento dell’intera filiera produttiva, riuscendo in soli 6 mesi a ridurre fortemente i costi causati dai fermi macchine e di manutenzione.
- Riduzione del tasso di churn: grazie ad un modello di Machine Learning, è stato sviluppato un indice di rischio relativo all’abbandono di ogni cliente, a partire da tutti i dati a disposizione dell’azienda relativi ai comportamenti dei clienti (es. tracciamento web, CRM, transazioni, email). Di fatto, in questo caso sono state applicate tecniche di clustering per suddividere i clienti in quattro categorie. Da qui, è stato possibile pianificare azioni mirate sui clienti potenziali “churner”.