• Richiedi informazioni

  • 10 luglio 2020

Data Governance: come costruire la qualità dei dati.

Data Governance: come costruire la qualità dei dati.

696 402 3rdPlace

La Data Governance – o governo dei dati – si definisce come l’insieme delle policy, dei processi e delle tecnologie necessarie per governare i dati, ovvero mantenere un controllo sugli accessi ai dati, sull’integrità degli stessi, sulle modifiche effettuate e, sempre più importante, sulla qualità dei dati.

Governance dei dati non fa più rima semplicemente con sicurezza o con attenzione alla conformità normativa (un aspetto comunque importante, soprattutto in settori quali il finance o il farmaceutico). Governance dei dati significa oggi manutenere e poter quindi trarre valore dal principale asset a disposizione delle aziende: le informazioni. In breve, governare i dati è il necessario fondamento per accelerare la propria trasformazione data-driven.

Data Governance: tecnologia, organizzazione, coinvolgimento

Il tema della governance dei dati, come si è forse già potuto intuire, è molto complesso. Nonostante si parli molto delle opportunità degli Analytics e dell’Intelligenza Artificiale, le aziende, soprattutto quelle di più piccole dimensioni, fanno fatica ad ottenere dei database di partenza ben strutturati e fruibili, da mettere a disposizione a coloro che dovrebbero estrarne insight rilevanti.

Non a caso, le ricerche sul tema ci dicono che gran parte del tempo dei Data Scientist (circa l’80%) è tutt’oggi dedicato ad attività che precedono l’analisi vera e propria, quali pulizia e preparazione dei dati. 

Per raggiungere una buona Data Governance si dovranno quindi trovare le giuste sinergie tra tematiche tecnologiche, organizzative e di coinvolgimento di tutti gli attori in azienda.

La tecnologia svolge ovviamente un ruolo cruciale: non solo non è possibile gestire ampie moli di dati con strumenti tradizionali come fogli elettronici, ma l’evoluzione verso i Big Data prevede il rinnovamento anche di architetture legacy quali ad esempio data warehouse poco performanti o sistemi ETL (Extract Transform Load) classici. Questa evoluzione tecnologica dovrà tuttavia essere accompagnata da una costante attenzione alle funzionalità di governance e di controllo della qualità. Non a caso, nella proposizione commerciale degli strumenti oggi presenti sul mercato, questo tema viene toccato sempre più pesso. In questo senso, scegliere il Cloud può essere vincente per avere a disposizione delle funzionalità allo stato dell’arte e poter rivoluzionare velocemente i propri sistemi di storage ed elaborazione dei dati. 

Dal punto di vista organizzativo, le aziende più mature si stanno strutturando con la definizione formale di ruoli dedicati alla governancei. Lo scenario internazionale ci parla della figura del Chief Data Officer – ancora poco diffuso in Italia –, ovvero un ruolo executive responsabile della gestione dei dati a livello corporate. A livello più operativo, può essere rilevante identificare dei data steward, ovvero figure responsabili della bontà e qualità di una specifica fonte dati.

Data Governance è, infine, anche un tema di comunicazione ed engagement di tutti gli stakeholder. Siamo tutti, in azienda, responsabili delle azioni che compiamo sui dati e ciò è ancor più vero nel momento in cui l’accesso ai dati e alle analisi diventa sempre più ampio.

Scopri le soluzioni per GOVERNARE i tuoi dati

Perché la Data Quality è sempre più centrale?

Nell’ambito delle finalità della Data Governance, come detto, sta diventando sempre più importante garantire la qualità dei dati. Qualità significa conformità delle informazioni alle aspettative, gestione (e se possibile eliminazione) di dati mancanti, correttezza del formato dei dati, gestione dei duplicati e così via.

Nel mondo dei Big Data, garantire questi aspetti è davvero una grande sfida e, oltre tutto, è anche difficile da monitorare e valutare nel tempo. Tuttavia, le aziende stanno acquisendo ormai consapevolezza della necessità di investire tempo e risorse per questo scopo con due principali motivazioni:

  • Single Source of Truth: spesso le organizzazioni si scontrano con la necessità di creare fiducia nei dati. Se c’è fiducia, le persone inizieranno a prendere decisioni data-driven;
  • Verso gli Augmented Analytics: solo dei dati di qualità possono garantire l’efficacia e la fiducia in modelli previsionali (in particolare di Machine Learning) complessi e difficili da interpretare.

Quattro step per ottenere dati di qualità

Per concludere, proviamo – mettendoci nei panni di un’azienda che decida di investire in ambito Analytics – a delineare quattro fondamentali passaggi per avere dei dati ben governati, fruibili e di qualità:

  1. Investire nell’infrastruttura tecnologica: se si parte da un contesto tradizionale, investire in strumenti quali data warehouse di nuova generazione o data lake è ineludibile;
  2. Data Governance by-design: la governance non è una funzionalità che si può inserire in una seconda fase, fin dalla migrazione dei dati sui nuovi sistemi si deve approfittare per ristrutturare il proprio patrimonio informativo;
  3. Creare della documentazione strutturata: deve essere possibile tenere traccia di ogni modifica sui dati, dell’utilizzo di nuove fonti e dei dati che vengono utilizzati, ad esempio, nella reportistica aziendale;
  4. Far sentire coinvolto il business: i fruitori delle analisi devono essere ben consapevoli del loro ruolo come garanti di un dato di buona qualità e responsabili delle informazioni relative al loro processo di competenza.

Scopri come estrarre dati di qualità

Richiedi Demo

Scegli soluzioni

Request a DEMO

Choose Solutions