5 considerazioni fondamentali per elaborare una strategia di governance dei dati

5 considerazioni fondamentali per elaborare una strategia di governance dei dati

  • Nitin Kudikala
    Nitin Kudikala is a Customer Success Architect at Talend. In this role, Mr.Kudikala advises firms on how to create value by becoming Data Driven and ensures that they are empowered to use the Talend software in the most optimal way. He has 15 years of experience in the field of Data Governance, Data Quality, Data Warehousing, Master Data Management and Big Data. Prior to Talend, he worked as a Data Management Specialist at PepsiCo and before that as a Senior Consultant at Informatica Corporation.

In un precedente contributo del blog di Talend ho condiviso alcuni suggerimenti fondamentali per le aziende che si accingono a progettare i processi relativi alla qualità dei dati (DQ) in Hadoop. I framework e i processi che ho menzionato in quel post sono importanti perché hanno un impatto non solo sul programma per la qualità dei dati, ma anche su quello per la governance dei dati. Ecco perché ti chiedo se hai già un programma di governance dei dati; una domanda alla quale non è facile rispondere poiché la governance dei dati non è un concetto del tutto noto. È probabile che la tua azienda operi già una certa governance dei dati senza che te ne renda conto; allora sorge spontaneo chiedersi di cosa si tratta.

Il Data Governance Institute definisce la governance dei dati (o DG) come "un sistema di diritti decisionali e responsabilità inerenti ai processi relativi alle informazioni, eseguiti in base a modelli concordati che descrivono chi può fare cosa con quali informazioni, e quando, in quali circostanze e utilizzando quali metodi". Una definizione piuttosto complessa, ma in fin dei conti basta ricordare che la governance dei dati riguarda standard, policy e modelli riutilizzabili.

Se disponi di un data warehouse (DW), che è l'approccio tradizionale utilizzato per ricavare informazioni dai dati, è probabile che nella tua azienda sia già implementato un qualche tipo di framework e standard per la governance dei dati, legato all'uso di standard per le tabelle dimensionali. Quindi, quando parliamo di best practice in ambito di governance dei dati, il primo passo è capire cos'è in realtà la DG per la tua azienda.

La governance dei dati per la TUA azienda

Molti definiscono la governance dei dati come un concetto equivalente alla MDM, il che non è sbagliato, ma semplicemente incompleto. La governance dei dati non riguarda necessariamente un'unica piattaforma o un unico concetto. In effetti, un approccio corretto alla governance dei dati può e dovrebbe coinvolgere più di una piattaforma o di un progetto. La DG è un programma all'interno dell'azienda che fissa regole e standard applicabili alle materie inerenti ai dati. Ad esempio, se la tua azienda necessita di una soluzione per la creazione di report sulle vendite, si presentano alcune questioni di governance, tra cui:

  1. Quali database interni dispongono di queste informazioni?
  2. Chi vi ha accesso?
  3. È stata stabilita una definizione per "cliente" e per "fornitore"?
  4. Le strutture dei dati di vendita sono già definite?
  5. Qual è la qualità dei dati sorgente?
  6. Esistono delle metriche per valutare le dimensioni dei dati?

I team IT avranno il compito di fornire soluzioni per il progetto e offrire servizi di sviluppo e infrastrutturali; ma sarà il team dedicato alla governance dei dati a dover fornire ai team IT indicazioni inerenti a standard e policy relativi ai dati. Questo ci porta al punto saliente successivo.

Il consiglio per la governance dei dati

Questo consiglio avrebbe la responsabilità di definire un framework per la governance dei dati all'interno dell'organizzazione, framework che andrebbe personalizzato in funzione delle esigenze specifiche dell'azienda, ma che in generale potrebbe includere attività di pianificazione strategica, quali la definizione delle esigenze in termini di dati, lo sviluppo di policy e linee guida applicabili ai dati e la pianificazione di progetti di gestione dei dati. Il framework potrebbe prevedere anche attività di controllo costante, quali la gestione e risoluzione di problemi legati ai dati, il monitoraggio delle policy dei dati e la promozione del valore delle risorse dei dati.

Analogamente ai team dirigenziali dei progetti IT, il consiglio per la governance dei dati dovrebbe includere oltre a membri del reparto IT anche membri degli altri reparti aziendali. È di fondamentale importanza coinvolgere in questo programma membri aziendali, che saranno coinvolti attivamente nelle attività legate alla DG.

Per il consiglio è importante altresì poter contare su una struttura organizzativa flessibile. È buona prassi seguire un approccio "dall'alto verso il basso", in cui i livelli dirigenziali del consiglio guidano la governance mentre gli analisti aziendali e i data steward implementano le policy. I data steward, inoltre, hanno il compito di fornire ai dirigenti il feedback necessario.

Comunicazione

L'implementazione della governance dei dati comporta un enorme cambiamento all'interno dell'organizzazione. Ecco perché è essenziale che il consiglio per la governance dei dati formuli una mission in linea con gli interessi aziendali e prenda in considerazione i punti di forza dei team dedicati all'implementazione. La mission dei programmi di DG deve essere comunicata in termini chiari e concisi, enunciando i principali fattori che riguardano la governance dei dati all'interno dell'organizzazione. La comunicazione della mission deve avvenire in modo ripetuto e regolare utilizzando diversi canali.

Area di interesse. Nell'ambito di un programma di governance dei dati possono rientrare numerose aree di interesse ed è importante scegliere quella di maggior valore per l'azienda. Le iniziative in tal senso possono essere a livello di impresa o a livello di progetto. Qui di seguito sono elencate alcune aree di interesse corredate da una breve descrizione:

  1. Standard e policy. Si tratta di un tipo di programma volto a mettere insieme gli standard, analizzare quelli esistenti e confrontarli con gli standard aziendali. Un'altra attività principale consiste nel definire una strategia dei dati per l'azienda e fornire assistenza a ogni progetto organizzato in modo isolato nel tentativo di collegarlo al panorama aziendale.
  2. Qualità dei dati (DQ). Si tratta di un tipo di programma volto a trovare, correggere e monitorare eventuali problemi legati alla qualità dei dati all'interno dell'impresa. Questi programmi generalmente richiedono l'uso di software per la profilazione, pulizia e corrispondenza dei motori. Le iniziative di DQ producono anche progetti di Master Data Management (MDM), che definiscono i dati master e forniscono una visione a 360° di domini quali cliente o fornitore.
  3. Sicurezza e privacy dei dati. In ogni azienda esistono requisiti di conformità e normativi; questo programma si occuperebbe di tali questioni, configurando i diritti di gestione degli accessi, fissando i controlli sulla sicurezza delle informazioni e definendo le procedure legate alla privacy dei dati, ecc., in particolare dei dati sensibili.
  4. Architettura/Integrazione. Si tratta di un'area di interesse finalizzata a conseguire l'efficienza operativa semplificando i componenti dell'architettura di integrazione dei dati, come ad esempio la modellazione dei dati e dei dati master, l'architettura orientata al servizio, eccetera.
  5. DW e Business intelligence (BI). Questo programma promuove la creazione di data warehouse e data mart per supportare la comunicazione di dati storici e anche futuristici.
  6. Architetture self-service. Si tratta di un tipo di programma che prende in considerazione le problematiche legate alla stewardship e alla preparazione dei dati con l'obiettivo di creare flussi di lavoro limitando il paradigma "shadow IT", che spesso si verifica nelle organizzazioni.

È un viaggio, non una meta

È importante comprendere che, proprio come la governance aziendale, anche la governance dei dati non è un progetto ma un processo in corso, e come tale deve avere degli obiettivi predefiniti e un metodo per misurare i progressi del programma. Per questo è raccomandabile adottare un approccio che preveda la valutazione dei progressi rispetto a un modello di maturità della governance dei dati. A seconda dell'area di interesse prescelta per il programma DG, l'azienda dovrebbe anche definire delle metriche per misurare il successo del programma. È consigliabile anche adottare pratiche agili, quali l'erogazione continua, la collaborazione costante tra reparto IT e reparti aziendali, l'accoglienza del cambiamento e la continua attenzione all'eccellenza tecnica e al design di qualità, tutti metodi agili che si addicono perfettamente alle prassi di governance dei dati.

Evoluzione

Proprio come i processi e le persone, anche la tecnologia rappresenta una parte importante nell'ambito della governance dei dati, e la tecnologia è in continua evoluzione. È auspicabile sposare l'innovazione tecnologica, sia nel reparto IT che negli altri reparti aziendali. Le innovazioni nel campo dell'apprendimento automatico, il cloud e lo spazio dei big data possono rendere davvero efficaci le iniziative messe in atto per la governance dei dati. Creare un data lake in Hadoop, ad esempio, potrebbe rendere più economica l'archiviazione dei dati master e dei DW e velocizzare i processi di elaborazione.

È molto probabile che nella tua azienda siano già attuate efficacemente delle iniziative di governance dei dati. Il mio consiglio è di utilizzarle come base per implementare altre aree di interesse. Definire una vision della governance dei dati nell'azienda, coinvolgere dirigenti del reparto IT e degli altri reparti aziendali e migliorare la collaborazione tra IT e altri reparti: dopo aver attuato queste fasi iniziali, la governance dei dati può conoscere un'efficace evoluzione e apportare un valore reale all'organizzazione.

Riferimenti:

https://www.sas.com/en_us/insights/articles/data-management/what-is-a-data-governance-framework.html

http://www.datagovernance.com/the-dgi-framework/

http://tdan.com/a-ten-step-plan-for-an-effective-data-governance-structure/19183

http://mitiq.mit.edu/IQIS/Documents/CDOIQS_200777/Papers/01_08_1C.pdf

https://www.pcmag.com/article/347785/big-data-basics-how-to-build-a-data-governance-plan

http://www.computerweekly.com/tip/Guidelines-for-data-governance-framework-creation

https://www.dataqualitypro.com/data-governance-design-build-execute-guy-harvey/

https://www.whitepapers.em360tech.com/wp-content/files_mf/white_paper/wp_iway_7steps.pdf

https://www.isaca.org/chapters3/Atlanta/AboutOurChapter/Documents/GW2014/Implementing%20a%20Data%20Governance%20Program%20-%20Chalker%202014.pdf

http://dbhids.org/wp-content/uploads/2016/03/OCIO-DBHIDS-DG-Framework-Strategic-Plan-v1.01.pdf

Partecipa alla discussione

0 Comments

Scrivi una risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *