Come strutturare metriche e indicatori di data quality?

Tecnologia: Customer Intelligence     Topic: Dati & Analytics  

Un sistema di metriche per la misurazione della qualità del dato permette di monitorare le attività di aggiornamento e controllo dei dati e indicare quali sono i miglioramenti da apportare.

Gli aspetti da considerare per creare gli indicatori di qualità dei dati sono:

  • completezza, per misurare se i dati sono tutti quelli necessari al processo/i per cui sono stati raccolti
  • accuratezza, per misurare se i dati contengono valori precisi e rappresentativi dell’informazione che definiscono
  • tempestività, per misurare se i tempi di acquisizione/produzione dei dati sono coerenti con il processo
  • coerenza, per verificare se ci sono contraddizioni tra i dati presenti nel sistema 
  • univocità, per verificare se i dati riferiti a una stessa informazione hanno lo stesso valore
  • integrità, per verificare se i dati presenti corrispondono a quelli immessi 
  • conformità formale, per  verificare il rispetto degli standard formali

Nello specifico ecco alcuni esempi di metriche che si possono adottare:

Rapporto tra dati ed errori: tiene traccia della percentuale di errori – voci mancanti, incomplete o ridondanti – presenti in un set di dati. Più la percentuale si abbassa più i dati sono di qualità.

Quantità di valori vuoti: i valori vuoti indicano le informazioni mancanti o registrate nel campo sbagliato. Si  può quantificare quanti campi vuoti ci sono all'interno di un set di dati e monitorare come il numero cambia nel tempo.

Tasso di errore nella trasformazione dei dati –  nel processo di acquisizione dei dati archiviati in un formato e conversione in un formato diverso possono insorgere problemi che influiscono sulla qualità dei dati. Misurando il numero di operazioni di trasformazione dei dati che falliscono puoi ottenere informazioni dettagliate sulla qualità complessiva dei tuoi dati.

Numero di dark data –  i dark data sono quei dati che non possono essere utilizzati in modo efficace. Un numero elevato è indice di scarsa qualità del set di dati.

Frequenza di rimbalzo delle e-mail – se stai eseguendo una campagna di marketing, la scarsa qualità dei dati è una delle cause più comuni di rimbalzo delle email. Errori, dati mancanti o obsoleti ti fanno inviare e-mail agli indirizzi sbagliati.

Tecnologia: Customer Intelligence     Topic: Dati & Analytics  

Autorizzo L'Ippocastano srl, titolare del trattamento dei dati, a utilizzare i miei dati per comunicazioni inerenti le attività di CMI Customer Management Insights.
L'autorizzazione è obbligatoria per poter processare la tua azione. Leggi la Privacy Policy

VOCI CORRELATE

In che modo si utilizzano i first party data?

Se vuoi sfruttare le informazioni dei first party data devi prima sapere con esattezza da quali fonti provengono, che tipo di dati sono e in quali database sono raccolti.

Leggi

Quali dati si utilizzano in un approccio data-driven?

Una volta compreso cos’è il modello data-driven, sorge spontanea una domanda: quali dati occorrono?

Leggi

Cosa sono i first party data?

I first party data (dati proprietari) sono tutti i dati che puoi raccogliere direttamente attraverso i tuoi canali di contatto digitali o fisici.

Leggi

Cosa si intende per data as a service e data monetization?

Le analisi che vengono effettuate sui dati raccolti danno vita a informazioni molto appetibili che possono essere vendute. Si parla quindi di monetizzazione diretta o indiretta:

Leggi

Cosa si intende per data governance?

La data governance, o governo dei dati, è un termine ampio applicato alla definizione di politiche, regole, processi e responsabilità sull'uso, la condivisione e la protezione dei dati.

Leggi

Cosa sono le customer data platform?

Una customer data platform (CDP) è una piattaforma utilizzata per raccogliere e aggregare tutti i dati proprietari sui clienti in un unico database…

Leggi

Cosa si intende per data quality?

Secondo Gartner “la scarsa qualità dei dati distrugge il valore del business.

Leggi

Cosa si intende per data enrichment?

Per data enrichment, arricchimento dei dati, si intendono i processi attuati per validare, integrare e migliorare i dati grezzi e le informazioni nei database aziendali e ottenere un database integro…

Leggi

Cosa sono i self service data analytics?

I self-service data analytics, ossia la diffusione di strumenti che permettono all’utente di business di gestire in autonomia il processo d’interrogazione dei dati (dall’esplorazione all’analisi…

Leggi