La profilazione dei Dati è il processo che consente l’esame dei dati disponibili nelle sorgenti di dati (es. database, applicazioni, files, etc) e la raccolta di statistiche e di informazioni riguardantyi questi dati. La profilazione dei dati consente il livello di qualità dei dati contenuti nel sistema informativo in funzione di una serie di paramentri e di obbiettivi da rispettare.
Talend Open Profiler è un sofisticato ed anche semplice da usare profilatore di dati open source che definisce i contenuti, le strutture e la qualità di strutture di dati altamente complesse. Il profilatore di dati open source permette agli utenti business e al Team di gestione di svolgere una grande varietà di analisi utilizzando una serie di indicatori, modelli e regole per ogni elemento di dati analizzati o monitorati. Analizza i dati su base continuativa, e analizza le modifiche ai dati di origine nel corso del tempo per contribuire a migliorare la qualità dei dati.
Scarica ora Talend Open Profiler !
Vuoi saperne di più su Talend Open Profiler? Guarda online demo o verifica le nostre testimonianze.
Non siete sicuri se necessitate di Talend Open Profiler o Talend Data Quality? Controllate la features comparison matrix.
Metadata discoveryTalend Open Profiler si connette al database per l'introspezione delle loro strutture e memorizza la descrizione dei loro metadati nel suo Metadata Manager. Un sistema di filtraggio permette agli utenti di selezionare solo le tabelle parziale o le colonne per l'analisi, ottimizzando le prestazioni di connessione in caso di un gran numero di tabelle e per aiutare gli analisti dei dati per concentrare la loro analisi sui dati più rilevanti.
I metadati viene poi utilizzati dagli analisti di dati per eseguire confronti di database e di analisi e creare metriche di qualità dei dati e degli indicatori che aiutano gli utenti a valutare la qualità dei dati analizzati e rendere la decisione sulle possibili pulizie dei dati, l'integrazione dei dati o sulle misurazioni dei data stewardship da prendere. Inoltre, un data explorer integrato, consente agli utenti di effettuare drill down direttamente nelle tabelle dei database analizzati e di sfogliare i dati utilizzando standard di settore SQL. Regole di Business customizzateLe regole di business sono criteri specifici, soglie o range di valori che vengono utilizzate per identificare i record corrispondenti, i record illogici (ad esempio: età inserita <0 o è un decimale) o record che non corrispondono ai valori previsti. Una procedura guidata dedicata lo rende facile per impostare dati sulla qualità delle regole aziendali personalizzate utilizzando standard di settore in linguaggio SQL per definire queste regole, e consentendo l'uso avanzato di condizioni di join per esigenze più complesse. Le norme di qualità dei dati vengono utilizzate per definire soglie previste sul valore della qualità dei dati dell'indicatore. La gamma o l’ istruzione definita viene utilizzato per misurare la qualità dei dati nella tabella selezionata nei dati di profiling tool. ModelliI modelli sono master data, Patterns are master data, che analizzano che i dati vengono controllati durante il profiling dei dati. Una libreria di modelli predefiniti è disponibile per i rpoblemi di qualità più frequenti dei dati. Un certo numero di pattern predefiniti sono disponibili nativamente per aiutare a definire le forme più comunemente attese di dati analizzati. Inoltre, i modelli completamente personalizzati possono essere costruiti sulla base di espressioni regolari o istruzioni SQL per il controllo ottimizzato e più dettagliata dei dati. (La profilazione degli utenti) possono anche condividere i loro modelli di home-grown così come i modelli di leva sviluppato da altri utenti del open source La Comunità di Talend attraverso la piattaforma di Talend Exchange direttamente accessibile in studio di Talend Open Profiler.Le espressioni regolari o i modelli SQL possono anche essere importati da un file CSV quando il numero dei modelli è da gestire è molto grande.IndicatoriGli indicatori sono i risultati dell'attuazione di modelli differenti. Essi definiscono il contenuto, la struttura e la qualità dei dati analizzati e possono derivare da semplici operazioni estremamente complesse basate su operazioni relative ai dati dati-matching. Un certo numero di indicatori di sistema sono disponibili nel formato nativo di Talend Open Profiler per aiutare gli utenti a iniziare con i dati di profiling, tra cui:
Dedica procedure guidate consentono agli utenti di definire i propri indicatori personalizzati sulla base di standard SQL o Java per tracciare nuove metriche di qualità dei dati o specifiche caratteristiche dei dati. Rendering
|