Talend Data Quality

La qualità dei dati implica più che aiuta le aziende a ottenere i dati corretti nei loro sistemi d'informazione, ma significa anche liberarsi di cattivi, corrotti, o di dati duplicati. La pulizia dei dati è un elemento chiave durante l'integrazione delle informazioni tra i sistemi, perché la disinformazione può proliferare rapidamente – internamente in maniera naturale, ma anche tramite i partner commerciali. Con i sistemi di informazione interconnessi di oggi, i dati di scarsa qualità si diffondono e  nello stesso modo si diffondono i virus: le informazioni errate possono diffondersi velocemente ad altre applicazioni. Il costo della compromissione dei dati è incalcolabile, tra mancate vendite, la produttività sprecate, la perdita di reputazione o di avviamento, e le occasioni mancate.

Vuoi saperne di più su open source Talend Data Quality? Guarda l’ online demo o verifica le nostre testimonianze.

Non siete sicuri se necessitate di Talend Open Profiler o Talend Data Quality? Controllate la features comparison matrix.

Data Profiling

Il primo passo per migliorare la qualità dei dati di un'impresa è quello di "profilo" (profilazione di dati) o di valutare questi dati. Sofisticato, ma facile da usare, il profiler dati è un sistema avanzato che non richiede una comprensione di motori di database e di strutture di file. Gli analisti di business o di altro personale non tecnico possono definire una serie di indicatori, modelli e regole di business per ogni elemento di dati che devono essere analizzati e monitorati attraverso i dati di profiling tool open source. Questi indicatori possono variare da statistiche semplici o avanzate, alle frequenze del modello e soundex così come la stringa di testo e l'analisi numerica, compresi i dati di sintesi e le distribuzioni statistiche dei dati. I modelli sono espressioni predefinite o personalizzate che definiscono la forma prevista dei dati analizzati e le regole aziendali open source data quality consentono di definire delle soglie di business personalizzate e intervalli di valori.

Talend Data Quality: open source Data Profiling

Rivedendo i parametri su base regolare, e dopo la loro evoluzione, una società può seguire l'evoluzione (miglioramento o peggioramento) della qualità dei propri dati attraverso i dati di profilazione.

Talend Data Quality include altre funzionalità di profilazione e reporting:

  • History of data profiling analyses
  • Batch analyzing
  • Report stylesheet customization
  • Various report formats including PDF, HTML and XML.

Data Cleansing

Talend Data Quality: open source Data Cleansing

Una volta che le aree problematiche sono state individuate, i dati devono essere corretti. Per i dati non conforme agli standard, Talend Data Quality dispone di strumenti potenti per la riparazione e la pulizia. Talend Data Quality consente di utilizzare i dati di riferimento per fissare gli standard per i valori, le espressioni regolari per definire standard per forma e dimensione dei dati, algoritmi di matching e di trovare e riparare i duplicati ( e i vicini?).

Impostare i processi di pulizia utilizzando una vasta gamma di dedicati integrazione dei dati e componenti di qualità. Questi componenti dedicati, come il nome e l'indirizzo dei componenti di pulizia, i componenti deduplicazione fuzzy, sono nativamente disponibili in Talend Data Quality.

Data Enrichment

Talend Data Quality: open source Data Enrichment

Data Enrichment riempie i pezzi mancanti nei dati in modo da poter raggiungere i vostri obiettivi di business. La varietà di queste informazioni è senza limiti - può rientrare l'inclusione di informazioni Dun & Bradstreet, una società a punteggio di credito di un consumatore, ottenendo la longitudine e la latitudine di un indirizzo per aiutare i percorsi di consegna, in tutto o nella raccolta dei dati del censimento al target demografici o categorie di reddito. L'ambiente di sviluppo intuitivo aiuta gli utenti a sviluppare i processi senza soluzione di continuità in un unico ambiente, di consolidare, fondere o semplicemente inserire i dati in qualsiasi sistema di destinazione.

Analytical Portal

Data Quality Portal fornisce dati web-based personalizzabili di monitoraggio e reporting per aiutare le organizzazioni a controllare dati cruciali parametri di qualità che possano avere impatto nei processi aziendali importanti.

Talend Data Quality: Analytical Portal

Data Quality Portal fornisce una chiave personalizzata di indicatori di qualità (KQI) ad un portale web-based in cui le squadre possono collaborare al processo di miglioramento della qualità dei dati in tutta l'azienda. Esso comprende la generazione di report PDF, cruscotti utente personalizzati, query ad hoc e di monitoraggio basato sul tempo di KQIs. Il portale Data Quality offre anche l'accesso a un insieme predefinito di report e indicatori di qualità globale che guarda per la violazione delle soglie di qualità dei dati.

Data Quality and Data Integration

Talend Data Quality: Data Quality and Data Integration

Poiché tutti i prodotti di Talend sono parte della stessa piattaforma unificata, tutte le funzionalità della qualità dei dati sono perfettamente integrate con Talend Integration Suite, e con Talend MDM, fornendo agli utenti ergonomia coerente, veloce curva di apprendimento e un alto livello di riusabilità. Questo offre vantaggi ineguagliabili in termini di ottimizzazione delle risorse e l'utilizzo, e la coerenza del progetto.

Le caratteristiche principali di questa piattaforma integrata comprendono:

  • Single development studio based on Eclipse: Oggetti come le norme di trasformazione e di convalida, le regole di business, le espressioni, le variabili, joblets, ecc possono essere facilmente riutilizzati da un progetto all'altro.
  • A common metadata repository che promuove la condivisione del patrimonio informativo vitale, compresi i dati utente, l'applicazione dei metadati, modelli di business, regole di business, regole di trasformazione e la validazione, connettori, la convalida dei dati e flussi di lavoro.
  • Unified deployment environment, che comprende un paradigma di esecuzione distribuito e ad alta disponibilità, il monitoraggio in un'unica console e l'esecuzione del reporting in tempo reale.