Big Data Platform

Trasformazione dei big data in risorse affidabili.

Versione di prova gratuita

Rendi la tua piattaforma operativa rapidamente con lo strumento open source per big data leader del settore.

Talend Big Data Platform semplifica le integrazioni più complesse per consentirti di sfruttare al meglio le piattaforme Apache Spark, Databricks, Qubole, AWS, Microsoft Azure, Snowflake, Google Cloud e NoSQL e garantisce la massima qualità dei dati, per trasformare i big data in informazioni affidabili per la tua azienda. Sfrutta tutto il potenziale e la scalabilità del tuo framework per big data con la piattaforma di integrazione e qualità dei dati leader del settore basata su Spark, per architetture cloud, ibride e multi-cloud.

Novità di Big Data Talend Fall '18

Big Data Platform Funzionalità

Licenza

  • Licenza di abbonamento con garanzia e indennizzo
  • 2 free Data Preparation and 2 free Data Stewardship licenses with any Talend subscription
  • Disponibile come servizio cloud e software scaricabile

Strumenti di progettazione e produttività

  • Generazione di codice batch MapReduce e Spark nativo
  • Mappatura visuale per dati JSON, XML e EDI complessi su Spark
  • Tool di progettazione Spark e MapReduce
  • Supporto della distribuzione dinamica
  • Scheduler lavori Hadoop con YARN
  • Sicurezza Kerberos per Hadoop
  • Collaborazione in team con repository condiviso
  • Integrazione continua/Rilascio continuo
  • Mappatura grafica per dati JSON, XML e EDI complessi
  • Verifica, confronto lavori, analisi dell’impatto, test, debugging e messa a punto
  • Metadata Bridge per l’importazione/esportazione e la gestione centralizzata dei metadati
  • Distant Run e parallelizzazione
  • Schema dinamico, joblet riutilizzabili e progetti di riferimento
  • Gestione del repository
  • Supporto ETL ed ELT
  • Procedure guidate e visualizzatore di dati interattivo
  • Controllo delle versioni
  • Change data capture (CDC)
  • Documentazione automatica
  • Valutazione personalizzabile
  • Libreria di modelli
+ Mostra più funzionalità

Qualità dei dati e governance

  • Analisi e profilazione dei dati con diagrammi grafici e drill-down
  • Risoluzione automatica di errori di qualità dei dati e applicazione di regole
  • Pulizia e mascheramento dei dati
  • Portale per la qualità dei dati con monitoraggio, report e dashboard
  • Ricerca semantica con rilevamento automatico di pattern
  • Survivorship completa
  • Campionamento dei dati
  • Arricchimento, armonizzazione, fuzzy matching e deduplicazione
+ Mostra più funzionalità

Connettori

  • Cloud: Amazon Web Services (AWS), Microsoft Azure, Google Cloud Platform e molti altri
  • Distribuzioni Big Data supportate: Amazon EMR, Azure HDInsight, Cloudera, Google Dataproc, Hortonworks, MapR
  • Ambienti senza server: Cloudera Altus, Databricks, Qubole

Componenti

  • Componenti Hadoop: HDFS, Hbase, Hive, Pig, Sqoop
  • Gestione file: apertura, spostamento, compressione, decompressione senza l’esecuzione di script
  • Controllo e orchestrazione di flussi e integrazioni di dati con lavori master
  • Mappatura, aggregazione, ordinamento, arricchimento e unione di dati
+ Mostra più funzionalità

Preparazione e stewardship dei dati

  • 2 licenze gratuite con ogni abbonamento
  • Importazione, esportazione e combinazione di dati da qualsiasi database o file Excel o CSV
  • Importazione, esportazione e combinazione di file CSV, Parquet e AVRO**
  • Esportazione in Tableau
  • Accesso self-service on demand a set di dati sanzionati
  • Condivisione di dati preparati e set di dati
  • Operazionalizzazione dei dati preparati in qualsiasi flusso di integrazione dati o big data
  • Operazionalizzazione dei dati preparati in qualsiasi flusso di integrazione cloud
  • Esecuzione di dati preparati su Apache Beam*
  • Rilevamento automatico, standardizzazione, profilazione automatica, suggerimenti intelligenti e visualizzazione dei dati
  • Personalizzazione del tipo di semantica per auto-profilazione e standardizzazione
  • Campionamento dei dati intelligente e selettivo ed esecuzioni complete
  • Tracciamento e mascheramento dei dati con sicurezza basata sui ruoli
  • Funzioni di pulizia e arricchimento
  • Applicazione Data Stewardship per la gestione e certificazione dei dati
  • Definizione di modelli e semantica dei dati e conseguente profilazione dei dati. Definizione e applicazione di regole
  • Esecuzione di unioni e corrispondenze di dati, risoluzione di errori relativi ai dati e mediazione sui dati (classificazione e certificazione)
  • Orchestrazione e collaborazione in relazione ad attività legate alle campagne
  • Definizione di ruoli utente, flussi di lavoro e priorità, assegnazione e delega di compiti, inserimento di tag e commenti
  • Integrazione di funzionalità di governance e stewardship nei flussi di integrazione dei dati e gestione dei rifiuti
  • Integrazione di procedure di human certification e risoluzione errori nei processi MDM
  • Possibilità di prendere decisioni in merito alla corrispondenza dei dati che non possono essere elaborate automaticamente
  • Deduplicazione di dati su vasta scala con tecnologia di apprendimento automatico
  • Azioni di risoluzione di errori di verifica e monitoraggio dei dati Monitoraggio dello stato di avanzamento delle campagne Annullamento/ripristino di azioni in base alle esigenze aziendali
+ Mostra più funzionalità

Gestione e monitoraggio

  • Alta disponibilità, bilanciamento del carico, failover per i lavori
  • Gestione implementazione e collaborazione in team
  • Gestione di utenti, gruppi, ruoli, progetti e licenze
  • Piano di esecuzione, scheduler basato su tempi ed eventi
  • Punti di controllo, recupero da errori
  • Gestione del contesto (sviluppo, QC, prod.)
  • Monitoraggio dell’attività
  • Indirizzi IP statici*
  • Esportazione dei log in S3 per i processi*
  • Ambienti (2 per i prodotti base, illimitati per le piattaforme*)
+ Mostra più funzionalità

Qualità dei Big Data

  • Pulizia, profilazione, mascheramento, parsing e comparazione dei dati in Spark e Hadoop
  • Apprendimento automatico per la comparazione e deduplicazione dei dati
  • Profilazione di file HDFS

Profilazione avanzata dei dati

  • Rilevamento di schemi di frode tramite Benford Law
  • Statistiche avanzate con soglie degli indicatori
  • Analisi di set di colonne
  • Analisi avanzata delle corrispondenze
  • Analisi di correlazione di colonne temporali
+ Mostra più funzionalità

Storie di successo dei Clienti

Contattaci

Per informazioni sulla raccolta e utilizzo delle informazioni personali, sulle pratiche in materia di privacy e sicurezza e sui diritti di protezione dei dati personali esercitati da Talend, vi preghiamo di voler consultare la nostra Privacy Policy.