Novità Talend - Primavera 2018

Talend Data Streams

Metti più dati al lavoro

I nuovi miglioramenti in ambito Cloud, Big Data e Governance aumenteranno notevolmente la capacità del tuo team di fornire risultati data driven.

Acquisizione semplificata dei flussi di dati

Semplifica l’integrazione dei flussi di dati per data scientist, analisti e sviluppatori di dati

Serverless
Computing

Riduci del 67% i costi di elaborazione dei dati nel cloud

Integrazione più rapida
dei Big Data

Crea velocemente Data Warehouse e Data Lake nel Cloud con la tecnologia di ultima generazione

Cloud Data Stewardship

Offri un’applicazione di gestione e convalida self-service agli utenti che conoscono meglio i dati

Cattura i tuoi
flussi di dati

Concepita per data scientist, analisti e sviluppatori di dati, Talend Data Streams è un’applicazione self-service gratuita che rende l’integrazione dei flussi di dati più veloce, semplice e accessibile. Creata per il Cloud, può essere operativa nel giro di pochi minuti. Includi tipi di dati nuovi e in streaming senza difficoltà con lo schema in lettura, il tutto da un’unica interfaccia per pipeline in streaming e in batch basata su Apache Beam. Accelera lo sviluppo delle tue pipeline con i componenti di codifica Python incorporati e usa l’esclusiva anteprima in tempo reale per visualizzare i tuoi dati in ogni fase di progettazione.

Webinar: Metti più dati al lavoro

Riduci i costi di elaborazione dati nel cloud del 67% con il Serverless Computing

Affidati ai servizi serverless per concentrarti sul fornire informazioni dettagliate piuttosto che occuparti della gestione dell’infrastruttura. Grazie ai plug-in Maven puoi facilmente integrare Docker nel tuo processo di compilazione e utilizzarlo con servizi serverless come AWS Fargate e Azure Container Instances (ACI). La misurazione al secondo e le velocità di esecuzione più rapide riducono i costi di elaborazione fino al 67%, mentre l’elaborazione di più dati in parallelo incrementa le prestazioni fino al 50%. Il supporto per Qubole e Cloudera Altus su Azure consente di ridurre al minimo i processi di gestione dei server e ridimensionare automaticamente le risorse cloud per le integrazioni di big data senza server.

Articolo: How to go Serverless with AWS Lambda

Integrazione più rapida
dei Big Data

Elabora più dati in meno tempo da Warehouse e Data Lake nel Cloud. Ottieni rapidamente informazioni dettagliate con le nuove funzionalità ELT push-down per il supporto di Snowflake, Spark e Spark Streaming in Azure Data Lake Store, e con le funzionalità avanzate di estrazione dati per SAP.

Ora Talend supporta la distribuzione dinamica per Cloudera, offrendo l’accesso istantaneo alle nuove funzionalità di Cloudera senza dover aggiornare la soluzione Talend, con un risparmio di settimane o addirittura mesi. Sviluppa i processi big data una sola volta e implementali in azienda, su qualsiasi cloud oppure come servizio Talend Cloud gestito.

Scopri di più: Novità Big Data

Talend Cloud Data Stewardship

Aumenta l’affidabilità dei tuoi dati con Talend Cloud Data Stewardship, un’applicazione self-service per la gestione e la convalida dei dati in team che permette alle persone che meglio conoscono i dati di identificare, gestire e risolvere velocemente qualsiasi problema di integrità dei dati. Una semplice interfaccia utente basata sul web consente di definire ruoli degli utenti, flussi di lavoro e priorità per la gestione dei dati, per poi delegare le mansioni. Crea un’unica versione della verità, qualunque sia il Cloud o il luogo in cui si trovano i tuoi dati. Devi solo attivare il servizio Talend Cloud, senza nulla da installare.
 
(Data Stewardship è disponibile in versione Talend Cloud app e Talend software da scaricare e installare)

Webinar: Data Quality Team-Driven e Data Stewardship

Miglioramenti

Talend Spring ‘18 e Talend Winter ‘18, non perdere le nuove features.
Per scoprire cosa c’è di nuovo in ogni release e in ogni prodotto (versione del software scaricabile o Talend Cloud), visita help.talend.com

Big Data Integration
Integrazione dati
Data Quality
Data Preparation
Data Stewardship
MDM
Talend Data Mapper
Big Data Integration Migliora le prestazioni e la produttività dei tuoi progetti Big Data:
  • Nuovo supporto per la distribuzione dinamica (anteprima tecnica) per Cloudera CDH – Aggiungi istantaneamente aggiornamenti alle distribuzioni Hadoop senza aggiornare Talend
  • Esegui i processi Spark in modalità cluster YARN senza bisogno di un server di processo su un nodo periferico in fase di esecuzione, semplificando e accelerando la distribuzione senza alcun punto di errore
  • Aumenta sensibilmente la tua capacità di estrarre dati da SAP a livello di applicazione, database e data warehouse. Le nuove funzionalità di estrazione di massa SAP ti permettono di estrarre quantità praticamente illimitate di dati da SAP. Estrai facilmente i dati preconfigurati SAP nuovi o modificati utilizzando l’estrattore di contenuti aziendali con modalità delta (anteprima tecnica). Il supporto ELT push-down per SAP consente l’elaborazione nativa in SAP prima del trasferimento dei dati nel cloud
  • Il supporto per componenti Snowflake è stato migliorato e consente ora l’esecuzione di push-down ELT quando l'elaborazione e la trasformazione dei dati vengono eseguite su cluster Snowflake, sfruttando le elevate prestazioni e la scalabilità di Snowflake per analisi più veloci
  • Inserimento di dati ed esecuzione di query su Cloudera Kudu, un gestore di storage a colonne per Hadoop utilizzato per analisi rapide e scenari di fast data come IoT, GDPR e rilevamento di frodi. Le opzioni di ottimizzazione avanzate forniscono prestazioni ottimali
  • Supporto MapR-DB OJAI per eseguire trasformazioni gerarchiche avanzate in modalità grafica e lanciare query su MapR-DB OJAI dal proprio processo, fornendo prestazioni più rapide e maggiore flessibilità per applicazioni web, mobile, social e basate su IoT
  • Implementazione semplificata della sicurezza su AWS S3 tramite ruoli IAM e Secure Token Service per il tuo processo
  • Esegui i tuoi carichi di lavoro Talend in Cloudera Altus su Azure (oltre all'opzione esistente in AWS)
  • Elabora più dati più velocemente grazie al supporto di Spark e Spark Streaming per Microsoft Azure Data Lake Store
  • Tieni traccia degli identificativi delle applicazioni in Hive Query per gestire meglio i tuoi processi Talend / Hive
  • Crea e imposta le chiavi di riga in HBase per sfruttare le best practice di HBase e lavorare con dati di serie temporali
Data Integration Migliora la produttività e la sicurezza dei tuoi progetti:
  • Miglioramenti alla sicurezza del server di processo e alla produttività, tra cui:
    • Sicurezza basata sui ruoli: in Studio, uno sviluppatore può eseguire solo i processi che appartengono a un progetto per il quale è autorizzato
    • Le opzioni potenziate di pulizia dei dati del server di processo consentono di ignorare i processi attivi in esecuzione e qualsiasi dipendenza o libreria collegata
    • Miglioramenti alla pianificazione e alla gestione degli errori, per consentire di riavviare le attività su server di processo non disponibili e server di processo virtuali con bilanciamento del carico con round-robin ponderato
  • Miglioramenti a Talend Administration Center (TAC):
    • Opzioni Single Sign-on (SSO) aggiuntive, tra cui il supporto per Ping Identity PingFederate Server e Microsoft Active Directory Federation Services
    • Maggiore visibilità sulle attività in corso tramite controllo e logging di sicurezza, che tiene traccia di tutte le interazioni degli utenti quali accesso, cambiamenti e modifiche di configurazione
    • Nuovo ruolo di Auditor per la configurazione e l’accesso al log di controllo, per garantire un maggiore livello di sicurezza
  • Talend Cloud riduce i tempi di verifica e debug a pochi secondi grazie a un motore di test gratuito e alla capacità di eseguire il debug remoto di processi Big Data e il debug di processi su Talend Cloud Engines o Remote Engines
  • Gli aggiornamenti relativi all'integrazione continua includono l’uso di standard Maven per build incrementali in Studio, un supporto più ampio per Git incluso Bitbucket Server 5.x, il supporto Nexus 3 per il repository di artefatti Talend, comandi Maven standard per l’integrazione di dati e applicazioni (anteprima tecnica) e la capacità di ampliare facilmente il processo di build tramite plug-in Maven e POM (Project Object Models) personalizzati
  • Incrementa la produttività creando componenti Talend personalizzati. Effettua un unico sviluppo con Talend Component Kit e riutilizzalo in tutti i prodotti e stili d’integrazione Talend – in batch o in tempo reale, per l'integrazione di dati o per i Big Data, in azienda o nel cloud
  • Risparmia tempo comparando automaticamente le colonne con nome simile tramite l’automappatura fuzzy intelligente di tMap, che utilizza algoritmi di data quality (Levenshtein, Jaccard) per ottenere corrispondenze fuzzy
  • Maggiore flessibilità e produttività nella progettazione dei processi, con possibilità di cambiare i nomi delle tabelle in fase di esecuzione tramite ELTMap, oltre a nuove routine per adattarsi alle modifiche degli schemi
Data QualityAumenta l'integrità dei dati su cloud e on-premise che passano attraverso l'azienda:
  • Regole di sopravvivenza migliorate con supporto per ogni colonna, per avere un controllo più accurato del valore master che si desidera mantenere
  • Nuovo componente tPatternMasking per definire nuovi tipi di pattern di mascheramento ai fini della privacy e del controllo della sicurezza
  • Importa ed esporta tipi semantici dall'interfaccia di Dictionary Service per semplificare la gestione della promozione di tipi semantici nei vari ambienti
  • Le API REST di Talend Dictionary Service sono ora disponibili pubblicamente e autodocumentate tramite Swagger. Puoi utilizzare Talend Dictionary Service in scenari di integrazione di dati/applicazioni e popolarlo in modo programmatico
  • L’interfaccia di Dictionary Service è stata tradotta in francese
Data PreparationOffri la migliore esperienza di preparazione dati con la massima scalabilità:
  • Con il servizio Cloud Dictionary puoi definire nuovi termini aziendali per i tuoi dati, facilitando la comprensione e l’utilizzo da parte delle persone e delle macchine
  • Opzioni di connettività estesa con i connettori self-service per Redshift e Snowflake
  • Selezione della preparazione dinamica in un processo Talend per migliorare la manutenzione e la produttività
  • Maggiore flessibilità con le nuove funzioni di preparazione dati: deduplicazione di base, standardizzazione tramite dizionari di dati, riempimento dall'alto, generazione di una sequenza, gestione delle percentuali
  • Il supporto per caratteri di enclosure/escape personalizzati per i file CSV consente di gestire file CSV non standard o complessi senza dover normalizzare i file all'esterno di Talend Data Preparation
  • L’interfaccia utente supporta ora le lingue Francese e Giapponese
Data StewardshipIdentifica, gestisci e risolvi velocemente qualsiasi problema di integrità dei dati:
  • Offri alle persone che conoscono meglio i dati Talend Cloud Data Stewardship, un’applicazione di gestione e convalida dei dati self-service che consente ai team di identificare, gestire e risolvere velocemente ogni problema di integrità dei dati
  • Con il servizio Cloud Dictionary puoi definire nuovi termini aziendali per i tuoi dati, facilitando la comprensione e l’utilizzo da parte di altri, che siano persone o macchine
  • Gli utenti possono ora importare ed esportare campagne e modelli di dati direttamente dall'interfaccia utente di Talend Data Stewardship. Questo semplifica la conformità alle policy IT, permettendo di gestire la promozione della configurazione in diversi ambienti (solo software in download)
  • L’interfaccia utente supporta ora le lingue Francese e Giapponese
MDMProgetta, includi, crea, gestisci e aggiorna i tuoi dati master più velocemente:
  • Gestione di licenze e identità con Talend Administration Center per una maggiore sicurezza
  • Risparmio di tempo grazie all'accesso single sign-on con Data Preparation e Data Stewardship
  • Miglioramento dell’API REST (operatore “IN”)
  • Regole di sopravvivenza per colonna nelle funzioni di matching integrate in MDM
  • Controllo di tutte le azioni degli utenti, inclusi login/logout e implementazione della configurazione, per la conformità della sicurezza
Talend Data MapperAumenta le prestazioni delle tue mappature complesse:
  • tHMapRecord è in grado sia di ricevere che di inviare strutture gerarchiche complesse per accodare output come Kafka (tKafkaOutput) e Kinesis (tKinesisOutput)
  • tHMap può creare diversi output da un singolo input, migliorando così la produttività
  • Nuove funzioni di linguaggio per trasformazioni ed espressioni regolari, tra cui maiuscolo, minuscolo, traduzione e funzione Contains
  • Conversione migliore tra dati gerarchici e record piatti

Amplia i confini delle tue integrazioni di dati

Per scoprire quali componenti sono inclusi in ogni prodotto Talend, visita help.talend.com.

Distribuzioni Hadoop nuove e aggiornate

  • Amazon EMR 5.8
  • Cloudera CDH 5.12, 5.13
  • MapR 6.0
  • Spark 2.2

Componenti nuovi e aggiornati

  • Amazon S3
  • Cloudera Kudu
  • Couchbase
  • FTP
  • Hbase
  • Hive
  • MapR-DB OJAI
  • Marketo
  • Marklogic
  • Microsoft Azure Data Lake Store
  • Microsoft Dynamics CRM 2016 (on-premises)
  • MongoDB
  • Neo4J
  • Oracle Cloud
  • SAP Business Suite
  • SAP Hana
  • SAP s/4Hana
  • Snowflake
  • Sybase
  • Vertica