Una giornata con uno sviluppatore che si occupa di integrazione dati: Esecuzione, test e debug [Parte 3]

In questa puntata di Una giornata con uno sviluppatore che si occupa di integrazione dati verrà illustrato come eseguire processi o job ed effettuare i test e il debug all'interno di Talend Studio. In questo video, e nel testo dettagliato riportato di seguito, vengono illustrate le diverse modalità di esecuzione dei job e viene spiegato come eseguire test con set di dati più piccoli, come utilizzare le funzioni di registrazione per eseguire il debug e come usare la funzione di debug integrata in Studio.

Debug - Metodo uno

Ecco qui un processo semplice che legge i dati da un file di grandi dimensioni, li aggrega e li scrive in una tabella.

screenshot talend studio

Nella scheda Run (Esecuzione) andiamo alla funzione Run (Esegui) e facciamo clic su Debug e quindi sul pulsante Next (Avanti). Verrà creato il job e avviata l'esecuzione del processo. Possiamo osservare le varie trasformazioni a cui vengono sottoposti i dati con tutti gli attributi.

Il file ha diverse colonne e il tMap lo restringe. Ora voglio ridurre il set di dati in modo da visualizzare qui un volume di dati minore.

Se faccio clic sul componente del file, ho a disposizione un campo per impostare il limite di campi, ad esempio dieci. Torno su Run, Debug Run (Esecuzione, Esecuzione debug) e vedo che l'esecuzione viene completata con solo 10 record facendo clic sul pulsante Next (Avanti) per dieci volte.

Posso anche osservare le caratteristiche degli attributi di debug per tutti i componenti. Posso trascinarle e spostarle per vedere più facilmente quali dati vengono effettivamente scritti nel database qui. E posso vedere la sequenza che viene creata nel tMap.

Debug - Metodo due

Un altro modo per eseguire il debug del processo consiste nell'aggiungere in Studio l'output a schermo utilizzando il componente tLogRow e collegando l'output dall'ultimo tMap al tLogRow.

Quindi mi basta creare una nuova riga di output nel tMap. Vado nel tMap, dove posso connettere gli attributi del tMap che voglio inserire in tLogRow semplicemente selezionandoli e trascinandoli qui:

screenshot talend studio

Se devo aggiungere una sequenza, mi assicuro che venga generata correttamente aggiungendo una nuova colonna.

screenshot talend studio

La chiamo seq che sta per "sequenza". E devo impostarla come integer, modificando il valore in int. Poi aggiungo una funzione nell'Expression Builder (Generatore di espressioni) e specifico una sequenza numerica. A questo punto la mia sequenza è pronta.

Per vedere i dati in un formato tabella facilmente leggibile, posso modificare l'impostazione. Se voglio visualizzare più output posso aumentare le righe, quindi nel file modifico l'impostazione su 100 righe. E se lancio l'esecuzione in modalità standard, posso vedere a schermo tutti gli output di dati che sono stati aggregati con i numeri della sequenza.

Per maggiori dettagli su questi due metodi di debug, guarda il video qui sopra. Nel tutorial successivo vengono spiegate le funzioni di progettazione di base.

| Ultimo aggiornamento: agosto 7th, 2019