P A T H

Melhores práticas na entrada de dados

O que você vai aprender?

Nesta dica iremos mostrar algumas funções que temos na entrada de dados do Tableau prep e que irão otimizar muito o seu fluxo de dados.

Como bem sabemos, o quanto antes unirmos, limparmos e removermos dados indesejados, melhor será a performance  do nosso fluxo de dados. Tratar 10 colunas é mais rápido do que tratar 50 colunas, tratar 1.000 linhas é mais rápido do que tratar 28.000 linhas.

Então vamos conhecer abaixo algumas coisas que podemos fazer já na entrada de dados.

Identificador da linha: Uma função muito importante é a identificação da ordem original dos dados, para isso podemos ativar a coluna nativa “Source Row Number” que traz um identificador único e incremental para cada linha de dados.

Remover Colunas: Remover colunas desnecessárias melhora e MUITO a performance do fluxo, então o quanto antes realizarmos a limpeza, mais performático será o fluxo.

Filtrar Dados: Assim como a remoção de colunas, o filtro nos permite remover linhas indesejadas, como por exemplo, valores nulos. Resultando assim também em uma melhor performance do fluxo.

Unir Tabelas na Entrada: Como já sabemos, podemos fazer união vertical e horizontal dos nossos dados, mas quando vamos ler diversos arquivos ou tabelas, NÃO precisamos criar várias entradas para isso.

Podemos dentro da mesma ferramenta de leitura, configurar uma união vertical de dados.

A partir dessa configuração, também podemos filtrar por nome de tabelas e arquivos para tornar essa união dinâmica.

E aí? Já usava todas essas funcionalidades NA ENTRADA DE DADOS?

22 de Junho de 2023

Pronto! Agora você já sabe como otimizar seu fluxo Prep desde a entrada.

Language