O que você vai aprender?
A função “Identificar linhas duplicadas ” está disponível na versão 2024.1 do Tableau Prep, na ferramenta de limpeza. Podemos usá-la para detectar linhas duplicadas em uma coluna específica ou na base inteira.
Introdução:
Para demonstrar como esse processo acontece vamos usar uma base de dados como exemplo.
Utilizaremos a base “Superloja”, disponível no diretório Tableau.
Como utilizar a função
A função “Identificar linhas duplicadas ” pode ser encontrada na ferramenta de Limpeza, como pode ser visto abaixo:
Se nenhuma coluna for selecionada, a função irá identificar linhas duplicadas na base inteira. Será criada uma nova coluna chamada “É linha duplicada?” que vai indicar se aquela linha é exclusiva ou está duplicada (todos os campos são iguais a outra linha anterior).
Na imagem acima, podemos ver que em toda nossa base, apenas uma linha era totalmente duplicada.
Agora vamos olhar se possuímos valores duplicados na coluna “ID da Compra”. Para isso, selecione a coluna e clique em “Identificar linhas duplicadas”.
E como podemos ver, quando temos valores duplicados para a coluna “ID da Compra”, o valor de “É linha duplicada?” aparecerá como “Duplicar”.
Lembrando que podemos selecionar mais de uma linha ao mesmo tempo, então se, por exemplo, selecionarmos as colunas “ID da Compra” e “Estado” e clicarmos em “Identificar linhas duplicadas”, vamos obter o resultado Duplicado apenas se uma linha dessas duas colunas apresentarem valores duplicados: