P A T H

Como utilizar a ferramenta de Imputation

O que você vai aprender?

Nessa dica você irá aprender a utilizar ferramenta de Imputation e suas possibilidades de configuração.

INTRODUÇÃO

Um dos processos mais comuns de preparação de dados é a limpeza de valores, removendo números nulos e complementando-os com 0.

Em algumas situações precisamos criar uma base de dados mais específica, substituindo um certo valor por outro a partir de um cálculo. Dentro do Alteryx podemos utilizar várias ferramentas para calcular e substituir os dados, ou podemos utilizar a ferramenta de Imputation que executa esta tarefa de forma única.

Para essa demonstração, utilizaremos a seguinte base de dados:

PASSO 1: SELECIONANDO AS COLUNAS

Assim como na ferramenta de Data Cleansing, o primeiro passo é selecionar as colunas que serão tratadas pela ferramenta, mas dessa vez, apenas colunas do tipo numérico poderão ser selecionadas.

Configuração imputation:

PASSO 2: DEFINIR O VALOR QUE SERÁ SUBSTITUIDO E QUAL SERÁ SEU SUBSTITUTO

Em um segundo momento definimos o tratamento a ser feito, podendo substituir valores NULOS ou um valor específico determinado

E em sequência informamos em sua configuração, quem será o substituto, podendo ser esse cálculo, como por exemplo uma média, mediana ou moda das linhas preenchidas na coluna.

PASSO 3: CONFIGURAR A SAÍDA DOS DADOS

O último passo é determinar se a tratativa configurada anteriormente irá substituir os dados da coluna original, ou criar uma coluna com os dados ajustados.

Nesta etapa temos 2 checkbox que podem ser marcadas simultaneamente se necessário:

  • Include imputed value indicator field

Irá criar colunas com o formato booleano, indicando com 1 as linhas que sofreram imputation e 0 as linhas que não foram alteradas.

 

  • Output imputed value as separate field

Irá criar colunas com os dados alterados pela ferramenta imputation, gerando assim uma coluna nova e mantendo os dados originais também

Seguindo estes passos temos a seguinte configuração final da ferramenta:

E abaixo, o resultado:

01 de Dezembro de 2021

Pronto! Agora você sabe como utilizar a ferramenta Imputation e todas as suas possibilidades de configuração!

Language