O que você vai aprender?
Nessa dica você irá aprender a utilizar ferramenta de Imputation e suas possibilidades de configuração.
INTRODUÇÃO
Um dos processos mais comuns de preparação de dados é a limpeza de valores, removendo números nulos e complementando-os com 0.
Em algumas situações precisamos criar uma base de dados mais específica, substituindo um certo valor por outro a partir de um cálculo. Dentro do Alteryx podemos utilizar várias ferramentas para calcular e substituir os dados, ou podemos utilizar a ferramenta de Imputation que executa esta tarefa de forma única.
Para essa demonstração, utilizaremos a seguinte base de dados:
PASSO 1: SELECIONANDO AS COLUNAS
Assim como na ferramenta de Data Cleansing, o primeiro passo é selecionar as colunas que serão tratadas pela ferramenta, mas dessa vez, apenas colunas do tipo numérico poderão ser selecionadas.
Configuração imputation:
PASSO 2: DEFINIR O VALOR QUE SERÁ SUBSTITUIDO E QUAL SERÁ SEU SUBSTITUTO
Em um segundo momento definimos o tratamento a ser feito, podendo substituir valores NULOS ou um valor específico determinado
E em sequência informamos em sua configuração, quem será o substituto, podendo ser esse cálculo, como por exemplo uma média, mediana ou moda das linhas preenchidas na coluna.
PASSO 3: CONFIGURAR A SAÍDA DOS DADOS
O último passo é determinar se a tratativa configurada anteriormente irá substituir os dados da coluna original, ou criar uma coluna com os dados ajustados.
Nesta etapa temos 2 checkbox que podem ser marcadas simultaneamente se necessário:
- Include imputed value indicator field
Irá criar colunas com o formato booleano, indicando com 1 as linhas que sofreram imputation e 0 as linhas que não foram alteradas.
- Output imputed value as separate field
Irá criar colunas com os dados alterados pela ferramenta imputation, gerando assim uma coluna nova e mantendo os dados originais também
Seguindo estes passos temos a seguinte configuração final da ferramenta:
E abaixo, o resultado: