O que você vai aprender?
Já se deparou alguma vez com dados que não estavam organizados da maneira que você gostaria? Aposto que pensou em inúmeras maneiras de reorganiza-los e talvez até se perdeu no processo.
Hoje mostraremos uma maneira muito eficaz de tratar seus dados para melhor visualização usando a Transpose Tool. Temos pronto um exemplo prático para explicar como funciona essa ferramenta.
Usaremos esse registro das compras de 10 pessoas. Não existe nada impossível de ser feito à mão em alguns minutos, mas servirá para ilustrar oque vamos fazer.
Digamos que eu seja o estoquista do mercado e precise saber o número de itens que foram vendidos, para organizar novamente as prateleiras e repor os mesmos.
Usando a imagem acima não seria difícil fazer-lo, mas eu posso facilitar ainda mais o processo, mudando a forma com que estão organizados esses dados. É aí que entra a Transpose tool.
Tratando nossos dados com as configurações a seguir, nós pedimos que a ferramenta organize todas as colunas de itens, gerando uma coluna única com o total de itens vendidos por produto, que seria a “Transaction Number”.
Assim teremos somente 3 colunas, nossas colunas de itens se tornarão uma só, chamada “Name”, onde seus valores são os nomes das antigas colunas. Além disso, será criada uma coluna “Value” onde correlacionando com os itens da coluna “Name” mantemos os valores das antigas linhas.
A única diferença é que agora as linhas se repetirão várias vezes até atingir 80, mesmo tendo algumas linhas de valor nulo.
Marcando “Transaction Number” como a nossa coluna chave (Key Columns), dizemos para o Alteryx que queremos que as outras colunas se baseiem nela, e todo resultado delas será repetido N vezes, sendo N o número de colunas que irão virar linhas, abaixo selecionamos as colunas de dados (Data Columns), são as colunas que irão se tornar dados para a coluna chave organizar. E o resultado:
Vale ressaltar uma outra função de nossa “Transpose Tool”. Ela pode ser dinâmica, incluindo automaticamente à tratativa qualquer nova coluna que apareça na base de dados, basta marcar essa check-box no final da escolha das Data Columns.
Agora que nossos dados estão melhor organizados podemos partir para a próxima etapa, que é remover os valores nulos. Já que nossa base é organizada de uma maneira em que sempre temos 8 colunas e algumas pessoas não chegaram a comprar 8 itens, os espaços vazios ficam como nulos, iremos remover todos esses espaços para trabalharmos com menos linhas ainda.
Usaremos para isso a ferramenta Filter (Filtro) e assumiremos que a saída verdadeira para os valores serão aquelas em que nenhum valor for vazio.
Para finalizar, utilizamos a ferramenta de Summarize para saber quanto de cada produto foi comprado, facilitando a reposição dos mesmos. Abaixo temos a configuração da ferramenta.
Configurando a ferramenta dessa maneira agrupamos nossas linhas pelo nome de cada alimento, ou seja, cada alimento que se repetir irá se juntar ao anterior e adicionar +1 a contagem. Sendo assim:
E com isso agora temos a perfeita contagem de quantas vezes cada um dos produtos foi vendido.
Mas a dica não para por aqui. Com esse exemplo mais simples, ficou muito mais fácil explicar o uso de cada ferramenta, mas fica uma dúvida. O tamanho da nossa base seria um problema para nosso fluxo? É oque vamos testar agora!
Nossa base de dados agora está bem maior, ao invés de 10 temos 500 linhas, e totalmente desorganizadas, cereal, ovos, pão e leite para todo lado, ainda bem que já temos um fluxo pronto para organizar isso.
Usando somente essas 4 ferramentas nossa base se transforma aos poucos. As configurações ainda são as mesmas e nada foi mudado. Logo após a primeira ferramenta laranja, nossa Transpose Tool, nossos dados ficaram assim:
4 mil linhas é bem mais que da última vez, mas ainda vamos tirar as linhas nulas com a ferramenta a azul, Filter Tool.
Viu a diferença que uma só ferramenta pode fazer no fluxo? Diminuímos o número de linhas praticamente para a metade. E agora, mantendo todas as configurações, temos nosso resultado após a ferramenta de Sumarize.
Todos aqueles dados embaralhados viraram exatamente oque precisávamos, a quantidade certa de cada item que saiu do nosso mercado fictício.