P A T H

Por que a Alteryx machine learning?

INTRODUÇÃO:

O campo de Machine Learning nos fornece muitas ferramentas que podemos usar tanto para a compreensão dos dados quanto para a previsão. Profundos conhecimentos e experiência são normalmente necessários para fazer projetos ML de forma eficaz e correta, uma vez que a ciência dos dados e o aprendizado de máquinas estão cheios de buracos e campos minados que podem descarrilar um projeto, mesmo para especialistas.

 

A Alteryx ML automatiza muitos tipos de análises e verificações de dados para ajudá-lo a evitar estes problemas, para que você possa estar mais confiante em seus resultados. Quer você seja um Analista de Dados ou especialista em domínio que é novo na Predictive Analytics e ML, ou um Cientista de Dados que passa seus dias fazendo este tipo de trabalho, a Alteryx Machine Learning pode facilitar sua vida e ajudar a garantir que seus projetos sigam as melhores práticas.

O que o Machine Learning pode fazer por mim?

O Machine Learning (ML) tem tudo a ver com encontrar automaticamente padrões em seus dados. Estes padrões podem ajudá-lo a compreender as informações escondidas em seus dados para que você possa tomar medidas para ajudar em suas atividades do dia a dia. A Alteryx Machine Learning tem ferramentas para encontrar automaticamente alguns destes padrões para você, e facilita a exploração de seus dados. Em vez de ter que verificar manualmente cada problema possível, a Alteryx ML direciona sua atenção para onde ela é mais necessária.

 

Após investigar seus dados brutos, você pode treinar modelos para obter ainda mais informações. Os modelos de Machine Learning encontram padrões automaticamente e os colocam à superfície para que você os explore usando várias ferramentas. Eles também permitem que você faça previsões sobre novos dados. A Alteryx Machine Learning toma automaticamente muitas ações para ajudar a garantir que você possa contar com estas previsões.

Verificação de dados e qualidade dos dados

Logo de cara, a Alteryx ML faz uma série de verificações de dados para chamar nossa atenção para problemas específicos que possam estar dentro de nosso conjunto de dados.

O Assistente ML

O texto Assistente ML disponível na barra lateral direita do Alteryx ML lhe dá uma orientação clara em todas as telas e visualizações do produto. Tudo o que vemos no Alteryx ML é explicado lá, assim como a orientação sobre quaisquer ações que você deve tomar.

Engenharia Automatizada de Recursos

 

Um dos pontos fortes da Alteryx Machine Learning é sua capacidade de descobrir automaticamente variações das características de seu conjunto de dados original que podem ajudar os modelos a encontrar os padrões ocultos em seus dados. O botão Avançado abre um diálogo que lhe permite controlar este processo, bem como dar-lhe opções especializadas para o processo de treinamento do modelo.

Engenharia Automatizada de Recursos

Um dos pontos fortes da Alteryx Machine Learning é sua capacidade de descobrir automaticamente variações das características de seu conjunto de dados original que podem ajudar os modelos a encontrar os padrões ocultos em seus dados. O botão Avançado abre um diálogo que lhe permite controlar este processo, bem como dar-lhe opções especializadas para o processo de treinamento do modelo.

Treinamento de modelos

Cada algoritmo de modelo tem seus pontos fortes e fracos em termos de precisão, e no tradeoff entre interpretabilidade/explicabilidade do modelo. Modelos GBM como XGBoost, lightGBM e CatBoost geralmente têm o maior desempenho de previsão, enquanto aqueles que são extensões de regressão linear (Elastic Net, Ridge e Regressão Logística) são mais facilmente interpretados.

Os algoritmos de treinamento do modelo, primeiro encontram padrões que podem ajudar a separar as classes, e depois codificam esses padrões em uma representação que podemos usar para fazer previsões.

Avaliação de nossos modelos

Como a Alteryx ML treina modelos, ela os acrescenta a uma prancha líder que podemos classificar pela métrica de desempenho do modelo de nossa escolha. É importante que a métrica que usamos para medir o desempenho da previsão corresponda ao seu caso de uso. Felizmente, o texto do Assistente ML lhe dá uma orientação clara sobre o que cada métrica significa.

Lotes de Probabilidade

As várias métricas do modelo e a Confusion Matrix nos dão um rico conjunto de medidas sobre como nosso modelo está fazendo previsões, mas o Probability Plot nos dá algo mais: ele nos mostra visualmente o quão bem nosso modelo está separando as duas classes. Quanto menos filas no meio da trama, melhor nosso modelo provavelmente generalizará os dados futuros que lhe lançarmos, o que significa que nossas previsões serão mais estáveis e confiáveis.

Lotes de Dependência Parcial

Os gráficos de dependência parcial nos mostram como nossa meta muda quando uma característica específica é variada ao longo de seu alcance.

Simulações

Essa é uma característica do ML que pode nos ajudar a ganhar intuição e confiança sobre como nosso modelo está funcionando, e que também pode nos ajudar a explicar suas previsões para linhas individuais e a entender como influenciá-las.

O fluxo de trabalho ML

O fluxo de trabalho ML é exploratório e iterativo. À medida que avançamos, obtemos insights sobre nossos dados. Podemos descobrir que queremos voltar às fases iniciais do processo para fazer mudanças. A Alteryx ML facilita isso ao rastrear nossos passos na barra lateral esquerda e nos permite retornar a qualquer momento simplesmente clicando na etapa.

Derivação de dados

Se você pretende usar seu modelo para fazer previsões no futuro, guarde seu projeto para mais tarde e continue coletando dados que incluam o valor real de sua variável alvo. Os dados podem flutuar com o tempo, o que significa que uma ou mais características podem mudar.

Se você voltar ao seu projeto, você pode aplicar seus dados mais recentes como um conjunto de espera para verificar se seus modelos ainda estão funcionando bem. Se não estiverem, você precisará reciclar seus modelos nos dados de treinamento mais recentes.

Próximos passos com a Alteryx Machine Learning

Agora que você já viu a maioria das características da Alteryx Machine Learning, é hora de experimentá-la em seus próprios conjuntos de dados! Lembre-se, os dados que temos disponíveis nem sempre serão preditivos da coluna em que estamos interessados, mas é surpreendente a frequência com que são. Se seu problema pode ser enquadrado como a previsão de um valor numérico (regressão) ou a previsão de um conjunto discreto de escolhas (classificação), é rápido e fácil experimentá-lo!

Boa sorte no seu caminho com o Alteryx ML!

 

9 de Junho de 2022

Gostou dessa ferramenta? Corre lá para ver as possibilidades!

Language