P A T H

Como usar a nova ferramenta de text analysis para Alteryx

O que você vai aprender?

Com a chegada do Alteryx Intelligence Suite, na versão 2020.2, foi lançada a nova paleta de ferramentas de text mining, e com ela, sete novas ferramentas. No entanto, para usar essas ferramentas você precisa comprar a licença do Intelligence Suite.

Nessa dica, você irá aprender como usar uma nova ferramenta para realizar text analysis no Alteryx, sem precisar comprar a licença do Alteryx Intelligence Suite.

INTRODUÇÃO

Dados textuais estão em todo lugar. São 1,4 bilhão de postagens por dia apenas no Facebook e no Twitter. Cada vez mais empresas desejam analisar dados textuais, como e-mails, pesquisas, logs de centrais de atendimento e fluxos de mídia social como blogs, postagens em fóruns, tweets, feeds de notícias para entender melhor o que as pessoas pensam e dizem sobre eles.

Existem muitas bibliotecas Python de código aberto para executar tarefas de processamento de linguagem natural com funcionalidades incríveis. Essa ferramenta foi criada para colocar o poder dessas bibliotecas nas mãos de analistas de dados que não sabem codificar em Python, e também, tornar o trabalho mais fácil para aqueles que sabem.

Passo 1: Baixe a ferramenta

O instalador pode ser baixado aqui. Na pasta você encontrará duas versões do instalador, ao lado de outras ferramentas.

Se estiver usando a versão do Alteryx anterior a 2020.2, você precisará do instalador do Text Analysis v3 – Pre 2020.2.yxi.

Caso contrário, baixe o arquivo chamado Text Analysis v3.yxi.

Você precisará de direitos de administrador para instalar a ferramenta. Se você for solicitado a instalar para o usuário atual ou todos os usuários, selecione todos os usuários.

Após a instalação, a ferramenta aparecerá na paleta Text Mining se você estiver usando a versão 2020.2 e mais recente, caso contrário, você a encontrará na categoria Desconhecido. O ícone é parecido com este:

Passo 2: Entendendo a interface da ferramenta 

A ferramenta possui uma entrada e três saídas. A saída principal é identificada como “O”, ela sempre conterá todas as linhas da entrada.

As outras duas saídas são opcionais. Elas podem estar vazias ou ter mais de uma linha para cada linha de entrada. A fim de poder juntar os registros das saídas opcionais aos registros na saída principal, a ferramenta gera um campo ‘record_id’ em cada saída.

Essa é a interface para a saída principal:

Selecione o campo de origem que contém os dados de texto que você deseja analisar. Em seguida, marque as métricas e funções que deseja incluir na saída. Passar o mouse sobre o ícone 🛈 fornece informações sobre a métrica ou função. Esteja ciente de que processar algumas dessas tarefas consome muito tempo.

Você encontrará duas saídas opcionais rotuladas como “1” e “2”. As interfaces de usuário delas são idênticas.

As tarefas acima podem ser selecionadas para as saídas opcionais. Se você precisar realizar mais de dois desses procedimentos, deverá colocar outra ferramenta na tela. Os ids gerados serão os mesmos para as mesmas linhas de entrada em ambas as ferramentas, portanto, você pode confiar neles se quiser fazer um join.

Passo 3 (opcional): Análise de sentimento!

O modelo usado no exemplo abaixo teve um desempenho excepcionalmente bom, e também funciona bem com frases mais longas. Ele dá uma precisão média de 95% ao classificar documentos em categorias positivas e negativas. Veja alguns resultados abaixo em comparação com o algoritmo VADER, que foi executado com cerca de 75% de precisão no mesmo conjunto de dados.

fonte: https://www.thedataschool.com.au/laszlo-dobiasz/i-introduce-my-new-text-analysis-tool-for-alteryx/

22 de Outubro de 2020

Pronto, você aprendeu como usar a nova ferramenta de text analysis para Alteryx!

Language