P A T H

Como utilizar a ferramenta RegEX

O que você vai aprender?

Nessa dica você irá aprender a utilizar ferramenta RegEx e suas possibilidades de configuração.

INTRODUÇÃO

Muitas vezes precisamos substituir algum valor ou fazer alguma transformação em uma coluna de texto da base.

A ferramenta RegEx usa a sintaxe de expressão regular para separar, corresponder ou substituir dados.

Dica Alteryx 67 1

Muitas vezes precisamos substituir algum valor ou fazer alguma transformação em uma coluna de texto da base.

A ferramenta RegEx usa a sintaxe de expressão regular para separar, corresponder ou substituir dados.

Passo 1: Configurar a ferramenta

Dica Alteryx 67 2

 

  1. Selecione a Coluna a ser analisada.
  2. Em Formato a ser convertido
    • Insira sua Expressão regular. Use o botão “+” para acessar expressões regulares comuns que você pode precisar ao criar sua expressão.
    • Sem distinção entre maiúsculas e minúsculas: selecionado por padrão. Com essa opção marcada, as pesquisas não diferenciam letras maiúsculas e minúsculas.
  1. Em Saída, selecione o Método de saída a ser usado na análise. Em seguida, configure as propriedades relacionadas.
    • Substituir: substitua a expressão que você pesquisou por uma segunda expressão.
      • Texto de substituição: digite uma expressão para substituir sua expressão regular original identificando o grupo marcado pelo qual a expressão será substituída. Use o botão “+” para acessar expressões regulares comuns que você pode precisar ao criar sua expressão.
    • Tokenizar: separe os dados recebidos usando uma expressão regular. Essa opção funciona de forma semelhante à ferramenta Texto para Colunas, mas em vez de fazer a correspondência para remover o que você não quer, você faz a correspondência com o que deseja manter. A correspondência deve ser feita com o token inteiro e, se houver um grupo marcado, somente aquela parte é retornada.
      • Dividir em colunas: divida uma única coluna de dados em múltiplas colunas, em cada instância do delimitador especificado.
        • Número de colunas: defina quantas colunas devem ser criadas.
        • Colunas extras: selecione o comportamento aplicado a colunas extras.
          • Descartar extras com aviso: os dados que se estendem após a divisão são descartados e um aviso é gerado indicando que houve excesso de informações.
          • Descartar extras sem aviso: os dados que se estendem após a divisão são descartados e nenhum aviso é gerado.
          • Erro: os dados que se estendem após a divisão causam um erro e o processamento do fluxo de trabalho é interrompido.
        • Nome raiz de saída: insira um nome para servir de base para as colunas recém-geradas. As novas colunas são nomeadas com o nome raiz acrescido de um número crescente em série.
      • Dividir em linhas: divida uma única coluna de dados em múltiplas linhas, em cada instância do delimitador especificado. Use uma coluna de chave em seu registro para que você não perca o controle sobre qual valor veio de qual linha.
    • Analisar: separe a expressão em novas colunas e defina o Nome, o Tipo e o Tamanho das novas colunas. Uma nova coluna é criada na tabela Colunas de saída com os seguintes campos:
      • Nome: clique sobre o nome da coluna para inserir um novo nome.
      • Tipo: use a lista suspensa para selecionar o novo tipo de dados.
      • Tamanho: clique sobre o número para inserir um novo tamanho para os dados.
      • Expressão: preenchido automaticamente.
    • Corresponder: acrescente uma coluna contendo o número 1 se a expressão for correspondida e 0 se não for.
      • Nome da coluna para o status de correspondência: forneça um nome para a coluna acrescentada.

Gerar erro se não houver correspondência: marque para gerar um erro caso não haja correspondência entre a expressão e a cadeia de caracteres e encerrar o processamento do fluxo de trabalho.

Exemplo do método Tokenizar

Dada uma cadeia de dez caracteres “12345-6789”, devemos separa-la em duas colunas com os caracteres antes do “-” e os depois do “-” utilizando a configuração Tokenizar. Para isso, vamos usar a seguinte expressão regular: [^\-]+

Vamos configurar a ferramenta RegEx como mostrado abaixo.

Dica Alteryx 67 3

Com isso, originalmente nossos dados estavam assim:

Dica Alteryx 67 4

E passaram a ficar assim:

Dica Alteryx 67 4

18 de Novembro de 2021

Pronto! Agora você sabe como utilizar a ferramenta RegEx e todas as suas possibilidades de configuração!

Language