quarta-feira, 10 de maio de 2017

NUIX - Criando filtro para localizar CPF e CNPJ



Olá pessoal, resolvi escrever este post para ajudar algumas pessoas que tem se deparado com o problema de como editar a entidade no Nuix, que realiza busca por CPF que por padrão vem configurado para encontrar somente o SSN US (CPF Americano), de antemão vou demonstrar o passo a passo para alterar somente este parâmetro mas, o procedimento serve para os demais filtros de ENTIDADES da ferramenta. Além disso o código foi desenvolvido para encontrar também padão de CNPJ.

Vale ressaltar que deve-se possuir privilégios administrativos no diretório de instalação do sistema.

Cabe destacar ainda que alguns filtros de entidade do NUIX funcionam com REGEX (Expressões Regulares), para quem não tem muito conhecimento sobre esta técnica de desenvolvimento segue o link para maiores detalhes: Aprenda REGEX. Este procedimento funciona para as versões 6 e 7 do produto. Então vamos lá !

1º Passo - Acessar o diretório C:\Program Files\NUIX\NUIX (versão)\user-data\Named Entities, caso tenha instalado no diretório padrão, caso contrário basta acessar o diretório de instalação do produto e procurar pelo diretório user-data\Named Entities.


2º Passo - Crie um arquivo utilizando o Bloco de Notas do Windows ou Notepad++, e cole o seguinte texto:

# Regular expressions matching CPF BRL numbers.
# TODO: add more CPF here.

# Matches CPF and CNPJ BRL
([0-9]{2}[\.]?[0-9]{3}[\.]?[0-9]{3}[\/]?[0-9]{4}[-]?[0-9]{2})|([0-9]{3}[\.]?[0-9]{3}[\.]?[0-9]{3}[-]?[0-9]{2})

Em seguida, salve o arquivo com o seguinte nome: CPF-CNPJ.regexp e cole o mesmo no diretório mencionado no passo anterior, para facilitar a localização do filtro dentro da ferramenta copie e cole o arquivo CPF.png (clique aqui para baixar) dentro deste mesmo diretório, este será o ícone mostrado ao selecionar o filtro no produto. Caso prefira você pode copiar o arquivo "personal-id-num" e editá-lo.

3º Passo - Continuando no diretório em questão localize o arquivo "regex.properties", abra o arquivo e insira o seguinte texto:

NamedEntities.CPF-CNPJ.group = Named Entities
NamedEntities.CPF-CNPJ.title = CPF-CNPJ
NamedEntities.CPF-CNPJ.icon = CPF.png



Salve e feche o arquivo.


4º Passo - Ao criar um caso no Nuix, marque as opções de processamento de texto conforme abaixo, para habilitar o filtro de entidades.



5º Passo - Ao término do processamento clique em "View by > Entities".


Em seguida será apresentado o filtro criado CPF-CNPJ


Selecione o mesmo para que sejam exibidos os resultados obtidos.


Pronto !

Esta solução valida os seguintes formatos: 00000000000, 00000000000000, 000.000.000-00, 00.000.000/0000-00 e 000000000-00 ou 00000000/0000-00, Os pontos e traços são opcionais em cada uma das posições.

O que não é aceito, por exemplo é o padrão: 000-000-000-00, que pode ser acrescentado sem nenhum problema.

Espero ter ajudado !