fbpx

A utilização de RPA (Robotic Process Automation) tem crescido percentualmente pelo menos dois dígitos ao ano com o objetivo de eliminar tarefas repetitivas de negócios. Os exemplos mais comum incluem a integração entre sistemas digitais, a extração e migração de dados entre legados, preencher informações em sistemas e sites e a tomada de decisões simples.

Já tarefas um pouco mais complexas envolvem o uso de inteligência, interpretação e incluem o manuseio de documentos como formulários manuscritos e/ou digitalizados, assim como notas fiscais, faturas, ordens de compra, pedidos, editais, etc. Muitos processos digitais iniciam com entradas manuscristas ou digitalizadas que precisam ser extraídas, interpretadas e tabuladas. Esse é uma grande dor para digitalização fim a fim de processos.

À medida que o RPA e o Machine Learning estão evoluindo para o conceito de Hyperautomation, podemos fazer uso de bots em conjunto com inteligência para lidar com essas tarefas mais complexas. Em um estudo recente com equipes da área financeira e contábil de empresas que vem utilizando RPA, em média, apenas 29% das funções tem sido automatizadas. Inclusive, esse é um bom indicador que tratarei em um próximo artigo: penetração/capilaridade das automações para medição da densidade digital.

Antes de nos aprofundarmos no Document Understanding, vamos falar sobre a função dos robôs para o Document Understanding. Esses ajudantes totalmente invisíveis tornam nossa vida muito mais confortável. Ao contrário de filmes e séries, esses robôs não são dispositivos físicos ou programas de inteligência artificial que ficam em uma área de trabalho e pressionam botões para executar tarefas. Podemos pensar neles como assistentes digitais treinados para processar documentos lendo e usando aplicativos como nós. Do lado funcional, os robôs são bons em melhorar o desempenho e a eficiência de um processo. Ainda assim, por ser um software autônomo, não podem avaliar o processo e tomar decisões cognitivas sem apoio. No entanto, se o aprendizado de máquina for integrado com sucesso, os bots se tornarão mais dinâmicos e versáteis.

Por exemplo, os robôs utilizados para processamento de documentos podem gerenciar dados e outras funções no front e middle office realizando ações mais inteligentes, como eliminar entradas duplicadas ou resolver exceções ou desvios de sistema, evitando a propagação de erros. Além disso, os robôs podem ser treinados para ler, extrair, interpretar e agir com base nos dados dos documentos usando inteligência artificial (IA).

Umas das bases do Document Understanding é o OCR. Mas, o que essa tecnologia significa e como funciona? Literalmente, OCR significa Optical Character Recognition. É uma tecnologia amplamente difundida para reconhecer texto dentro de imagens, como documentos digitalizados e fotos. A tecnologia OCR é usada para converter virtualmente qualquer tipo de imagem contendo texto escrito (digitado, manuscrito ou impresso) em dados de texto legíveis por máquina.

A tecnologia OCR tornou-se popular no início dos anos 1990, enquanto tentava digitalizar jornais históricos. Desde então, a tecnologia passou por diversas melhorias. Hoje em dia, as soluções oferecem precisão de OCR quase perfeita. Métodos avançados como OCR Zonal são usados para automatizar fluxos de trabalho baseados em documentos complexos.

Não existe uma única abordagem tecnológica para extração de informações de documentos assim como não existe somente um tipo de documento. Existem abordagens baseadas em regras e abordagens baseadas em modelos de OCR para lidar com dados de diferentes estruturas de documentos, como veremos a seguir.

Documentos Estruturados

Neste tipo de documento, os layouts e modelos são geralmente fixos e quase consistentes. Todos esses documentos serão idênticos e terão os mesmos campos como Número de Identificação, Nome da Pessoa, Idade e alguns outros nas mesmas posições. Mas apenas os detalhes variam. Pode haver algumas restrições, como estouro de tabela ou dados não arquivados.

Normalmente, a abordagem recomendada usa um modelo ou mecanismo baseado em regras para extrair as informações para documentos estruturados. Isso pode incluir expressões regulares ou mapeamento de posição simples com OCR. Portanto, para integrar robôs para automatizar a extração de informações, podemos usar modelos pré-existentes ou criar regras para nossos dados estruturados. Há uma desvantagem em usar a abordagem baseada em regras, uma vez que depende de partes fixas e, mesmo pequenas alterações na estrutura do formulário, podem causar falhas nas regras.

Documentos semiestruturados

Esses documentos contêm as mesmas informações, mas são organizados em posições diferentes. Normalmente, as abordagens baseadas em regras não oferecem alta precisão; portanto, é necessário incluir o aprendizado de máquina e os modelos de aprendizado profundo para a extração de informações usando OCR. Como alternativa, em alguns casos, podemos usar modelos híbridos envolvendo regras e modelos de ML. Alguns modelos pré-treinados populares são FastRCNN, Attention OCR, Graph Convolutions para extração de informações em documentos.

Documentos não estruturados

O RPA hoje é incapaz de gerenciar dados não estruturados diretamente, exigindo, portanto, que os robôs primeiro extraiam e criem dados estruturados usando OCR. Ao contrário dos documentos estruturados e semiestruturados, os dados não estruturados não têm alguns pares de valores-chave. Para que os modelos de ML possam processá-los com precisão, os robôs precisam aprender como traduzir o texto escrito em dados acionáveis, como um e-mail, número de telefone, endereço, etc. Por exemplo, modelo aprenderá que padrões numéricos de 9 ou 13 dígitos devem ser extraídos como números de telefone e texto enorme contendo códigos de cinco dígitos e substantivos diferentes como texto. Para tornar esses modelos mais precisos, também podemos usar técnicas de processamento de linguagem natural (PLN), como reconhecimento de entidade nomeada e incorporação de palavras.

O principal motivo para a integração de bots para a compreensão de documentos é automatizar todo o processo do início ao fim. Tudo o que precisamos fazer é criar um fluxo de trabalho para os bots aprenderem, sentar e relaxar. Durante o processo de validação, podemos interagir com as informações e análises realizadas pelos bots (Human in the loop) onde quaisquer erros ou fraudes são identificados e, por regra de negócio, eventualmente tomamos a decisão final.

Para tarefas gerais, como extração de tabelas e informações, teremos que criar diferentes canais de aprendizado para diferentes tipos de documentos. Isso leva à construção de várias soluções e à implantação de vários modelos com diferentes abordagens. Melhorar e padronizar processos é um caminho assim como dispor de uma tecnologia e uma plataforma de automatização versátil te deixa com mais opções. Por exemplo, podemos integrar vários serviços terceiros especializados em leitura de documentos, ou modelos prontos, para ganhar qualidade em escala.

Vale lembrar que Document Understanding é a trinca de ases da automação de processos: redução de tempo, redução de atividades repetitivas e melhoria da qualidade com redução de retrabalho e com ganhos tangíveis. Sempre buscamos automatizar processos que irão gerar ganho de produtividade e, tipicamente, a extração de informações de documentos consome muito tempo, ocorre de maneira frequente, possui uma alta taxa de erros e o impacto da falha se desdobra em toda a cadeia gerando necessidade de controles, retrabalho, além do impacto na jornada do cliente interno e externo.

As plataformas de automatização líderes de mercado tem feito um ótimo trabalho para tornar a compreensão de documentos mais rápida e fácil. Seja com aplicação nativa ou terceira, hoje dispomos de soluções minimamente preparadas para serem implantadas, customizadas e treinadas num curto espaço de tempo. Dessa forma, considerar Document Understanding dentro do seu portfolio de soluções tecnológicas de Hyperautomation e Transformação Digital não é só possível, como também é necessário e urgente.

Gilberto Strafacci Neto

Chief Operating Officer da Practia Brasil (www.practiaglobal.com.br) e Senior Partner do Setec Consulting Group (www.setecnet.com.br). Master Business Essentials CORe Program pela Harvard Business School, MBA em Liderança e Inovação, Engenheiro Mecânico pela Escola Politécnica da Universidade de São Paulo, Master Black Belt, Agile Coach, Design Thinker, Manager 3.0, Certified Six Sigma Master Black Belt pela American Society for Quality (ASQ) e Certified Scrum Master pela Scrum Alliance e Facilitador Certificado LEGO® SERIOUS PLAY® (Ver PERFIL).

0
    0
    Meu Carrinho
    Carrinho vazioRetornar para o site