DOCUMENT PROCESSING SOLUTIONS


EXTRACT DATA   |   AUTOMATIC VALIDATION   |   FRAUD DETECTION





DOCUMENT PROCESSING SOLUTIONS

Colaboramos com as organizações, analisando as suas tecnologias e processos, para desenhar e implementar soluções de processamento e de verificação automática de documentos, extração de dados para alimentar diferentes sistemas e desenvolvimento de mecanismos de prevenção e deteção de fraude recorrendo às mais inovadoras metodologias, que se traduzem em ganhos operacionais, financeiros e que contribuem para um incremento da qualidade e da eficácia nos processos organizacionais.
Neste contexto, desenvolvemos soluções de processamento e de verificação automática de documentos de acordo com as necessidades específicas das organizações nas diferentes áreas de negócio (ex: Banca, Seguros, Utilities, Administração Pública, Privados, etc.).



TECNOLOGIA

A complexidade das necessidades dos nossos clientes requer uma abordagem diferente e oposta à que é utilizada tradicionalmente pela indústria das TI's. As soluções atuais para a digitalização em massa e gestão de documentos por grandes organizações ainda estão longe das suas perspetivas, devido à sua falta de robustez e à grande necessidade de interação humana para que os processos de negócio possam evoluir com sucesso. Esta oferta inovadora de serviços de valor acrescentado assenta em três pilares, Machine Learning, Print & Scan Channel e Optical Document Processing (ODP).


Machine Learning

É uma área da inteligência artificial que tem como objetivo desenvolver técnicas que permitem aos sistemas aprender com um conjunto de dados, que podem ser utilizados para detetar padrões, grupos (clusters) , prever o futuro ou para classificar amostras. Como por exemplo, os dados históricos de crédito que podem empregar algoritmos de Machine Learning para detetar padrões de pedidos de crédito fraudulento, e aplicar o modelo para auxiliar na classificação de risco de cada nova aplicação, ou utilizar o Machine Learning para corrigir erros após a aplicação de OCR para documentos digitalizados.
Existem vários algoritmos de Machine Learning e SVM ( Support Vector Machine), redes neurais e regressão logística, que geralmente são classificados em duas grandes categorias: Algoritmos Supervisionados, quando os dados fornecidos para testar os algoritmos são formados por um conjunto de amostras e a classe a que pertence cada amostra, tais como os dados solicitados nos pedidos de crédito, classificados como fraude ou nenhuma fraude e Algoritmos Não Supervisionados, aqueles em que as amostras de dados não são classificadas como pertencentes a qualquer classe.
A escolha de um determinado algoritmo requer um conhecimento adequado , tendo em conta o objetivo do problema a ser resolvido, a sua variação com o tempo, o poder computacional ou o volume de dados que estão disponíveis.


"Machine learning is a field of study that gives computers the ability to learn without being explicitly programmed"
Arthur Samuel. 1959

Print & Scan Channel

O conteúdo de documentos sujeitos a digitalização e processos de impressão são submetidos a grandes distorções que dificultam significativamente a implementação de soluções automatizadas de processamento de documentos. Esta digitalização binomial e a impressão são conhecidos como o Print & Scan Channel, e foi modelado matematicamente, utilizando técnicas avançadas de processamento de sinal em comunicações, onde o dispositivo de impressão é o transmissor, o papel o meio de transmissão, e o scanner, tablet ou smartphone o recetor.
As fórmulas que modelam o Print & Scan Channel define-se com um canal não linear, variante no tempo, no espaço e com alto nível de ruído, que relacionam matematicamente um documento original com a versão impressa e digitalizada. É precisamente esta caracterização que à priori define o comportamento puramente aleatório que apresenta o Canal de Impressão e Digitalização, que permite à equipa de engenheiros oferecer valor acrescentado diferenciado e único face aos serviços tradicionais de processamento de documentos, detetando sinais de adulteração nos documentos impressos , ou melhorar a interpretação do conteúdo de um documento digitalizado.
Existem vários algoritmos de Machine Learning e SVM ( Support Vector Machine), redes neurais e regressão logística, que geralmente são classificados em duas grandes categorias: Algoritmos Supervisionados, quando os dados fornecidos para testar os algoritmos são formados por um conjunto de amostras e a classe a que pertence cada amostra, tais como os dados solicitados nos pedidos de crédito, classificados como fraude ou nenhuma fraude e Algoritmos Não Supervisionados, aqueles em que as amostras de dados não são classificadas como pertencentes a qualquer classe.
A escolha de um determinado algoritmo requer um conhecimento adequado , tendo em conta o objetivo do problema a ser resolvido, a sua variação com o tempo, o poder computacional ou o volume de dados que estão disponíveis.

Optical Document Processing

Optical Document Processing (ODP) engloba todas as tecnologias aplicadas para processamento automático de todos os tipos de documentos digitais, desde faturas ao Cartão do Cidadão, para automação de processos em fluxos de organizações de gestão de documentos com a necessidade de processamento em massa de grandes volumes de documentos e de cumprimento de prazos. Os principais processos são:

  • OCR em documentos digitalizados;

  • Pesquisa automática de dados em documentos genéricos e associação automática de dados a etiquetas lógicas utilizando técnicas de Machine Learning;

  • Deteção de anomalias na estrutura morfológica de documentos, combinando técnicas tradicionais de processamento de imagem com técnicas de Machine Learning;

  • Deteção de Anomalias em documentos que foram mal padronizados, conjugando o OCR e técnicas de Machine Learning.




SERVIÇOS

Neste âmbito prestamos serviços com diferentes especificidades no que concerne ao tratamento da documentação e respondemos a várias áreas como a Administração Pública, Financeira - Banca - Seguros e Utilities e Perícia Documental, das quais passamos a descrever os serviços.


Administração Pública

A relação entre os cidadãos e a Administração Pública e os seus serviços são regidos pelo procedimento administrativo, o que garante o princípio da igualdade de todos os cidadãos perante a Administração.
A Administração Pública é uma realidade vasta e complexa. Tradicionalmente, a Administração Pública é entendida num duplo sentido: sentido orgânico e sentido material. No sentido orgânico, a administração pública é o sistema de órgãos, serviços e agentes do Estado e de outras entidades públicas que visam a satisfação regular e contínua das necessidades coletivas; no sentido material, a administração pública é a própria atividade desenvolvida por aqueles órgãos, serviços e agentes. Considerando o seu sentido orgânico, é possível distinguir na Administração Pública três grandes grupos de entidades:

  • Administração direta do Estado;

  • Administração indireta do Estado;

  • Administração Autónoma.


Uma parte fundamental deste processo de comunicação é a capacidade de agilizar e melhorar os processos documentais através das soluções que disponibilizamos para o efeito. Hoje mais do que nunca a necessidade de eficiência e eficácia na Administração Pública nos processos requer:

  • Redução de Custos;

  • Redução nos tempos de espera nos processos;

  • Economia de tempo na tramitação do expediente;

  • Avanço na interoperabilidade e reutilização de informações e E-Government.

Financeiro | Banca | Seguros | Utilities

Atualmente, e apesar dos meios telemáticos disponíveis, o início de uma relação contratual entre o cliente e o fornecedor é baseada na informação constante em documentos em papel físico. A prestação de serviços bem como o fornecimento de bens de consumo que requerem o recurso a crédito, através de uma entidade financeira que facilite o crédito ao cliente, processo este que é realizado com base na qualidade e autenticidade da documentação recebida.
Para evitar incorrer em custos desnecessários, é essencial avaliar a viabilidade da operação em tempo real, para tal, é necessário detetar nos processos de admissão os documentos suspeitos antes de eles entrarem no canal de análise de risco ou de autorização. Para responder a estes requisitos específicos desenvolvemos soluções para a automação destes processos, atuando desde o momento da receção da informação, detetando os documentos suspeitos em tempo real, validando os documentos de identidade e comprovativos de morada. Ao mesmo tempo é feita a extração automática dos dados requeridos para as aplicações e feita digitalização dos documentos, evitando custos recorrentes do armazenamento manual dos dados, correção de erros, verificação visual da documentação recebida e perdas por fraude.
Para estes processos são utilizados os mais avançados conhecimentos de "Machine Learning", modelos matemáticos das distorções produzidas pelos processos de impressão e digitalização de documentos (Print & Scan Channel) e "Optical Document Processing".

Perícia Documental

Clarificar a autenticidade e a integridade de um documento impresso é muitas vezes uma questão-chave num litígio. Até à data, a prática usual é utilizar técnicas documentoscópicas como o uso de scanners de luzes ultravioleta ou infravermelhos, técnicas válidas em documentos de segurança, tais como, os cartões de identificação ou o passaporte, menos eficazes em documentos normais, como contratos, documentos enviados por fax ou provas.
A evolução das tecnologias de informação tornou possível e colocou ao alcance de todos a possibilidade de alterar documentos. Saber, por exemplo, se um documento supostamente impresso ou um fax não foi adulterado, é uma questão difícil de determinar. A Manipulação pode ser feita simplesmente recorrendo a um editor de imagem como o Photoshop ou o Gimp, sem deixar vestígios visualmente detetáveis.
Muitas vezes este tipo de alterações fraudulentas deixam um rastro que através de técnicas avançadas de processamento de imagem, conhecimento especializado do Canal de Impressão e Digitalização e algoritmos de "Machine Learning" podem ser detetadas.
Disponibilizamos um conhecimento altamente especializado para a elaboração de relatórios periciais que podem contribuir para uma melhor compreensão sobre a autenticidade e a integridade dos documentos.

Contacte-nos para agendar uma reunião