Este blog nació en Febrero de 2010, y ya llevaba un tiempo sin nuevas entradas... y aunque han ocurrido muchas cosas en el mundo de la Digitalización y la Captura de Documentos, no ha habido ninguna tan disruptiva como la que se esta produciendo ahora mismo de la mano de Google Cloud, Azure y AWS gracias a la Inteligencia Artificial llevando el entendimiento del lenguaje natural al siguiente nivel.
Se siguen haciendo OCR e ICR, también muy mejorado por la IA, pero la autentica revolución esta en la interpretación del contenido para extraer la información relevante con la mínima intervención humana.
Y aunque parece tecnología del pasado, las grandes empresas de tecnología se han dado cuenta que para poder tener procesos 100% Digitales con la mínima intervención humana, y que por lo tanto puedan escalar en función de las necesidades de negocio y responder con agilidad a nuevas necesidades, debían procesar documentos no estructurados, tanto documentos Digitalizados (muchas veces con la cámara de un móvil) como documentos digitales, y así poder continuar el flujo en un proceso de contratación, una reclamación, un cambio de titular, etc...
Cada "nube" tiene su propia solución, aunque también se pueden desplegar soluciones tradicionales que luego se potencian con el uso de la IA, aunque lo puede hacer algo mas complejo:
- Google Cloud: Documents AI es una solución SaaS que permite realizar el OCR e ICR analizar documentos, crear tus propias plantillas o "parsers" para extraer los pares clave-valor correspondientes, dispone de una serie de plantillas creadas, etc... y con la integración de personas para revisar (Human in the loop), consigue una solución muy completa lista para competir con los lideres en este segmento como Kofax, Abbyy, etc...
- Microsoft Azure: la solución de Microsoft es Form Recognizer y con funcionalidades muy similares a la de Google, realizar OCR e ICR, mejora de imagen, dispone de plantillas predefinidas y puedes diseñar las tuyas propias.
- AWS: la tercera de las soluciones es Textract que realizar OCR, ICR, analizar documentos con formularios, tablas, etc... y que cuenta con una solución para poder revisar por personas (Built-in Human Review) con lo que cerrar el ciclo.
Cualquiera de estas soluciones se puede integrar en nuestro proceso de forma sencilla y con las ventajas habituales de la nube de no tener que hacer grandes inversiones en Hardware y Software, como era necesario en los proyectos de Expediente Digital, Censos, Facturas... que muchos recordareis.
Además, al ser servicios que integras en tu proceso, se pueden utilizar indistintamente evitando el "vendor lock-in", aunque eso si, perderíamos parte del conocimiento que tengamos o hayamos entrenado en esa plataforma.
Otra de las ventajas de utilizar estas soluciones en la nube, es que prácticamente de serie nos proporcionan la integración con los entornos de BigData y podemos incorporar esta información en otros procesos o en la "inteligencia operativa y comercial" de la compañía.
Os invito a que las probéis, los resultados con poco esfuerzo son impresionantes, y con un poco de trabajo podemos llegar a niveles de reconocimiento por encima del 90%, lo que significa un ahorro significativo. El 100% ya sabéis que va a depender del tipo de documento y la calidad con la que lo recibamos.