Revisión del libro “Intelligent Document Capture with Ephesoft” de PacktPub

Packt Publishing, la editorial que ha publicado varios libros sobre Alfresco, ha lanzado recientemente un nuevo libro llamado Intelligent Document Capture with Ephesoft. Ha sido escrito por Pat Myers, VP de Zia Consulting (partner de Alfresco) e  Ike Kavas fundador y CTO de Ephesoft que también fue empleado de Kofax antes de empezar este nuevo proyecto.

En blyx.com ya he escrito varias veces [1] , [2] sobre soluciones de digitalización y escaneo, incluso hicimos un webinar con Baratz sobre Alfresco y Ephesoft con demo incluida .

Este libro, basado en la versión 3 del producto, es estupendo para reforzar todo lo comentado anteriormente ya que Ephesoft es una herramienta que ha evolucionado mucho en los pocos años de vida que tiene.

Ephesoft es una solución para procesar documentos en papel, fax, correo electrónico, desde un ERP o cualquier otra herramienta corporativa que genere documentos gráficos o imágenes de los mismos, está hecha en Java (contiene Spring, Lucene, Hibernate, Jbpm, etc.) y es Open Source (con versión Community y Enterprise), clasifica, separa y extrae metadatos de forma inteligente implementando OCR desde una interfaz web bastante intuitiva y orientada tanto a administradores como a revisores u operadores. Además soporta interfaces de integración y exportación de los documentos con sus metadatos (personalizados o no) a diferentes soluciones de ECM mediante CMIS, como puede ser el caso de la integración con Alfresco que vimos en el webinar. Ephesoft es una alternativa a otras soluciones que hay en el mercado como Kofax o Athento.

  • El libro comienza con una introducción genérica pero completa sobre el mundo de la digitalización y ejemplos reales muy útiles para todos los perfiles involucrados a la hora de hacer un proyecto de digitalización (desde el comercial que lo vende, hasta el programador, administrador y  operador). Es una base esencial e ilustrativa para aprender bien  conceptos como los diferentes métodos de entrada, clasificación, extracción y exportación. También contempla tipos de documentos con ejemplos.
  • En el capitulo segundo se hace una descripción completa sobre todas las características de Ephesoft y muestra las interfaces web de administrador y operador.
  • En el tercer capítulo se va al grano y nos enseña a hacer cargas masivas y gestión de procesos batch para automatizar el procesamiento e ingesta de documentos escaneados (creación de batch, tipos documentales, clasificación, creación de nuevos campos, extracción de valores, expresiones regulares y exportación).
  • Tras esto, se pasa al procesado, revisión y verificación de toda la información en el capitulo cuatro.
  • El quinto capítulo es el clave desde mi punto de vista, ya que cubre características internas de Ephesoft y permite  comprender correctamente el funcionamiento del sistema en cuanto a clasificación, extracción y exportación. Cómo usar códigos de barras, imágenes, documentos complejos y clasificación automática o personalizada. Combinación con valores en BBDD externas, escáner web con origen TWAIN, exportación CMIS integrado con Alfresco (con un ejemplo de configuración paso a paso con Alfresco) y enumeración de otros ECM conocidos que también se pueden integrar.
  • En el capítulo seis se cubre todo lo relacionado con extender y personalizar la plataforma, añadir métodos de clasificación, extracción, scripts, integraciones, procesos automáticos para rellenar o extender datos concretos, gestión de digitalización distribuida geográficamente, aprendizaje automático del tipo clave/valor con expresiones regulares, etc.
  • Por último, el capítulo siete habla sobre algunos trucos, buenas prácticas y resolución de problemas comunes como gestión de logs, integración con Active Directory o LDAP y temas más variados.

Generalmente, los libros que comento en el blog y no me parecen medianamente provechosos no les dedico un post. Este libro es una referencia interesante y un punto inicial para hacer proyectos con Ephesoft. Si estás en este mundo de digitalización y ECM, y sea cual sea tu nivel de responsabilidad te recomiendo este libro, aunque hay capítulos muy específicos y orientados a desarrolladores, seguro que te aportará argumentos para tu día a día y mejorar o reforzar los conocimientos de captura inteligente. Si ya dominas totalmente la solución y has hecho proyectos con Ephesoft posiblemente aprendas poco leyendo el libro. Aunque muchos de los temas cubiertos en el libro se pueden encontrar por Internet, aquí lo tienes todo en el mismo sitio, explicado con fluidez y bien organizado. ¿Le falta algo? Si, parte de instalación, despliegue y arquitectura, pero también se encuentra por internet. ¿Lo recomiendo? Si.

One thought to “Revisión del libro “Intelligent Document Capture with Ephesoft” de PacktPub”

Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.