Estos servicios de digitalización de texto se basan en una tecnología conocida como OCR (Optical Character Recognition). Consiste en una interpretación de las figuras captadas en una imagen digital analizando sus formas y su posición para tratar de identificar cada caracter del documento capturado en la imagen digital.
Este proceso de OCR requiere que el dispositivo posea suficiente potencia de procesamiento de información ya que los algoritmos utilizados por cada fabricante de OCR son complejos.
Incluso con potencia suficiente de procesador los resultados, hasta hace un par de años, no eran del todo satisfactorios debido a que la imagen digital no tenía la suficiente calidad para reconocer algunas letras conflictivas.
Con la mejora en la calidad de las cámaras fotográficas en los smartphones las tareas relacionadas con el entorno físico del usuario de estos dispositivos aumentan tanto en posibilidades como en calidad en los resultados. Esto se puede apreciar claramente a la hora de intentar digitalizar un documento de texto impreso utilizando un iPhone 3GS y un iPhone 4. La mejora de la calidad de la cámara hace que la digitalización sea más precisa y el programa de OCR pueda realizar mejor su trabajo.
Con estas mejoras en el hardware la única diferencia entre las distintas aplicaciones de OCR que existen en la App store la marca el algoritmo utilizado para realizar el proceso de reconocimiento de texto.
Abbyy, reconocida empresa desarrolladora de aplicaciones OCR para Windows, OSX y dispositivos móviles, posee uno de los mejores algoritmos del mercado. Su afamado FineReader para OSX y Windows es reconocido como uno de los mejores paquetes de OCR para la oficina.
Esta empresa ya posee varias aplicaciones en la App store entre las que destaca TextGrabber + Translator
Índice
Interfaz y uso de la aplicación Textgrabber
TextGrabber + Translator
A la hora de tomar la imagen se nos ofrecen diversas opciones como la activación permanente del led flash para una correcta iluminación, recortar la zona para el análisis OCR, cambio de contraste de color, etc. Todo esto enfocado para conseguir la mejor calidad de imagen para reconocer el texto de la forma más óptima.
Calidad del reconocimiento de caracteres
Abbyy demuestra su calidad en los procesos OCR en esta aplicación. A diferencia de otras existentes en la App store, TextGrabber utiliza el mismo algoritmo que Finereader por lo que textos a doble y triple columna no son problema. Detecta también la presencia de contenidos en otros idiomas así como la presencia de marcos y recuadros.
Esta captura se hizo a una publicidad de cine de una revista,
con el papel inclinado y sin precisar el enfoque.
En resumen, si las condiciones no son idóneas, el OCR puede ser más un problema que una solución.
Todo esto es posible al uso de servicios OCR distribuidos. La aplicación utiliza la conexión a Internet del dispositivo para que los servidores de Abbyy realicen el proceso de OCR del documento.
Para un correcto funcionamiento de la aplicación es recomendable invertir un poco de tiempo en la configuración y personalización de esta aplicación así como la realización de diversas pruebas para conocer cuál es el mejor ángulo para la cámara a la hora de captar un documento.
Otros servicios extra de Textgrabber
La aplicación no se limita a convertir una imagen a texto. También nos permite traducir a otro idioma el texto reconocido, para utilizarlo en otra aplicación (Mail, Pages, etc) o compartirlo en redes sociales.
Accesibilidad deficiente
Las aplicaciones OCR son muy utilizadas por personas ciegas para conocer la información de facturas, folletos, libros y otros documentos impresos. La posibilidad de utilizar un software OCR en el dispositivo que lleva cualquiera en el bolsillo abre multitud de posibilidades. Siempre y cuando el desarrollador haya hecho su interfaz accesible.
Abbyy no ha hecho bien esta tarea. En TextGrabber encontramos un interfaz lleno de botones sin etiquetas para VoiceOver, el lector de pantallas para iOS y OSX utilizado por personas ciegas para acceder a la información del dispositivo.
Aunque la aplicación posee un interfaz sencillo con pocos botones, en algunos casos es muy complicado que una persona ciega pueda utilizar la aplicación de forma autónoma en todas sus funciones. Incluso utilizando el reetiquetado de botones de VoiceOver. Esto se debe a que hay elementos del interfaz que, además de no tener etiqueta, no pueden ser activados por VoiceOver.
Es una pena que una de las mejores aplicaciones de OCR de la App Store no pueda ser utilizada de forma autónoma por las personas que más necesitan del OCR. Esperemos que Abbyy solucione este problema pronto en todos sus productos.
TextGrabber + Translator