¿Has tenido que extraer texto de muchas imágenes una a una alguna vez?
Nosotros lo hemos necesitado hace poco para extraer números de serie de imágenes. Lo necesitábamos para mantener la trazabilidad de equipos que usamos. En aras de la búsqueda de automatización con foco al aumento de productividad, hemos desarrollado la aplicación que te presentamos hoy.
La aplicación
La aplicación en realidad comprende un script «sencillo» y un requirements.txt en el que se relacionan las dependencias:
serialidentifier.py: script principal que pide la ruta a las imágenes que se quieren analizar.
requirements.txt: archivo que contiene las dependencias. En este caso, pillow y pytesseract. Para instalar todas las dependencias: pip install -r requirements.txt (requiere pip, que se instala cuando se instala alguna distro de Python).
Las dependencias
pillow. Dependencia que carga e interpreta las imágenes.
pytesseract. Red neuronal pre-entrenada para analizar texto en imágenes. Tesseract además debe ser instalado manualmente desde: https://github.com/UB-Mannheim/tesseract/wiki y añadirlo al PATH de Windows. Se debe añadir como: C:\Program Files\Tesseract-OCR.
El resultado
Un programa capaz de analizar una carpeta completa de imágenes.
Las imágenes analizadas:
La ejecución:
El resultado real:
Imagenes+TXT generado
Contenido TXT
Fallos y mejoras
Puede verse que hay varios fallos en el detector de textos. Pero todos se pueden corregir.
Lectura de matrículas. Falla por la detección de colores y la orientación del texto. Con una corrección de orientación automática y orientación a monocromo se corrige.
Imagen maxresdefault.jpg. Falla por la saturación de colores. Se puede corregir con detección de bordes y paso a monocromo.
Imagen ogimage. Funciona correctamente. La razón: el área de texto es completamente horizontal y monocromática, no mezclada con los otros elementos gráficos.
Imagen «Qué es un texto». Funciona correctamente por la misma razón anterior.
¿Te gusta lo que ves?
Si necesitas una aplicación parecida, pero mucho más detallada y perfeccionada, con una interfaz gráfica (GUI) en Casas Electronics también la desarrollamos. Contáctanos para ver qué podemos hacer por ti. Imagina cuánto tiempo ahorrarías con una aplicación automática como esta para identificar por ejemplo aquellos números de serie que vienen sin QR o código de barras.