¿Qué es el OCR?

¿Qué es el OCR?

Compartir:

El reconocimiento óptico de caracteres, conocido con la sigla OCR (del inglés, Optical Character Recognition), es un proceso dirigido a la digitalización de textos, los cuales se identifican automáticamente a partir de una imagen, símbolos o caracteres que pertenecen a un determinado alfabeto, para luego almacenarlos en forma de datos.

El proceso básico que se lleva a cabo en el OCR es convertir el texto que aparece dentro de una imagen en un archivo de texto que podrá ser editado y utilizado como tal por cualquier otro programa o aplicación que lo necesite.  Luego de este proceso, se lo puede editar electrónicamente, y almacenarlo de forma más eficiente para luego ser rastreado y nuevamente visualizado desde cualquier tipo de dispositivo.

En los últimos años, la digitalización se ha transformado en un punto de interés para las empresas y las personas. En el caso concreto de los textos, existen y se generan continuamente grandes cantidades de información escrita en todo tipo de soportes. En este contexto, poder automatizar la introducción de caracteres evitando la entrada por teclado implica un importante ahorro de recursos humanos o su redireccionamiento hacia otras actividades de mayor valor agregado y un aumento de la productividad, al mismo tiempo que se mejora la calidad de muchos servicios.

El reconocimiento de estos caracteres se realizará básicamente comparándolos con unos patrones o plantillas que contienen todos los posibles caracteres. Ahora bien, las imágenes reales no son perfectas, por lo tanto el OCR se encuentra con varios problemas:

  • El dispositivo que obtiene la imagen puede introducir niveles de grises al fondo que no pertenecen a la imagen original.
  • La resolución de estos dispositivos puede introducir ruido en la imagen, afectando los píxeles que han de ser procesados.
  • La distancia que separa a unos caracteres de otros, al no ser siempre la misma, puede producir errores de reconocimiento.
  • La conexión de dos o más caracteres por píxeles comunes también puede producir errores

Si querés conocer cómo DigitalDocs utiliza y potencia el proceso de OCR para ayudarte a optimizar los procesos de tu empresa con esta tecnología, completá el formulario de contacto en: https://noobitar.com/digitaldocs-landing/

Compartir: