Tugurium/GTI

Glosario Terminología Informática

Optical Character Recognition

0 OCR
Tecnología mediante la cual la imagen de un texto es explorada, reconocida y codificada digitalmente para su posterior tratamiento por una computadora. Un dispositivo periférico de OCR acepta un documento impreso como entrada, identifica los caracteres por su forma mediante la luz que se refleja y crea un fichero de salida en disco. Para obtener mejores resultados, la página impresa debe contener sólo caracteres de un tipo que puedan ser leídos fácilmente por el dispositivo OCR y ubicados en la página dentro de ciertos márgenes.
Además de reconocer y codificar el texto, los programas de OCR intentan reconocer y codificar los elementos estructurales de la página de un documento, como las columnas y los elementos gráficos no textuales.
Al elegir un producto OCR, la consideración principal debe ser el nivel de precisión del programa aplicado al tipo de documento que se va a escanear. Los niveles de precisión inferiores al 97% se consideran generalmente pobres.
1997-02-26