Login | registrarse | recordar contraseña
Usuarios registrados: 373.431 | Top visitas día: 320.655 | Personas conectadas: 4.849 | Usuarios conectados: 30
Portada Foro Ayuda Tutoriales Programas Blog Tecnología Drivers Videos
Buscador

--Tutoriales >> ¿Qué es el OCR?



¿Qué es el OCR?


Tags: Software, Escaner
EL OCR: QUE ES Y PARA QUE SE PUEDE UTILIZAR.

El OCR (Optical character recognition) es un software de reconocimiento de texto que saca de una imagen el texto que contiene y lo transforma en cadenas de caracteres para guardarlos en un formato que se pueda utilizar en programas de edición de texto.

Cuando tenemos una imagen (ya sea una fotografía o un documento que hayamos escaneado), el texto que contiene forma parte de esa imagen, al igual que cualquier elemento de la misma (un dibujo o un esquema, por ejemplo). Pues bien, si necesitamos extraer ese texto para poder editarlo, necesitamos un programa de OCR que reconozca dicho texto y lo transforme en una cadena de caracteres (ya sea ASCII o Unicode) y posteriormente copiar esta cadena a un programa de edición para ya poder trabajar con ella, con el consiguiente ahorro de tiempo al no tener que teclear este texto.

Básicamente, el sistema que utilizan es el siguiente:
El sistema usado hasta no hace mucho consistía en que el OCR aislaba la imagen correspondiente a un carácter y la comparaba con una base de caracteres para determinar su correspondiente código ASCII o bien Unicode. Una vez reconocido lo transformaba y lo trasladaba al documento OCR resultante. Este sistema tenía el inconveniente de que trabajaba con un número limitado de fuentes, por lo que el resultado obtenido no siempre era el deseado. Además, en textos muy largos y con inclusión de frases en cursiva, por ejemplo, el proceso era bastante lento.

Los programas actuales de OCR están basados en el análisis de características de los caracteres en vez de en la coincidencia de las matrices de estos, lo que permite una mayor velocidad en el proceso y el no tener que depender de una limitada base de fuentes.

Hay en el mercado bastantes programas de OCR, entre los que cabe destacar los conocidos OmniPage, Abbyy Fine Reader o READiris. Versiones reducidas de estos programas suelen contarse entre el software incluido en los escáneres.

Cabe destacar entre ellos el OmniPage Professional por su amplia variedad de opciones y su buena presentación y funcionamiento.

Estos programas son de especial utilidad cuando necesitamos hacer referencia a textos en un escrito (copiar literalmente un texto dentro de otro), como puede ser el caso de redacción de informes o referencias bibliográficas.

También pueden ser utilizados en el mundo de la música, ya que la mayoría de ellos tienen también capacidad de leer partituras musicales.

Actualmente estos programas son capaces de reconocer no solo el texto en sí, sino también el estilo y formato de este, aunque dentro de unas limitaciones, haciendo necesario que posteriormente editemos el texto resultante y revisemos estos dos parámetros.

Ahora bien, lo que sí que tenemos que tener muy claro es que estos programas no hacen milagros. Para su correcto funcionamiento es necesario que la imagen de donde provenga dicho texto esté en las mejores condiciones posibles para que pueda reconocer correctamente los caracteres. Hay que tener en cuenta que factores tales como un texto borroso (aunque sea solo ligeramente), papel manchado o demasiado fino, arrugas o arañazos en el documento, falta de una parte de una letra, cualquier tipo de transparencia en el papel, etc. van a dificultar el correcto reconocimiento de este texto. El promedio de efectividad de los programas OCR, en perfectas condiciones, ronda el 90%, disminuyendo de forma ostensible al disminuir la calidad del original. A esto hay que añadir una correcta configuración del escáner tanto en su resolución como en su brillo y en la limpieza de la lente y cristal. Uno de los requisitos básicos para que un programa OCR funcione correctamente es que necesita una imagen de gran calidad.

Es cierto que también pueden reconocer textos escritos manualmente, pero en este caso siempre a condición de que estén escritos claramente, a ser posible con letra de molde, y que esta se asemeje lo más posible a un tipo de letra existente.






Autor: JOSITO - Publicado: 04/05/2007 - DERECHOS AUTOR
Tags: Software, Escaner | Compartir:

Tutoriales de Software | Ver más Tutoriales | Tutoriales Windows Vista

Todos los días publicamos nuevos tutoriales.

Si deseas realizarnos una consulta relacionada con este tutorial pulsa aquí.


Buscar: en el


Publicidad





Configurar red inalámbrica en Windows 7
5 cosas que hacer después de instalar Ubuntu
Cómo crear un fondo de Escritorio con Photoshop
Cómo instalar Ubuntu 9.10 Desktop (Karmic Koala)
Añadir subtítulos a videos de YouTube




Consejos para comprar un escáner.
Escanear un documento desde Windows Vista
Instalar versiones beta de programas
Problemas con descargas Ares
Versiones de Microsoft Office 2007



¿Qué es esto del RSS?



¿No encuentras lo que buscas?


No te preocupes, pregunta en nuestro Foro en el que participan más de 150.000 usuarios diarios.



Bajar Antivirus gratisCual es mi IPTest velocidadTrucosADSL Lo más Visto
OverclockingForo ADSLDiccionarioWireless Mapa Segunda manoTiendas de informatica
Blog TecnologíaMapa BlogÚltimos VirusLibros informaticaManualesPost foro SeguridadMapa ForoOrdenadores segunda mano

Aviso Legal Politica de Privacidad Referencias en Prensa Colaborar Contactar Publicidad
PORTADA ¿Que es ConfigurarEquipos? Logo


Buscar:

en
Copyright(c) 2002-2009 ConfigurarEquipos.com® | 22-11-2009 02:34:29 Informática | Permitido el uso Parcial citando Fuentes y Autores | Mapa Web