Sie sind auf Seite 1von 0

I

MANUAL DEL USUARIO


MANUAL MANUAL
MANUAL MANUAL MANUAL
DEL USUARIO DEL USUARIO
DEL USUARIO DEL USUARIO DEL USUARIO
foreword.pmd 3/04/2006, 15:34 1
II
Readiris Pro
1990-2006 I.R.I.S. Reservados todos los derechos
Tecnologa de OCR propriedad de I.R.I.S.
Tecnologas Connectionist, AutoFormat y tecnologa lingstica propriedad de I.R.I.S.
Tecnologa de ICR y de lectura de cdigos de barras de I.R.I.S.
1990-2006 I.R.I.S. Reservados todos los derechos
foreword.pmd 3/04/2006, 15:34 2
III
MANUAL DEL USUARIO
A A A A AHORRE HORRE HORRE HORRE HORRE TIEMPO TIEMPO TIEMPO TIEMPO TIEMPO, , , , , NO NO NO NO NO VUEL VUEL VUEL VUEL VUELV VV VVA AA AA A AA AA TECLEAR TECLEAR TECLEAR TECLEAR TECLEAR! !! !!
Queremos darle la enhorabuena por haber adquirido Readiris. Este paquete
de software le resultar, sin duda, de gran ayuda a la hora de capturar textos,
tablas, grficos, cdigos de barras y incluso textos escritos a mano.
Por eficientes que sean los ordenadores, primero tiene que teclear su
informacin. Si alguna vez ha tenido que volver a teclear un informe de 15 pginas
o una amplia tabla de cifras, sabr lo tedioso y prolongado que puede ser. Utilice
este innovador paquete de software de OCR para introducir texto automticamente
en sus aplicaciones y disfrute de un nivel de eficiencia y comodidad sin precedentes.
(Hay dos modos de reconocimiento disponibles: uno que garantiza una velocidad
ptima, y otro que garantiza una precisin de OCR ptima.)
Escanee cualquier documento impreso o mecanografiado, indique las zonas
de inters - o deje que el sistema lo haga por usted -, ejecute el reconocimiento de
caracteres y exporte el documento al procesador de textos que prefiera. Los
documentos de mltiples pginas se procesan de principio a fin de una sola vez.
Unos cuantos clics con el ratn equivalen a largas horas de trabajo, puesto que
Readiris convierte sus documentos en papel en archivos digitales modificables
hasta 40 veces ms rpido que si volviese a teclearlos.
El asistente de OCR lo ayudar durante el proceso de reconocimiento:
responda a unas simples preguntas para obtener rpidos resultados con Readiris!
Podr enviar directamente el resultado del reconocimiento a un procesador de
textos o a una hoja de clculo. Para reconocer un fax y convertir documentos
PDF, basta con arrastrar el archivo desde el Explorador de Windows hasta la
ventana de la aplicacin Readiris. O hacer clic sobre cualquier imagen con el
botn secundario del ratn para enviarla inmediatamente a Readiris.
Readiris reconoce datos tabulados y los reproduce como hojas de clculo o
como objetos de tabla en un procesador de textos; los datos numricos estn as
listos para ser procesados.
Basado en la tecnologa Connectionist de I.R.I.S., Readiris representa lo me-
jor que puede ofrecer el reconocimiento de caracteres. La extraccin de carac-
foreword.pmd 3/04/2006, 15:34 3
IV
tersticas independiente de las fuentes est complementada por tcnicas de
autoaprendizaje derivadas de una red neural patentada. El sistema puede apren-
der nuevos caracteres mediante anlisis del contexto: los conocimientos lingsticos
sobre slabas y palabras mejoran el rendimiento del reconocimiento.
Readiris reconoce hasta 126 idiomas: todos los idiomas americanos y europeos,
incluyendo los idiomas centroeuropeos y blticos, adems de los alfabetos cirlico
(ruso) y griego. (Opcionalmente, puede reconocer documentos escritos en rabe
y en cuatro idiomas asiticos: el japons, el chino simplificado, el chino tradicional
y el coreano.) Readiris puede procesar incluso alfabetos mixtos: el programa
detecta las palabras occidentales que aparecen en documentos escritos en
griego, cirlico, rabe o alguna lengua asitica, como muchos nombres propios,
nombres de marcas, etc. que no se pueden transcribir y se escriben utilizando los
smbolos occidentales.
Readiris usa la lingstica durante la fase de reconocimiento, no despus. Como
resultado de ello, Readiris reconoce documentos de todo tipo con mxima precisin,
incluyendo documentos de baja calidad, faxes e impresiones con matriz de agujas.
Procesa los documentos mal escaneados y copiados que contienen formas de
fuentes demasiado claras u demasiado oscuras. Los caracteres unidos entre s
(ligaduras) se resuelven y las formas fragmentadas, como los smbolos de las
matrices de agujas, se vuelven a componer.
La ventana de verificacin por parte del usuario no slo destaca los caracte-
res dudosos, sino que tambin aumenta la precisin del sistema. Todas las solu-
ciones confirmadas por el usuario se almacenan en memoria, aumentando as la
velocidad y confianza a medida que trabaja. Usar Readiris significa hacerlo ms
inteligente cada vez! Esta potente herramienta de aprendizaje le permite ensear
a Readiris para que reconozca caracteres especiales, como smbolos matemti-
cos y dingbats, e incluso procesar fuentes distorsionadas como las que se en-
cuentran en los documentos de la vida real.
Para aumentar an ms su productividad, Readiris no slo reconoce textos,
sino que tambin puede darles formato. Si utiliza el formato automtico, Readiris
reproducir una copia facsmil del documento escaneado, manteniendo el forma-
to de las palabras, prrafos y pginas del documento original.
foreword.pmd 3/04/2006, 15:34 4
V
MANUAL DEL USUARIO
Se utilizan tipos de letras similares, los tamaos y estilos usados en el documento
original se mantienen tras el reconocimiento. La colocacin de columnas, bloques
de texto y grficos imita la de los documentos originales. Y como Readiris escanea
sin ningn problema imgenes en escala de grises o en color, puede capturar
cualquier grfico - ya sean dibujos, fotografas en blanco y negro o ilustraciones
en color. Cuando el documento contiene tablas, Readiris las recoloca imitando
perfectamente las celdas y reproduciendo los bordes de las tablas originales.
En otras palabras, Readiris le permite archivar una copia fiel de sus documen-
tos en forma de archivos digitales de texto que puede modificar en lugar de una
imagen escaneada. Existen varios niveles de formato, la eleccin la tiene el usua-
rio.
Tambin es posible leer los cdigos de barras que aparezcan en las pginas
escaneadas, as como cualquier tipo de texto escrito a mano - siempre que se
haya escrito utilizando letras de palo seco debidamente separadas entre ellas.
Readiris permite utilizar una amplia gama de escneres: escneres planos,
escneres con alimentador de hojas, perifricos multifuncionales (MFP - mul-
tifunctional peripheral) y cmaras digitales. Readiris tambin cumple la norma
Twain y, adems, puede utilizarse en algunas plataformas de escaneado. El
escaneado a intervalos le permite escanear documentos de mltiples pginas de
manera eficiente si su escner no dispone de alimentador de documentos.
T TT TTABLA ABLA ABLA ABLA ABLA DE DE DE DE DE MA MA MA MA MATERIAS TERIAS TERIAS TERIAS TERIAS
Ahorre tiempo, no vuelva a teclear! ............................................................................. III
Tabla de materias ........................................................................................................... V
Crditos y derechos de autor ....................................................................................... VII
Captulo 1: Instalacin Captulo 1: Instalacin Captulo 1: Instalacin Captulo 1: Instalacin Captulo 1: Instalacin
Requisitos del sistema ................................................................................................. 1-1
Instalacin del software de Readiris ............................................................................ 1-1
Desinstalacin del software de Readiris ...................................................................... 1-3
Instalacin de software opcional ................................................................................. 1-4
Instalacin de productos relacionados ........................................................................ 1-6
foreword.pmd 3/04/2006, 15:34 5
VI
Archivos instalados ..................................................................................................... 1-8
Archivo Lame y documentacin ............................................................................................... 1-8
Patrn de escritura ............................................................................................................................ 1-8
Regstrese! .................................................................................................................. 1-8
Cmo obtener asistencia tcnica ............................................................................... 1-10
Captulo 2: Captulo 2: Captulo 2: Captulo 2: Captulo 2: V VV VVisita guiada isita guiada isita guiada isita guiada isita guiada
Inicio del software ........................................................................................................ 2-1
Primera ejecucin ......................................................................................................... 2-2
Descubrir el interfaz de Readiris ................................................................................... 2-2
Primera leccin introductoria ....................................................................................... 2-5
Ampliacin de imgenes ............................................................................................ 2-10
Uno, descomponer una imagen escaneada ................................................................ 2-13
Una y media, clasificacin de ventanas ..................................................................... 2-16
Dos, trazar ventanas manualmente ............................................................................ 2-19
Tres, guardar modelos de ventanas ........................................................................... 2-23
Readiris lo lleva por todo el mundo............................................................................ 2-25
Readiris cambia de idioma cuando es necesario ........................................................ 2-30
Definir las caractersticas del documento................................................................... 2-33
Velocidad contra precisin ......................................................................................... 2-35
Readiris se hace cada vez ms inteligente! ............................................................... 2-37
Aprender ........................................................................................................................................... 2-39
Descartar Aprendizaje ..................................................................................................................... 2-40
Borrar ................................................................................................................................................ 2-41
Deshacer ........................................................................................................................................... 2-41
Terminar ........................................................................................................................................... 2-41
Cancelar ............................................................................................................................................ 2-41
Papel de los diccionarios de fuentes .......................................................................... 2-41
Envo de resultados a la aplicacin de trabajo ........................................................... 2-44
Guardar los resultados en un archivo de texto ........................................................... 2-48
Creacin de documentos porttiles ............................................................................ 2-51
... o reconocimiento de dichos documentos ............................................................... 2-60
Reconocimiento de varias pginas ............................................................................ 2-63
Edicin de documentos de mltiples pginas ............................................................ 2-73
Abrir un nuevo documento........................................................................................ 2-75
Reconocimiento de zonas de texto ............................................................................. 2-76
Organizacin del texto resultante ............................................................................... 2-77
Configuracin del escner ......................................................................................... 2-79
foreword.pmd 3/04/2006, 15:34 6
VII
MANUAL DEL USUARIO
Ponga colores en sus textos digitalizados! ................................................................ 2-81
Aparatos distintos, resolucin distinta...................................................................... 2-84
Guardar la configuracin predeterminada .................................................................. 2-89
Guardar propiedades especficas ............................................................................... 2-90
Escanear documentos ................................................................................................ 2-91
Ajuste de las imgenes escaneadas ........................................................................... 2-95
Deje que el asistente trabaje por usted .................................................................... 2-100
Readiris reproduce el diseo de sus documentos .................................................... 2-101
Utilice columnas en lugar de cuadros ...................................................................... 2-106
Formato de textos, 2 parte ....................................................................................... 2-109
Exportar el texto varias veces ................................................................................... 2-110
Guardar grficos por separado ................................................................................. 2-111
Recrear columnas, cuadros, etc. de color ................................................................. 2-114
Conservar los colores del texto ................................................................................ 2-116
Lectura de faxes y reconocimiento diferido.............................................................. 2-118
Reconocimiento de tablas ........................................................................................ 2-120
Reconocimiento de textos escritos a mano .............................................................. 2-128
Lectura de barras y espacios ................................................................................... 2-133
Cmo obtener ayuda en lnea................................................................................... 2-136
C CC CCRDIT RDIT RDIT RDIT RDITOS OS OS OS OS Y YY YY DERECHOS DERECHOS DERECHOS DERECHOS DERECHOS DE DE DE DE DE AUT AUT AUT AUT AUTOR OR OR OR OR
El programa Readiris ha sido diseado y desarrollado por I.R.I.S. Las
tecnologas de OCR, ICR, lectura de cdigos de barras, Connectionist, AutoFormat
y lingstica son propiedad de I.R.I.S. Asmismo, I.R.I.S. detenta los derechos de
autor del software Readiris, de la tecnologa de OCR, de la tecnologa de ICR, de
la tecnologa de lectura de cdigos de barras, de la tecnologa lingstica, del
sistema de ayuda en lnea y del presente manual.
AutoFormat, Cardiris, Connectionist, el logotipo de I.R.I.S., Readiris y la
tecnologa lingstica I.R.I.S. son marcas de I.R.I.S.
Analizador sintctico XML desarrollado por Apache. Este producto incluye
software desarrollado por la Apache Software Foundation (www.apache.org).
foreword.pmd 3/04/2006, 15:34 7
VIII
Acrobat y Reader son marcas (registradas) de Adobe. Excel, Windows y
Word son marcas de Microsoft. Intel es una marca registrada de Intel.
foreword.pmd 3/04/2006, 15:34 8
1 - 1
MANUAL DEL USUARIO
Captulo 1
INSTALACIN
Este captulo describe los requisitos del sistema y la instalacin del software
Readiris.
R RR RREQUISITOS EQUISITOS EQUISITOS EQUISITOS EQUISITOS DEL DEL DEL DEL DEL SISTEMA SISTEMA SISTEMA SISTEMA SISTEMA
sta es la configuracin mnima del sistema necesaria para utilizar Readiris:
un procesador Intel 486 o compatible. Se recomienda un procesador
Pentium.
64 MB de RAM. Se recomiendan 128 MB para procesar imgenes en
escala de grises o en color.
120 MB de espacio en el disco duro. Bastarn 105 MB si deja los
archivos de muestra en el CD-ROM.
sistema operativo Windows XP, Windows ME, Windows 2000, Win-
dows 98 o Windows NT 4.0.
Puede que algunos controladores de escner controladores de escner controladores de escner controladores de escner controladores de escner no funcionen con la(s)
ltima(s) versin(es) de Windows. Consulte la documentacin del escner para
ver qu plataformas pueden utilizarse.
I II IINST NST NST NST NSTALACIN ALACIN ALACIN ALACIN ALACIN DEL DEL DEL DEL DEL SOFTW SOFTW SOFTW SOFTW SOFTWARE ARE ARE ARE ARE DE DE DE DE DE R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS
El programa Readiris se entrega exclusivamente en un CD-ROM CD-ROM CD-ROM CD-ROM CD-ROM
autoejecutante autoejecutante autoejecutante autoejecutante autoejecutante. Para instalarlo, simplemente introduzca el CD-ROM en la unidad
de CD-ROM y espere a que el programa de instalacin comience a ejecutarse.
Siga las instrucciones que aparecen en la pantalla.
chapter1.pmd 3/04/2006, 15:36 1
1 - 2
Si la instalacin no comienza a ejecutarse con el CD-ROM introducido en la
unidad de CD-ROM, ejecute el programa MENU.EXE para instalar el programa.
Los usuarios de Windows XP, Windows 2000 y Windows NT 4.0 deben
comprobar que tienen los derechos de acceso derechos de acceso derechos de acceso derechos de acceso derechos de acceso adecuados. Si fuera necesario,
debern ponerse en contacto con el administrador del sistema.
El usuario puede escoger entre una instalacin completa y una instalacin
personalizada. Asegrese de instalar las bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas de todos
los idiomas con los que piensa trabajar. Por defecto, se instalan todas. Le
recomendamos que tambin instale las imgenes de muestra imgenes de muestra imgenes de muestra imgenes de muestra imgenes de muestra que se usan en
los tutoriales del presente manual.
De igual manera, el manual electrnico manual electrnico manual electrnico manual electrnico manual electrnico se copia por defecto en el disco
duro, pero puede dejarlo en el CD-ROM. (Asegrese de instalar Abobe Reader
para acceder a la documentacin del programa Readiris en caso necesario.)
chapter1.pmd 3/04/2006, 15:36 2
1 - 3
MANUAL DEL USUARIO
El programa de instalacin crea automticamente el submen "Aplicaciones
I.R.I.S. - Readiris" en el men "Programas".
Har lo mismo creando un acceso directo acceso directo acceso directo acceso directo acceso directo a Readiris en el escritorio escritorio escritorio escritorio escritorio de
Windows. As podr usted lanzar Readiris directamente desde su escritorio.
D DD DDESINST ESINST ESINST ESINST ESINSTALACIN ALACIN ALACIN ALACIN ALACIN DEL DEL DEL DEL DEL SOFTW SOFTW SOFTW SOFTW SOFTWARE ARE ARE ARE ARE DE DE DE DE DE R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS
Slo hay una forma correcta de eliminar Readiris: utilizando el asistente de
(des)instalacin de Windows. Le recomendamos encarecidamente no desinstalar
Readiris o sus mdulos de software borrando manualmente los archivos de
programa.
Ejecute los siguientes pasos para utilizar el programa automtico de programa automtico de programa automtico de programa automtico de programa automtico de
(des)instalacin de (des)instalacin de (des)instalacin de (des)instalacin de (des)instalacin de W WW WWindows indows indows indows indows.
Haga clic en "Configuracin" en el men "Inicio" de Windows y vaya al
"Panel de Control".
Haga clic en el "Agregar o Quitar Programas" situado en el panel de
control.
chapter1.pmd 3/04/2006, 15:37 3
1 - 4
Siga las instrucciones que aparecen en pantalla para eliminar el soft-
ware de Readiris.
I II IINST NST NST NST NSTALACIN ALACIN ALACIN ALACIN ALACIN DE DE DE DE DE SOFTW SOFTW SOFTW SOFTW SOFTWARE ARE ARE ARE ARE OPCIONAL OPCIONAL OPCIONAL OPCIONAL OPCIONAL
Existe un software opcional complementario a Readiris. Se trata del Mdulo Mdulo Mdulo Mdulo Mdulo
de OCR asitico de OCR asitico de OCR asitico de OCR asitico de OCR asitico, que le permitir reconocer documentos en japons, chino
simplificado, tradicional y coreano.
chapter1.pmd 3/04/2006, 15:37 4
1 - 5
MANUAL DEL USUARIO
Este software se suministra asimismo en un CD-ROM autoejecutable. Al
instalar esta opcin, se habilitar la documentacin especfica en la que se explica
cmo reconocer documentos escritos en lenguas asiticas.
chapter1.pmd 3/04/2006, 15:37 5
1 - 6
I II IINST NST NST NST NSTALACIN ALACIN ALACIN ALACIN ALACIN DE DE DE DE DE PRODUCT PRODUCT PRODUCT PRODUCT PRODUCTOS OS OS OS OS RELACIONADOS RELACIONADOS RELACIONADOS RELACIONADOS RELACIONADOS
Segn del paquete de software que haya adquirido, Readiris puede suministrarse
con una versin de evaluacin del producto Cardiris, un organizador de tarjetas organizador de tarjetas organizador de tarjetas organizador de tarjetas organizador de tarjetas
de visita de visita de visita de visita de visita.
Si su versin de Readiris contiene este programa gratuito, tambin se instalar
mediante el programa autoejecutable del CD-ROM. Siga para ello las instrucciones
que aparecen en pantalla.
Pngase en contacto con I.R.I.S. para obtener ms informacin acerca de
este software; la opcin "Contactar con I.R.I.S" del men "Ayuda" de Readiris
describe las formas en que puede ponerse en contacto con I.R.I.S.
chapter1.pmd 3/04/2006, 15:37 6
1 - 7
MANUAL DEL USUARIO
Un icono del submen "Aplicaciones I.R.I.S. - Readiris" del men "Programas"
lo conducir directamente a la pgina web pgina web pgina web pgina web pgina web de I.R.I.S. Tambin podr acceder
a esta pgina desde la pantalla de inicio del programa, o seleccionando la opcin
"I.R.I.S. en Internet" del men "Ayuda".
chapter1.pmd 3/04/2006, 15:37 7
1 - 8
A AA AARCHIVOS RCHIVOS RCHIVOS RCHIVOS RCHIVOS INST INST INST INST INSTALADOS ALADOS ALADOS ALADOS ALADOS
El programa de instalacin crea una carpeta en la que se localizan los archivos
de Readiris. Nunca intente desinstalar Readiris o alguno de sus mdulos borrando
manualmente los archivos de programa, utilice el programa automtico de
(des)instalacin de Windows. Vase ms arriba.
Archivo Lame y documentacin Archivo Lame y documentacin Archivo Lame y documentacin Archivo Lame y documentacin Archivo Lame y documentacin
README.HTM Archivo Lame (en formato HTML)
MANUAL.PDF Manual del usuario (en formato Adobe Acrobat)
Patrn de escritura Patrn de escritura Patrn de escritura Patrn de escritura Patrn de escritura
TEMPLATE.PDF Patrn de escritura en blanco para reimprimir
(en formato Adobe Acrobat)
TEMPLATE.DOC Patrn de escritura en blanco para editar
(en formato Word)
R R R R REGSTRESE EGSTRESE EGSTRESE EGSTRESE EGSTRESE! !! !!
No olvide de registrar su licencia Readiris. Si lo hace lo mantendremos
informado sobre futuros productos y productos conexos de I.R.I.S. Las ventajas
de registrarse, como la asistencia asistencia asistencia asistencia asistencia gratuita y las ofertas especiales ofertas especiales ofertas especiales ofertas especiales ofertas especiales, estn
reservadas estrictamente a los usuarios registrados.
Puede registrarse de muchas formas: envindonos por correo el formulario de
registro, o por fax el formulario electrnico, llamando a I.R.I.S. en horas de oficina,
o bien completando el formulario de registro en la pgina web de I.R.I.S.
chapter1.pmd 3/04/2006, 15:37 8
1 - 9
MANUAL DEL USUARIO
El asistente de registro asistente de registro asistente de registro asistente de registro asistente de registro de Readiris, que encontrar en el men "Registrar"
del programa Readiris, lo guiar cmodamente durante todo el proceso.
chapter1.pmd 3/04/2006, 15:37 9
1 - 10
Dependiendo de la versin adquirida, recibir la clave de acceso clave de acceso clave de acceso clave de acceso clave de acceso necesario
para continuar utilizando el programa Readiris despus de un mes de demostracin.
C CC CCMO MO MO MO MO OBTENER OBTENER OBTENER OBTENER OBTENER ASISTENCIA ASISTENCIA ASISTENCIA ASISTENCIA ASISTENCIA TCNICA TCNICA TCNICA TCNICA TCNICA
La opcin "Asistencia Tcnica" del men "Ayuda" de Readiris explica cmo
obtener asistencia tcnica. Describa claramente lo que le sucede e incluya toda
la informacin pertinente sobre Readiris, su escner y su sistema informtico.
chapter1.pmd 3/04/2006, 15:37 10
1 - 11
MANUAL DEL USUARIO
Antes de solicitar asistencia tcnica, le recomendamos que compruebe si hay
actualizaciones de actualizaciones de actualizaciones de actualizaciones de actualizaciones de software software software software software disponibles para ser descargadas. Utilice la
opcin "Buscar Actualizaciones" del men "Ayuda" para hacerlo.
chapter1.pmd 3/04/2006, 15:37 11
1 - 12
chapter1.pmd 3/04/2006, 15:37 12
2 - 1
MANUAL DEL USUARIO
Captulo 2
VISITA GUIADA
Readiris es un paquete con la tecnologa OCR de punta provisto de numerosas
caractersticas avanzadas. En este captulo describiremos todas sus principales
caractersticas y aadiremos consejos sobre el uso de Readiris.
I II IINICIO NICIO NICIO NICIO NICIO DEL DEL DEL DEL DEL SOFTW SOFTW SOFTW SOFTW SOFTWARE ARE ARE ARE ARE
Haga clic en el submen "Aplicaciones I.R.I.S. - Readiris", o en el acceso
directo a la aplicacin Readiris situada en su escritorio.
Se visualizarn la pantalla de inicio y la ventana de la aplicacin Readiris. La
pantalla de inicio muestra la versin y los derechos de autor del programa Readiris.
Le permite tambin un acceso directo a la portada web portada web portada web portada web portada web de I.R.I.S. - haga clic
en la direccin URL para acceder a la pgina. Esta pantalla desaparecer haciendo
clic en cualquier otra zona.
La siguiente ventana se refiere al asistente de OCR. Haga clic en "Cancelar".
chapter2.pmd 3/04/2006, 15:38 1
2 - 2
P PP PPRIMERA RIMERA RIMERA RIMERA RIMERA EJECUCIN EJECUCIN EJECUCIN EJECUCIN EJECUCIN
Dependiendo del paquete de software que haya adquirido, la primera ejecucin
puede ser especial, pues se le pedir que registre su licencia.
En tal caso, la utilizacin de Readiris est limitada a un mes y, al registrarse,
recibir de I.R.I.S. una clave de acceso clave de acceso clave de acceso clave de acceso clave de acceso gratuita para continuar utilizando el
software transcurrido dicho plazo.
Necesitar su nmero de identificacin nmero de identificacin nmero de identificacin nmero de identificacin nmero de identificacin para generar la clave de acceso;
asegrese de disponer de dicho nmero o de mencionarlo al registrar su licencia.
D DD DDESCUBRIR ESCUBRIR ESCUBRIR ESCUBRIR ESCUBRIR EL EL EL EL EL INTERF INTERF INTERF INTERF INTERFAZ AZ AZ AZ AZ DE DE DE DE DE R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS
La ventana de aplicacin de Readiris no slo contiene mens de opciones mens de opciones mens de opciones mens de opciones mens de opciones,
sino tambin dos barras de botones que permiten acceder rpidamente a todas
las opciones frecuentes. Al principio, algunos mens estn difuminados, pues se
refieren a la vista preliminar. Mientras no se abra una imagen, no se puede dis-
poner de ellos.
chapter2.pmd 3/04/2006, 15:38 2
2 - 3
MANUAL DEL USUARIO
Otro tanto sucede con la barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen barra de herramientas de imagen situada a la
derecha de la ventana de aplicacin: contiene todas las opciones que necesita
durante la vista preliminar de la imagen. La barra principal de herramientas barra principal de herramientas barra principal de herramientas barra principal de herramientas barra principal de herramientas
situada a la izquierda permite acceder rpidamente a todas las opciones gen-
erales usadas con frecuencia.
chapter2.pmd 3/04/2006, 15:39 3
2 - 4
Para saber la opcin que corresponde a cada botn, coloque el cursor del
ratn sobre este ltimo durante un momento: una etiqueta emergente etiqueta emergente etiqueta emergente etiqueta emergente etiqueta emergente le dir lo
que hace el botn.
La parte interior de la ventana o zona de imagen zona de imagen zona de imagen zona de imagen zona de imagen es donde se muestran las
imgenes escaneadas. Puede arrastrar los archivos grficos hacia la zona de
imgenes (o hacia el icono de Readiris) para reconocerlos.
Cuando se procesan pginas, en la parte izquierda aparecer una nueva barra
de herramientas, denominada barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina. En esta
barra se representan las distintas pginas del documento y permite el acceso a
las funciones de pgina haciendo clic con el botn secundario del ratn. (Se abre
el men "Contexto".)
chapter2.pmd 3/04/2006, 15:39 4
2 - 5
MANUAL DEL USUARIO
A continuacin, aparece el panel de documentos panel de documentos panel de documentos panel de documentos panel de documentos debajo de la imagen
escaneada. En l podr encontrar estadsticas estadsticas estadsticas estadsticas estadsticas e informacin acerca de todas
las pginas escaneadas - la imagen original y su resolucin, el tiempo empleado
en los procesos de escaneado y reconocimiento, etc. (El panel de documentos
tambin incluye mensajes emergentes...)
P PP PPRIMERA RIMERA RIMERA RIMERA RIMERA LECCIN LECCIN LECCIN LECCIN LECCIN INTRODUCTORIA INTRODUCTORIA INTRODUCTORIA INTRODUCTORIA INTRODUCTORIA
La mejor manera de familiarizarse con el manejo de Readiris es sin duda
utilizndolo. El programa contiene una serie de imgenes ya escaneadas imgenes ya escaneadas imgenes ya escaneadas imgenes ya escaneadas imgenes ya escaneadas que
chapter2.pmd 3/04/2006, 15:39 5
2 - 6
le permitirn comenzar incluso si no tiene un escner conectado a su ordenador.
Pasemos a estas imgenes.
El botn "Fuente" de la barra principal de herramientas determina si va a
utilizar un escner o una imagen ya escaneada como origen de la imagen.
Readiris reconoce igualmente imgenes en color, en escala de grises y en
blanco y negro. Readiris le permite abrir documentos PDF de Adobe Acrobat y
archivos de imagen en los formatos fax DCX (una versin multipgina del formato
Paintbrush), DjVu (*.djv, *.djvu), JPEG, JPEG 2000 (*.j2c, *.jp2), PNG, TIFF (no
comprimidas o con compresin LZW, PackBits, Grupo 3, Grupo 4 o JPEG), TIFF
de mltiples pginas, mapas de bits de Windows (*.bmp) y ZSoft Paintbrush
(*.pcx).
Esta funcin resulta especialmente til para convertir sus faxes faxes faxes faxes faxes en archivos
digitales de texto.
Cuando vaya a abrir una imagen ya escaneada, con el botn "Fuente" de la
barra principal de herramientas seleccione el disco y no el escner como origen
de la imagen.
A continuacin haga clic en el botn "Abrir". (Cuando selecciona el disco
como origen de la imagen, al botn "Escanear" lo sustituye el botn "Abrir".
Asimismo, el mando "Escanear" del men "Accin" la sustituye el mando "Abrir".)

chapter2.pmd 3/04/2006, 15:39 6
2 - 7
MANUAL DEL USUARIO
A continuacin haga clic en el botn "Abrir" del men "Archivo" y abre una
imagen escaneada previamente - esto es posible incluso si su escner funciona
como origen actual de la imagen.
Se le pedir que elija un archivo grfico. Seleccione el archivo SPANISH.JPG
de la carpeta "Samples", una subcarpeta de la carpeta donde est instalado Readiris.
(Todas las imgenes de muestra se encuentran en esta carpeta!) Como se trata
de una imagen en color, adems de leerla directamente desde el disco, se crea
una versin binaria, en blanco y negro, para el proceso de OCR.

Finalmente, la imagen se visualiza en la zona de imgenes, y la barra de
herramientas de pgina y el panel de documentos indican que se ha cargado una
pgina en Readiris.
chapter2.pmd 3/04/2006, 15:39 7
2 - 8
Una tercera forma de abrir imgenes ya escaneadas es el arrastre con el arrastre con el arrastre con el arrastre con el arrastre con el
ratn ratn ratn ratn ratn: arrastre imgenes desde el Explorador de Windows hacia la zona de
imagen de Readiris o hacia el icono de Readiris y se abrirn inmediatamente.
chapter2.pmd 3/04/2006, 15:39 8
2 - 9
MANUAL DEL USUARIO
Por ltimo, podr abrir imgenes directamente desde el Explorador de Win-
dows haciendo clic con el botn derecho haciendo clic con el botn derecho haciendo clic con el botn derecho haciendo clic con el botn derecho haciendo clic con el botn derecho del ratn en un archivo grfico y
seleccionando el mando "Reconocer" del men "Contexto". (Esto mando slo
estar disponible si el archivo en cuestin pertenece a alguno de los reconocidos
por el programa.)
chapter2.pmd 3/04/2006, 15:39 9
2 - 10
Esto no significa que el OCR se efecte inmediatamente. Con el fin de
proporcionar al usuario la mxima flexibilidad de uso, nicamente se ejecuta la
aplicacin Readiris y se abre la imagen.
La barra de herramientas de imagen situada a la derecha de la ventana de
aplicacin de Readiris contiene todas las opciones que necesita durante la vista
preliminar de la imagen: herramientas para indicar las zonas de inters, para girar
la imagen, para ampliarla o reducirla, etc.
A AA AAMPLIACIN MPLIACIN MPLIACIN MPLIACIN MPLIACIN DE DE DE DE DE IMGENES IMGENES IMGENES IMGENES IMGENES
Readiris cuenta con varias opciones que le permiten ampliar ampliar ampliar ampliar ampliar la imagen
escaneada, por ejemplo, para verificar la calidad de escaneado.
La barra de herramientas de imagen contiene botones que le permiten ampliar
a tamao real, ajustar la imagen al ancho de pgina y ajustar toda la imagen en la
chapter2.pmd 3/04/2006, 15:39 10
2 - 11
MANUAL DEL USUARIO
ventana de vista preliminar. El men "Ver" contiene las mismas opciones y aade
dos niveles adicionales de ampliacin: puede mostrar la imagen al 50% y al 200%
de su tamao real. En tamao real, un pixel de pantalla corresponde a un pixel de
la imagen. (Hay mtodos abreviados de teclado para todos los niveles de zoom.)

Observe tambin que dispone de un aceso a los niveles de ampliacin gracias
al clic derecho. Haga clic con el botn derecho del ratn para que aparezca el
menu contextual y seleccione el nivel de ampliacin adecuado.
chapter2.pmd 3/04/2006, 15:39 11
2 - 12
Adems, puede hacer doble clic con el botn derecho del ratn en una zona
de la imagen escaneada para ampliarla inmediatamente a tamao real. Repita la
operacin para volver a disminuirla.
Por ltimo, puede utilizar la lupa lupa lupa lupa lupa para ampliar detalles del documento
escaneado. La lupa de aumento tambin est disponible en el men contextual al
hacer clic sobre la imagen con el botn derecho del ratn.

Pulse Escape o haga clic con el ratn para que vuelva a desaparecer la lupa.
chapter2.pmd 3/04/2006, 15:39 12
2 - 13
MANUAL DEL USUARIO
U UU UUNO NO NO NO NO, , , , , DESCOMPONER DESCOMPONER DESCOMPONER DESCOMPONER DESCOMPONER UNA UNA UNA UNA UNA IMAGEN IMAGEN IMAGEN IMAGEN IMAGEN ESCANEADA ESCANEADA ESCANEADA ESCANEADA ESCANEADA
Una vez escaneada la imagen debe indicar las partes que desea convertir en
texto modificable trazando marcos, denominados ventanas, alrededor de las
zonas de inters.
De hecho, Readiris lo har automticamente si activa la opcin "Anlisis de
Pgina" desde el botn "Opciones" de la barra de herramientas principal (o desde
el men "Configuracin").
La descomposicin automtica de pginas resulta especialmente til para
reconocer textos con columnas textos con columnas textos con columnas textos con columnas textos con columnas y documentos con un diseo de pgina complejo
(incluirn posiblemente grficos y tablas).
chapter2.pmd 3/04/2006, 15:39 13
2 - 14
La divisin de pgina se realiza mediante tres tipos de ventanas tipos de ventanas tipos de ventanas tipos de ventanas tipos de ventanas: ventanas
de texto, de grficos y de tablas. Readiris separa en cada pgina bloques de
texto, zonas de tablas y zonas de grficos (fotografas, ilustraciones, etc.). (La
manera de reconocer tablas y guardar grficos se tratar ampliamente ms
adelante.)
chapter2.pmd 3/04/2006, 15:39 14
2 - 15
MANUAL DEL USUARIO
Hay dos otros tipos ms de zona que siempre deben definirse manualmente:
las zonas de cdigos de barras y las zonas de texto manuscrito. (La lectura de
cdigos de barras y el reconocimiento de letras de palo seco escritas a mano se
explican detalladamente en otra seccin de este manual.)
Un cdigo de color cdigo de color cdigo de color cdigo de color cdigo de color indica el tipo de ventana de que se trata: las zonas de
texto tienen un borde amarillo, las ventanas grficas tienen un borde azul y las de
tablas, un borde morado. Las zonas de cdigo de barras son verdes, mientras que
las manuscritas son azules.
El nmero de ventanas se indica en todo momento en las etiquetas emergentes
de las herramientas de ventanas.


El anlisis de pgina es rpido, sumamente preciso y tolera distorsiones: traza
formas complejas e irregulares.
El anlisis de pgina detectar incluso aquellas zonas en que hay texto blanco texto blanco texto blanco texto blanco texto blanco
sobre fondo negro. sobre fondo negro. sobre fondo negro. sobre fondo negro. sobre fondo negro. El reconocimiento de dichos trozos no plantea problema
alguno: la vista preliminar muestra el documento escaneado de forma correcta en
la pantalla, pero Readiris invierte la imagen cuando es necesario para reconocer
dichos bloques de texto. (Gracias al escner, podr generar imgenes totalmente
invertidas de pginas que contengan texto blanco sobre fondo negro. Ver ms
adelante.)
chapter2.pmd 3/04/2006, 15:39 15
2 - 16
U UU UUNA NA NA NA NA Y YY YY MEDIA MEDIA MEDIA MEDIA MEDIA, , , , , CLASIFICACIN CLASIFICACIN CLASIFICACIN CLASIFICACIN CLASIFICACIN DE DE DE DE DE VENT VENT VENT VENT VENTANAS ANAS ANAS ANAS ANAS
Readiris no slo detecta los diferentes tipos de bloques, sino que tambin los
clasifica: esta clasificacin se realiza por defecto de arriba a abajo y de derecha
a izquierda, con objeto de poder trabajar con documentos que contengan columnas.
Los nmeros indican la clase de orden.
Evidentemente, puede usted modificar el orden de clasificacin orden de clasificacin orden de clasificacin orden de clasificacin orden de clasificacin. Para ello,
haga clic en el botn "Ordenar" de la barra de herramientas de imagen. El cursor
se convierte en una manecilla en cuanto se activa el modo de clasificacin.
Haga clic en las ventanas que desee incluir. Las ventanas en las que no haga
clic no sern clasificadas, quedando excluidas del reconocimiento. Es muy fcil
saber qu zonas han sido seleccionadas y cules no: las ventanas seleccionadas
se visualizan con todo su color, mientras que las no lo han sido presentan unos
tonos ms claros y no tienen ningn nmero.
chapter2.pmd 3/04/2006, 15:39 16
2 - 17
MANUAL DEL USUARIO
Por defecto, el anlisis de pgina est activado. Para obligar a Readiris a
descomponer la pgina actual - debido a que desactiv el anlisis de pgina
accidentalmente o borr algunas ventanas por error y desea volver a efectuar el
anlisis de pgina - simplemente haga clic en el botn "Analizar Pgina" de la
barra de herramientas de imagen.
chapter2.pmd 3/04/2006, 15:39 17
2 - 18
Seleccione el idioma del documento antes de ejecutar el anlisis de pgina
siempre que vaya a reconocer documentos escritos en un idioma asitico. Para
estos idiomas se utilizan rutinas especficas, dado que, por una parte, el espacio
entre lneas de los documentos escritos en lenguas asiticas es, por regla general,
mayor que el de los documentos escritos en lenguas occidentales. Adems, el
texto est formado por pequeos iconos denominados ideogramas que podran
ser fcilmente confundidos con zonas grficas en los documentos occidentales.
Y, por ltimo, es posible que el texto vaya de arriba a abajo y de derecha a
izquierda. Si ha olvidado seleccionar el idioma adecuado, seleccionel despus:
Readiris volver a ejecutar el anlisis de pgina automticamente.
Algunos documentos presentan pequeas manchas sobre la pgina, pueden
generar un borde negro alrededor de la imagen real, etc. Para eliminar todas las
pequeas ventanas - suponiendo que no contienen texto - haga clic en el mando
"Suprimir Pequeas Ventanas" bajo el men "Edicin".

Otra rutina parecida es automtica: la deteccin de zonas en los mrgenes de
las pginas. Cuando se desactiva esta rutina en el men "Configuracin", el anlisis
de pgina ignora cualquier zona que est muy cerca de los mrgenes. Si el escner
genera mrgenes negros alrededor de la imagen, el anlisis de pgina tiende a
encontrar zonas en lugares en los que en realidad slo hay ruido Las zonas de
grficos que pueda haber en los mrgenes no se tocan: las fotos a menudo se
chapter2.pmd 3/04/2006, 15:40 18
2 - 19
MANUAL DEL USUARIO
tocan con los mrgenes, los grficos de fondo en muchos casos ocupan toda la
pgina, etc.

D DD DDOS OS OS OS OS, , , , , TRAZAR TRAZAR TRAZAR TRAZAR TRAZAR VENT VENT VENT VENT VENTANAS ANAS ANAS ANAS ANAS MANUALMENTE MANUALMENTE MANUALMENTE MANUALMENTE MANUALMENTE
El anlisis de pgina es la forma automtica de trazar ventanas en una pgina
escaneada. Tambin puede dividir manualmente una imagen con las herramientas herramientas herramientas herramientas herramientas
de trazado de ventanas de trazado de ventanas de trazado de ventanas de trazado de ventanas de trazado de ventanas de Readiris.
chapter2.pmd 3/04/2006, 15:40 19
2 - 20
(Tal como se comenta en un apartado anterior, el usuario siempre debe trazar
manualmente las ventanas de cdigo de barras y de texto manuscrito, ya que el
anlisis de pgina no las detecta automticamente!)
Para trazar trazar trazar trazar trazar un rectngulo alrededor de una zona concreta, seleccione la
herramienta correspondiente en la barra de herramientas de imagen y arrastre el
cursor desde el extremo superior izquierdo hasta el extremo inferior derecho de
la ventana. (No se permiten lados inferiores a 1 mm., pues no podran contener ni
un solo carcter...)
En caso de haber seleccionado el tipo de zona errneo, no se preocupe: podr
cambiarlo rpidamente haciendo clic con el botn derecho del ratn sobre una
ventana y seleccionando el mando "Ventana - Tipo" desde el men contextual.
Las ventanas se clasifican automticamente siguiendo el orden de su creacin:
el orden de clasificacin se indica mediante nmeros.
Tambin puede enmarcar bloques irregulares de texto trazando ventanas ventanas ventanas ventanas ventanas
poligonales poligonales poligonales poligonales poligonales alrededor de ellos. Las ventanas no rectangulares se crean
fusionando zonas rectangulares: tan pronto como dos rectngulos (del mismo
chapter2.pmd 3/04/2006, 15:40 20
2 - 21
MANUAL DEL USUARIO
tipo) se intersectan, se convierten automticamente en una sola ventana. De
cierta forma, es como construir una casa aadiendo una habitacin tras otra...
(Crear ventanas de tablas poligonales y de cdigos de barras carece de sentido.)
Adems, puede combinarse el trazado manual de ventanas con la clasificacin
de stas: puede trazar nuevas ventanas incluso cuando est activado el modo de
clasificacin. As, puede realizar una clasificacin automtica para incluir las
ventanas detectadas y despus crear otras ventanas manualmente all donde el
anlisis de pgina no ha ofrecido los resultados esperados. En cuanto comience
el trazado manual de ventanas, con el modo de clasificacin activado, se borrarn
todas las ventanas que no haya seleccionado!
Para modificar, mover y eliminar ventanas, primero debe seleccionarlas. seleccionarlas. seleccionarlas. seleccionarlas. seleccionarlas.
Para ello, seleccione la herramienta "Seleccin de Ventana" (la flecha) en la
barra de herramientas de imagen y haga clic en el interior de la ventana. Aparecern
unas marcas rectangulares en cada esquina y en el centro de los lados de la
ventana.

chapter2.pmd 3/04/2006, 15:40 21
2 - 22
Para deseleccionar deseleccionar deseleccionar deseleccionar deseleccionar ventanas, pulse el botn del ratn en cualquier otro
lugar. Para seleccionar ventanas adicionales ventanas adicionales ventanas adicionales ventanas adicionales ventanas adicionales, mantenga pulsada la tecla Mays
mientras hace clic en dichas ventanas. Para seleccionar una ventana y las ventanas ventanas ventanas ventanas ventanas
incluidas incluidas incluidas incluidas incluidas (de otro tipo), mantenga pulsada la tecla Ctrl y haga clic en la ventana
principal.
Hasta aqu la seleccin de ventanas. Para modificar modificar modificar modificar modificar una ventana de texto,
seleccinela, coloque el cursor del ratn sobre una marca y arrastre el lado para
cambiar el tamao de la ventana.
Para mover mover mover mover mover una ventana, simplemente seleccinela y arrstrela al lugar
deseado.
Para eliminar eliminar eliminar eliminar eliminar ventanas, seleccione la(s) ventana(s) y elija el mando "Suprimir"
del men contextual. Dicha funcin borra la(s) ventana(s) seleccionada(s) y la
que se encuentre bajo el cursor del ratn. Al pegar ventanas, stas se insertan en
su posicin original y debe arrastrarlas al lugar deseado.
De igual modo, puede seleccionar zonas y optar los mandos "Cortar" o "Borrar"
del men "Edicin". El mando "Cortar" corta la(s) ventana(s) y la(s) enva a una
memoria temporal interna; la funcin "Borrar" borra irreversiblemente la(s)
ventana(s). Al pegar ventanas, stas se insertan en su posicin original y debe
arrastrarlas al lugar deseado.
chapter2.pmd 3/04/2006, 15:40 22
2 - 23
MANUAL DEL USUARIO
De hecho, todos los mandos del men "Edicin" se aplican a las ventanas:
puede eliminarlas, cortarlas, copiarlas y pegarlas. Tambin puede utilizar la opcin
"Deshacer": si por error ha eliminado, movido, cambiado de tamao, etc. algunas
ventanas, "Deshacer" anular la ltima operacin.
Existen macros para todas las opciones. He aqu un ejemplo: para borrar todas
las ventanas presentes, puede elegir la opcin "Seleccionar Todo" del men
"Edicin" o la macro equivalente Ctrl+A y hacer clic en el mando "Borrar" del
men "Edicin" o su macro Supr. Ahora ya est listo para reproducir el diseo
necesario. Para restaurar el diseo anterior, elija "Deshacer" o su macro Ctrl+Z.
T TT TTRES RES RES RES RES, , , , , GUARDAR GUARDAR GUARDAR GUARDAR GUARDAR MODELOS MODELOS MODELOS MODELOS MODELOS DE DE DE DE DE VENT VENT VENT VENT VENTANAS ANAS ANAS ANAS ANAS
Los diseos de ventanas resultantes pueden guardarse en forma de modelos modelos modelos modelos modelos
de zonas de zonas de zonas de zonas de zonas para futuro uso, con la opcin "Guardar el Formato" del men "Archivo"
y cargarlos en memoria con la opcin "Cargar el Formato".
Si desea reconocer documentos con un diseo similar, por ejemplo, un informe
de 50 pginas en la que el encabezado y el pie de pgina deben excluirse por
razones obvias, se puede aplicar un modelo nico para dividir en zonas las 50
pginas.
chapter2.pmd 3/04/2006, 15:40 23
2 - 24
Al cargar una plantilla en la memoria se desactiva automticamente el anlisis
de pgina. La divisin en zonas del modelo se mantiene activa hasta que vuelva a
activar el anlisis de pgina en la barra principal de herramientas. Cuando cargue
un formato en la memoria, puede activar la opcin "Aplicar Formato a Todas las
Pginas" para aplicarlo inmediatamente a todas las pginas del documento.
De hecho, existe una eficaz alternativa para establecer las plantillas de
determinacin de zona. La herramienta de vista preliminar "Ignorar la Zona Ex-
terior" limita la descomposicin de la pgina a la seccin cortada de la imagen.
Seleccione esta herramienta y encuadre la seccin de la imagen que quiere
procesar. Cuando est trabajando con un documento de mltiples pginas, puede
eliminar la misma zona exterior mediante un anlisis de pgina de cada pgina.
(Vuelva a realizar el anlisis de pgina para cancelar el corte de la imagen o
cambie las zonas manualmente.)
chapter2.pmd 3/04/2006, 15:40 24
2 - 25
MANUAL DEL USUARIO
R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS LO LO LO LO LO LLEV LLEV LLEV LLEV LLEVA AA AA POR POR POR POR POR T TT TTODO ODO ODO ODO ODO EL EL EL EL EL MUNDO MUNDO MUNDO MUNDO MUNDO
Suponiendo que las ventanas estn correctamente definidas, ahora ya casi
est listo para ejecutar el reconocimiento de caracteres. Decimos casi porque
an no hemos verificado el idioma y las propiedades del documento.
chapter2.pmd 3/04/2006, 15:40 25
2 - 26
Las propiedades de idioma se encuentran en la barra principal de herramientas.
Haga clic en el botn "Idioma" para modificar el idioma del documento.
chapter2.pmd 3/04/2006, 15:40 26
2 - 27
MANUAL DEL USUARIO
(Esta opcin tambin permite acceder a los modos de reconocimiento - rpido
y preciso. Hablaremos ms de ellos ms adelante...)
Para pasar directamente a un idioma pulse la letra inicial de ste: si est
seleccionado el espaol y desea localizar el dans, pulse la letra "D" para ir
directamente hasta l. Si varios idiomas tienen la misma inicial, pulse la letra
varias veces para recorrer las opciones. Por ejemplo, Readiris lee waray y wolof.
Si pulsa "W" una vez, seleccionar el waray, si vuelve a pulsar "W" seleccionar
el wolof, y pulsando "W" una tercera vez volver al waray. (Para ir a otra letra,
por ejemplo la "T", pulse primero la tecla Retroceso.)
Readiris no se limita ni con mucho al espaol: se pueden utilizar hasta 126
idiomas idiomas idiomas idiomas idiomas! Se pueden utilizar todos los idiomas americanos y europeos, incluyendo
los idiomas centroeuropeos, cirlicos (rusos), blticos, el griego y el turco.
Opcionalmente, puede reconocer documentos escritos en lenguas asiticas lenguas asiticas lenguas asiticas lenguas asiticas lenguas asiticas.
El software opcional Mdulo de OCR asitico permite el reconocimiento del
japons, el chino simplificado, el chino tradicional y el coreano. (El chino
simplificado se habla en la Repblica Popular de la China y en Singapur, mientras
que el chino tradicional se utiliza en Hong Kong, Taiwan, Macao y entre las
comunidades chinas de ultramar.)
Cabe sealar que tambin se distingue entre las variedades britnica y
norteamericana - o deberamos decir internacional? - de la lengua inglesa, as
como entre el espaol de Espaa y el de Mjico, entre otros.
Se requiere la configuracin adecuada de Windows para mostrar en pantalla
caracteres de idiomas exticos, como los basados en el alfabeto cirlico, los
idiomas asiticos, el griego, el turco, etc. Quiz deba instalar el componente de
soporte multilenguaje de soporte multilenguaje de soporte multilenguaje de soporte multilenguaje de soporte multilenguaje de W WW WWindows indows indows indows indows para que su sistema operativo pueda
procesar dichos idiomas.
En un sistema operativo Windows XP, 2000 y Windows NT 4.0, seleccione el
icono "Opciones Regionales (y Idiomas)" en el men "Panel de Control".
chapter2.pmd 3/04/2006, 15:40 27
2 - 28
En un sistema operativo Windows ME y 98, seleccione el icono "Agregar o
Quitar Programas" de "Panel de Control" para ver si el mdulo "Compatibilidad
Multilinge" est instalado.
chapter2.pmd 3/04/2006, 15:40 28
2 - 29
MANUAL DEL USUARIO
Para visualizar y editar documentos en lenguas asiticas, deber instalar una
versin asitica del sistema operativo Windows o utilizar Word 2003, Word 2002
o Word 2000 para visualizar y editar este tipo de documentos, dado que los paquetes
Office 2003, Office XP y Office 2000 fueron especficamente diseados para
trabajar con documentos en muy diversos idiomas.
Nada de esto es necesario para ver documentos en formato PDF documentos en formato PDF documentos en formato PDF documentos en formato PDF documentos en formato PDF: Adobe
Acrobat y Adobe Reader se actualizan automticamente cuando deben leerse
documentos escritos en idiomas exticos - ruso, japons, etc.
chapter2.pmd 3/04/2006, 15:40 29
2 - 30
Consulte el archivo Lame archivo Lame archivo Lame archivo Lame archivo Lame de Readiris para obtener ms informacin
sobre este tema.
La seleccin del idioma adecuado para el documento es imperativa. En funcin
de la seleccin del idioma, el programa sabe qu juegos de smbolos juegos de smbolos juegos de smbolos juegos de smbolos juegos de smbolos debe
reconocer. El soporte multilinge garantiza un reconocimiento correcto de
caracteres exticos como , , y .
Asimismo, el programa hace un extenso uso de bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas bases de datos lingsticas
para convalidar sus resultados. Supongamos que se debe leer la palabra "presi-
dente" y una mancha de tinta hace que la "r" parezca una "f". Al buscar en el
lxico espaol, Readiris detectar de forma autnoma que est leyendo la palabra
"presidente" y que no tiene sentido reconocer el smbolo "f". Por supuesto, esta
tcnica de tcnica de tcnica de tcnica de tcnica de autoaprendizaje autoaprendizaje autoaprendizaje autoaprendizaje autoaprendizaje depende en gran medida del contexto lingstico.
A menudo, la lingstica resulta muy til para resolver casos ambiguos casos ambiguos casos ambiguos casos ambiguos casos ambiguos, como
una "O" que puede confundirse errneamente por un '0'. Otro ejemplo es la letra
"l" y el nmero '1' que tienen una forma idntica en muchas fuentes; piense por
ejemplo en los textos escritos con antiguas mquinas de escribir. El contexto
lingstico ayuda a determinar si se trata de una "l" o de un '1'.
La ilustracin a continuacin muestra varias formas de '1' y "l". Las formas de
la primera lnea carecen de ambigedad, las formas de la segunda son ambiguas,
pero la lingstica permite resolverlas. Si no basta con el contexto, el usuario debe
intervenir.
R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS CAMBIA CAMBIA CAMBIA CAMBIA CAMBIA DE DE DE DE DE IDIOMA IDIOMA IDIOMA IDIOMA IDIOMA CUANDO CUANDO CUANDO CUANDO CUANDO ES ES ES ES ES NECESARIO NECESARIO NECESARIO NECESARIO NECESARIO
Pero eso no es todo: Readiris puede cambiar de idioma a media frase sin
intervencin del usuario. Cuando aparecen palabras occidentales en documentos
escritos utilizando caracteres griegos, cirlicos o asiticos - muchos nombres propios
chapter2.pmd 3/04/2006, 15:40 30
2 - 31
MANUAL DEL USUARIO
no modificables, nombres de marcas, etc. se escriben respetando su grafa latina
-, Readiris puede adaptarse automticamente al alfabeto apropiado. O sea, es
posible activar simultneamente un alfabeto mixto alfabeto mixto alfabeto mixto alfabeto mixto alfabeto mixto de caracteres griegos, cirlicos
o asiticos y latinos.
Asegrese de seleccionar "Griego-Ingls" o la propiedad adecuada de cirlico
- por ejemplo "Bielorruso-Ingls". En otras palabras, si selecciona nicamente
"Griego" o "Bielorruso" como idioma del documento, no espere que salgan bien
los caracteres latinos!

He aqu un ejemplo en el que un texto en ruso contiene algunas palabras
inglesas: abra el archivo de imagen ALPHABETS.TIF y reconozca la pgina
correspondiente si desea verlo usted mismo.
chapter2.pmd 3/04/2006, 15:40 31
2 - 32
El resultado final es parecido a ste cuando se abre con el tratamiento de
textos - quiz debe seleccionar una fuente fuente fuente fuente fuente cirlica para mostrar correctamente el
texto ruso en pantalla.
chapter2.pmd 3/04/2006, 15:40 32
2 - 33
MANUAL DEL USUARIO
Para mezclar otros idiomas mezclar otros idiomas mezclar otros idiomas mezclar otros idiomas mezclar otros idiomas, simplemente seleccione el idioma con el mayor
nmero de caracteres. Si tiene un documento en el que, digamos, una traduccin
ingles est junto al texto francs, debe seleccionar el idioma francs para garantizar
que se reconozcan los caracteres acentuados como , y .
D DD DDEFINIR EFINIR EFINIR EFINIR EFINIR LAS LAS LAS LAS LAS CARACTERSTICAS CARACTERSTICAS CARACTERSTICAS CARACTERSTICAS CARACTERSTICAS DEL DEL DEL DEL DEL DOCUMENTO DOCUMENTO DOCUMENTO DOCUMENTO DOCUMENTO
Una vez seleccionado el idioma, pasaremos a las otras caractersticas del
documento. Puede afinar el reconocimiento especificando algunas de las
caractersticas del documento - el tipo de fuente y el espacio entre caracteres.
(Estas opciones no se aplican a los documentos asiticos.) Expliquemos lo que
esto significa.
chapter2.pmd 3/04/2006, 15:41 33
2 - 34
Empecemos con el mando "Tipo de Fuente" en el men "Configuracin". El
tipo de fuente distingue los documentos normales de los documentos documentos documentos documentos documentos
matriciales matriciales matriciales matriciales matriciales. Los smbolos matriciales de calidad borrador, tambin
denominados 9 agujas, estn formados por puntos aislados y separados y su
reconocimiento requiere rutinas altamente especializadas.
La impresin con matriz de agujas calidad de carta, tambin denominado
25 agujas, requiere la configuracin normal al igual que las calidades de calidades de calidades de calidades de calidades de
impresin impresin impresin impresin impresin imprenta, mecanografiado, impresin lser e impresin con chorro de
tinta.
La opcin "Automtico" significa que Readiris detectarar por s mismo el tipo
de fuente. Deje Readiris detectar automaticamente el tipo de los caracteres en
todos los casos - a no ser que este seguro que va a leer documentos matriciales!
(Obviamente, "Automtico" es el valor por defecto.)
La etiqueta emergente del botn "Reconocer-Guardar" indica cul es el el tipo
de letra activo. Cuando no se muestra ningn mensaje, se usar la calidad de
impresin normal; cuando aparece el mensaje "Matricial", significa que est
activado el modo de lectura para textos impresos con impresora matricial.
El ancho de fuente ancho de fuente ancho de fuente ancho de fuente ancho de fuente puede establecerse con la opcin "Espacio entre
Caracteres" en el men "Configuracin".
chapter2.pmd 3/04/2006, 15:41 34
2 - 35
MANUAL DEL USUARIO
Con fuentes fijas (o fuentes monoespacios), todos los smbolos de la fuente
tienen el mismo ancho. Una "i" ocupa el mismo espacio hori-
zontal que una "w", como sucede en esta frase. Piense en
los documentos escritos con una mquina de escribir, en la que el carro se mueve
una distancia fija para cada smbolo escrito.
Un ancho proporcional significa que un carcter depende de su forma. Los
smbolos como m y w son ms anchos y ocupan ms espacio horizontal en
una lnea que caracteres delgados como l j. Virtualmente todos los libros,
revistas y peridicos estn impresos en ancho proporcional.
La solucin ms sencilla es dejar esta opcin siempre en el valor por defecto
"Automtico", que significa que Readiris detectar automticamente el ancho de
los caracteres.
V VV VVELOCIDAD ELOCIDAD ELOCIDAD ELOCIDAD ELOCIDAD CONTRA CONTRA CONTRA CONTRA CONTRA PRECISIN PRECISIN PRECISIN PRECISIN PRECISIN
Ha una opcin final que podemos configurar antes de empezar con el
reconocimiento - el modo de reconocimiento modo de reconocimiento modo de reconocimiento modo de reconocimiento modo de reconocimiento. De hecho, ya hemos tenido la
posibilidad de hacerlo cuando indicamos el idioma del documento con el botn
"Idioma". Este botn tambin permite seleccionar el equilibrio deseado entre
velocidad y precisin. (Estos modos de reconocimiento especializado no son com-
patibles con documentos realizados mediante impresin matricial o en algn idioma
asitico.)
chapter2.pmd 3/04/2006, 15:41 35
2 - 36

El modo de reconocimiento rpido es el ms apropiado para documentos con
una buena calidad de impresin (y de escaneado). Por ejemplo, hablamos de
ntidos documentos impresos con impresora lser y escaneados con la resolucin
y el brillo adecuados... El modo de reconocimiento preciso debera seleccionarse
cuando la calidad de imagen es inferior; hablamos ahora de faxes, instantneas
tomadas con una cmara digital u otras imgenes de baja resolucin, etc. El
modo de reconocimiento preciso garantiza unos resultados de OCR ptimos para
todo tipo de documentos, pero tarda ms en procesar los documentos.
El modo de reconocimiento preciso est activado por defecto. El mensaje
emergente del botn "Reconocer-Guardar" indica cul es el modo de
reconocimiento activo.
chapter2.pmd 3/04/2006, 15:41 36
2 - 37
MANUAL DEL USUARIO
R R R R READIRIS EADIRIS EADIRIS EADIRIS EADIRIS SE SE SE SE SE HACE HACE HACE HACE HACE CADA CADA CADA CADA CADA VEZ VEZ VEZ VEZ VEZ MS MS MS MS MS INTELIGENTE INTELIGENTE INTELIGENTE INTELIGENTE INTELIGENTE! !! !!
Una vez seleccionado el idioma del documento y establecidas las caractersticas
del documento, active el aprendizaje interactivo y pulse el botn "Reconocer-
Guardar".

El progreso del OCR se indica en la pantalla. Puede pulsar el botn de parada
o pulsar la tecla Escape para interrumpir el reconocimiento de texto.
Al trmino del reconocimiento, Readiris entra en la fase interactiva de
aprendizaje en la cual se activa el aprendizaje pulsando el botn "Aprendizaje" de
la barra principal de herramientas. El aprendizaje interactivo est desactivado
por defecto.
(El aprendizaje interactivo no est disponible para los documentos de lenguas
asiticas, pues carece de sentido en estos idiomas, que se componen de miles de
smbolos diferentes - adems habran de poder introducirse los ideogramas mediante
un teclado occidental, cosa nada fcil!)
chapter2.pmd 3/04/2006, 15:41 37
2 - 38
El aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes aprendizaje de fuentes puede mejorar considerablemente la precisin
del sistema de reconocimiento. Si el usuario intenta reconocer formularios
distorsionados o desfigurados como los que se encuentran en documentos reales
o bien formas estilizadas de fuentes que Readiris no reconoce de forma ptima,
este aprendizaje puede resolver este fallo temporal.
El aprendizaje del usuario tambin se utiliza para que el sistema aprenda
smbolos especiales smbolos especiales smbolos especiales smbolos especiales smbolos especiales que Readiris no es capaz de reconocer, como smbolos
matemticos y cientficos y dingbats. Algunos ejemplos: Readiris puede aprender
a reconocer el smbolo "" como "pi" o el dingbat "" como "Tel". (Sin embargo,
la lista de smbolos reconocidos no puede extenderse a los smbolos "" y "".)
El texto reconocido aparece progresivamente en pantalla y el sistema se detiene
en los caracteres dudosos, o - si se trata de caracteres unidos (ligaduras) - en
cadenas de caracteres dudosas. Los caracteres dudosos siempre se presentan
en su contexto y se destacan. Los caracteres no reconocidos se representan con
una tilde.
chapter2.pmd 3/04/2006, 15:41 38
2 - 39
MANUAL DEL USUARIO
Lo primero que debe hacer es comprobar si ha activado el diccionario de
fuentes y el modo de diccionario adecuados - stos se indican siempre en el ttulo
de la ventana de aprendizaje. Si no es as, haga clic en el botn "Cancelar" - el
documento vuelve a aparecer con la divisin por zonas con la que se fue creado
- active el diccionario de fuentes o el modo de diccionario adecuados y vuelva a
ejecutar el reconocimiento. (Pronto se explicar el funcionamiento de los
diccionarios de fuentes.)
De ser necesario, introduzca un carcter (o cadena de caracteres) en lugar de
la forma incorrecta o desconocida y pulse uno de los siguientes botones.
Aprender Aprender Aprender Aprender Aprender
Est de acuerdo con la solucin propuesta o la corrige. El programa guarda
este carcter dudoso en el diccionario de fuentes como carcter seguro, definitivo.
chapter2.pmd 3/04/2006, 15:41 39
2 - 40
Los reconocimientos posteriores no requerirn su intervencin, la forma se
considerar aprendida de una vez por todas.
En el ejemplo anterior, el sistema se detiene en un carcter sucio y pulsamos
"Aprender" para aceptar una forma que no puede confundirse con otros caracteres.
Descartar Descartar Descartar Descartar Descartar Aprendizaje Aprendizaje Aprendizaje Aprendizaje Aprendizaje
Est de acuerdo con la solucin propuesta o la corrige. La diferencia respecto
al botn "Aprender" consiste en que el smbolo aprendido obtiene el calificativo
de inseguro en el diccionario. Para su reconocimiento futuro, el sistema
propondr la solucin apprendida, pero an requerir una confirmacin.
Este botn se utiliza para aquellos smbolos que pueden confundirse con otros:
una "e" desfigurada que puede confundirse con una "c", una "t" daada que puede
parecerse a una "r", etc.
chapter2.pmd 3/04/2006, 15:41 40
2 - 41
MANUAL DEL USUARIO
La "e" que se muestra anteriormente est muy daada - de hecho es muy
parecida al smbolo "c", por lo que debe pulsar el botn "Descartar Aprendizaje"
a fin de no confundirlo con el smbolo "c".
Borrar Borrar Borrar Borrar Borrar
La forma que aparece en pantalla se elimina del resultado. Este botn se
utiliza para ignorar el ruido presente en los documentos - puntos, manchas de
caf, etc. - que pueden reconocerse como puntos, comas y otras cosas, as como
para borrar los smbolos no deseados.
Deshacer Deshacer Deshacer Deshacer Deshacer
Para volver y corregir errores. Puede deshacer las ltimas 32 decisiones.
T TT TTerminar erminar erminar erminar erminar
El proceso de aprendizaje concluye, pero el reconocimiento de caracteres
continua en modo automtico. En lo sucesivo, todas las decisiones adoptadas por
el usuario son aceptadas sin confirmacin por parte del usuario.
Pulse este botn cuando vea que el reconocimiento es sumamente preciso y
no requiere una correccin detallada.
Cancelar Cancelar Cancelar Cancelar Cancelar
No confunda el botn "Terminar" con el botn "Cancelar". Con "Cancelar" no
se genera un resultado y vuelve a comenzar desde el principio, con "Terminar" se
crea el texto, slo que no ha sido corregido en sus detalles.
P PP PPAPEL APEL APEL APEL APEL DE DE DE DE DE LOS LOS LOS LOS LOS DICCIONARIOS DICCIONARIOS DICCIONARIOS DICCIONARIOS DICCIONARIOS DE DE DE DE DE FUENTES FUENTES FUENTES FUENTES FUENTES
Los resultados de cada sesin de aprendizaje se conservan temporalmente en
la memoria del ordenador, pero pueden y deben guardarse en archivos
denominados diccionarios para su uso ulterior.
chapter2.pmd 3/04/2006, 15:41 41
2 - 42
(No confunda los diccionarios de fuentes con los lxicos! Los diccionarios de
fuentes contienen formas de caracteres adquiridas durante la fase interactiva de
OCR, mientras que los lxicos son bases de datos lingsticas que ayudan al
reconocimiento.)
Debe cargar en memoria estos diccionarios de fuentes si desea reconocer
documentos similares para aprovechar la informacin adicional que contienen;
de esta forma, Readiris toma en consideracin la informacin almacenada en
estas bibliotecas de fuentes. Podra decirse que Readiris se vuelve ms inteligente
cada vez que la usa!
Cmo funciona esto? El funcionamiento de los diccionarios de fuentes est
controlado por el men "Aprendizaje": tiene que seleccionar un diccionario con el
mando "Diccionario" y determinar su modo de funcionamiento.
Los diccionarios diccionarios diccionarios diccionarios diccionarios de fuentes estn limitados a 500 formas y le recomendamos
que elabore distintos diccionarios para cada aplicacin, por ejemplo, por tipo de
chapter2.pmd 3/04/2006, 15:41 42
2 - 43
MANUAL DEL USUARIO
documento. Por defecto, los diccionarios tienen la extensin *.dus. El aprendizaje
carece de efectos si el diccionario est lleno: los resultados no se conservan en la
memoria ni se transcriben en el diccionario.
Dentro de la opcin "Diccionario" o directamente en el men "Aprendizaje"
puede seleccionar un modo de diccionario. Existen tres modos de diccionario:
nuevo, aadir y de lectura.
Si selecciona "Nuevo Diccionario", indicar que los resultados del aprendizaje
deben guardarse en un nuevo diccionario. (Si selecciona un diccionario existente,
su contenido se borrar.)
El modo aadir indica que los resultados del aprendizaje se guardarn en
diccionario existente: el reconocimiento utiliza la informacin que ya contiene el
diccionario y se le aaden nuevas formas de fuentes. En otras palabras, esta
opcin le permite elaborar un diccionario de fuentes en varios pasos.
(Si introduce un nombre de archivo para un nuevo diccionario y activa el modo
aadir, se crear un diccionario de fuentes vaco y deber completarlo.)
Con la ltima opcin "Consultar Diccionario", el diccionario funciona en modo
de slo lectura y se aprovecha el diccionario sin aadirle nuevas formas.
Seleccione el modo nuevo si desea reconocer una sola pgina. Para reconocer
muchas pginas del mismo tipo - con las mismas fuentes y la misma calidad de
impresin - seleccione el modo nuevo para la primera pgina, el modo aadir
para unas cuantas pginas ms y el modo de lectura para el resto del documento
o documentos.
La etiqueta emergente del botn "Aprendizaje" siempre indica el diccionario
de fuentes que est activado y el modo en que opera ste.
chapter2.pmd 3/04/2006, 15:41 43
2 - 44
Al entrar en aprendizaje interactivo, el diccionario y su modo de funcionamiento
se indican en el ttulo de la ventana; pulse el botn "Cancelar" y vuelva a comenzar
si stos son incorrectos.
E EE EENVO NVO NVO NVO NVO DE DE DE DE DE RESUL RESUL RESUL RESUL RESULT TT TTADOS ADOS ADOS ADOS ADOS A AA AA LA LA LA LA LA APLICACIN APLICACIN APLICACIN APLICACIN APLICACIN DE DE DE DE DE TRABAJO TRABAJO TRABAJO TRABAJO TRABAJO
Con el aprendizaje interactivo concluye el reconocimiento de caracteres. Si
Microsoft Word es el programa receptor de datos por defecto, el procesador de
chapter2.pmd 3/04/2006, 15:41 44
2 - 45
MANUAL DEL USUARIO
textos se ejecuta automticamente (si fuese necesario) una vez concluido el
reconocimiento, y se inserta el texto reconocido.
Puede que en pantalla se muestre una barra de progresin del reconocimiento.
(Esto depender de del tamao del documento y de la complejidad del formato
que haya de realizarse.)
La imagen escaneada se visualiza de nuevo una vez efectuada la divisin en
zonas para su posterior procesamiento y permanece en su sitio hasta que se
escanee una nueva imagen.
De hecho, ha convertido un documento en papel en un archivo digital
modificable, y en un tiempo 40 veces inferior al que habra empleado si hubiera
tenido que volver a mecanografiarlo! Ahora comprelo con la imagen que tiene
en la ventana de Readiris.
En realidad, Readiris le ofrece tres mtodos diferentes a la hora de guardar el
resultado del reconocimiento: por un lado, enviar directamente el documento
reconocido a una aplicacin. Por otro, guardar el resultado en un archivo externo
y, por ltimo, copiar el resultado en el portapapeles de Windows.
El destino de salida destino de salida destino de salida destino de salida destino de salida se selecciona con el botn "Formato" de la barra de
herrramientas principal (o con la opcin "Formato Texto" del men "Configuracin").
chapter2.pmd 3/04/2006, 15:41 45
2 - 46
La funcin "Enviar a" permite un vnculo directo de OCR entre el escner y
las aplicaciones para Windows. Con ella podr enviar enviar enviar enviar enviar directamente el documento
que acaba de escanear a un procesador de textos, hoja de clculo o programa de
navegacin, a Adobe Reader, etc.!
chapter2.pmd 3/04/2006, 15:41 46
2 - 47
MANUAL DEL USUARIO
Una vez concluido el reconocimiento, se ejecuta la aplicacin de destino y el
documento reconocido se visualiza en un nuevo archivo de texto o en un libro de
trabajo.
chapter2.pmd 3/04/2006, 15:41 47
2 - 48
No olvide que la funcin "Enviar a" tambin permite enviar el texto reconocido
al portapapeles portapapeles portapapeles portapapeles portapapeles de Windows, de forma que no es absolutamente imprescindible
exportar el resultado de la lectura, ni guardarlo en un archivo externo...
G GG GGUARDAR UARDAR UARDAR UARDAR UARDAR LOS LOS LOS LOS LOS RESUL RESUL RESUL RESUL RESULT TT TTADOS ADOS ADOS ADOS ADOS EN EN EN EN EN UN UN UN UN UN ARCHIVO ARCHIVO ARCHIVO ARCHIVO ARCHIVO DE DE DE DE DE TEXT TEXT TEXT TEXT TEXTO OO OO
Es posible guardar el resultado del OCR en un archivo externo. Readiris
reconoce una gran variedad de los formatos de archivo ofrecidos por los
procesadores de texto, hojas de clculo y aplicaciones web ms conocidos. (En-
tre otros, Readiris es compatible con WordML y SpreadsheetML, los nuevos
formatos de texto de Microsoft Office 2003.)
La opcin "Guardar y Abrir" es muy parecida a la funcin "Enviar a", puesto
que le permite abrir el documento reconocido cuando ya se ha guardado.
chapter2.pmd 3/04/2006, 15:42 48
2 - 49
MANUAL DEL USUARIO
Sin embargo, el mtodo usado para dirigir la aplicacin deseada es distinto. En
esta ocasin, los tipos de archivo de tipos de archivo de tipos de archivo de tipos de archivo de tipos de archivo de W WW WWindows indows indows indows indows determinan qu aplicacin se
iniciar. Es como si hiciera doble clic sobre el archivo de salida desde el Explorador
de Windows... (Con la opcin "Enviar a", Readiris dirige directamente las
aplicaciones especficas deseadas.)
chapter2.pmd 3/04/2006, 15:42 49
2 - 50
La opcin "Enviar por E-mail" crea un nuevo mensaje de correo electrnico correo electrnico correo electrnico correo electrnico correo electrnico
y aade el documento reconocido como archivo adjunto del mensaje. Conoce
un mtodo ms rpido para distribuir un documento en papel...?
chapter2.pmd 3/04/2006, 15:42 50
2 - 51
MANUAL DEL USUARIO
C CC CCREACIN REACIN REACIN REACIN REACIN DE DE DE DE DE DOCUMENT DOCUMENT DOCUMENT DOCUMENT DOCUMENTOS OS OS OS OS POR POR POR POR PORTTILES TTILES TTILES TTILES TTILES
Veamos con ms atencin uno de los formatos reconocidos: el formato PDF formato PDF formato PDF formato PDF formato PDF
de de de de de Adobe Adobe Adobe Adobe Adobe Acrobat Acrobat Acrobat Acrobat Acrobat. Readiris le permite crear documentos PDF basados en
texto y basados en imgenes.
chapter2.pmd 3/04/2006, 15:42 51
2 - 52
Cal es la diferencia entre los dos? Cuando selecciona el formato "PDF
Texto", Readiris crea un archivo PDF que contiene el resultado del texto. (Es
chapter2.pmd 3/04/2006, 15:42 52
2 - 53
MANUAL DEL USUARIO
posible que haya grficos, pero slo cuando aparecen zonas grficas en la pgina
- fotografas, ilustractiones, etc.) En otras palabras, la imagen de la pgina no
forma parte del documento PDF, compuesto de una sola capa. Por contra, el
formato "PDF Imagen", que es tambin de una sola capa, slo contiene la imagen
escaneada, sin incluir los resultados del OCR!
chapter2.pmd 3/04/2006, 15:42 53
2 - 54
Los formatos "PDF Texto-Imagen" y "PDF Imagen-Texto" ofrecen otros
resultados: Readiris crea un archivo PDF en el que se pueden hacer bsquedas y
chapter2.pmd 3/04/2006, 15:42 54
2 - 55
MANUAL DEL USUARIO
que contiene el texto reconocido y la imagen de la pgina. En los archivos PDF
texto-imagen, el texto se coloca encima de la imagen de la pgina en el archivo
PDF de doble capa; por contra, en los archivos del tipo imagen-texto, el texto
se coloca debajo de la imagen de la pgina. Utilice la opcin "Buscar" de Adobe
Reader y lo comprobar rpidamente!
Los archivos PDF del tipo texo-imagen son de hecho bastante sofisticados:
los pxeles del texto reconocido se borran para crear un documento legible. Y es
que, por ejemplo, mostrar el texto reconocido en color negro encima de mapas de
bits de caracteres negros dara como resultado un texto con una fuerte sombra...
chapter2.pmd 3/04/2006, 15:42 55
2 - 56
Si desea comprobarlo usted mismo, le invitamos a reconocer la imagen de
muestra BACKGROUND.JPG.
Todos los archivos PDF basados en texto codifican las URL de pginas web
y las direcciones de correo electrnico como enlaces visibles: haga clic en ellos
para visitar la pgina web en cuestin o para enviar un mensaje de correo
chapter2.pmd 3/04/2006, 15:42 56
2 - 57
MANUAL DEL USUARIO
electrnico al contacto. (De hecho, el resto de formatos de texto enriquecido
de Readiris - Word, WordML, HTML, etc. - recrean tambin los hipervnculos.)
Haga clic en el botn "Formato" para ver algunas opciones relacionadas con
el formato PDF: "Crear Marcadores" e "Incrustar Fuentes". (En cuanto se haya
seleccionado el formato PDF, se aplica el formato automtico - y no se puede
desactivar.)
La opcin "Crear Marcadores" permite crear marcadores marcadores marcadores marcadores marcadores por pgina para
cada elemento del documento, tanto los grficos como las zonas de texto y tablas.
Para las zonas de texto, Readiris aplica un algoritmo inteligente que crea un ttulo,
un externo para cada zona; las tablas y grficos llevan simplemente un nmero.
(Otro elemento de navegacin de los documentos PDF, las miniaturas miniaturas miniaturas miniaturas miniaturas de pgina,
se pueden crear de manera dinmica con el programa Adobe Reader.)
chapter2.pmd 3/04/2006, 15:42 57
2 - 58

La opcin "Incrustar Fuentes" inserta fuentes en los archivos PDF. Al incrustar
fuentes, se evita la sustitucin de las mismas cuando el lector examina e imprime
el documento reconocido. Asegura que el lector - cualquiera que sea la
configuracin de su ordenador - vea el texto con las fuentes originales. Sin em-
bargo, al insertar fuentes se aumenta (un poco) el tamao de los documentos
reconocidos.
Otra funcin de Readiris con un inters especial a la hora de generar documentos
PDF es la utilizacin de propiedades del documento propiedades del documento propiedades del documento propiedades del documento propiedades del documento. Las propiedades del
documento contienen el ttulo del documento, el nombre y la organizacin de su
autor, el asunto, algunas palabras clave y comentarios, etc. Las propiedades del
documento se utilizan obviamente para clasificar y buscar archivos.
chapter2.pmd 3/04/2006, 15:42 58
2 - 59
MANUAL DEL USUARIO

El mando "Propiedades del Documento" del men "Archivo" permitir editar
estas propiedades. Tenga tambin en cuenta que puede definir las propiedades
del documento a generar ms tarde, cuando guarde los resultados del
reconocimiento...
chapter2.pmd 3/04/2006, 15:42 59
2 - 60
Recuerde que las propiedades del documento no slo se pueden definir para
documentos PDF: los documentos en los formatos Word (*.doc), RTF (Rich
Text Format), WordML (*.xml), SpreadsheetML (*.xml) y HTML tambin
disponen de propiedades del documento - aunque menos completas que las de los
documentos en formato PDF. (Y, como es de suponer, los formatos de texto
pobres como los documentos de texto con codificacin Texto (ANSI) o Texto
MS-DOS (ASCII) no permiten definir propiedades.)
... ... ... ... ... O OO OO RECONOCIMIENTO RECONOCIMIENTO RECONOCIMIENTO RECONOCIMIENTO RECONOCIMIENTO DE DE DE DE DE DICHOS DICHOS DICHOS DICHOS DICHOS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS
Vemoslo en el otro sentido. Dado que Readiris ofrece un reconocimiento
completo del formato PDF Adobe Acrobat, no slo le permite generar archivos
PDF, sino que tambin puede leerlos!
Puede que la conversin de los documentos PDF conversin de los documentos PDF conversin de los documentos PDF conversin de los documentos PDF conversin de los documentos PDF sea una de las principales
aplicaciones de Readiris. Existen diversas razones que lo justifican. En primer
lugar, es una manera de convertir imgenes en texto: ya que los documentos PDF
con imgenes abiertos ejecutan el reconocimiento y guardan el resultado del OCR
en un documento de texto (en cualquier formato de texto reconocido). Los archivos
de texto se pueden editar, mientras que los archivos con imgenes no son editables.
En segundo lugar, le permite convertir archivos PDF con imgenes en archivos
PDF de texto. Para ello debe ejecutar el reconocimiento de archivos PDF con
slo imgenes y guardar los resultados del OCR... como documentos PDF de
texto! Los archivos PDF de texto se pueden buscar y editar, mientras que con los
archivos PDF con slo imgenes esto no es posible.
Finalmente, la conversin de archivos PDF es una manera de desbloquear
el contenido del PDF. Piense en los documentos PDF de slo lectura, cuyo
texto normalmente es inaccesible. Con los archivos PDF desprotegidos, se puede
recuperar el contenido (copiar y guardar en un archivo texto), mientras que el
contenido de los archivos slo lectura no se puede extraer. Dichos documentos
slo se pueden ver e imprimir.
Deben tenerse en cuenta dos detalles importantes: Readiris no abre documentos
PDF protegidos con contrasea, ni siquiera en el caso de que Readiris haya roto
chapter2.pmd 3/04/2006, 15:42 60
2 - 61
MANUAL DEL USUARIO
el resto de barreras de seguridad del documento. (Para ser ms especficos, las
contraseas maestras que definen los permisos de los documentos PDF no
suponen ningn problema para Readiris, pero las contraseas del usuario
necesarias para abrir ciertos documentos PDF s que suponen un problema.) Por
otra parte, Readiris no puede convertir documentos PDF que contengan imgenes
comprimidas en formato JPEG 2000.
Proceda del modo habitual: cargue los archivos PDF en la memoria al tiempo
que abre imgenes previamente escaneadas - faxes, instantneas realizadas con
su cmara digital, etc. Haga clic en el botn de parada o pulse la tecla Esc para
interrumpir el proceso de carga entre dos pginas. (Esto tambin es vlido para
imgenes en formato TIFF con mltiples pginas y faxes en formato DCX.)
Sin embargo, existe una opcin especfica relacionada con los archivos PDF,
que permite abrirlos como documentos en color o en blanco y negro. Se ofrece
esta opcin porque explorar documentos en color es mucho ms lento!
chapter2.pmd 3/04/2006, 15:42 61
2 - 62
En segundo lugar, es posible que desee indicar qu pginas desea convertir Si
su objetivo es, por ejemplo, capturar slo un captulo de una publicacin en formato
PDF muy extensa, no tendra demasiado sentido cargar todo el libro en Readiris
Indicar el intervalo de pginas intervalo de pginas intervalo de pginas intervalo de pginas intervalo de pginas adecuado puede ahorrarle mucho tiempo. (Esto,
una vez ms, tambin es vlido para imgenes en formato TIFF con mltiples
pginas y faxes en formato DCX.)
Los documentos PDF basados en texto, en general, ofrecen una calidad
excelente; el modo de reconocimiento rpido es suficiente para realizar la
conversin con xito. Sin embargo, la calidad de los archivos PDF basados en
chapter2.pmd 3/04/2006, 15:42 62
2 - 63
MANUAL DEL USUARIO
imgenes depende de las caractersticas de los documentos originales en papel,
del brillo y la resolucin del escaneado, etc.
Si le interesa, puede probar con el archive SAMPLE.PDF, que encontrar en
la carpeta de imgenes de Readiris.
R RR RRECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENTO OO OO DE DE DE DE DE V VV VVARIAS ARIAS ARIAS ARIAS ARIAS PGINAS PGINAS PGINAS PGINAS PGINAS
Despus del OCR, el documento escaneado se visualiza de nuevo con la divisin
en zonas para su posterior procesamiento.
A partir de este momento, puede abrir el texto reconocido con su procesador
o editor de textos, importarlo a un programa de maquetacin (DTP - desktop
publishing) o a cualquier otra aplicacin de tratamiento de texto, archivarlo y
compartirlo, colocarlo en un servidor de Intranet, etc. Comprelo con la imagen
que hay en el interior de la ventana de Readiris.
Pero cmo se guarda el texto de las pginas adicionales? En otras palabras,
cmo se procesan los documentos compuestos de varias pginas? Es muy sencillo:
vaya ejecutando las pginas reconocidas y guarde los resultados en el mismo
archivo. (Asegrese de que el documento no est abierto para poder escribir en
l.) No olvide tampoco activar el modo aadir en el diccionario de fuentes, de
forma que pueda continuar cmodamente con el aprendizaje de fuentes.
Conforme vaya escaneando pginas (o abriendo archivos grficos), tendr
que decidir si quiere iniciar un nuevo documento o completar el que est abierto
en ese momento.
chapter2.pmd 3/04/2006, 15:43 63
2 - 64
Si responde "no", seguir aadiendo pginas al documento abierto; si responde
"s", crear un nuevo documento. Esta ltima respuesta corresponde a la funcin
"Nuevo Documento" del men "Archivo".
Pero existe un sistema ms eficaz para reconocer varias pginas sin tener que
escanearlas ni realizar su OCR una por una: se trata del procesamiento directo
de documentos de mltiples pginas documentos de mltiples pginas documentos de mltiples pginas documentos de mltiples pginas documentos de mltiples pginas!
Para escanear de una sola vez un documento de varias pginas, deber activar
el alimentador de documentos del escner, mediante la opcin "ADF" (alimentador
automtico de documentos) bajo el botn "Escner".

Site todas las pginas en el alimentador automtico de documentos y empiece
a escanear: se escanearn de la primera a la ltima pgina.
Si su escner plano no dispone de alimentador de documentos, el escaneado escaneado escaneado escaneado escaneado
a intervalos a intervalos a intervalos a intervalos a intervalos le permite escanear documentos de mltiples pginas de manera
eficiente. El escner digitaliza automticamente otra pgina transcurrida una
cantidad de segundos definida por el usuario. El intervalo permite reemplazar la
pgina que haba en la pantalla por otra nueva.
(El escaneado a intervalos resulta muy til al escanear un libro (de grandes
dimensiones): sus manos estarn demasiado ocupadas colocando adecuadamente
el libro en la plataforma del escner plano para poder utilizar el ratn...)
Indique, en la configuracin del escner, el intervalo de tiempo que necesita
para colocar otra pgina en la pantalla del escner. Haga clic en el botn "Escner"
chapter2.pmd 3/04/2006, 15:43 64
2 - 65
MANUAL DEL USUARIO
y defina un valor adecuado para la opcin "Escanear Otra Pgina a Continuacin
x Segundo(s)".
Haga clic en el botn "Escanear" parar iniciar la digitalizacin. Haga clic en el
botn "Detener" del cuadro de dilogo de escaneado a intervalos para detener el
proceso de escaneado automtico.

Readiris le ofrece la mxima flexibilidad: puede omitir el intervalo de escaneado
para escanear inmediatamente un documento, o congelar el proceso para hacer o
chapter2.pmd 3/04/2006, 15:43 65
2 - 66
atender una llamada telefnica. Haga clic en el botn "Pausa" del cuadro de
dilogo de escaneado a intervalos para detener temporalmente el proceso de
escaneado a intervalos. Haga clic en "Reanudar" cuando desee seguir con el
escaneado automtico, o haga clic en "Escanear Ahora", en el cuadro de dilogo
de escaneado a intervalos, para poder escanear inmediatamente: el intervalo de
tiempo se reduce!
Tambin puede abrir mltiples imgenes previamente escaneadas. Para ello,
seleccione primero una de ellas y, mientras mantiene pulsada la tecla Ctrl, vaya
escogiendo las restantes. Para seleccionar un rango continuo de imgenes,
seleccione la primera de ellas y, mientras mantiene pulsada la tecla Mays, escoja
la ltima.

Puede hacer lo mismo desde el Explorador de Windows: seleccione varios
archivos de imgenes, haga clic con el botn derecho del ratn y seleccione la
opcin "Reconocer" del men contextual. Si repite esta misma operacin, todas
las imgenes que enve a Readiris se aadirn al documento en uso hasta que
seleccione el mando "Nuevo Documento".
chapter2.pmd 3/04/2006, 15:43 66
2 - 67
MANUAL DEL USUARIO
Puede, incluso, abrir imgenes previamente escaneadas arrastrndolas desde
el Explorador de Windows hasta el rea de trabajo de Readiris. Tambin aqu
ocurre como citamos anteriormente: puede repetir esta operacin cuanto quiera,
y todas las imgenes que enve a Readiris se aadirn al documento en uso hasta
que seleccione el mando "Nuevo Documento".
Readiris ordena las imgenes automticamente: la imagen 001.tif precede a la
002.tif que precede a la 003.tif, etc.
El panel de documentos panel de documentos panel de documentos panel de documentos panel de documentos muestra estadsticas estadsticas estadsticas estadsticas estadsticas e informacin acerca de
todas las pginas escaneadas - la imagen original y su resolucin, el tiempo
empleado en los procesos de escaneado y reconocimiento, etc. El panel de
documentos se puede ocultar y volver a mostrar utilizando la opcin pertinente
del men "Ver".
chapter2.pmd 3/04/2006, 15:43 67
2 - 68
Con el panel de documentos tambin podr saber qu imagen se encuetra
cargada en la memoria. Si se abri una imagen de mltiples pginas, est claro
que habr un slo archivo para todas las imgenes. Si se digitalizan documentos,
el panel de documentos simplemente menciona el modelo de escner.
Para cambiar el tamao de una columna, arrastre el cursor de
redimensionamiento de columnas. (No es posible cambiar el orden de las
columnas.) Tambin puede situar el cursor encima de una columna demasiado
estrecha para visualizar los datos: un mensaje emergente mostrar toda la
informacin!

Puede ver la misma informacin para todas las pginas con el mando
"Informacin", situada en el men "Archivo", o de manera independiente para
cada pgina situando el cursor encima de la miniatura de la pgina que desee en
la barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina barra de herramientas de pgina, situdada en la parte izquierda de la
pantalla. Esta barra de herramientas aparece en el momento que empiezan a
procesarse pginas y da acceso a las diversas opciones de pgina (utilizando el
botn derecho del ratn).
chapter2.pmd 3/04/2006, 15:43 68
2 - 69
MANUAL DEL USUARIO

La pgina activa en un determinado momento queda resaltada en el panel de
documentos y en la barra de herramientas de pgina, y su nombre aparece en la
barra de ttulo de Readiris.
Para eliminar una pgina, coloque el cursor del ratn encima de la misma en el
panel de documentos y pulse la tecla Supr. O coloque el cursor del ratn encima
de su miniatura de la barra de herramientas de pgina y pulse la tecla Supr. (O
tambin puede seleccionarla en la barra de herramientas de pgina, hacer clic
con el botn derecho del ratn y seleccionar la opcin "Eliminar Pgina" del men
contextual.)
Puede imprimir imprimir imprimir imprimir imprimir rpidamente las imagnes imagnes imagnes imagnes imagnes escaneadas utilizando el mando
"Imprimir" de la barra de herramientas de imagen (o con el mando "Imprimir las
Imgenes" del men "Archivo") si necesita hacerse una idea general de su
documento.

Puede imprimir la pgina actual o todas las pginas. Selecciones el nmero de
pginas o miniaturas que quiera imprimir.
chapter2.pmd 3/04/2006, 15:43 69
2 - 70
Pero tampoco tiene por qu imprimir todas las pginas: el panel de documentos
(y los mandos pertinentes del men "Edicin" (y los mandos contextuales de
pgina de la barra de herramientas de pgina) le permite excluir pginas
(temporalmente). Haga clic en el nmero de pgina en cuestin en el panel de
documentos para excluirla del proceso de impresin (y reconocimiento). Vuelva
a hacer clic sobre ella para volverla a incluir. Para conseguir una mayor flexibilidad,
el men "Edicin" ofrece opciones equivalentes que se aplican a todas las pginas.

Las miniaturas de las pginas excluidas sern tachadas. Tenga en cuenta que
siempre funciona la impresin de la pgina actual, incluso si esta opcin est
desactivada en ese momento.
chapter2.pmd 3/04/2006, 15:43 70
2 - 71
MANUAL DEL USUARIO
(La exclusin de pginas tambin se aplica al reconocimiento: cuando ponga
en marcha el proceso de OCR, las pginas excluidas (temporalmente) no se
reconocern.)
Abra la imagen de prueba MULTIPAGE.TIF e inicie el reconocimiento. Las
pginas van apareciendo unas tras otras. En la barra de ttulo de Readiris se
indica el nmero de la pgina activa.
chapter2.pmd 3/04/2006, 15:43 71
2 - 72
Si el aprendizaje interactivo est en funcionamiento, ste ir reconociendo y
aprendiendo pgina por pgina. Para la primera de ellas se iniciar un diccionario
"nuevo", y en las sucesivas ir completndose este ltimo.
A partir del momento en que pulse el botn "Terminar", el sistema ir tomando
decisiones sin que el usuario tenga que validarlas. En otras palabras, se interrumpe
el aprendizaje interactivo para todas las pginas y el reconocimiento del documento
continuar en modo automtico.
El resultado del reconocimiento efectuado en documentos con varias pginas
queda guardado en un nico archivo de salida. (Si se enva el resultado del
reconocimiento a una aplicacin de salida, se crearn varias pginas dentro de un
nico documento.)
Al menos, ese es el caso cuando la opcin "Crear Un Archivo por Pgina"
est desactivada al guardar el documento reconocido. Esta opcin tratar el
documento como si cada pgina estuviera guardada en un archivo diferente. Si el
usuario pone el nombre texto.doc al archivo, los archivos se denominarn texto-
1.doc, texto-2.doc, etc. (Esta opcin slo se encuentra disponible cuando se crea
un archivo externo, y no cuando se envan los resultados del OCR a una aplicacin
destino.)
chapter2.pmd 3/04/2006, 15:43 72
2 - 73
MANUAL DEL USUARIO
E EE EEDICIN DICIN DICIN DICIN DICIN DE DE DE DE DE DOCUMENT DOCUMENT DOCUMENT DOCUMENT DOCUMENTOS OS OS OS OS DE DE DE DE DE ML ML ML ML MLTIPLES TIPLES TIPLES TIPLES TIPLES PGINAS PGINAS PGINAS PGINAS PGINAS
El usuario puede editar documentos de mltiples pginas para corregir,
principalmente, errores ocurridos en la fase de escaneado. Podr eliminar pginas
del documento o moverlas a otra posicin.
En primer lugar, veamos cmo desplazarnos. Para ir a una pgina, haga clic
en la misma en el panel de documentos o en la barra de herramientas de pgina.
(O bien lleve el cursor a la miniatura, haga clic con el botn derecho del ratn
para que aparezca el men contextual y seleccione la opcin "Seleccionar Pgina".)
Para ir a la pgina anterior, utilice la tecla RePg; para avanzar hasta la pgina
siguiente emplee AvPg. Pulse Inicio para ir a la primera pgina, y Fin para ir a la
ltima pgina. O utilice las funciones correspondientes en el men "Ver".
Vamos ahora a editar el documento. Para eliminar una pgina, coloque el
cursor del ratn encima de la misma en el panel de documentos y pulse la tecla
Supr, o coloque el cursor del ratn encima de su miniatura de la barra de
herramientas de pgina y pulse la tecla Supr. (O tambin puede seleccionarla en
la barra de herramientas de pgina, hacer clic con el botn derecho del ratn y
seleccionar la opcin "Eliminar Pgina" del men contextual.)
chapter2.pmd 3/04/2006, 15:43 73
2 - 74
Y le recordamos que podr excluir pginas temporalmente, pero no borrarlas,
del proceso de reconocimiento (y de impresin de imgenes): el panel de
documentos, la barra de herramientas de pgina y el men "Edicin" incluyen los
mandos necesarios.

Para subir una pgina dentro de un documento, utilice el mando "Subir la
Pgina". Si, por el contrario, desea bajarla, seleccione el mando "Bajar la Pgina".
Para mover una pgina a una ubicacin completamente distinta en el
documento, arrastre su icono a esa nueva ubicacin.
chapter2.pmd 3/04/2006, 15:43 74
2 - 75
MANUAL DEL USUARIO
A AA AABRIR BRIR BRIR BRIR BRIR UN UN UN UN UN NUEVO NUEVO NUEVO NUEVO NUEVO DOCUMENTO DOCUMENTO DOCUMENTO DOCUMENTO DOCUMENTO
Para cerrar el documento activo, puede utilizar el mando "Nuevo Documento"
del men "Archivo".
Esta funcin limpia completamente la pizarra. Cualquier documento cargado
en memoria - ya tenga una o mltiples pginas - se eliminar completamente. A
partir de entonces, podr crear uno nuevo.
Sin embargo, tambin puede crear un nuevo documento directamente desde
el documento activo. Mientras no haya ejecutado el OCR, el sistema entiende
chapter2.pmd 3/04/2006, 15:43 75
2 - 76
que usted desea aadir pginas al documento. Por ejemplo, puede escanear todas
las pginas que se encuentren en el alimentador del escner, colocar ms pginas
en el alimentador y continuar con el procedimiento. Todas las pginas escaneadas
compondrn un nico documento. O bien, podr escanear varias pginas y aadir
algunos archivos grficos, como por ejemplo, faxes. Estas pginas siguen formando
un solo documento; todo lo que tiene que hacer es cambiar el origen de la imagen
segn vaya siendo necesario. Para ello utilice el botn "Fuente".
Una vez realizado el OCR, si reinicia el proceso de escaneado (o la carga de
imgenes), empezar un nuevo documento o completar el que est en ese
momento en uso.
R RR RRECONOCIMIENTO ECONOCIMIENTO ECONOCIMIENTO ECONOCIMIENTO ECONOCIMIENTO DE DE DE DE DE ZONAS ZONAS ZONAS ZONAS ZONAS DE DE DE DE DE TEXTO TEXTO TEXTO TEXTO TEXTO
Una vez que sabemos cmo reconocer pginas y procesar documentos de
mltiples pginas, tenemos que preguntarnos si se puede reconocer menos de
una pgina con la misma facilidad. La respuesta es s. Para ello, haga clic con el
botn derecho del ratn y elija la opcin "Copiar como Texto" del men contex-
tual: la ventana del texto bajo el cursor del ratn ser reconocida y enviada al
portapapeles.
chapter2.pmd 3/04/2006, 15:43 76
2 - 77
MANUAL DEL USUARIO
Se aplicar la configuracin del sistema actual - idioma, modo de
reconocimiento, tipo de fuente, etc. El resultado del OCR se colocar en el
portapapeles como texto en corpo, no formateado.
O OO OORGANIZACIN RGANIZACIN RGANIZACIN RGANIZACIN RGANIZACIN DEL DEL DEL DEL DEL TEXT TEXT TEXT TEXT TEXTO OO OO RESUL RESUL RESUL RESUL RESULT TT TTANTE ANTE ANTE ANTE ANTE
Guardar o exportar el texto requiere algo ms que indicar simplemente un
mtodo de exportacin o un nombre para el archivo resultante. Tambin debe
chapter2.pmd 3/04/2006, 15:43 77
2 - 78
seleccionarse un formato de archivo y determinarse la apariencia del texto
reconocido. Es decir, tiene que elegir lo que quiere hacer con el texto antes de
iniciar el programa correspondiente.
Algunas opciones del botn "Formato" le permitirn determinar la apariencia
del texto resultante.
El flujo de texto flujo de texto flujo de texto flujo de texto flujo de texto del documento resultante es determinado directamente por
la opcin "Fusionar Lneas en los Prrafos".
Mantenga activada esta opcin para que Readiris detecte los prrafos. De
esta forma, Readiris aplicar el ajuste de lnea ajuste de lnea ajuste de lnea ajuste de lnea ajuste de lnea tpico de los tratamientos de
texto; de lo contrario se aade un retorno de carro (cdigo CR o EOL) tras cada
lnea y las palabras separadas por guiones quedan tal cual. Por defecto, la deteccin
de prrafos est activada.
Para explicar esto, he aqu un ejemplo. Si las primeras tres lneas de una
columna son "El nuevo presi-", "dente salud desde el balcn." y "Su esposa vino
a acompaarlo.", la deteccin de prrafos le ofrece el siguiente resultado: "El
nuevo presidente salud desde el balcn. Su esposa vino a acompaarlo." Las
partes separadas por el guin de la palabra "presidente" fueron unidas y se aadi
un espacio al final de la frase, creando as un flujo natural de texto.
Si la deteccin de prrafos no estuviese activada, se habra mantenido el diseo
original con un retorno de carro aadido al final de cada lnea.
Esta opcin no est disponible cuando el formato PDF est seleccionado:
siempre se almacenan los archivos PDF Adobe Acrobat lnea por lnea.
(El botn "Formato" contiene algunas opciones que an no hemos explicado;
lo haremos pronto.)
chapter2.pmd 3/04/2006, 15:43 78
2 - 79
MANUAL DEL USUARIO
C CC CCONFIGURACIN ONFIGURACIN ONFIGURACIN ONFIGURACIN ONFIGURACIN DEL DEL DEL DEL DEL ESCNER ESCNER ESCNER ESCNER ESCNER
Ahora debe configurar su escner. Se supone que el escner y los controladores
necesarios han sido instalados correctamente.
Si la licencia de su software Readiris va unida a un modelo de escner,
probablemente este paso resulte innecesario, ya que su escner puede estar
configurado para Readiris.
Haga clic en el botn "Escner" de la barra principal de herramientas.
Haga clic en el botn "Tipo de Escner" para determinar el modelo de modelo de modelo de modelo de modelo de
escner escner escner escner escner. .. ..
(No dude en ponerse en contacto con el fabricante del equipo o con su
distribuidor si siguiera teniendo problemas con los controladores del escner. La
chapter2.pmd 3/04/2006, 15:44 79
2 - 80
mayora de fabricantes permiten descargar las ltimas versiones de los
controladores directamente desde su pgina web.)
Si selecciona la opcin "<Image>" (imagen) como escner - las imgenes
ya escaneadas funcionan como origen de las imgenes en todo momento - no
tiene que seleccionar el disco como origen de imagen con el botn "Fuente" de la
barra principal de herramientas.
El botn "Configurar" slo est disponible si su escner lo permite. Para acceder
a algunos parmetros avanzados de escaneado con escaners Twain, haga clic en
el botn "Configurar" y seleccione el origen Twain. (Tambin puede utilizar la
opcin "Seleccionar Fuente" del men "Archivo".)
Una vez seleccionado el escner, la misma ventana le permitir establecer la
resolucin de escaneado, el formato y la orientacin de la pgina y el brillo y el
contraste. Asimismo, tendr ocasin de indicar si va a utilizar el alimentador del
escner. Con escaners Twain, todos los parmetros de escaneado a menudo se
establecen dentro del interfaz Twain.
Establezca el brillo brillo brillo brillo brillo y, si dispone de l, el contraste contraste contraste contraste contraste.
Si activa la opcin "Apaisado" indicar que la pgina tiene dicha orientacin y
no la vertical. En realidad, la orientacin de la pgina se aplica a los formatos
reducidos de pgina: en un escner plano de formato A4, se pueden escanear
pginas de formato A5 (la mitad del tamao del A4) en orientacin vertical y
horizontal, pero obviamente slo puede escanear la superficie completa de una
pgina A4 en una nica direccin.
chapter2.pmd 3/04/2006, 15:44 80
2 - 81
MANUAL DEL USUARIO
Por ltimo, la opcin "Invertir" le permitir generar imgenes invertidas imgenes invertidas imgenes invertidas imgenes invertidas imgenes invertidas
en la modalidad de escaneado en blanco y negro - puede activar esta opcin para
procesar pginas enteras en las que aparezca texto blanco sobre fondo negro.
Ya hemos hablado del escaneado a intervalos. Solamente recordar que es una
forma muy eficaz de escanear documentos de mltiples pginas cuando se utiliza
un escner plano sin alimentador de documentos.
P PP PPONGA ONGA ONGA ONGA ONGA COLORES COLORES COLORES COLORES COLORES EN EN EN EN EN SUS SUS SUS SUS SUS TEXT TEXT TEXT TEXT TEXTOS OS OS OS OS DIGIT DIGIT DIGIT DIGIT DIGITALIZADOS ALIZADOS ALIZADOS ALIZADOS ALIZADOS! !! !!
Readiris suporta sin ningn problema imgenes en blanco y negro, en escala
de grises y en color. Escoja, pues, la modalidad de color modalidad de color modalidad de color modalidad de color modalidad de color que mejor se adapte
a sus necesidades. Si va a incluir en los documentos dibujos, escanee en blanco y
negro, si desea incorporar fotografas en blanco y negro, escanee en escala de
grises y para insertar fotografas en color, escanee en color.
Pero cul es la razn para reducir la profundidad de las imgenes en la fase
de escaneado? Ni que decir tiene que las imgenes en escala de grises y en color
se escanean con ms lentitud y requieren ms memoria RAM que las imgenes
en blanco y negro.
Escanear en escala de grises y en color no es slo til para guardar imgenes
con suficiente calidad, y para conservar los colores del texto escaneado durante
el proceso de reconocimiento. A veces, tambin puede ser til - o incluso necesario
- para obtener buenos resultados con el OCR! Cuando el texto est impreso
sobre un fondo coloreado, el hecho de escanear en color puede generar esos
matices tonales de los que carecen las imgenes en blanco y negro. Cuando el
contraste entre el texto y el fondo es reducido, este ltimo puede crear cierto
ruido; lo que dificultar enormemente el reconocimiento, o lo har imposible!
chapter2.pmd 3/04/2006, 15:44 81
2 - 82
Piense, por ejemplo, en un texto negro impreso sobre fondo oscuro. Si escanea
un texto as en blanco y negro, por mucho que intente ajustar el brillo del escner,
no podr deshacerse del color de fondo sin perder tambin la informacin del
texto...

Readiris genera una versin en blanco y negro de cada imagen en escala de
grises o en color. Sus rutinas inteligentes resuelven incluso casos muy
problemticos. As es como se digitalizan las imgenes difciles.
chapter2.pmd 3/04/2006, 15:44 82
2 - 83
MANUAL DEL USUARIO
Para visualizar una imagen escaneada en blanco y negro, deshabilite la opcin
"Visualizar Documento en Color" del men "Ver".
Aunque, en realidad, usted no ver ninguna imagen en blanco y negro en la
pantalla de su ordenador, incluso si se escanean imgenes binivel! Esto se debe
a que Readiris optimiza las imgenes para una perfecta legibilidad en pantalla. La
tcnica especializada de visualizacin de alta resolucin visualizacin de alta resolucin visualizacin de alta resolucin visualizacin de alta resolucin visualizacin de alta resolucin de I.R.I.S. convierte
las imgenes en blanco y negro en imgenes en escala de grises.
Se suavizan y difuminan las imgenes en escala de grises y en color.
chapter2.pmd 3/04/2006, 15:44 83
2 - 84
Como consecuencia, no ser necesario ampliarlas, incluso en porttiles con
pantallas de cristal lquido u PC de escritorio con pantallas de gama baja.
Aumente la imagen a tamao real (o ms) para ver la imagen pura, tal como
e escane.
A AA AAP PP PPARA ARA ARA ARA ARAT TT TTOS OS OS OS OS DISTINT DISTINT DISTINT DISTINT DISTINTOS OS OS OS OS, , , , , RESOLUCIN RESOLUCIN RESOLUCIN RESOLUCIN RESOLUCIN DISTINT DISTINT DISTINT DISTINT DISTINTA AA AA
Sea como sea su modo de digitalizacin, utilice una resolucin resolucin resolucin resolucin resolucin de escaneado
de 300 ppp para aplicaciones normales. Cuando el documento que vaya a escanear
tenga un tipo de letra pequeo (menos de 10 puntos), o sea de mala calidad,
utilice mejor una resolucin ms alta, de 400 ppp.
Readiris lee tamaos de punto tamaos de punto tamaos de punto tamaos de punto tamaos de punto entre 6 y 72 puntos (0,21 y 2,54 cm.).
Readiris reconoce asimismo letras descendentes letras descendentes letras descendentes letras descendentes letras descendentes (drop letters),
maysculas de gran tamao que cubren varias lneas. (Desde luego, stas no
pueden ser superiores a 72 puntos.) Incluso se reconocen las maysculas
descendentes invertidas...
chapter2.pmd 3/04/2006, 15:44 84
2 - 85
MANUAL DEL USUARIO

Dado que el OCR ptimo requiere una resolucin de entre 300 y 400 ppp,
Readiris le avisa cuando escanea imgenes con una resolucin inferior a 200 ppp
o superior a 800 ppp. Entre otras cosas, la resolucin de imagen de estos archivos
se marca en color rojo en el panel de documentos.
Readiris puede corregir los imgenes escaneadas con demasiados detalles.
Para llevar a cabo la correccin, active la opcin "Optimizar la Resolucin para
el OCR" en la configuracin del escaneado. Siempre que la resolucin de la
imagen de los escaneados supere los 600 ppp, la resolucin se reduce para el
proceso del OCR.
Existen otras maneras de evitar este aviso: cuando lee faxes faxes faxes faxes faxes (que presentan
una resolucin de 100 o 200 ppp), cuando genera imgenes con una cmara
digital (cuya resolucin se desconoce) y cuando abre imgenes en las que el
encabezamiento del archivo contiene una resolucin incorrecta. Para procesar
este tipo de imgenes sin ningun problema, active la opcin "Procesar como 300
ppp". Este parmetro sirve para digitalizar directamente y abrir imgenes
previamente escaneadas.
chapter2.pmd 3/04/2006, 15:44 85
2 - 86

Cuando digitaliza imgenes con una cmara digital cmara digital cmara digital cmara digital cmara digital en lugar de un escner,
es imprescindible activar una opcin especfica. (Este parmetro sirve otra vez
para digitalizar directamente y abrir imgenes previamente escaneadas.)

As, optimiza la imagen antes de reconocerla. Existen varias dificultades en el
momento de digitalizar con cmaras digitales: generan imgenes con baja
resolucin - incluso cuando dispone la cmara muy cerca al documento - y en
todo caso no se conoce la resolucin de la imagen.
Incluso as, le recomendamos que active el modo de reconocimiento preciso,
mediante el botn "Idioma", para reconocer correctamente estas imgenes con
xito.
Tendr que tener en cuenta algunos elementos delicados a la hora de digitalizar
correctamente imgenes escaneadas con una cmara digital.
Antes de todo, seleccione la resolucin de imagen ms alta posible. Genere,
por ejemplo, imgenes con una resolucin de 2.600 x 2.000 con una cmara de 5
MP que tambin pueda hacer fotos con resoluciones de 2.100 x 1.550 y 1.600 x
chapter2.pmd 3/04/2006, 15:44 86
2 - 87
MANUAL DEL USUARIO
1.200. Luego, active el modo macro de su cmara para los primeros planos -
siempre es as cuando fotografia documentos. (Este modo ha sido diseado para
capturar flores, insectos, etc.) En el caso contrario las imgenes seran imprecisas
e ilegibles.

Utilice el zoom ptico e ignore el digital. Cuando se utiliza el zoom ptico, la
lente amplia la imagen. Como resultado, la calidad de la imagen aumenta. Por
contra, el zoom digital reduce la resolucin y la calidad de la imagen: las tcnicas
de interpolacin se aplican para aadir falsos pxeles de manera artificial a la
instantnea.
Tendr que limitarse a pequeas compresiones o a ninguna: una compresin
importante reduce la nitidez del texto digitalizado. Puede agrandecer para poder
recortar sus documentos - algunas cmaras vienen includas con un programa
para restablecer la fotografa orginal (photo stitching), pero no es til para
capturar un documento.
Mantenga la cmara directamente encima del documento para evitar capturar
el documento bajo un cierto ngulo. Sin embargo, evite que la sombra del aparato
o de su mano sea proyectada en el documento. Genere imgenes estables. Piense
tambin en colocar su cmara en un trpode cuando sea necesario.
Desactive el flash cuando fotografia papel brillante, o sino puede ser que la
imagen sea demasiado plida. Generalmente, mejor vale adaptar el brillo y contraste
chapter2.pmd 3/04/2006, 15:44 87
2 - 88
al entorno - luz del da, luz de una lmpara, luz de nen, etc. (Algunas cmaras
puede ser calibradas filmando un documento blanco.)
Para comprobarlo, abra la imagen DIGITAL.JPG en la carpeta de imgenes
de Readiris y ejecute el reconocimiento.
chapter2.pmd 3/04/2006, 15:44 88
2 - 89
MANUAL DEL USUARIO
G GG GGUARDAR UARDAR UARDAR UARDAR UARDAR LA LA LA LA LA CONFIGURACIN CONFIGURACIN CONFIGURACIN CONFIGURACIN CONFIGURACIN PREDETERMINADA PREDETERMINADA PREDETERMINADA PREDETERMINADA PREDETERMINADA
Defina correctamente todos los parmetros de escaneado y haga clic en la
opcin "Guardar la Configuracin por Defecto" del men "Archivo" para
sobrescribir la configuracin por defecto por la configuracin actual. (En caso
que esta configuracin no fuese tampoco la adecuada, siempre podr restablecer
la configuracin inicial con la opcin correspondiente...)
chapter2.pmd 3/04/2006, 15:44 89
2 - 90
Los archivos de configuracin no slo contienen la configuracin configuracin configuracin configuracin configuracin del escner,
sino que tambin determinan si desea utilizar el aprendizaje interactivo, el idioma
y las propiedades de los documentos, qu modos de reconocimiento y de salida se
utilizarn - por ejemplo, enviar el texto a la aplicacin WordPad -, etc. En pocas
palabras, todos los ajustes operativos de Readiris se almacenan en los archivos
de configuracin.
G GG GGUARDAR UARDAR UARDAR UARDAR UARDAR PROPIEDADES PROPIEDADES PROPIEDADES PROPIEDADES PROPIEDADES ESPECFICAS ESPECFICAS ESPECFICAS ESPECFICAS ESPECFICAS
Obviamente, la configuracin predeterminada se utilizar cada vez que se
inicie el programa, pero puede guardar propiedades especficas para no tener que
redefinir estos parmetros de funcionamiento. Las opciones "Guardar
Configuracin" y "Cargar Configuracin" del men "Archivo" se encargan de
ello.
He aqu un ejemplo: si peridicamente debe reconocer documentos en espaol
con un diseo especfico, le recomendamos que cree un archivo de configuracin
para dicho tipo de documento. A continuacin seleccione "Espaol" como idioma
del documento, cargue una divisin en zonas concreta para no tener que trazar
las mismas ventanas a cada pgina, desactive el aprendizaje, pero active un
diccionario de fuentes en modo de lectura porque algunas tipos de fuentes se
usan de forma sistemtica, etc.
Si no est seguro de la configuracin actual, no necesita pasar revista a todos
los mens y opciones para descubrirlas. Utilice la opcin "Informacin" del men
"Archivo" para obtener una sinopsis de las mismas.
chapter2.pmd 3/04/2006, 15:44 90
2 - 91
MANUAL DEL USUARIO
Este mando tambin muestra la inoformacin que se puede encontrar en el
panel de documentos para todas las pginas.
E EE EESCANEAR SCANEAR SCANEAR SCANEAR SCANEAR DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS
Ahora que el escner est correctamente configurado, vamos a empezar a
escanear documentos. Hay algunos aspectos de los que debe estar informado.
En primer lugar, tenga cuidado con la inclinacin de las lneas. Aunque el
anlisis de pgina y el reconocimiento admiten cierto grado de inclinacin, la
divisin en ventanas y el OCR de una pgina pueden verse dificultados si la
inclinacin de las lneas es excesiva. Una pequea inclinacin (menos de 0,5) no
tiene ninguna importancia: la fidelidad del OCR no se ve afectada.
El mando "Restablecimiento de Pginas" del botn "Opciones" (y del men
"Configuracin") determina si las pginas escaneadas con alguna inclinacin van
chapter2.pmd 3/04/2006, 15:44 91
2 - 92
a restablecerse restablecerse restablecerse restablecerse restablecerse, se arreglarn automticamente. (Las pequeas inclinaciones
no se tendrn en cuenta.) Esta opcin se encuentra desactivada por defecto.

Si ha olvidado activar esta opcin, utilice el botn "Restablecer la Pgina" de
la barra de herramientas de imagen (o la opcin del mismo nombre del men
"Accin") para rectificar las pginas escaneadas con alguna desviacin.

Este restablecimiento de lneas tarda algunos segundos, dado que, en primer
lugar, se analiza la imagen para detectar el posible ngulo de inclinacin.
Seguidamente se recompone la imagen en color o en escala de grises (as como
su versin en blanco y negro) y, por ltimo, vuelve a ejecutarse el anlisis de
pgina.
Cada vez que necesite ajustar la orientacin de la pgina, puede usar las
herramientas de rotacin rotacin rotacin rotacin rotacin de la barra de herramientas de imagen. (Los mandos
correspondientes se encuentran en el men "Ver".) Existen tres direcciones de
rotacin: a la izquierda, a la derecha e inversin. La rotacin tarda algunos segundos
en actualizar la imagen en s y no slo lo que se muestra en pantalla.

Sin embargo, Readiris puede corregir por usted las pginas mal orientadas.
Active la opcin "Detectar la Orientacin de las Pginas" bajo el botn "Opciones"
(o en el men "Configuracin") y Readiris orientar la pgina cuando sea necesario.
chapter2.pmd 3/04/2006, 15:44 92
2 - 93
MANUAL DEL USUARIO

Si desea comprobar cmo funciona esta opcin, utilice la imagen DESKEW.JPG
que se encuentra en la carpeta de imgenes de Readiris. Desactive los opciones
"Restablecemiento de Pginas" y "Detectar Orientacin de las Pginas" antes de
abrir la imagen y deje que Readiris restablezca la Torre de Pisa... tal como la
conocemos.
chapter2.pmd 3/04/2006, 15:44 93
2 - 94
Recuerde tambin que el panel de documentos indica qu ngulo de inclinacin
se corrigi y qu rotaciones se llevaron a cabo.
chapter2.pmd 3/04/2006, 15:45 94
2 - 95
MANUAL DEL USUARIO
A AA AAJUSTE JUSTE JUSTE JUSTE JUSTE DE DE DE DE DE LAS LAS LAS LAS LAS IMGENES IMGENES IMGENES IMGENES IMGENES ESCANEADAS ESCANEADAS ESCANEADAS ESCANEADAS ESCANEADAS
Como ya hemos indicado, las imgenes en color o escala de grises se
transforman automticamente en imgenes en blanco y negro mediante avanzadas
rutinas inteligentes. En caso de que siguiera siendo necesario, el usuario puede
afinar an ms la imagen, con vistas a un mejor OCR. Seleccione para ello la
opcin "Ajustar Imagen" del men "Accin".
Cuando seleccione esta opcin, se visualizar automticamente la versin en
blanco y negro de la imagen - es como si desactivara la opcin "Visualizar
Documento en Color". Hay algunos conceptos de cierta complejidad, que pasamos
a desarrollar con detalle seguidamente.
chapter2.pmd 3/04/2006, 15:45 95
2 - 96
La opcin "Alisar Imagen de Color" da a las imgenes en color o escala de
grises un aspecto ms homogneo y para ello rasea, es decir, suaviza las
diferencias relativas de intensidad, con lo que el contraste queda ms afinado
entre el primer plano - texto - y el fondo - un color, ilustraciones, etc.
Puede que este dispositivo de preprocesamiento preprocesamiento preprocesamiento preprocesamiento preprocesamiento le parezca muy tcnico y
difcil de entender, pero es realmente funcional, ya que con algunos modelos de
escner se necesita esta reduccin de nitidez para reconocer imgenes en color
y escala de grises. A veces, el nico modo de separar el texto del fondo de color
chapter2.pmd 3/04/2006, 15:45 96
2 - 97
MANUAL DEL USUARIO
consiste en suavizar las diferencias. Abajo tiene un ejemplo de imagen que es
ilegible si no se suaviza la imagen.
Se puede tambin suavizar las imgenes previamente escaneadas cuando se
cargan en la memoria.
Ocupmonos ahora del brillo brillo brillo brillo brillo. Este ajuste determina el brillo general de la
imagen: cualquier oscurecimiento o aumento en el brillo de la imagen se aplica a
todos los pxeles. El objetivo es deshacerse del fondo de pgina. Le daremos dos
ejemplos. En el primero, todas las zonas de la imagen son oscuras. En consecuencia,
hacemos ms clara la imagen para elimar el fondo de pgina; el primer plano (el
texto) sigue siendo lo suficientemente oscuro como para que el proceso de
binarizacin lo detecte. En el segundo ejemplo, tenemos una imagen tan clara que
chapter2.pmd 3/04/2006, 15:45 97
2 - 98
en la imagen escaneada ni se ve el texto que est en primer plano, por lo que
oscurecemos la imagen para que el texto sea legible.



El contraste contraste contraste contraste contraste determina la diferencia relativa entre las zonas ms claras y las
ms oscuras de la imagen. (El texto generalmente es ms oscuro que el fondo,
siendo el caso contrario cuando se trata con texto invertido.) El objetivo es hacer
que las formas de los caracteres se distingan claramente de los fondos (de color).
He aqu un ejemplo en el que se debe aumentar el contraste, dado que la
configuracin por defecto resulta en caracteres rotos.
Observe que no se ejecuta ningn ajuste de imagen hasta que no haga clic en
el botn "Aplicar". Al pulsar "Aceptar" se ejecutar el ajuste y se cerrar la
ventana. ste es un ejemplo en el que se ha aclarado drsticamente una imagen
chapter2.pmd 3/04/2006, 15:45 98
2 - 99
MANUAL DEL USUARIO
en blanco y negro. Naturalmente, sin pretender en ningn momento que el OCR
sea de calidad!
Estas opciones conciernen a las imgenes en color y en escala de grises,
mientras que la ltima de ellas, "Limpiar", concierne exclusivamente a las imgenes
en blanco y negro. Por limpieza entendemos la eliminacin de esa suciedad
(motas) que ocasionan algunos pxeles innecesarios.
chapter2.pmd 3/04/2006, 15:45 99
2 - 100
Asegrese de no borrar motas demasiado grandes, pues si no podra eliminar
tambin los puntos de las "i", o partes de letras obtenidas mediante impresoras
matriciales, etc.
Para conseguir la mejor calidad de imagen con vistas a un buen OCR, coloque
la ventana de ajuste de imagen donde no moleste para apreciar los arreglos que
vaya haciendo. Seguidamente, ajuste los parametros y vaya pulsando "Aplicar"
hasta conseguir una imagen clara y ntida.
D DD DDEJE EJE EJE EJE EJE QUE QUE QUE QUE QUE EL EL EL EL EL ASISTENTE ASISTENTE ASISTENTE ASISTENTE ASISTENTE TRABAJE TRABAJE TRABAJE TRABAJE TRABAJE POR POR POR POR POR USTED USTED USTED USTED USTED
Pasemos ahora a capturar documentos. En lugar de configurar uno a uno los
parmetros, utilizaremos el asistente de OCR asistente de OCR asistente de OCR asistente de OCR asistente de OCR. ste es un sistema muy sencillo
para reconocer pginas.
Haga clic en el botn "Asistente OCR" de la barra de herramientas principal
(o seleccione la opcin "Asistente OCR" del men "Accin").

El asistente lo ayudar durante el proceso de reconocimiento. Bastar con
responder a unas simples preguntas para obtener rpidos resultados.
chapter2.pmd 3/04/2006, 15:45 100
2 - 101
MANUAL DEL USUARIO
Observe que el asistente de OCR se ejecuta cada vez que inicia Readiris;
para que esto no ocurra, desactive la opcin "Activar el Asistente al Iniciar", que
aparece en la primera pantalla del asistente. (Tambin puede desactivarlo usando
la misma opcin del men "Configuracin".)
R RR RREADIRIS EADIRIS EADIRIS EADIRIS EADIRIS REPRODUCE REPRODUCE REPRODUCE REPRODUCE REPRODUCE EL EL EL EL EL DISEO DISEO DISEO DISEO DISEO DE DE DE DE DE SUS SUS SUS SUS SUS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS DOCUMENTOS
El asistente de OCR realiza el proceso de reconocimiento de forma
prcticamente automtica, pero el reconocimiento automtico no debe
confundirse con el formato automtico! Formato automtico significa que
Readiris reproduce una copia facsmil copia facsmil copia facsmil copia facsmil copia facsmil del documento escaneado, aplicando el
formato de las palabras, prrafos y pginas del documento original.
chapter2.pmd 3/04/2006, 15:45 101
2 - 102
Se utilizan tipos de letra iguales a los del documento original (serif y sans serif,
proporcionales y fijos, normales y condensados, superndice y subndice). Se
mantienen los tamaos y estilos (negrita, cursiva, subrayado, superndice y
subndice) durante el reconocimiento. Se reproducen las tabulaciones y la
justificacin (izquierda, centrada, derecha o justificada) de cada bloque de texto.
Lo mismo ocurre con las vietas y la numeracin. Todas las direcciones de correo
electrnico y de pginas web sern detectadas y se establecern como
hipervnculos en el texto creado. La colocacin de columnas, bloques de texto y
grficos ser la misma del documento original.
En otras palabras, Readiris le permite archivar una copia fiel de sus documentos,
pero ahora en forma de archivo de texto digital, modificable y compacto, en
lugar de una imagen escaneada!
As pues, la clasificacin de ventanas slo se aplica parcialmente al realizar el
formato automtico. Es decir, puede incluir y excluir zonas, pero cualquier
reclasificacin no ser tenida en cuenta!
Para familiarizarse con esta funcin, abra el archivo de imagen
AUTOFORMAT.JPG, que se encuentra en la carpeta de imgenes de Readiris.
chapter2.pmd 3/04/2006, 15:45 102
2 - 103
MANUAL DEL USUARIO
Haga clic en el botn "Formato" de la barra de herramientas principal y enve
el resultado del reconocimiento a Microsoft Word o bien seleccione el formato
Word (*.doc), WordML (*.xml) o RTF (Rich Text Format). En segundo lugar,
seleccione "Volver a Crear el Documento Original" como opcin de formato. (La
opcin "Fusionar Lneas en los Prrafos" est activada por defecto para realizar
chapter2.pmd 3/04/2006, 15:45 103
2 - 104
el ajuste de lneas dentro de los prrafos.) (El mensaje emergente del botn
"Formato" indica el modo de salida y el formato de texto seleccionados.)
Que la reconstruccin del formato sea posible o no depende del modo de
salida. Algunos formatos pobres que generan texto simple, como Texto
(ANSI), Texto formato MS-DOS (ASCII), etc., no pueden utilizar los cdigos
avanzados de formato y, por consiguiente, no pueden ofrecer un formato
automtico. Por otro lado, el formato PDF Adobe Acrobat se dise para copiar
el aspecto de los documentos. As pues, los documentos PDF implican, por
naturaleza, el formato automtico.
Al abrir el texto reconocido con un tratamiento de textos, el texto tiene esta
apariencia, sin intervencin alguna del usuario. (Para ver este efecto
correctamente, el modo WYSIWIG del procesador de textos, denominado
generalmente diseo de pgina, se activa automticamente.)
chapter2.pmd 3/04/2006, 15:45 104
2 - 105
MANUAL DEL USUARIO
En pocas palabras, Readiris no slo reconoce sus textos, sino que puede tambin
formatearlos. Ahora, el OCR ya no es un simple reconocimiento de textos, sino
que tambin es un autntico reconocimiento de documentos reconocimiento de documentos reconocimiento de documentos reconocimiento de documentos reconocimiento de documentos!
chapter2.pmd 3/04/2006, 15:45 105
2 - 106
U UU UUTILICE TILICE TILICE TILICE TILICE COLUMNAS COLUMNAS COLUMNAS COLUMNAS COLUMNAS EN EN EN EN EN LUGAR LUGAR LUGAR LUGAR LUGAR DE DE DE DE DE CUADROS CUADROS CUADROS CUADROS CUADROS
La opcin de formato "Utilizar Columnas y No Cuadros" determina cmo se
realiza el formato automtico: los bloques de texto, las tablas y los grficos
pueden almacenarse en cuadros o en columnas columnas columnas columnas columnas que pueden editarse.
Los cuadros son contenedores de texto separados que sirven para colocar
varios bloques de texto, de grficos y de tablas en una pgina. El texto en columnas
pasa de forma natural de una columna a la siguiente y es mucho ms fcil de
editar.
Imaginemos ahora que en el documento escaneado hay columnas reales.
Cuando el sistema es incapaz de detectar columnas en el documento original,
este modo de formato utiliza igualmente cuadros por defecto!
Si quiere probarlo, puede utilizar la imagen COLUMNS.TIF de la carpeta de
imgenes de Readiris.
chapter2.pmd 3/04/2006, 15:45 106
2 - 107
MANUAL DEL USUARIO
La opcin "Insertar Saltos de Columna" mejora la recreacin de columnas:
dermina si desea o no insertar un cdigo de fin de columna entre ellas. Con los
cdigos de fin entre columnas, cualquier texto que se edite, aada o borre
permanecer dentro de su columna; ningn texto fluir de forma automtica a la
chapter2.pmd 3/04/2006, 15:45 107
2 - 108
siguiente columna. Aquellos textos que vayan despus de un espacio entre
columnas sern colocados al principio de la columna siguiente.
Active esta opcin si quiere conservar los fino de columnas en el mismo lugar
en el que se hayan detectado en el documento reconocido - independientemente
de la edicin de texto que se realice despus del OCR. En peridicos y revistas,
las columnas de una pgina se corresponden casi siempre a distintos artculos.
Por lo tanto, no es buena idea permitir que el texto fluya automticamente de una
columna a la siguiente.
Desactive esta opcin cuando haya dividido el texto en columnas: as se
asegurar la fluidez natural del texto de una columna a la siguiente.
Hay un aspecto en el que puede decidir no recrear el formato del documento
original: el tamao de pgina de los documentos que se producirn. Qu queremos
decir con esto? Veamos algunos ejemplos: usted escanea pginas de tamao
Carta pero genera documentos de tamao A4 porque considera que este formato
resulta ms fcil de imprimir, ya que la impresin de documentos de tamao
Carta requiere alimentacin manual. O, por ejemplo, usted es abogado y escanea
documentos de tamao Carta que guarda en formato Legal.
Esta es la razn por la cual Readiris le permite definir el tamao de pgina que
prefiera para los documentos que produce. Haga clic en el botn "Tamao del
Papel" en el cuadro de dilogo "Formato".
chapter2.pmd 3/04/2006, 15:45 108
2 - 109
MANUAL DEL USUARIO
Seleccione los tamaos de papel aplicables y excluidos: los tamaos de papel
preferidos se pueden utilizar para dar formato a los documentos reconocidos,
mientras que los formatos excluidos no se utilizarn. Ordene los tamaos de
papel aceptados: Readiris pasa por los diferentes tamaos de papel en el orden
indicado, y utiliza el primer tamao de papel en el que pueda caber el documento
escaneado. El botn "Por Defecto" vuelve a aplicar la configuracin por defecto.
(Esto incluye su configuracin de Windows!)
Recuerde que esta opcin no se puede utilizar con los archivos en formato
HTML, un formato de texto pensado para Internet que no tiene formatos de
pgina. Tampoco es compatible con los archivos PDF, que utilizan tamaos de
pgina propioas para recrear con precisin el documento original.
F FF FFORMA ORMA ORMA ORMA ORMAT TT TTO OO OO DE DE DE DE DE TEXT TEXT TEXT TEXT TEXTOS OS OS OS OS, 2 , 2 , 2 , 2 , 2 P PP PPAR AR AR AR ARTE TE TE TE TE
Las otras opciones de diseo son "Crear Texto Continuo" y "Conservar el
Formato de Palabras y Prrafos".
chapter2.pmd 3/04/2006, 15:46 109
2 - 110
Como ilustra el icono de la derecha, crear texto de cuerpo texto de cuerpo texto de cuerpo texto de cuerpo texto de cuerpo significa crear
un texto continuo, sin formato. El texto ser capturado, pero se ignorar
totalmente el formato. Utilice esta opcin cuando necesite capturar un texto pero
no su diseo.
El cuerpo del texto es tambin lo que usted selecciona cuando reconoce
rpidamente una zona del texto haciendo clic con el botn derecho, y seleccionar
la opcin "Copiar como Texto": una vez realizado el reconocimiento, pegar usted
el cuerpo del texto en su aplicacin de texto.
La opcin "Conservar el Formato de Palabras y Prrafos" representa un camino
intermedio: durante el reconocimiento se mantiene el formato de palabras formato de palabras formato de palabras formato de palabras formato de palabras -
tipo de letra, el tamao de letra y el estilo. Asimismo, tambin se mantiene el
formato de prrafo formato de prrafo formato de prrafo formato de prrafo formato de prrafo - tabulaciones y justificacin.
Pero no hay que confundir este formato con el formato automtico completo:
la primera opcin coloca los prrafos uno tras otro y no reproduce columnas, ni
copia la posicin relativa de las diferentes zonas.
E EE EEXPOR XPOR XPOR XPOR XPORT TT TTAR AR AR AR AR EL EL EL EL EL TEXT TEXT TEXT TEXT TEXTO OO OO V VV VVARIAS ARIAS ARIAS ARIAS ARIAS VECES VECES VECES VECES VECES
En realidad, podr exportar los resultados del OCR varias veces sin tener que
repetir el reconocimiento. Cambie el formato del texto y las opciones de formato
con el botn "Formato" y haga de nuevo clic en el botn "Reconocer-Guardar".
En este caso, no se ejecutar OCR, a menos que haya usted definido nuevas
chapter2.pmd 3/04/2006, 15:46 110
2 - 111
MANUAL DEL USUARIO
ventanas o haya modificado las existentes. De lo contrario, Readiris slo cambiar
el formato de los resultados OCR y los guardar en el nuevo formato del texto o
los enviar a la aplicacin de llegada que usted haya seleccionado.

Lo mismo se aplicar para cualquier otro elemento que usted cambie: cuando
aada una pgina a su trabajo OCR, slo se reconocer esa pgina. Si crea una
nueva zona de texto en una pgina, slo ser reconocida esa zona antes de que
los resultados se exporten.
Por ejemplo, usted podra reconocer un documento de 10 pginas y guardarlo
en un archivo de Word, escanear el resumen de la primera pgina y enviarlo por
correo electrnico a un compaero impaciente, escanear el anexo - una tabla - y
guardar todos los resultados en un archivo HTML para colgarlo en la pgina web
de su empresa.
G GG GGUARDAR UARDAR UARDAR UARDAR UARDAR GRFICOS GRFICOS GRFICOS GRFICOS GRFICOS POR POR POR POR POR SEP SEP SEP SEP SEPARADO ARADO ARADO ARADO ARADO
En nuestro ejemplo, el grfico se inclua en el documento reconocido; que esto
sea as o no, depender de la opcin de formato "Incluir Grficos". Los grficos
que hay en el texto se podrn volver a guardar dependiendo del modo de salida.
Los formatos de texto pobres como Texto (ANSI), etc. no almacenan grficos.
An as, con Readiris puede guardar grficos sin llevar a cabo el reconocimiento
de texto. Dado que el programa Readiris genera imgenes en blanco y negro, ,, ,, en
escala de grises o en color, con l pueden capturarse dibujos y fotografas muy
fcilmente.
chapter2.pmd 3/04/2006, 15:46 111
2 - 112
Cmo? Trace una zona de grfico alrededor de las ilustraciones, caricaturas,
etc. que desee capturar. Hgalo de la misma forma que traza una ventana de
texto o de tabla, pero en este caso seleccione la herramienta "Ventana de Grfico".
A continuacin elija la opcin "Guardar Grficos" en el men "Archivo".
Se le pedir que especifique un nombre de archivo. Determine el formato
grfico que desee usar. Seleccione un formato que pueda utilizar con su software
de retoque. Dispone de los formatos JPEG, TIFF y Zsoft Paintbrush (*.pcx).
Active la opcin "Escala de Grises/Color" que permite guardar las imgenes
bien en color, bien en escala de grises. Al guardar grficos en blanco y negro en
el formato TIFF, se utiliza la compresin de Grupo 4. Al guardar grficos en
escala de grises o en color en el formato TIFF, se utiliza la compresin JPEG y el
usuario puede definir la calidad JPEG (nivel de compresin).
chapter2.pmd 3/04/2006, 15:46 112
2 - 113
MANUAL DEL USUARIO
Para enviar un grfico al portapapeles mejor que guardar un archivo de imagen,
haga clic con el ratn sobre una ventana de grfico y seleccione la opcin "Copiar
como Grfico": la zona del grfico que se haya seleccionado con el ratn est
lista para ser pegada.
chapter2.pmd 3/04/2006, 15:46 113
2 - 114
R RR RRECREAR ECREAR ECREAR ECREAR ECREAR COLUMNAS COLUMNAS COLUMNAS COLUMNAS COLUMNAS, , , , , CUADROS CUADROS CUADROS CUADROS CUADROS, , , , , ETC ETC ETC ETC ETC. . . . . DE DE DE DE DE COLOR COLOR COLOR COLOR COLOR
Readiris tambin ofrece otra forma de aadir color a los documentos que
genere: la opcin "Conservar los Colores del Fondo" conserva los colores del
fondo de pgina durante el proceso de reconocimiento. (Esta opcin implica que
se conserven tambin los colores del texto.)
chapter2.pmd 3/04/2006, 15:46 114
2 - 115
MANUAL DEL USUARIO
Siempre que el documento original tuviese algn color de fondo, el resultado
ser un color de fondo uniforme en cada prrafo. Esta funcin es compatible con
los formatos de salida Word (*.doc), RTF (Rich Text Format), WordML (*.xml)
y HTML. Sin embargo, recuerde que, con esta funcin, no se conservarn los
detalles de, por ejemplo, una fotografa a pgina completa ubicada en el fondo de
un documento. (Reconozca la imagen de muestra COLORS.JPG para hacer una
prueba...)
chapter2.pmd 3/04/2006, 15:46 115
2 - 116
C CC CCONSER ONSER ONSER ONSER ONSERV VV VVAR AR AR AR AR LOS LOS LOS LOS LOS COLORES COLORES COLORES COLORES COLORES DEL DEL DEL DEL DEL TEXT TEXT TEXT TEXT TEXTO OO OO
Y hay an otra forma de aadir color a los documentos que genere: puede
conserver los colores del texto colores del texto colores del texto colores del texto colores del texto.
La opcin de formato "Conservar los Colores del Texto" para preservar los
colores originales del texto durante todo el proceso de reconocimiento: aparecer
un ttulo de color rojo en el documento generado, etc.
chapter2.pmd 3/04/2006, 15:46 116
2 - 117
MANUAL DEL USUARIO
chapter2.pmd 3/04/2006, 15:46 117
2 - 118
L LL LLECTURA ECTURA ECTURA ECTURA ECTURA DE DE DE DE DE F FF FFAXES AXES AXES AXES AXES Y YY YY RECONOCIMIENT RECONOCIMIENT RECONOCIMIENT RECONOCIMIENT RECONOCIMIENTO OO OO DIFERIDO DIFERIDO DIFERIDO DIFERIDO DIFERIDO
Al guardar imgenes en archivos graficos se abre otra posibilidad: puede guardar
la pgina completa y realizar un reconocimiento diferido reconocimiento diferido reconocimiento diferido reconocimiento diferido reconocimiento diferido ms adelante. Eso
fue lo que hicimos con las imgenes escaneadas para nuestro curso.
Escanee simplemente el documento y seleccione la opcin "Guardar Toda la
Pgina como Imagen" del men "Archivo" para guardar una nica pgina. El
programa le pedir en qu formato desea guardar la pgina: PDF, JPEG, TIFF o
ZSoft Paintbrush (*.pcx).
Seleccione la opcin "Guardar todas las pginas como imagen" para guardar
un documento de mltiples pginas. Dispondr de dos formatos de archivo: PDF
y TIFF de mltiples pginas. Pero tambin puede seleccionar los formatos de
salida PDF Imagen o TIFF con el botn "Formato".
chapter2.pmd 3/04/2006, 15:46 118
2 - 119
MANUAL DEL USUARIO
(La exclusin de pginas tambin se aplica al reconocimiento: cuando ponga
en marcha el proceso de OCR, las pginas excluidas (temporalmente) no se
incluirn en el archivo de imagen de multiples pginas.)
Ahora puede seleccionar el disco como origen de la imagen y abrir el archivo
grfico con el botn "Abrir" (o con la opcin equivalente del men "Accin"). (Si
utiliza la opcin "Abrir" del men "Archivo", ni siquiera tiene que actualizar el
origen de la imagen.)
Como el programa reconoce imgenes en color, en escala de grises y en
blanco y negro, Readiris le permite abrir documentos PDF de Adobe Acrobat y
archivos de imagen con los formatos fax DCX (una versin multipgina del formato
Paintbrush), DjVu (*.djv, *.djvu), JPEG, JPEG 2000 (*.j2c, *.jp2), PNG, TIFF (no
comprimidos o comprimidos con los mtodos LZW, PackBits, Grupo 3, Grupo 4 o
JPEG), TIFF de mltiples pginas, mapas de bits de Windows (*.bmp) y ZSoft
Paintbrush (*.pcx).
Esta capacidad resulta especialmente til para convertir sus faxes faxes faxes faxes faxes en archivos
de texto editables. Readiris usa su mxima capacidad para reconocer faxes. El
programa detecta las resoluciones tpicas de fax - 100 x 200 ppp (calidad nor-
mal), 200 x 200 ppp (calidad fina) y 200 x 400 ppp (calidad superfina) - y
chapter2.pmd 3/04/2006, 15:46 119
2 - 120
preprocesa automticamente estas imgenes para asegurar unos resultados de
OCR ptimos.
Sin embargo, de ser posible, pida a sus corresponsales que enven sus faxes
con calidad fina, puesto que dichos faxes darn mejores resultados de OCR.
Nuestro secundo consejo ya le resultar familiar: active el modo de reconocimiento
preciso, que encontrar haciendo clic en el botn "Idioma", y podr reconocer los
faxes con xito.
No olvide que puede abrir imgenes directamente desde el Explorador de
Windows haciendo clic con el botn derecho del ratn en un archivo grfico y
seleccionando la opcin "Reconocer" del men contextual. Tambin puede
arrastrarlos con el ratn desde el Explorador de Windows hasta la zona de imgenes
o sobre el icono de Readiris, y se abrirn automticamente.
R RR RRECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENTO OO OO DE DE DE DE DE T TT TTABLAS ABLAS ABLAS ABLAS ABLAS
Hasta ahora hemos reconocido textos y faxes y hemos guardado grficos.
Ahora procesaremos una tabla. Coja una tabla con cifras y escanela, o bien
abra la imagen de muestra TABLES.JPG que se encuentra en la carpeta de
imgenes de Readiris.
En realidad, la imagen TABLES.JPG contiene dos tablas y no es una
coincidencia! El anlisis de pgina las divide en ventanas de tabla y Readiris las
reconstruir reproducindolas celda a celda en un programa de hoja de clculo o
insertando una tabla en el archivo del procesador de textos que usted prefiera.
Daremos algunos ejemplos. Empezaremos con la tabla con cuadrcula o
enmarcada; es decir, la que tiene bordes alrededor de las celdas.
chapter2.pmd 3/04/2006, 15:46 120
2 - 121
MANUAL DEL USUARIO
Utilice el botn "Ordenar" para seleccionar la tabla y ejecute el reconocimiento
con cualquier nivel de formato. Da igual que cree cuerpo de texto, que conserve
el formato de las palabras y los prrafos o que recree el documento fuente: la
tabla se recrear. Abra un procesador de textos y ver el resultado: las clulas
y los bordes han sido creados por Readiris uno a uno! (Naturalmente, tambin
puede incluir prrafos de texto normales en este archivo.)
chapter2.pmd 3/04/2006, 15:46 121
2 - 122
Pasemos ahora al ejemplo de las tablas sin cuadrcula - o sea, las que no
tienen bordes alrededor de las celdas. Observe que, pese a todo, el anlisis de
pgina la detecta! Otro aspecto muy interesante de esta tabla es que su contenido
es totalmente numrico.
chapter2.pmd 3/04/2006, 15:46 122
2 - 123
MANUAL DEL USUARIO
Para una precisin ptima de reconocimiento, limite el reconocimiento a los
smbolos numricos smbolos numricos smbolos numricos smbolos numricos smbolos numricos con el botn "Idioma". (El modo numrico no es
estrictamente numrico, incluye los smbolos 0 a 9, +, *, /, %, ,
(coma), . (punto), (, ), -, =, $, , y el smbolo .)
chapter2.pmd 3/04/2006, 15:47 123
2 - 124

Dado que esto slo puede hacerlo cuando la tabla no contiene ningn carcter
alfabtico - de lo contrario, las porciones de texto no se reconoceran correctamente
- , podemos activar el modo numrico solamente para reconocer esta tabla, pero
no el resto del documento. (En consecuencia, utilice el botn "Ordenar" para
seleccionar la tabla.)
En esta ocasin, enviaremos directamente el resultado del reconocimiento al
programa de hoja de clculo Microsoft Excel. Seleccionaremos, pues, Excel como
aplicacin de salida mediante el botn "Formato".
La hoja de clculo se inicia automticamente y el resultado es idntico al de la
tpica estructura de tabla con filas y columnas, en la que podr procesar datos
inmediatamente.
chapter2.pmd 3/04/2006, 15:47 124
2 - 125
MANUAL DEL USUARIO
Puede ocurrir que el anlisis de pgina a veces no detecte como tal alguna
tabla sin cuadrcula y por tanto no la site en una zona de tabla. Esto se debe a
que el espacio entre columnas es muy amplio. Readiris pretende de esta manera
evitar la posible confusin con bloques de texto en los que haya columnas y no
tablas. Para trazar una ventana de tablas manualmente, haga clic en la herramienta
"Ventana de Tabla" de la barra de herramientas de imagen y siga el procedimiento
habitual. Una vez ms, la etiqueta emergente del botn le indicar el nmero de
ventanas de tabla.
En los dos ejemplos anteriores, seleccionamos la primera tabla y, a continuacin,
la segunda, con el botn "Ordenar" para limitar el reconocimiento a los datos
requeridos. Tuvimos que excluir la otra tabla y cualquier texto que est alrededor
de las tablas. De hecho, este paso manual no es necesario cuando generamos
resultados en formato SpreadsheetML, el nuevo formato de tabla basado en XML
de Microsoft Office 2003. (Podemos hacerlo enviando los resultados del
reconocimiento a Microsoft Excel 2003 y generando archivos SpreadsheetML.)
chapter2.pmd 3/04/2006, 15:47 125
2 - 126
Algunas opciones slo son aplicables a este formato de tabla.
La opcin "Ignorar Todo Texto Fuera de Tablas" guarda las tablas e ignora el
resto de resultados del reconocimiento. Todos los datos del interior de las tablas
se capturan, mientras que los datos situados fuera de la(s) tabla(s) - bloques de
texto, grficos, cdigos de barras, etc. - se ignoran con este modo de salida.
Siempre que las zonas de tabla estn correctamente definidas, no importa qu
ventanas detecta el anlisis de pgina.

Con esta opcin, puede deshacerse del texto situado alrededor de las tablas de
manera instantnea, sin necesidad de realizar operaciones manuales. Pero, incluso
chapter2.pmd 3/04/2006, 15:47 126
2 - 127
MANUAL DEL USUARIO
as, an tenemos dos tablas en la misma pgina. Podemos guardarlas por separado
sin realizar ms operaciones adicionales? Claro que s! Active la opcin de
SpreadsheetML "Crear una Hoja de Clculo por Tabla" para colocar cada tabla
en una hoja independiente. Cuando el texto reconocido en el exterior de las tablas
se incluye, lo encontrar en otra hoja; los hipervnculos le permitirn saltar del
texto a las tablas y viceversa de manera instantnea.
Si el documento reconocido contiene varias pginas, ver que esta estructura
se repite en cada pgina.
La opcin alternativa es "Crear una Hoja de Clculo por Pgina", que hace
que se cree una sola hoja por cada pgina escaneada. Si una pgina contiene
tablas y texto, todo se colocar en la misma hoja de clculo. Tenga en cuenta que
slo las cifras situadas dentro de las tablas se codificarn como nmeros, y siempre
que la opcin "Convertir Cifras en Nmeros" est activada. El texto situado dentro
y fuera de las tablas sigue siendo... texto.
chapter2.pmd 3/04/2006, 15:47 127
2 - 128
La opcin "Convertir Cifras en Nmeros" codifica las cifras reconocidas como
nmeros. Como consecuencia, es posible ejecutar operaciones aritmticas en
estas celdas. Las celdas de texto (en cualquier tabla) siguen siendo lo que eran -
texto. (Excel ejecuta operaciones matemticas - calcular sumas, promedios, etc.
- exclusivamente en datos codificados como nmeros. Dentro de Excel, slo se
aade texto para aumentar la claridad de los datos y para imprimir.)
Asimismo, Readiris sustituye las comas por puntos y viceversa. Vamos a ver
un ejemplo: usted exporta una tabla en ingls (o ingls de EE.UU.) a un PC en el
que la configuracin internacional es espaol. Readiris reconoce "1. .. ..25" y
"1, ,, ,,000, ,, ,,000" correctamente, pero recodifica los nmeros como "1, ,, ,,25" y "1. .. ..000. .. ..000"
en la hoja de clculo. (En caso que tenga dudas acerca de la configuracin de su
sistema, compruebe la configuracin regional de Windows (en el "Panel de Con-
trol") para ver cmo representarn los idiomas, las fechas, las horas y los nmeros
sus programas compatibles con datos internacionales.)
Tenga tambin en cuenta que la opcin "Conservar los Colores del Texto" es
aplicable al formato SpreadsheetML, del mismo modo que la opcin de formato
"Conservar los Colores del Fondo". En otras palabras, puede recrear los colores
del texto y el color de fondo de cada celda.
R RR RRECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENT ECONOCIMIENTO OO OO DE DE DE DE DE TEXT TEXT TEXT TEXT TEXTOS OS OS OS OS ESCRIT ESCRIT ESCRIT ESCRIT ESCRITOS OS OS OS OS A AA AA MANO MANO MANO MANO MANO
Hasta ahora hemos reconocido documentos escaneados, tablas, faxes,
instantneas tomadas con una cmara digital, hemos guardado grficos y hemos
chapter2.pmd 3/04/2006, 15:47 128
2 - 129
MANUAL DEL USUARIO
convertido documentos PDF. Sin embargo, Readiris tiene an otra funcionalidad:
el reconocimiento de textos escritos a mano.
En realidad, deberamos hablar de textos manuscritos y no escritos a mano. El
trmino escritura a mano se utiliza para describir un texto continuo escrito a
mano, en cursiva. Los smbolos que forman una palabra o una cadena de
caracteres se tocan, por lo que es imposible saber dnde termina un smbolo y
dnde empieza otro. En los manuscritos, las letras de palo seco (block let-
ters) estn separadas entre ellas, por lo que el programa de reconocimiento
puede aislar ms fcilmente los caracteres individuales.
Es necesario utilizar software muy especializado - software de ICR (Intel-
ligent Character Recognition, reconocimiento inteligente de caracteres) - para
reconocer los smbolos manuscritos. Esta potente tecnologa de ICR de I.R.I.S.
se basa en ms de un milln de muestras de escritura! Readiris es compatible con
todos los estilos de escritura naturales, ya sean americanos o europeos. No requiere
ningn estilo impuesto.
El reconocimiento de textos manuscritos se limita a los numerales (0-9), las
maysculas (A-Z) y los signos de puntuacin , (coma), . (punto) y - (guin).
Significa esto que slo puede tomar notas en ingls? No, tambin puede
escribir notas en espaol, francs, alemn, italiano, etc. siempre que no escriba
acentos ni diresis en los caracteres en mayscula. Por ejemplo, Readiris no
reconocer TLCOPIE 4H, PNKTLICH IN STERREICH o PI
QUALIT, pero s que reconocer TELECOPIE A 4H., PUENKTLICH
IN OESTERREICH y PIU QUALITA. Aun as, no puede tomar notas en
griego, ruso, etc.: slo se reconoce el alfabeto latino!
Si los resultados obtenidos distan de ser ptimos puede utilizar el patrn de
escritura optimizado de I.R.I.S. y adaptar su estilo de escritura. Consulte la ayuda
en lnea de Readiris para descubrir las reglas de escritura. Escriba las maysculas
chapter2.pmd 3/04/2006, 15:47 129
2 - 130
con claridad, con trazos regulares, de modo que su escritura manual se parezca lo
mximo posible a los caracteres impresos. (Tenga especial cuidado al escribir
las letras A, G y Q!)
Unos pocos y sencillos consejos pueden ensearle por qu se producen las
sustituciones y cmo evitarlas. El patrn de escritura en blanco de I.R.I.S. puede
utilizarse como plantilla a pgina completa en la que escribir las letras de palo
seco con un espaciado regular y con el tamao adecuado. Puede encontrar el
patrn en blanco para reimprimir y editar en el CD-ROM de Readiris.
chapter2.pmd 3/04/2006, 15:47 130
2 - 131
MANUAL DEL USUARIO
Ahora ya sabemos cmo podemos tomar notas en una reunin de modo que
despus las pueda leer nuestro ordenador. Qu dedemos hacer para poder
reconocerlas despus con Readiris? Trace una ventana de manuscrito alrededor
del texto manuscrito en cuestin y ejecute el reconocimiento. (Puede probarlo
con la imagen de muestra HANDPRINTING.TIF.)
chapter2.pmd 3/04/2006, 15:47 131
2 - 132
Las caractersticas del documento - idioma, tipo de fuente, ancho de los
caracteres - no se tienen en cuenta en los textos manuscritos. El usuario est
limitado al juego de caracteres ingls - o, mejor dicho, latino! - bsico de letras
(maysculas) de palo seco. Tampoco se utiliza el aprendizaje interactivo: el
aprendizaje no tiene demasiado sentido en un contexto en el que todo el mundo
tiene su propio estilo de escribir. (Tal como hemos indicado anteriormente, la
tecnologa de ICR de I.R.I.S. se basa en ms de un milln de muestras de
escritura...)
chapter2.pmd 3/04/2006, 15:47 132
2 - 133
MANUAL DEL USUARIO
L LL LLECTURA ECTURA ECTURA ECTURA ECTURA DE DE DE DE DE BARRAS BARRAS BARRAS BARRAS BARRAS Y YY YY ESP ESP ESP ESP ESPACIOS ACIOS ACIOS ACIOS ACIOS
Y es que Readiris tambin lee cdigos de barras! Los cdigos de barras que
aparecen en las imgenes escaneadas se pueden leer e incluir como datos
reconocidos en el interior de los documentos generados.
chapter2.pmd 3/04/2006, 15:47 133
2 - 134
Los cdigos de barras estn formados por barras paralelas con espacios entre
ellas. Combinaciones predefinidas de barras y espacios representan caracteres
especficos. Hay varios estndares o simbologas de cdigos de barras. Readiris
es compatible con todas las simbologas de cdigos de barras ms utilizadas.

Slo tienen suficiente calidad los cdigos de barras imprimidos con impresoras
lser o de inyeccin de tinta. Excluya los cdigos de barras imprimidos con
impresoras matriciales: no tienen suficiente contraste y su resolucin acostumbra
a ser como mximo de 60 ppp. Readiris reconoce mejor los cdigos de barras
con un buen contraste; las barras negras sobre un fondo blanco dan los mejores
resultados. La mayora de tipos de cdigos de barras requieren una zona
tranquila alrededor del cdigo. Los cdigos de barras no dan nunca resultados
parciales: la falta de una barra, la falta de un carcter de inicio o de final o un
dgito de control incorrecto siempre dar un error de lectura, un resultado nulo.
Trace una ventana de cdigo de barras alrededor de los cdigos de barras - el
anlisis de pgina no los detecta - y ejecute el reconocimiento. Readiris leer los
cdigos de barras y los incluir en el texto resultante. Tambin puede hacer clic
con el botn derecho del ratn sobre una zona de cdigo de barras y seleccionar
el mando "Copiar como Datos" del men contextual; Readiris leer el cdigo de
barras y lo enviar al portapapeles... (Los caracteres de control de algunos
estndares se verifican pero no se incluyen en el resultado de la lectura.) La
imagen de muestra BARCODE.TIF puede servirle para hacerse una idea ms
clara de esta funcin.
chapter2.pmd 3/04/2006, 15:47 134
2 - 135
MANUAL DEL USUARIO

La opcin "Cdigos de Barras" del men "Configuracin" determina qu tipos
de cdigo de barras - el trmino exacto es simbologas - se reconocern y si los
caracteres de control de algunos cdigos de barras se verificarn y eliminarn de
los resultados del reconocimiento. Utilice el botn "Por Defecto" para restablecer
la configuracin por defecto.
chapter2.pmd 3/04/2006, 15:48 135
2 - 136
C CC CCMO MO MO MO MO OBTENER OBTENER OBTENER OBTENER OBTENER A AA AAYUDA YUDA YUDA YUDA YUDA EN EN EN EN EN LNEA LNEA LNEA LNEA LNEA
Con esto concluimos nuestra sinopsis general de Readiris. Es posible que este
manual no contenga informacin de ltimo minuto. Por ello le recomendamos que
consulte el sistema de ayuda en lnea para ms informacin sobre Readiris.
Para ello vaya el men "Ayuda". La opcin "Temas de Ayuda" y su macro, la
tecla F1, le permiten navegar a travs de los numerosos temas de ayuda.
chapter2.pmd 3/04/2006, 15:48 136
2 - 137
MANUAL DEL USUARIO
El resto de opciones del men "Ayuda" le indican cmo obtener asistencia
tcnica para el producto, cmo ponerse en contacto con I.R.I.S., cmo acceder
directamente a la pgina web de I.R.I.S., etc.
chapter2.pmd 3/04/2006, 15:48 137
2 - 138
chapter2.pmd 3/04/2006, 15:48 138

Das könnte Ihnen auch gefallen