Beruflich Dokumente
Kultur Dokumente
Morse
Baudot
CCITT#2
5 bit
Codificación binaria
Combinaciones
posibles
22: 4
23: 8
24: 16
25: 32
26: 64
27: 128
28: 256
216: 65536
ASCII
American Standard Code for Information Interchange
Caracteres gráficos
Caracteres de control
EBCDIC [Extended
Binary Coded
Decimal Interchange
Code].
Se trataba de
un código de 8
bits capaz de
representar 256
combinaciones si
bien sus caracteres
alfabéticos no
son secuenciales,
es decir no se
corresponden
con números
consecutivos como
en ASCII.
EBCDIC
IBM
Tarjetas perforadas
Jospeh Marie
Jacquard
Hermann Hollerit
ASCII
American Standard Code for Information Interchange
ISO 2022
Esta norma nació en 1973 y llegó hasta 1994. Es una tabla de 8 bits con 256
caracteres. Fue un sistema para incluir conjuntos de caracteres múltiples
en un sistema de codificación de carácter. ISO / IEC 2022 se desarrolló como
una técnica para atacar estos dos problemas: para representar los caracteres
en varios conjuntos de caracteres dentro de una codificación de carácter
individual, y para representar grandes conjuntos de caracteres.
ISO 8859
Se trata de complementos para el ASCII con variantes de diversas escrituras.
ISO 8859 se caracteriza por poseer la codificación ASCII en su rango inicial
(128 caracteres) y otros 128 caracteres para cada codificación, con lo que en
total utilizan 8 bits.
ASCII
American Standard Code for Information Interchange
ISO 8859-5
ISO 8859-7
ISO 8859-7
ISO 8859-6
ISO 8859-8
Japón
Big Five
Taiwan
Hong Kong
Singapur
ASCII
American Standard Code for Information Interchange
Apple
Apple
Desde el principio
el Macintosh usó su
propio código, una
extensión de ASCII que
fue completándose poco
a poco. Incluía signos
matemáticos para el
sumatorio tomados del
griego y ligaduras para
“fi” así como el símbolo
de Apple convertido en
carácter. La tabla recibía
el nombre, un poco
equívoco de Standard
Roman. Obviamente hubo
variantes para completar
las necesidades de otras
lenguas al modo que lo
había hecho Microsoft.
Unicode
Universalidad
Uniformidad
Unicidad
Universalidad
Uniformidad
Unicidad
Unicode
Farsí, Thai
El sistema adjudica un
nombre y un identificador
numérico único para cada
carácter o símbolo, el code
point o punto de código,
además de otros datos
necesarios para su uso
correcto y entiende los
caracteres alfabéticos e
ideográficos del mismo
modo por lo que hace
posible su mezcla en una
misma escritura.
Unicode
Lenguas indoeuropeas
Unicode
Lenguas indoeuropeas
Griego
Armenio
Latino
Celta
Eslavo
Germánico
Unicode
Lenguas indoeuropeas
hay caracteres sin glifo como los caracteres de control y glifos [x] que pueden
pertenecer a varios caracteres. Así la forma “x” puede ser la letra del alfabeto o
un signo matemático. Hay miles de formas de dibujar una misma letra.
Y hay glifos que no tienen una única correspondencia como sucede con el
ideograma japonés de la imagen que puede ser muchas cosas: entrada,
sección, campo, discípulo, escuela y alguna otra.
H hache x letra
H eta x op. mt
Unicode
Armenio
Unicode
Cherokee
Unicode
Características
Tipos de caracteres
Caracteres gráficos. Letras, signos diacríticos, cifras, caracteres de puntuación, símbolos y espacios.
Caracteres de formato. Caracteres invisibles que afectan al del texto. Ejemplos: U+2028 salto de
línea, U+2029 salto de párrafo, U+00A0 espacio de no separación, etc.
Códigos de control. 65 códigos definidos por compatibilidad con ISO/IEC 2022. Son los caracteres
entre en los rangos [U+0000,U+001F], U+007F y [U+0080.U+009F]. Interpretarlos es responsabilidad
de protocolos superiores.
Caracteres privados. Reservados para el uso fuera del estándar por fabricantes de software.
Caracteres reservados. Códigos reservados para su uso por Unicode cuyas posiciones no han sido
asignadas.
Puntos de código subrogados. Unicode reserva los puntos de código de U+D800 a U+DFFF para su
uso como códigos subrogados en UTF-16, en la representación de caracteres suplementarios.
No-caracteres. Son códigos reservados permanentemente para uso interno por Unicode. Los dos
últimos puntos de cada plano U+FFFE y U+FFFF.
Caracteres descartados. Son caracteres que se retienen por compatibilidad con versiones anteriores,
pero se debe evitar su uso.
Composición de caracteres
Mapa de caracteres
(CharMap.exe) es una
utilidad incluida con
los sistemas operativos
Microsoft Windows y se
utiliza para visualizar
todas las fuentes
tipográficas instaladas
en el sistema, para
comprobar la entrada del
teclado (Alt + código). Se
utiliza para introducir los
caracteres, seleccionándolo
de la lista y copiándolo al
portapapeles en lugar de
escribir. La herramienta
suele ser útil para
introducir caracteres
especiales.
Unicode
Open Type
Pueden contener hasta 65,536 glifos, aunque no es fácil hallar tipos OpenType
que se acerquen a ese límite.
Los archivos del tipo de letra son multiplataforma, por lo que pueden usarse sin
modificación en sistemas operativos tan diferentes como Mac OS X, Windows y
algunos sistemas Unix.