Sie sind auf Seite 1von 32

Introducción al XML

Sesión del
Día Uno

Curso XML
ISC. José Aurelio Ramírez González
I. ANTECEDENTES
• XML proviene de un lenguaje que invento IBM allá por los
años 70. El lenguaje de IBM se llama GML(General Markup
Language).
• Surge por la necesidad que tenían las empresas de
almacenar grandes cantidades de información de temas
diversos.
• En 1986 se normaliza el lenguaje, creando el SGML
(Standard Generalized Markup Language) que no era mas
que el GML pero estándar.
• 1991 Tim Berners crea las reglas de la primera versión de
HTML.
WORLD WIDE WEB CONSORTIUM(W3C)

• Constituído en 1994 con el objetivo de desarrollar


protocolos comunes para evolución de internet.
• Es un consorcio de industrias internacionales y esta
participado por el MIT(EEUU),INRIA(Francia) y Keio
University (Japon).
• Cuenta con el soporte oficial de DARPA (EEUU) y la
comisión Europea.
¿QUÉ ES EL XML?

XML son las siglas de Extensible Markup Language, una


especificación/lenguaje de programación desarrollada
por el W3C.

XML es una versión de SGML, diseñado especialmente


para los documentos de la web. Permite que los
diseñadores creen sus propias etiquetas, permitiendo la
definición, transmisión, validación e interpretación de
datos entre aplicaciones y entre organizaciones.
POR QUE XML

• Es un estándar internacionalmente reconocido.


• No pertenece a ninguna compañía y su utilización es
libre.
• Permitirá la utilización efectiva de internet en diferentes
alfabeto, por gente con minusvalías física, y en
diferente hardware(telefono celulares, PDAa, terminales
Braille, etc).
TECNOLOGÍA XML
• XML es una familia de tecnologías. El estándar define
qué son las etiquetas y los atributos, pero alrededor
están creciendo una serie de módulos que
proporcionan etiquetas, atributos y guías para realizar
tareas específicas:
a) XPointer, XBase y XLink describen un modo
extándar de añadir hiperenlaces a un documento
XML.
b) XPath define la sistaxis para referirse a partes de
un documento XML.

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
TECNOLOGÍA XML
c) CSS, el lenguaje de estilo de HTML se puede aplicar
a XML.
d) XSL es el lenguaje de estilo avanzado para XML, y
está basado en XSLT, que es un lenguaje de
transformación que permite reordenar, añadir o
elimitar etiquetas y atributos.
e) DOM y SAX son un conjunto estándar de llamadas
a funciones que permiten manipular documentos
XML (y HTML) desde programas.
f) XML Namespaces describe cómo se puede asociar
una URL con cada etiqueta y atributo de un
documento XML.
TECNOLOGÍA XML
ÁREAS DE APLICACIÓN
• Banca en Linea( online Banking)
• Canales (Push Technology)
• Automatizacion Web ( Web Automation)
• Publecacion de Base de datos (Database Publishing)
• Distribucion de Software(Software Distribution)

Corporaciones Usuarias
• Microsoft, Netscape, Sun MicroSystems,Adobe, IBM,
Corel,Hewlett-Packard…
CONCEPTOS BÁSICOS

Muchas formas de presentación a partir de un documento


XML:

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
ANÁLISIS DE DOCUMENTO XML
Analizador
• Modulo de software que lee un documento XML y
proporciona acceso a su contenido y estructura.

Funcionamiento del Analizador.


• Toma el documento y comprueba si esta bien
construido y/o si es valido. A su salida genera un árbol
de análisis.

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
LO QUE VE EL PROCESADOR

 LA RAÍZ DEL DOCUMENTO.


 ELEMENTOS.
 TEXTO.
 ATRIBUTOS.
 ESPACIOS DE NOMBRES (NAMESPACES).
 INSTRUCCIONES DE PROCESAMIENTO (PI).
 COMENTARIOS.

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
REPASO DE LOS CONCEPTOS ANALIZADOS:

VIDEO “INTRODUCCIÓN A XML”


PREPARÁNDONOS PARA TRABAJAR CON
XML
2. Herramientas necesarias
• Un Editor de texto
• Un explorador o Navegador de Internet
• Una herramienta de procesamiento y
transformación para XML o parser.

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
PREPARÁNDONOS PARA TRABAJAR CON
XML
3. Editando un archivo XML
• Ejecutar cualquier editor de texto
• Escribir el texto
• Guardar el archivo “nombre_archivo.xml”

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
DOCUMENTO XML
• Un documento XML está formado por datos de
caracteres y marcado, el marcado lo forman las
etiquetas:

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
PROLOGO
Aunque no es obligatorio, los documentos XML pueden empezar
con unas línea que describen la versión de XML, el tipo de
documento, y otras cosas.

Además, se puede incluir una declaración de documento


autónomo ( standalone), que controla qué componentes de la DTD
son necesarios para completar el procesamiento del documento.

<?xml version="1.0" encoding="UTF-7" standalone="yes"?>

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
CUERPO
A diferencia del prólogo, el cuerpo no es opcional en un
documento XML, el cuerpo debe contener un y solo un elemento
raíz, característica indispensable también para que el documento
esté bien formado. Sin embargo es necesaria la adquisición de
datos para su buen funcionamiento.

Por Ejemplo:

<Edit_Mensaje >
( ……… )
</Edit_Mensaje>

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
ELEMENTOS
• Los documentos XML están formados por texto plano (sin
formato) y contienen marcas (etiquetas) definidas por el
desarrollador.

<nombre>Elsa</nombre>

• Sintaxis:
<etiqueta>valor</etiqueta>

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez

ELEMENTOS VACÍOS
Un elemento puede no contener ningún valor.
<etiqueta></etiqueta>
<etiqueta/>

• EJEMPLO
<nombre></nombre>
<nombre/>

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
RELACIONES PADRE-HIJO ENTRE
ELEMENTOS
• UN ELEMENTO (PADRE) PUEDE CONTENER A OTRO U
OTROS
• ELEMENTOS (HIJOS).
• <PERSONA>
• <NOMBRE>ELSA</NOMBRE>
• <MUJER/>
• <FECHA-DE-NACIMIENTO>
• <DÍA>18</DÍA>
• <MES>6</MES>
• <AÑO>1996</AÑO>
• </FECHA-DE-NACIMIENTO>
• <CIUDAD>PAMPLONA</CIUDAD>
• </PERSONA>
Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
ELEMENTO RAÍZ DE UN DOCUMENTO XML
• Todo documento XML tiene que tener un único elemento
raíz (padre) del que desciendan todos los demás.

• Los elementos son los que dan estructura semántica al


documento.
Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
ELEMENTOS CON CONTENIDO MIXTO
• Un elemento puede contener contenido mixto, es decir,
texto y otros elementos.
<persona>
<nombre>Elsa</nombre> vive en <ciudad>Pamplona</ciudad>.
</persona>

• El elemento "persona" contiene los elementos "nombre" y


"ciudad", además de los textos " vive en " y "."

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
NORMAS DE SINTAXIS BÁSICAS
• Todos los nombres de los elementos son case sensitive.

• Pueden contener letras minúsculas, letras mayúsculas,


números, puntos “.”, guiones medios “-” y guiones bajos
“_”.

• Pueden contener el carácter dos puntos “:”. No obstante,


su uso se reserva para cuando se definan espacios de
nombres.

• El primer carácter tiene que ser una letra o un guión bajo


“_”.
Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
NORMAS DE SINTAXIS BÁSICAS
• Detrás del nombre de una etiqueta se permite escribir un
espacio en blanco o un salto de línea.
<ciudad >Pamplona</ciudad
>

• No puede haber un salto de línea o un espacio en blanco


antes del nombre de una etiqueta.
<
ciudad>Pamplona</ ciudad>

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
EJEMPLOS
ELEMENTOS ESCRITOS
INCORRECTAMENTE
• <CIUDAD>PAMPLONA</CUIDAD>
• <DÍA>18</DIA>
• <MES>6<MES/>
• <CIUDAD>PAMPLONA</FINCIUDAD>
• <_ROJO>
• <2COLORES>ROJO Y NARANJA</2COLORES>
• < AFICIONES >CINE, BAILAR, NADAR</ AFICIONES >
• <PERSONA><NOMBRE>ELSA</PERSONA></NOMBRE>
• <COLOR FAVORITO>AZUL</COLOR FAVORITO>

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
ATRIBUTOS
• Un atributo proporciona información extra del elemento
que lo contiene.
<producto codigo="G45">
<nombre color="negro" precio="12.56">Gorro de
lana</nombre>
</producto>

• Los valores de los atributos pueden escribirse entre


comillas dobles (") o simples (').

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
NORMAS DE SINTAXIS (ATRIBUTOS)
• Los nombres de los atributos deben cumplir las mismas
normas de sintaxis que los nombres de los elementos.

• Además, todos los atributos de un elemento tienen que


ser únicos. Por ejemplo, es incorrecto escribir:
<datos x="3" x="4" y="5"/>

• Sí es correcto escribir:
<datos x="3" X="4" y="5"/>
Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
REALICE LOS SIGUIENTES EJERCICIOS

• SERIE DE EJERCICIOS DIA 1


• PRESENCIALES
REFERENCIAS
• WWW Consortium (W3C) [www.w3.org]
• Escuela W3 [www.w3schools.com]
• XML.com de O'Reilly [www.xml.com]
• Especificación XML 1.0 [www.w3.org/TR/REC-xml]
• Portal XML para la Industria [www.xml.org]
• ebXML [www.ebxml.org]
• OASIS [www.oasis-open.org]
• TEI [www.tei-c.org]
• Dublin Core [dublincore.org]
• Creando Documentos Electrónicos [ota.ahds.ac.uk/documents/creating/]
• Libro blanco Java-XML [java.sun.com/xml/ncfocus.html]
REFERENCIA BIBLIOGRÁFICA
Advanced Quality Solutions. XML Schema y DTDs.
http://www.programacion.com/tutorial/schemaydtd/

CASTILLO, Carlos. DTD y Schemas. Tejedores del Web.


http://www.tejedoresdelweb.com/307/article-2147.html

FLYN, Peter (ed.) The XML Facq. http://www.ucc.ie/xml/

MARIANO LÓPEZ, Leandro. FOAF: el proyecto 'amigo de un amigo'.


http://purl.org/net/inkel/2003/01/27/foaf.htm

Useful Information Company. DOAP: Description of a project.


http://usefulinc.com/doap/

The FOAF Project. http://www.foaf-project.org/

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez
REFERENCIA BIBLIOGRAFICA

W3C.Extensible Markup Language XML W3C Recommendation.


http://www.w3.org/TR/REC-xml/

W3C. XML in 10 points. http://www.w3.org/XML/1999/XML-in-10-


points.html (traducción al castellano por Enmanuelle Gutiérrez y Restrepo:
http://www.sidar.org/recur/desdi/traduc/es/xml/xml10p/xml10p.htm)

W3C. XML Schema Part 1: Structures. Second Edition.


http://www.w3.org/TR/xmlschema-1/

W3C. XML Schema. http://www.w3.org/XML/Schema

Curso de XML
M.A.S.C . Arturo Iván Grajales Vázquez

Das könnte Ihnen auch gefallen