Beruflich Dokumente
Kultur Dokumente
Introdução
Por volta de 1969, a equipe desenvolveu uma linguagem com todas essas
possibilidades e a chamaram de Generalized Markup Language (GML).
Enquanto o HTML é legível apenas pelas pessoas, os documentos XML podem ser
lidos pelas pessoas e manipuláveis pelos computadores.
3. XML
Qualquer editor de texto pode ser utilizado para criar um documento XML. Muitos
pacotes de software também permitem que os dados sejam armazenados como
documentos XML.
É necessário tomar cuidado para que não seja criado mais do que um elemento raiz
em um documento XML.
Embora a declaração de XML seja opcional, ela deve ser usada para identificar a
versão da XML do documento. Caso contrário, no futuro, é possível que seja
assumido que um documento sem uma declaração de versão XML obedece à ultima
versão da XML, o que pode vir a ocasionar problemas.
Os nomes dos elementos não podem conter caracteres especiais nem espaços, e
devem começar por letras ou “_”.
Atributos são pares de valores nomeados que ocorrem dentro das marcas de início,
após o nome do elemento. Por exemplo:
<elemento classe="prefácio">
Uma vez que o caractere “<” denota o início de uma marcação, não poderia ser
utilizado no conteúdo de um elemento. As seções CDATA são seções de um
documento XML que podem conter texto, caracteres reservados (por exemplo, <) e
caracteres espaços em branco. Os caracteres contidos nas seções CDATA são
excluídos da interpretação.
Um uso comum das seções CDATA é o código de criação de scripts (Javascript ou
VBScript), que freqüentemente contêm os caracteres &, <, >, ` e “.
Esta característica faz com que as seções CDATA sejam adequadas para, por
exemplo, o armazenamento de trechos de código em linguagens de programação.
Uma vez que a XML, como o próprio nome sugere, é uma linguagem, está sujeita a
certas regras, indicam como escrever um documento bem formado.
Explicando de forma mais clara as regras que um documento XML deve atender
para ser considerado bem-formado:
<books>
<book>
<title>XML Como Programar
<publisher>Bookman</publisher>
</book>
<books>
A tag <title> não possui fechamento (</title>), por isto o documento é mal-formado.
<books>
<book>
<title>XML Como Programar
<publisher>Bookman</title>
</publisher>
</book>
<books>
A tag <publisher> não pode encerrar-se depois da tag <title>, por isto o documento
é mal-formado.
<books>
<book code=10>
<title>XML Como Programar
<publisher>Bookman</title>
</publisher>
</book>
<books>
O valor do atributo code não contém aspas nem apóstrofes, o que torna o
documento mal-formado.
e) Existe diferença entre maiúsculas e minúsculas (case-sensitive):
<books>
<book code=10>
<title>XML Como Programar
<publisher>Bookman</title>
</publisher>
</Book>
<books>
Existem softwares que são chamados de analisadores sintáticos (parsers), que lêem
os documentos, verificando sua sintaxe e relatando possíveis erros, permitindo, via
programa, acesso ao conteúdo dos documentos.
Existem caracteres que, por serem reservados, não podem ser utilizados em
documentos XML. A linguagem XML oferece substitutos para estes casos. Tais
substitutos começam por “&” e terminam por “;” (referência a entidade).
< <
> >
& &
‘ '
“ "
3.8. Comentários
3.8. Marcação
está correto em HTML, mas em XML a marca de finalização também deveria ser
fornecida, como em
Como este elemento não contem conteúdo (dados de caracteres), ele é chamado de
elemento vazio. A marca vazia pode ser escrita de forma mais concisa, como <img
src = “logo.gif”/> que usa a barra ( / ) para indicar o término.
Os atributos não são considerados como nós filhos de um elemento, mas como
informações adicionais aos elementos.
Se um documento XML não está de acordo com a DTD correspondente, mas estiver
sintaticamente correto, ele é bem-formado, mas não é válido.
Uma DTD também pode ser utilizada para validar documentos HTML ou XHTML e
neste caso podem ser de três tipos:
a) Transactional: se você tiver tags que não estão sendo fechadas, atributos em
maiúsculos ou os valores sem aspas.
A referência normativa do XHTML diz que você pode utilizar 3 tipos de doctype:
Para cada elemento, são especificados os tipos permitidos para os nós filhos.
Sinal de mais (+) - O elemento pode aparecer um número qualquer de vezes, mas
deve aparecer pelo menos uma vez (uma ou mais vezes).
<!ELEMENT album(musica+)>
<!ELEMENT livraria(livro*)>
<!ELEMENT assento(pessoa?)>
Exemplo 1:
Desta forma os seguintes exemplos de marcação estão de acordo com essa regra:
Exemplo 2:
Exemplo 3:
O exemplo 3 indica que o elemento farm pode ter um ou mais elementos farmer, um
número qualquer de elementos opcionais dog ou um elemento opcional cat, um
número qualquer de elementos opcionais pig, um elemento opcional goat ou cow e
um ou mais elemenots chicken e ou um número qualquer de elementos opcionais
duck.
<!ELEMENT myMessage(#PCDATA|message)>
<!ELEMENT x EMPTY>
#FIXED – especifica que o valor do atributo é constante e não pode ser diferente no
documento XML. Um valor para o atributo é requerido.
“string” – especifica um valor padrão para o atributo, se não for definido um.
ENTITY – Entidades são utilizadas para associar nomes com outros fragmentos do
documento. Podem ser utilizadas entidades internas, ou externas. A utilização é na
forma de &nome;
assim:
<elemento>&esucri;</elemento>
resulta em:
Atributos enumerados – o mais restritivo dos três tipos. Podem aceitar somente
um valor da lista de valores definida na declaração de atributo. Os valores de tipos
enumerados são separados por caracteres barra vertical (|).
O exemplo acima contém uma declaração de tipo enumerado que permite que o
atributo gender tenha ou o valor M ou F. O valor padrão “F” é especificado à direita
do tipo de atributo do elemento. Já o exemplo que segue, <!ATTLIST person
gender ( M | F ) #IMPLIED> não fornece um valor padrão para gender.
REFERÊNCIAS
Anotações de aula:
Profa. Ana Carolina Nicolosi da Rocha Gracioso
Prof. Rafael de Moura Speroni
Prof. Sidnei Aparecido dos Reis
Profa. Elaine Cristina de Souza
Sites:
http://www.w3c.org
www.unicode.org