Dokumenttypen (DOCTYPE)
SGML (Standardised General Markup Langu-
age) => HTML (HyperText Markup Language) HTML und XHTML (Abb. 1) sind Aus-
zeichnungssprachen. Sie werden vom
XML (eXtensible Markup Language) =>
XHTML (eXtensible Hypertext Markup Lan- Anzeigeprogramm, dem Browser (z. B.
guage) Internet Explorer, Firefox, Morzilla, Ope-
ra etc.) am Bildschirm dargestellt. Beide
Abb. 1: Übersicht der Auszeichnungssprachen:
HTML ist aus SGML entstanden, während Sprachen haben eine bewegte Ver-
XHTML ein Teil von XML ist. gangenheit, die sich am Versionsstand
(HTML 4.01, XHTML 1.1) ablesen lässt.
HTML 4.01 Strict Damit der Browser die jeweils richtigen
<!DOCTYPE HTML PUBLIC „-//W3C//DTD
HTML 4.01//EN“ „http://www.w3.org/TR/ Regeln zur Darstellung des Dokuments
html4/strict.dtd“> verwendet, sollte im Quelltext der Doku-
HTML 4.01 Transitional
menttyp (DOCTYPE) genannt werden.
<!DOCTYPE HTML PUBLIC „-//W3C//
DTD HTML 4.01 Transitional//EN“ „http: Die Dokumenttyp-Denition (Abb. 2) er-
//www.w3.org/TR/html4/loose.dtd“> folgt noch vor dem <HTML>.
HTML 4.01 Frameset
<!DOCTYPE HTML PUBLIC „-//W3C//
DTD HTML 4.01 Frameset//EN“ „http: Mit dieser Denition werden die „Gram-
//www.w3.org/TR/html4/rameset.dtd“>
XHTML 1.0 Strict
matik-Regeln“ der jeweils verwendeten
<!DOCTYPE HTML PUBLIC „-//W3C//DTD Version und (in geringem Maße) die Ab-
XHTML 1.0 Strict//EN“ „http://www.w3.org/ weichungen vom Standard deniert. Bei
TR/xhtml1/DTD/xhtml1-strict.dtd“>
XHTML 1.0 Transitional den Abweichungen unterscheidet man:
<!DOCTYPE HTML PUBLIC „-//W3C//
DTD XHTML 1.0 Transitional//EN“ „http:
//www.w3.org/TR/xhtml1/DTD/xhtml1- Strict
transitional.dtd“> Der Quelltext liegt im korrekten Format
XHTML 1.0 Frameset
des jeweiligen Versionsstands vor.
<!DOCTYPE HTML PUBLIC „-//W3C//
DTD XHTML 1.0 Frameset//EN“ „http:
//www.w3.org/TR/xhtml1/DTD/xhtml1- Transitional (Transition = Übergang)
frameset.dtd“>
XHTML 1.1 DTD Es können Abweichungen zum Standard
<!DOCTYPE HTML PUBLIC „-//W3C//DTD enthalten sein.
XHTML 1.1//EN“ „http://www.w3.org/TR/
xhtml11/DTD/xhtml11.dtd“>
Abb. 2: Die wichtigsten DOCTYPs ür HTML
Frameset
4.01 und XHTML 1.0 sowie XHTML 1.1 DTD Der Quelltext deniert ein Frameset.
Seite 1 von 2
Dokumenttypen - Grammatik-Regeln für den Browser
Die Variante „Transitional“ wurde geschafen, Ein fehlender oder falscher DOCTYPE
da viele Elemente und Attribute in den neue- ührt dazu, dass ein moderner Browser
ren Versionen (HTML 4.01) nicht mehr ent-
das Dokument nicht im „Standard-Mo-
halten sind (Elemente: z. B. FONT, CENTER,
U; Attribute: z. B. TEXT, LINK, ALINK, CO- dus“, sondern im „Quirks-Modus“ an-
LOR, BGCOLOR, BACKGROUND, FACE, zeigt. Dieser dient der Abwärtskompatibi-
SIZE, BORDER).
Da diese jedoch weit verbreitet sind, wurde lität. Er soll sicherstellen, dass veralteter
eine Übergangsvariante geschafen, in der oder ungültiger HTML-Code weiterhin
die nicht mehr zu verwendenden Elemente
und Attribute noch erlaubt sind.
korrekt angezeigt wird. Dabei werden u.
Eine vollständige Übersicht der „deprecated“ a. Darstellungsfehler alter Browser simu-
Elemente und Attribute ührt das W3C (World liert.
Wide Web Consortium): http://www.w3.org/
TR/html4/index/attributes.html. Die DOCTYPE-Angaben sind beim W3C
unter: http://www.w3.org/QA/2002/04/
Formaler Aufbau der DOCTYPES: valid-dtd-list.html nachzulesen.
<!DOCTYPE HTML PUBLIC „-//W3C//DTD
XHTML 1.0 Strict//EN“ „http://www.w3.org/ Ob Sie den DOCTYPE ür HTML oder
TR/xhtml1/DTD/xhtml1-strict.dtd“>
XHTML verwenden ist eigentlich egal.
HTML: Typ des SGML/XML Dokuments Bei XHTML sind allerdings die folgenden
PUBLIC: Public Identier Regeln zu beachten:
-: Minuszeichen = Organisation, die diese
DTD veröfentlicht hat und nicht bei der ISO - Alle Elemente und Attribute müssen
registriert ist (ein Pluszeichen würde eine klein geschrieben werden.
Registrierung bei der ISO bedeuten)
W3C: Identikation des Eigentümers der - Alle Werte der Attribute müssen in An-
DTD (W3C = World Wide Web Consortium) ührungszeichen stehen.
DTD: Art des Objekts (DTD = Document
- Alle Beehle (TAGs) müssen geschlos-
Type Denition)
XHTML 1.0 Strict: Bezeichnung des Objekts sen werden, auch solche, die allein
(XHTML), seine Version (1.0) und die Abart stehen. So muss ein Zeilenumbruch in
(Strict).
EN: natürliche Sprache (hier: englisch), die XHTML ormal wie olgt aussehen: <br />
dem Dokument zu Grunde liegt.
Es schließt sich die URL zum Regelwerk an.
Zeichensätze
Eine zweite wichtige Angabe ist der
Überprüfen einer Webseite auf Verwen- korrekte Zeichensatze im Kopfbereich
dung überholter Elemente und Attribute:
http://www.bitvtest.de/werkzeugliste.html#bo (HEAD) des Dokuments.
okmarklets Der Zeichensatz ür westeuropäische
Mit den Bookmarklets können zwei Lese-
zeichen angelegt werden. Rufen Sie eine Sprache lautet:
beiebiege Internetseite auf und betätigen Sie <meta http-equiv=“content-type“
die Lesezeichen. Sie funktioneren jedoch nur
content=“text/html; charset=ISO-
unter Fireox/Morzilla. !
8859-1“>
Weitere Zeichensätze sind dem SelHTML
von Stean Münz zu entnehmen: http://
intra.dion.de/man/selhtml70/////thb.htm.
Seite 2 von 2