Jump to content
Main menu
Main menu
move to sidebar
hide
Navigation
Aphorismen
Applications
Business Economics & Admin.
My Computers
Cooking
Devices
Folders
Food
Hardware
Infos
Software Development
Sports
Operation Instructions
Todos
Test
Help
Glossary
Community portal
adaptions
Sidebar anpassen
Wiki RB4
Search
Search
Create account
Log in
Personal tools
Create account
Log in
Pages for logged out editors
learn more
Contributions
Talk
Editing
XML
(section)
Page
Discussion
English
Read
Edit
View history
Toolbox
Tools
move to sidebar
hide
Actions
Read
Edit
View history
General
What links here
Related changes
Special pages
Page information
Warning:
You are not logged in. Your IP address will be publicly visible if you make any edits. If you
log in
or
create an account
, your edits will be attributed to your username, along with other benefits.
Anti-spam check. Do
not
fill this in!
==Einführung== Da es bei Textverarbeitungsprogrammen um die Steuerung von visuellen Attributen geht, spricht man in diesem Fall auch von Visual Markup. Im Gegensatz dazu konzentriert sich das Generic Markup darauf, Auszeichnungen in den Text einzubringen, die eine Aussage über die Bedeutung der markierten Textstelle machen (»logische« oder »semantische« Auszeichnungen). Anstatt beispielsweise Zitate als »kursiv« zu markieren, ist es sinnvoller, sie als »Zitat« zu markieren. Überschriften bekommen nicht mehr die Auszeichnung »groß und fett«, sondern die Auszeichnung »Überschrift«. Ein wesentlicher Meilenstein in der Umsetzung dieser Ideen war die Entwicklung der''' Standard Generalized Markup Language''' (SGML). Die Verwandtschaft zwischen XML und SGML besteht darin, dass XML eine Teilmenge von SGML ist. XML wird durch das World Wide Web Consortium definiert. Zu den '''Vorteilen''' von XML zählen: *Erweiterbar In HTML sind beispielsweise alle Tags vorgegeben. *Offenes Format Der XML-Standard ist offen zugänglich. Im Gegensatz zu proprietären Formaten eines bestimmten Herstellers, sind XML-Daten unabhängig von einem einzelnen Softwareprodukt oder -anbieter. *System-unabhängig XML ist unabhängig von einem Betriebssystem oder von einem Computersystem (Hardware). *Medienneutral XML-Dokumente sind unabhängig von einem Ausgabeformat oder -gerät (Papier, Bildschirm usw.). *Anpassbar XML ist kein starres Format, sondern kann (muß) auf die jeweiligen Bedürfnisse zugeschnitten werden. (»Enabling Standard«) Zu den '''Nachteilen''' gehören: *Hoher Initialaufwand Der Einsatz verlangt üblicherweise nach der Analyse der Dokumentstruktur, dem Entwurf der DTD und der Erstellung einer Layoutbeschreibung. Je nach Umfang der Anwendung ist dabei die Zuhilfenahme von Experten sinnvoll oder notwendig. *Laufende Entwicklung Zum Teil sind technische Realisierungen noch nicht vorhanden. Eine XML Datei ist '''wohlgeformt''', wenn: * am Anfang die [[XML#Aufbau_einer_XML-Datei|XML Deklaration]] steht * es mindestens ein Datenelement gibt * es gibt ein Datenelement, dass alle anderen enthält Eine XML Datei ist '''gültig''', wenn: * eine [[XML#Dokumenttypen|Dokumententyp-Definition]] enthalten ist. ===Dokumenttypen=== Neben der Grundidee Generic Markup ist ein wichtiges Konzept von XML der '''Dokumenttyp'''. Die Eingabe eines Dokumententyps ist optional. Der Dokumenttyp beschreibt eine Klasse von Dokumenten, die sich in ihrem strukturellen Aufbau gleichen. Ein allgemein bekanntes Beispiel ist der Dokumenttyp »Brief«. Verschiedene Briefe sind meistens identisch oder zumindest sehr ähnlich strukturiert. Sie beginnen mit der Adresse des Absenders, gefolgt von der Adresse des Empfängers. Sie besitzen eine Ort- und Datumsangabe, eine Anrede, den eigentlichen Text des Briefes sowie eine abschließende Grußformel. Ein anderer vertrauter Dokumenttyp ist das »Buch«, oder etwas spezieller das »Fachbuch«. Der grobe Aufbau ist dabei: Titelei, Hauptteil, Anhangteil. Die Titelei enthält den Buchtitel, das Impressum, das Vorwort und ggf. eine Widmung und eine Danksagung. Der Hauptteil besteht aus einer Folge von Kapiteln. Kapitel sind auch im Anhangteil zu finden. Das diese anders dargestellt werden als Kapitel im Hauptteil (Kapitelüberschriften im Anhang sind meist mit einem Buchstaben versehen, während Kapitel im Hauptteil durchnumeriert werden) spielt für die Strukturierung keine Rolle (Generic Markup). Des weiteren gibt es im Anhangteil oft besondere Abschnitte wie etwa ein Glossar, ein Literaturverzeichnis und ein Stichwortverzeichnis. Um zu erläutern, was unter einem Dokumenttyp zu verstehen ist, wird zunächst erläutert, was ein '''Elementtyp''' ist. Man sagt, dass dies ein '''Element''' ist: <p>Lola rennt.</p> Das Element besteht aus einem Start-Tag, dem Inhalt des Elements und einem End-Tag. Auch dies ist ein Element: <p>Ist ja gar nicht wahr.</p> Es handelt sich um zwei Elemente mit auffallenden Ähnlichkeiten. Der Start-Tag und der End-Tag sind gleich. Deswegen sagt man, dass beide Elemente demselben Elementtyp angehören. Im Vergleich zum Brief erscheint die Struktur des Dokumenttyps Buch sehr viel variantenreicher. Komponenten wie Vorwort, Widmung und Danksagung sind optional. Die Anzahl der Kapitel im Hauptteil darf nicht von vornherein festgelegt sein. Und ob es ein Glossar und ein Literaturverzeichnis gibt, sollte ebenfalls dem Autor überlassen bleiben. Die formale Definition eines Dokumenttyps in XML muss die Flexibilität besitzen, die Gemeinsamkeiten festzulegen, aber zugleich genügend Spielraum für ein konkretes Dokument zu lassen. So würde man wohl kaum sagen, dass ein Buch mit fünf Kapiteln ein Vertreter eines anderen Dokumenttyps ist, als ein Buch mit acht Kapiteln. Fehlt jedoch einem Buch der Titel, so würde man wohl von einem (strukturellen) Fehler sprechen. Die '''Dokumenttypdefinition''' muss also den Titel als zwingenden Bestandteil enthalten, die Anzahl der Kapitel aber offen lassen. Zum Beispiel wird festgelegt, welche Elementtypen in den Dokumenten eines bestimmten Dokumenttyps verwendet werden können. XML bietet nun die Möglichkeit, solche Dokumenttypdefinitionen (abgekürzt DTD) für beliebige Arten von Dokumenten zu formulieren. Die DTD kann sowohl in * externer Form vorliegen und vom XML-Dokument referenziert <?xml version="1.0"?> <!DOCTYPE <NAME> (PUBLIC|SYSTEM) "-//MeineFirma Solutions//DTD EMail V 1.0//DE" "http://www.example.org/dtds/email.dtd"> Bei SYSTEM liegt die DTD auf dem spezifizierten Rechner, bei PUBLIC folgt in Hochkommata und -// der Name des Veröfftlichers, dann die DTD und die Sprache. Danach u.U. der tatsächliche Speicherort. * werden oder sie befindet sich (gesondert ausgewiesen) innerhalb des XML-Dokuments: <?xml version="1.0"?> <!DOCTYPE Gruss [ <!ELEMENT Gruss (#PCDATA)> ]> <Gruss>Hallo Jupiter!</Gruss> Die bekannteste DTD ist die HTML-DTD. Sie definiert die Hypertext Markup Language (bisher noch auf Grundlage von SGML, in Zukunft auf Basis von XML). Leider ist HTML ein schlechtes Beispiel für die Umsetzung der Generic Markup Idee. Auf Grund des breiten Einsatzgebietes gibt es nur wenige logische Auszeichnungen, die naturgemäß nicht textspezifisch sind. Sogar visuelle Auszeichnungen (z. B. »b« für bold und »i« für italic) sind vorhanden. Für die Gliederung eines Textes bietet HTML lediglich Überschriften, jedoch keine Elemente wie etwa »Kapitel«, »Abschnitt«, »Unterabschnitt« usw. Versucht man anhand von Beispielen zu erkennen, welcher Dokumenttyp von HTML definiert wird, wird man einen Typ nur schwer erkennen können: HTML-Dokumente sind Homepages, wissenschaftliche Abhandlungen, Kochrezepte, Bücher, Gedichte, Veranstaltungskalender, Börsenkurse, virtuelle Warenhäuser, usw. Kurz gesagt: HTML-Dokumente sind keine Dokumente eines einzigen Typs. Deshalb ist die HTML-DTD so allgemein und enthält keine textspezifischen Metadaten. XML wird diesen Mangel dadurch lösen, dass jeder eine eigene DTD entwerfen kann, die für die eigenen Daten maßgeschneidert ist. ===XML Schemata=== Der Nachteil von DTDs ist, dass die Syntax nicht XML-konform ist. Ein Ansatz dieses Problem zu lösen sind die sogenannten XML-Schematas. XML Schema, abgekürzt '''XSD''', ist eine Empfehlung des W3C zum Definieren von Strukturen für XML-Dokumente. Anders als bei den klassischen XML-DTDs wird die Struktur in Form eines XML-Dokuments beschrieben. Darüber hinaus wird eine große Anzahl von Datentypen unterstützt. ===Interpretation und Darstellung von XML-Dateien=== Zwei Fragen drängen sich dabei auf: *Sie schreiben einen Text über die musikalische Entwicklung Ihres bevorzugtes Komponisten. Woher weiß der Browser, wie Auszeichnungen wie <instrument>, <tonart> oder <tempo>, die zwar hervorragend Ihren Text beschreiben, dem Browser aber vollkommen unbekannt sind, am Bildschirm darzustellen sind? *Welche Aussagekraft hat eine Auszeichnung wie <titel>? Es kann sich um den Titel eines Dokumentes handeln, um einen akademischen Titel einer Person oder um den Titel eines Musikstücks. Die erste Frage ist relativ leicht zu beantworten: Zur '''Darstellung''' (auf dem Bildschirm, auf Papier oder auch als Sprachausgabe) sind Formatierungsanweisungen nötig. Meist spricht man hier von style sheets. Für HTML hat das World Wide Web Consortium (W3C) die Cascading Style Sheets (CSS) entwickelt. Für SGML und XML gibt es die '''Document Style Semantics and Specification Language''' ('''DSSSL'''), die als Norm von der ISO im Jahre 1996 verabschiedet wurde. Momentan (Frühjahr 1999) arbeitet das W3C noch an der [[XML#XSL_.28Extensible_Style_Language.29|'''Extensible Style Language''' ('''XSL''')]], die speziell für XML-Dokumente geeignet ist. Die zweite Frage ist nicht ganz so direkt zu beantworten. Es macht natürlich keinen Sinn, in Zukunft eine unendliche Anzahl von DTDs zu entwerfen, die jeweils neue Elementnamen definieren. Dokumenttypen sind nur dann von Nutzen, wenn es im Verhältnis zu der Anzahl der Dokumente nur eine kleine Anzahl an DTDs gibt. Viele Vorteile von XML hängen damit zusammen, dass man einen Arbeitsschritt mit Bezug auf die DTD durchführt und dass das Ergebnis auf alle Dokumente dieses Typs angewendet werden kann. Zum Beispiel beziehen sich bei der Formatierung die Anweisungen zur Darstellung auf Elementnamen, die in der DTD deklariert werden. Eine einmal geschriebene Formatierungsfunktion kann dann für alle Dokumente, die gemäß dieser DTD ausgezeichnet sind, benutzt werden. So kann es sich beispielsweise lohnen, eine DTD für eine Buchreihe oder das gesamte Programm eines Verlags zu entwerfen. Es wird dann einmal der Produktionsablauf für diese DTD implementiert und fortan können beliebig viele Manuskripte ohne Mehraufwand verarbeitet werden. Im Gegensatz dazu wäre eine DTD je Buch sicher sinnlos und zu aufwendig. XML tritt meistens in 2 Dateien auf. Die XML-Datei enthält die Textinformationen, die von Tags eingeschlossen sind, deren Namen Sie selber vergeben können. Im XSL-File bestimmen Sie wie die Textinformationen aus dem XML-File dargestellt werden sollen. Der Vorteil von XML ist das Sie ein XSL-File für mehrere XML-Dateien verwenden können. Das ist vor allem von Vorteil, wenn Sie viele Seiten machen wollen, deren Aussehen aber einheitlich bestimmt werden soll. Wenn man bei HTML die Farbe des Textes auf 20 Seiten ändern will, muss man dies auf jeder einzeln machen. Bei XML muß man bloß das eine XSL-File ändern, um die Änderung auf allen Seiten zu bewirken. Ein einheitliches Bild ist gerade bei größeren Produktlandschaften interessant. Jedes Dokument wird in drei Teile zerlegt: Inhalt, Struktur und Layout. Eine XML-Datei, die XML konform ist, nennt man wohl geformt (well-formed), eine XML-Datei, der eine DTD zugeordnet ist und deren Inhalt dazu passt, nennt man gültig (valid).
Summary:
Please note that all contributions to Wiki RB4 may be edited, altered, or removed by other contributors. If you do not want your writing to be edited mercilessly, then do not submit it here.
You are also promising us that you wrote this yourself, or copied it from a public domain or similar free resource (see
Uwe Heuer Wiki New:Copyrights
for details).
Do not submit copyrighted work without permission!
Cancel
Editing help
(opens in new window)
Toggle limited content width