Semantische Auszeichnung
Die Erfinder von HTML, der Markup-Sprache für Webseiten, haben sich etwas dabei gedacht, spezielle Auszeichnungen für Absätze (P), Aufzählungslisten (UL, bzw. OL) und Überschriften (H1-H6) einzubauen. Diese Elemente von HTML, Tags genannt, bilden die Hierarchie innerhalb einer Webseite ab und gliedern sie auf. Semantisch korrekte Auszeichnung zeichnet die Inhalte ihrem Sinn gemäß aus.
Vorteile von semantischer Auszeichnung?
Es liegt auf der Hand. Unterschiedlich ausgezeichnete Elemente werden unterschiedlich dargestellt. So sind Überschriften fetter und größer als Text in Absätzen. Doch das ist nur die halbe Wahrheit, denn ganz am Anfang hat das dazu geführt, dass für fette Schrift Überschriften genutzt wurden. Das war nicht der Sinn.
Der Sinn liegt vielmehr in der Bedeutung des HTML. Der sehende Mensch arbeitet visuell. Er kann einen Teil eines Textes, der größer ist als der Rest, eine höhere Bedeutung zumessen. Er erkennt anhand der Schriftgröße, eventuell einer anderen Farbgebung und fetterer Darstellung, dass es sich um ein wichtiges Element, beispielsweise eine Seitenüberschrift handelt.
Der Computer – und dazu zähle ich jetzt mal nicht nur Suchmaschinen und den geliebten Rechner zu Hause, sondern auch alternative Ausgabegeräte für Sehbehinderte oder Blinde – kann dies nicht. Er muss die Unterscheidung anhand der Auszeichnung treffen.
HTML nun bietet von Anfang an die Möglichkeit, Elemente ihrer Bedeutung nach auszuzeichnen. Für Überschriften beispielsweise stehen sechs Ordnungsgrade zur Verfügung, die entsprechend von 1 nach 6 in ihrer Bedeutung gestaffelt sind. Für Aufzählungen, die der Mensch anhand der Kommata für sich als solche erkennt, stehen drei verschiedene Listentypen im HTML zur Verfügung, um dem Computer mitzuteilen, dass es sich um eine Aufzählung handelt.
Die physische Formatierung ist dabei nebensächlich. Mit Hilfe der entprechenden Formatierungssprache CSS wurde die Möglichkeit geschaffen, Elemente unabhängig voneinander global auszuzeichnen und die Formatierungen (durch CSS) von der semantischen Hierarchie zu trennen, also die Typographie vom Code. Der Vorteil: der Text erhält seine Bedeutungshierarchie und seine Semantik, die Formatierung des Textes wird gleichzeitig flexibler.
Welchen Sinn hat die Trennung von Formatierung und Hierarchie?
Jeder hat ein Recht auf Design. Doch man kann es nicht allen aufzwingen. Blinde Besucher und Suchmaschinen beispielsweise ist das Design ganz egal. Für beide bestimmt allein die Semantik, wie ein Baustein, beispielsweise eine Zwischenüberschrift oder ein Listenpunkt, in die Gesamtheit der Seite eingeordnet wird.
Darüber hinaus wollen Sie ja, dass das Erscheinungsbild aller Unterseiten Ihrer Präsenz einheitlich wirkt? Das geht durch diese Trennung, durch Einhaltung der Semantik, durch pures HTML mit globaler Formatierung über CSS deutlich einfacher.
Semtantik im Code kann sich nämlich auch im Design wiederspiegeln. Durch die Nutzung von Zwischenüberschriften und nummerierten oder nicht nummerierten Listen im Markup lockern Sie beipielsweise die Texte Ihrer Website optisch auf. Dem Besucher fällt das Lesen am Bildschirm dadurch leichter.
Semantik: nicht nur bei den Texten
Semantik ist nicht nur wichtig für die richtige Auszeichnung von Texten auf Internetseiten. Es ist essentiell für die gesamte Website, also auch für die Navigation etc. Deshalb sollten die Seiten auch generell Webstandards entsprechen und in standardkonformen (X)HTML und CSS oder einer anderen Markup-Sprache erstellt werden.
RDFa und Microformats für ein semantisches Web
Semtantische Auszeichnung von Webinhalten ist jedoch nicht auf XHTML begrenzt. Moderne Formate wie RDFa erlaubt es, über die XHTML-Formatierungen hinausgehende Mittel zur Kennzeichnung der Bedeutung anzuwenden, oder kurz gesagt: RDFa ermöglicht existierende HTML-Elemente mit semantischen Metadaten auszustatten.
Unlängst hat die Suchmaschine Google Möglichkeiten vorgestellt, der Suchmaschine mittels RDFa die Lizenz eines Bildes oder Metadaten – Titel und Beschreibung – zu einem Video mitteilen können.
Insgesamt betrachtet wird das Web semantischer. Und dieser Ansatz ist sicher sinnvoll, da das Internet nicht für Maschinen, sondern für Menschen existiert. Hier also die Inhalte gemäß Ihrer Bedeutung unterscheiden zu können, ist bei der Vielzahl an Dokumenten im Internet irgendwann unumgänglich.