Die Grundlagen von HTML

Was bedeutet HTML?

HTML ist die Abkürzung für HyperText Markup Language. Es ist also eine textbasierte Auszeichnungssprache zur Strukturierung digitaler Dokumente mit Hilfe von Hyperlinks.

Hyperlinks

Ein Hyperlink ist ein Querverweis zu inhaltlichen Verknüpfungen (innerhalb oder außerhalb des aktuellen Dokuments). Man gelangt schnell, gezielt zu neuen Informationen, indem man den Hyperlink mit der Maus anklickt.

Markup-Language

Markup-Language bedeutet Auszeichnungssprache. Es ist eine Text- und Seitenbeschreibungssprache zur Strukturierung des aktuellen Dokuments. HTML ist plattformunabhängig universell einsetzbar.

Darstellung und Erstellung von HTML-Dokumenten

Zur Darstellung von HTML-Dokumenten wird ein Browser benötigt.

Zur Erstellung von HTML-Dokumenten und zur Darstellung von HTML-Quelltext genügt ein einfacher Texteditor. Alle modernen Browser bieten mit ihren Entwicklerwerkzeugen die Möglichkeit, HTML-Quelltext anzuzeigen sowie weitere Features zur Beurteilung (Fehlersuche) von HTML-Dokumenten an. Die Entwicklerwerkzeuge erreicht man zumeist über die [F12] Taste

Die Geschichte von HTML

HTML5-Logo
Abbildung: HTML5-Logo
Von W3C
CC BY 3.0, Wikimedia Commons
Motivation für die Entstehung von HTML war der einfache und strukturierte Austausch digitaler Informationen. Am CERN (Europäische Organisation für Kernforschung) entstand 1989 ein Projekt, das sich mit der Lösung dieser Aufgabe beschäftigte. Tim Berners-Lee gilt als Begründer von HTML.

1992 erschien die erste Version der HTML-Spezifikation.

HTML ist eine der Grundlagen für das World Wide Web (www) und dient hauptsächlich dazu, Websites zu erstellen und darzustellen. Inzwischen lassen sich aber auch mit einigen Crosscompilern Apps programmieren, die auf HTML-Dokumenten und deren Funktionalität basieren.

HTML hat sich bis heute kontinuierlich weiterentwickelt. Die seit 2014 aktuelle Version ist HTML5 (seit 2016 HTML5.1).

HTML5

HTML5 ist der neue Standard bei der Endwicklung von Webinhalten und Websites. Es vereinheitlicht alte Standards wie HTML 4, XML, XHTML u.s.w.

HTML5 dient als Strukturierungs-Sprache für Webinhalte. Als Weiterentwicklung wurden viele neue Features wie die Darstellung von Video- und Audio-Inhalten aber auch dynamische 2D und 3D Grafiken eingeführt.
Ein wichtiger Gesichtspunkt sind neue Elemente, die eine verbesserte Darstellung der Semantik eines HTML-Dokuments ermöglichen. Dies macht es Suchmaschinen einfacher, Webinhalte nach Themen zu indizieren und so die Treffgenauigkeit beim Suchen wesentlich zu verbessern.

Die Standardisierung von HTML

Die Sprache HTML wird vom World Wide Web Consortium (W3C) standardisiert. Dieses definiert, als Gremium zur Standardisierung der Techniken im WWW, die Standards für die Sprache HTML.

Das Dateiformat von HTML

Bei HTML-Dokumenten handelt es sich um unverschlüsselte Textdateien, die von jedermann gelesen werden können. HTML-Dateien werden von Browsern und Editoren mit Syntax-Highlighting an der Endung *.html oder *.htm erkannt.

Die Grundstruktur eines HTML-Dokuments

Ein HTML-Dokument gliedert sich in drei Bereiche auf:

  • Der DOCTYPE-Bereich: Hier teilt man dem Internet-Browser mit, um welche Art von Dokument es sich handelt, welche Befehle zu erwarten sind und in welchem Standard.
  • Der HEAD-Bereich: Hier stehen Meta-Informationen zum Dokument, die beispielsweise von Suchmaschinen ausgewertet werden können. Darüber hinaus findet man hier auch Links zu CSS oder Javascript-Files. Auch Angaben zum Zeichensatz und der Titel der Seite, der ganz oben im Browserfenster angezeigt wird sind hier zu finden.
  • Der BODY-Bereich: Hier findet sich der eigentliche Quelltext des HTML-Dokuments.

Die <head>- und <body>-Bereiche werden zudem vom <html>-Tag umschlossen.

Die oben genannten Bereiche sind in einem validen HTML-Dokument zwingend vorgeschrieben.

<!DOCTYPE html>
<html>
<head> <meta charset="UTF-8"> <title>Hallo Welt!</title> </head>
<body> Inhalt des HTML-Dokuments </body>
</html>

Sprachelemente von HTML

Dem Text bzw. Teilen des Textes im HTML-Dokument wird durch bestimmte Auszeichnungen (Markups) eine Struktur verliehen. Die meisten dieser Elemente werden durch Tag-Paare definiert. Einige HTML-Tags stehen aber auch alleine, die sogenannten Standalone-Tags.

Die HTML-Sprachelemente werden können in unterschiedliche Kategorien unterteilt werden.

Das Impressum einer Website

In Deutschland muss laut §5 TMG (Telemediengesetz) jeder geschäftsmäßig betriebene Onlinedienst ein Impressum besitzen. Aus dem Impressum beinhaltet als Anbieterkennzeichnung, eine ladungsfähige Anschrift des Inhabers der Website. Über diese Anschrift können Rechtsansprüche durchgesetzt werden. Insbesondere sind Abkürzungen von Namen und Vornamen nicht erlaubt!
Außerdem ergibt sich eine Impressums-Pflicht aus §55 RstV (Rundfunkstaatsvertrag), wenn man journalistisch redaktionell erstellte Inhalte online stellt, die zur Meinungsbildung beitragen können.

Das Impressum muss auf einer Website "leicht erkennbar, unmittelbar erreichbar und ständig verfügbar" sein.

Verstöße gegen die Impressums-Pflicht können abgemahnt werden, was zu hohen Kosten führen kann.

Die Verzeichnisstruktur einer Website

Beim Erstellen einer Website sollte man sich vor der Programmierung des HTML-Quellcodes Gedanken zur Verzeichnisstruktur der Website machen. Dies erspart im Nachhinein viel Arbeit. Nachträgliche Änderungen der Verzeichnisstruktur sind nur mit hohem Aufwand machbar. Oft müssen viele einzelne HTML-Dokumente geändert werden.

Die semantische Struktur von HTML5-Dokumenten

Mit dem Begriff Semantik ist die inhaltliche Bedeutung von Teilen des HTML-Dokuments gemeint. HTML5 bietet eine Auswahl neuer Elemente zur semantischen Strukturierung des Dokuments an. Damit lässt sich bereits mit einem Blick auf den Quelltext erkennen, welche Bedeutung ein Abschnitt für das Dokument hat. Dies erleichtert auch die zielgerichtete Indizierung von Webinhalten durch Suchmaschinen.