HTML-Header entschlüsselt

Der Header-Bereich ist ein wichtiger Bestandteil jeder HTML-Seite. Unter der Oberfläche verborgen, können die Meta-Befehle einen Beitrag zum Erfolg von Webseiten leisten. Lest hier, wie Ihr den "HTML-Kopf" perfekt in den Griff bekommt.

Einen beispielhaften Header zeigt der unten stehende Code. Ein "Kochrezept", das gern für eigene Zwecke genutzt und modifiziert werden darf.

Codebeispiel:

01. <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
02. <html>
03. <head>
04. <title>Die Kopfsache</title>
05. <meta http-equiv="content-type" content="text/html; charset=iso-8859-15">
06. <meta name="description" content="Ein gut definierter Header ist die halbe Miete.">
07. <meta name="keywords" content="head, definition, intelligent, gemeistert">
08. <meta name="author" content="Klaus Mustermann">
09. <meta name="content-language" content="de">
10. <meta name="revisit-after" content="15 days">
11. <meta name="robots" content="index,follow">
12. </head>
13. <body>

Codezeilen entschlüsselt:

01. Doctype-Deklaration

Für eine standardkonforme HTML-Programmierung (W3C-gerecht) empfiehlt es sich, eine Doctype-Deklaration zu notieren. Im Beispiel verwende ich die Variante "HTML 4.0 Transitional". Diese erlaubt den Einsatz von (fast) allen HTML-Tags, Style Sheets und Script-Sprachen. Die Deklaration sollte bevorzugt groß geschrieben werden.

Die Notwendigkeit einer Doctype-Deklaration lässt sich nicht in Kürze erklären. Aus formalen Gründen sollte die Angabe notiert werden. Für weitere Informationen zu dieser Thematik empfiehlt sich ein Blick in die HTML-4-Dokumentation [1] oder in das bekannte Selfhtml [2].

02. HTML-Tag

Zeile 2 beinhaltet den üblichen <html>-Tag, um den Inhalt der Seite einzuschließen.

03. Head-Tag

Hier beginnt die Definition des Kopfteils, dem sogenannten Header, also dem Bereich, um den es in diesem Beitrag geht.

04. Seitentitel

Mit dem <title>-Tag wird der Name des HTML-Dokumentes festgelegt. Diese Angabe ist sehr bedeutend, da sie als Bezeichnung für das Browserfenster verwendet wird, eine wichtige Input-Größe für Suchmaschinen-Roboter darstellt und beim Setzen eines Lesezeichens auf das Dokument als Bezeichnung für dieses übernommen wird.

Diese Angabe sollte fehlerfrei (Rechtschreibung), passend zum Dokument und nicht allzu lang sein. Günstig ist es, die im Dokument verwendete <h1>-Überschrift analog im Titel zu notieren. Unsinnig dagegen ist es, für alle Seiten eines Webprojektes den gleichen Titel zu verwenden.

05. Zeichensatz

Mit dieser Meta-Angabe wird der verwendete Zeichensatz angegeben. Im Beispiel ist es der Standard ISO-8859-15. Dies ist der gängige Zeichensatz für den westeuropäischen Sprachraum, also auch für die "deutschen" Seiten. Die Angabe hilft dem Browser, das Dokument korrekt darzustellen.

06. Seitenbeschreibung

Mit diesem Meta-Tag wird der Inhalt des HTML-Dokumentes beschrieben. Üblich sind ein oder zwei Sätze. Insgesamt sollte man nicht mehr als 256 Zeichen verwenden. Für die Seitenbeschreibung gilt: "Weniger ist mehr". Ferner sollten die Angaben passend zum Seiteninhalt sein.

07. Schlüsselwörter

Für Suchmaschinen-Spammer waren Schlüsselwörter einst das A & O ihrer Header-Definition, ließen sich doch so Spitzenplätze bei Suchmaschinen-Anfragen ergaunern. Aufgrund dieser Unzulänglichkeiten spielen die "keywords" heute eine untergeordnete Rolle. Für die Angabe selbst sollten 3 bis 10 passende Stichwörter durch Komma getrennt notiert werden.

08. Der Autor

Mit dieser Angabe gibt man sich als Autor eines HTML-Dokumentes zu erkennen. Inwiefern dies zwingend notwendig ist, sei dahingestellt. Andere (Web)Autoren können auf diese Information zurückgreifen, wenn sie auf ein Dokument verweisen wollen und dabei exakt arbeiten.

09. Sprache

Jedes HTML-Dokument, dass mehr als drei Sätze beinhaltet, sollte mit einer Meta-Angabe zur verwendeten Sprache versehen sein. Einige deutsche Suchmaschinen indizier(t)en erst deutschsprachige Seiten, wenn die korrekte Meta-Angabe für die deutsche Sprache gemacht wurde. In unserem Fall ist das "de".

Andere Sprachkürzel: en (englisch), fr (französisch), it (italienisch), ru (russisch)

10. Suchroboter-Info 1

Suchmaschinen-Robotern, die Meta-Angaben berücksichtigen, kann man mitteilen, wann die Seite erneut besucht werden soll. Viele Roboter halten sich leider nicht an diese Konvention. Eine Reduzierung des Traffics wäre ein sinnvolles Ergebnis dieses Meta-Tags.

11. Suchroboter-Info 2

Ähnlich wie bei Zeile 10 verhält es sich mit dieser Angabe. Gute Suchmaschinen-Spider beachten diese Konvention. Damit gibt man an, ob eine Seite überhaupt in den Suchmaschinen-Index soll und ob den im Dokument enthaltenen Links gefolgt werden soll.

Mögliche Attribute für diese Meta-Angabe:

index - Seite indizieren
noindex - Seite nicht indizieren
follow - enthaltenen Links folgen
nowfollow - enthaltenen Links nicht folgen

Die Meta-Angaben 10 und 11 sollte man ruhig notieren. Schließlich pflegt der ambitionierte Webmaster seine "robots.txt"-Datei, obwohl diese von vielen Spidern ignoriert wird.

12. Header-Ende

Dieser Tag beendet den Header-Bereich.

13. Body

Codezeile 13 beinhaltet den Body-Tag. Hier beginnt der "Körper" (body) der HTML-Datei.

Zusammenfassung

Für das Ranking in "guten" Suchmaschinen spielen Meta-Angaben im Gegensatz zu früher nur noch eine untergeordnete Rolle. Das ist aus meiner Sicht gut. Relevant ist ein durchdachter Header z.T. für Meta-Suchmaschinen, für lokale Suchskripte, die auf diese Angaben zurückgreifen, und z.T. für moderne Webbrowser. Es lohnt sich also einen gepflegten HTML-Header anzubieten.

Historie

Dieser Artikel entstand 1999 ursprünglich für das Webmagazin "Dr.Web" und ging dort ein paar Jahre später im Zuge eines Relaunches offline. Die Entwicklung im Internet ist in den vergangenen Jahren so rasant voran geschritten, dass eine komplette Überarbeitung des Beitrages, der auf meiner Website weiterhin zur Verfügung stand, notwendig schien. Das vorliegende Dokument ist das Ergebnis dieser Überarbeitung Anfang 2003.

Kurzglossar

robots.txt - Mit dieser Datei regelt der Webmaster den Zugriff auf die Dokumente und Dateien einer Website für Suchmaschinen-Roboter.

Spider - Synonym für Suchmaschinen-Roboter / Suchmaschinen-Spider.

W3C - Gremium, das technische Standards für das Web erarbeitet und entwickelt.

Quellen

[1] HTML 4.01 Specification
[2] Selfhtml (HTML-Dateien selbst erstellen)

Interessanter Link

- HTML META, REL and REV Tags

Erstveröffentlichung: 1999



URL: http://www.schmager.de/header.shtml aktualisiert: 01.01.2017
© 1998 - 2017 Jan Schmager
0.0052 s