Facebook
Twitter
Google+
Kommentare
0

Ungültiger HTML Code: Sollte uns das interessieren?

Um Webseiten zu optimieren soll man unter anderem darauf achten, validen HTML Code zu schreiben. Das macht es häufig einfacher, Seiten für alle Browser gleich aussehen zu lassen, und Browser zeigen fehlerfreie Seiten auch eine Millisekunde schneller an wenn keine Fehlerkorrekturen und Workarounds im Browser angewendet werden müssen. Ich weiß nicht ob es noch mehr Vorteile gibt die man so hört wenn es um fehlerfreien HTML Code geht. Um mal zu schauen wie viele Fehler große Webseiten im Schnitt haben habe ich ein kleines Script geschrieben dass die TOP 10.000 Webseiten mit dem W3C Validator untersucht.

Auf der Alexa-TopSites-Seite gibt es eine csv-Datei mit den Top 1.000.000 Webseites. Die Ergebnisse:

Durchschnittlich haben die Top 10.000 Seiten 136 Errors und 63 Warnings, was ich ziemlich hoch finde, ich hätte vielleicht mit 10-20 gerechnet im Schnitt. Um herauszufinden ob die Anzahl der Fehler mit der Bekanntheit abnimmt hier noch einige Zwischenwerte:

Ränge Errors Warnings
1-100 187 61
101-500 121 53
501-1000 119 62
1001-5000 141 67
5001-10000 133 61

Es folgt eine Aufschlüsselung nach Top Level Domain, wobei ich nur Domains genommen habe die mehr als 10 Seiten in dieser Liste haben. .edu, .cz, .us und .gov haben relativ wenig Fehler, .de liegt im Mittelfeld genauso wie die am meisten genutzte .com Domain. Schlusslichter sind .cn, .my, .kr und .il

TLD Anzahl Errors Warnings
com 5267 144.5667 68.4139
net 403 136.4764 38.5856
ru 295 148.2203 53.5288
de 256 107.8477 59.1992
org 244 66.1680 31.1516
jp 184 94.0978 33.2337
cn 180 252.7833 105.2111
fr 120 132.3500 121.5083
it 98 161.2653 81.4388
uk 95 95.5368 74.4737
pl 88 56.1477 21.7045
br 87 93.0575 81.7586
in 54 76.8333 19.8704
es 54 93.1111 28.1852
edu 51 17.5098 11.4706
nl 41 110.6098 85.0732
tv 41 150.9268 48.7073
au 39 106.9231 54.4359
gov 39 33.9487 18.9487
ir 35 113.6000 42.3429
ca 34 180.3529 107.6765
cz 33 19.7576 9.0303
mx 29 106.6897 60.1034
info 28 119.7857 76.9286
gr 22 188.7727 32.0909
tr 22 198.2273 110.1364
ro 21 110.0000 64.9048
se 21 49.8571 26.1905
no 20 106.0000 31.5000
vn 20 134.2500 93.8500
be 20 93.4000 36.3000
tw 19 216.4737 87.6842
ua 18 86.5000 28.0000
hu 18 44.3333 35.6111
eu 17 42.4706 9.8824
ch 17 78.5294 42.4118
at 16 39.1875 13.1250
kr 16 389.4375 165.3750
cc 16 71.3125 15.7500
pt 15 172.7333 49.0667
za 15 82.4000 28.6667
il 14 535.0714 429.1429
me 14 98.5714 11.5714
id 13 235.3077 32.6154
to 12 203.5000 12.4167
us 12 29.3333 8.1667
my 12 294.5000 151.5833
sk 12 111.6667 72.1667
cl 11 96.1818 34.7273
ar 11 111.3636 41.3636

Die meisten Fehler insgesamt unter den Top 10.000 hat airliners.net mit satten 11.010 Errors, gefolgt von bubblebox.com, yingjiesheng.com und askmefast.com mit jeweils über 5000 Errors. Komplett fehlerfrei ist beispielsweise die Seite von mozilla.org. Insgesamt sind nur 383 Seiten ohre Errors, das sind 3,8%.

Nicht immer sollte man auf eine 100% fehlerfreie Seite pochen, Google hat auf seiner wichtigsten Seite, der Suchmaske, auch Fehler, Google begründet das in einem Video mit der Datenmenge die man durch diese Fehler sparen kann. Anstatt brav um jedes Attribut Anführungszeichen zu setzen werden diese einfach weggelassen, um auch noch die letzten 500 Byte zu sparen.

<body id=gsr bgcolor=#ffffff text=#222222

Google ist es also wichtiger die Datenmenge zu reduzieren als fehlerfreien HTML-Code zu schreiben. Natürlich hat Google aber nur so weit “optimiert” dass die Seite trotzdem noch in allen (mobilen) Browsern funktioniert. Aber generell empfiehlt Google fehlerfreie Webseiten zu erstellen.

Sind eure Webseiten fehlerfrei, achtet ihr auf Fehlerfreiheit soweit es geht, oder ist euch das nicht wichtig?

Ähnliche Artikel:

  1. HTML 5 und Javascript 5: Clientseitige Datenbanken
  2. Zend_View Output Filter: Whitespaces aus HTML entfernen
  3. Debug Ausgaben im Code vergessen?
Über den Autor

PHP Gangsta

Der zweitgrößte deutsche, eher praxisorientierte PHP-Blog von Michael Kliewe veröffentlicht seit Mitte 2009 Artikel für Fortgeschrittene.

Link erfolgreich vorgeschlagen.

Vielen Dank, dass du einen Link vorgeschlagen hast. Wir werden ihn sobald wie möglich prüfen. Schließen