Ungültiger HTML Code: Sollte uns das interessieren?
Um Webseiten zu optimieren soll man unter anderem darauf achten, validen HTML Code zu schreiben. Das macht es häufig einfacher, Seiten für alle Browser gleich aussehen zu lassen, und Browser zeigen fehlerfreie Seiten auch eine Millisekunde schneller an wenn keine Fehlerkorrekturen und Workarounds im Browser angewendet werden müssen. Ich weiß nicht ob es noch mehr Vorteile gibt die man so hört wenn es um fehlerfreien HTML Code geht. Um mal zu schauen wie viele Fehler große Webseiten im Schnitt haben habe ich ein kleines Script geschrieben dass die TOP 10.000 Webseiten mit dem W3C Validator untersucht.
Auf der Alexa-TopSites-Seite gibt es eine csv-Datei mit den Top 1.000.000 Webseites. Die Ergebnisse:
Durchschnittlich haben die Top 10.000 Seiten 136 Errors und 63 Warnings, was ich ziemlich hoch finde, ich hätte vielleicht mit 10-20 gerechnet im Schnitt. Um herauszufinden ob die Anzahl der Fehler mit der Bekanntheit abnimmt hier noch einige Zwischenwerte:
Ränge | Errors | Warnings |
---|---|---|
1-100 | 187 | 61 |
101-500 | 121 | 53 |
501-1000 | 119 | 62 |
1001-5000 | 141 | 67 |
5001-10000 | 133 | 61 |
Es folgt eine Aufschlüsselung nach Top Level Domain, wobei ich nur Domains genommen habe die mehr als 10 Seiten in dieser Liste haben. .edu, .cz, .us und .gov haben relativ wenig Fehler, .de liegt im Mittelfeld genauso wie die am meisten genutzte .com Domain. Schlusslichter sind .cn, .my, .kr und .il
TLD | Anzahl | Errors | Warnings |
---|---|---|---|
com | 5267 | 144.5667 | 68.4139 |
net | 403 | 136.4764 | 38.5856 |
ru | 295 | 148.2203 | 53.5288 |
de | 256 | 107.8477 | 59.1992 |
org | 244 | 66.1680 | 31.1516 |
jp | 184 | 94.0978 | 33.2337 |
cn | 180 | 252.7833 | 105.2111 |
fr | 120 | 132.3500 | 121.5083 |
it | 98 | 161.2653 | 81.4388 |
uk | 95 | 95.5368 | 74.4737 |
pl | 88 | 56.1477 | 21.7045 |
br | 87 | 93.0575 | 81.7586 |
in | 54 | 76.8333 | 19.8704 |
es | 54 | 93.1111 | 28.1852 |
edu | 51 | 17.5098 | 11.4706 |
nl | 41 | 110.6098 | 85.0732 |
tv | 41 | 150.9268 | 48.7073 |
au | 39 | 106.9231 | 54.4359 |
gov | 39 | 33.9487 | 18.9487 |
ir | 35 | 113.6000 | 42.3429 |
ca | 34 | 180.3529 | 107.6765 |
cz | 33 | 19.7576 | 9.0303 |
mx | 29 | 106.6897 | 60.1034 |
info | 28 | 119.7857 | 76.9286 |
gr | 22 | 188.7727 | 32.0909 |
tr | 22 | 198.2273 | 110.1364 |
ro | 21 | 110.0000 | 64.9048 |
se | 21 | 49.8571 | 26.1905 |
no | 20 | 106.0000 | 31.5000 |
vn | 20 | 134.2500 | 93.8500 |
be | 20 | 93.4000 | 36.3000 |
tw | 19 | 216.4737 | 87.6842 |
ua | 18 | 86.5000 | 28.0000 |
hu | 18 | 44.3333 | 35.6111 |
eu | 17 | 42.4706 | 9.8824 |
ch | 17 | 78.5294 | 42.4118 |
at | 16 | 39.1875 | 13.1250 |
kr | 16 | 389.4375 | 165.3750 |
cc | 16 | 71.3125 | 15.7500 |
pt | 15 | 172.7333 | 49.0667 |
za | 15 | 82.4000 | 28.6667 |
il | 14 | 535.0714 | 429.1429 |
me | 14 | 98.5714 | 11.5714 |
id | 13 | 235.3077 | 32.6154 |
to | 12 | 203.5000 | 12.4167 |
us | 12 | 29.3333 | 8.1667 |
my | 12 | 294.5000 | 151.5833 |
sk | 12 | 111.6667 | 72.1667 |
cl | 11 | 96.1818 | 34.7273 |
ar | 11 | 111.3636 | 41.3636 |
Die meisten Fehler insgesamt unter den Top 10.000 hat airliners.net mit satten 11.010 Errors, gefolgt von bubblebox.com, yingjiesheng.com und askmefast.com mit jeweils über 5000 Errors. Komplett fehlerfrei ist beispielsweise die Seite von mozilla.org. Insgesamt sind nur 383 Seiten ohre Errors, das sind 3,8%.
Nicht immer sollte man auf eine 100% fehlerfreie Seite pochen, Google hat auf seiner wichtigsten Seite, der Suchmaske, auch Fehler, Google begründet das in einem Video mit der Datenmenge die man durch diese Fehler sparen kann. Anstatt brav um jedes Attribut Anführungszeichen zu setzen werden diese einfach weggelassen, um auch noch die letzten 500 Byte zu sparen.
<body id=gsr bgcolor=#ffffff text=#222222
Google ist es also wichtiger die Datenmenge zu reduzieren als fehlerfreien HTML-Code zu schreiben. Natürlich hat Google aber nur so weit “optimiert” dass die Seite trotzdem noch in allen (mobilen) Browsern funktioniert. Aber generell empfiehlt Google fehlerfreie Webseiten zu erstellen.
Sind eure Webseiten fehlerfrei, achtet ihr auf Fehlerfreiheit soweit es geht, oder ist euch das nicht wichtig?
Ähnliche Artikel: