Mit „canonical“ auf Spatzen schießen
Na wenn das nicht mal ein super Titel ist. Der Pulitzer ist wohl dieses Jahr mein. Gibt es eigentlich einen Preis für das Abschweifen von wichtigen Themen? Den könnte ich mir auch schnappen, denn eigentlich wollte ich heute mal was zum canonical tag erzählen. Was macht diese von google, yahoo und Microsoft erfundene Tag denn also? Ganz einfach, es hilft doppelten Content zu vermeiden, indem es einer Seite die Möglichkeit gibt zu definieren, wo ihr Ihnalt ursprünglich herkommt. Hier könnte ich zum Beispiel definieren, dass dieser Artikel unter www.phphatesme.com/allgemein/artikel.php gefunden wird, aber auch unter www.phphatesme.com/webentwicklung/artikel.php. Für eine von den beiden URLs müsste ich mich entscheiden und die anderen dann per Tag als „Kopie“ outen. Wie ich finde eine sehr gute Idee, denn zum Beispiel WordPress in der Version, die ich habe, vergibt solche URLs doppelt. Das all-in-one-seo Dingens greift euch da aber unter die Arme und automatisiert das hinzufügen des canonicals.
Da ihr meine Einträge ja schon seit 250 Artikel verfolgt, wisst ihr, dass es hier auch ein aber gibt und ich mich mal wieder über etwas aufrege. Canonical bezieht sich anscheinend nur auf den Content, was ja auch in meisten Fällen reicht … ja genau! Falsch gedacht. Die doofen Google Webmastertools motzen immer noch wegen doppeltem Title Tag. Natürlich haben zwei Seiten mit dem gleichen Inhalt auch den gleichen Titel! Sie sind ja identisch. Da ich ein Freund von fehlerfreien Statistiken bin, werde ich da mal ein wenig drüber schauen müssen. Bis jetzt habe ich Glück und Google kennt noch nicht so viele von diesen doppelten Seiten, aber das kann sich ja noch ändern. Existieren tun sie ja. Vielleicht warte ich auch einfach mal ab, bevor ich jetzt ein großes Fass aufmache. Google lernt ja stündlich dazu, vielleicht erkennen sie ja auch in absehbarer Zeit, dass da noch eine kleine inkonsistenz drinnen ist. Kann aber auch sein, dass ich lerne, dass ich das Meta Tag ganz falsch einsetze. Abwarten lohnt sich wohl in beiden Fällen.
Ach ja, google, Microsoft und Yahoo haben dieses Tag ohne die w3c eingeführt. Finde ich schon ganz schön frech.
Irgendwie ist das mittlerweile Normal geworden, von Standards abzuschweifen. Das betrifft nicht nur Meta-Tags, manche haben es sichauch zum Hobby gemacht, schwachsinnige HTTP-Header zu setzen, um auszudrücken, was sie toll finden oder um ne halbe Geschichte zu erzählen … Wozu? Brauch doch wirklich niemand! Innovitver finde ich Jobangebote als Kommentar im HTML Quelltext 😉
Ich find den canonical jetzt gar nicht so schlecht, ich weiss sogar, wer dafür verantwortlich ist, dass das Ding eingeführt wird 😀
Canonical macht durchaus Sinn, wenn man z.B. eine Seite hat, die eine Ergebnisliste hat, die mit unterschiedlichen URLs anders sortiert dargestellt wird.
@Dominik: Ich finde es ja auch super, sonst würde ich es nicht verwenden. Mein Problem ist nur, dass ich dann erwarten würde, dass das Title Tag doppelt vorkommen kann.
@Dennis: Genial, wo kann man das sehen? 🙂 Also die Sache mit dem Jobangebot im HTML.
@all: Kommando zurück. Google hat meine Webmaster Tools aktualisiert und die doppelten Titel sind rausgefallen. Hat zwar über einen Monat gedauert und ging auch nicht parallel zu den anderen Änderungen in den Index über, aber es hat dann tatsächlich doch geklappt. Hat trotzdem gut getan mal wieder zu motzen!
Also ich finde es unschön exakt gleiche Seiten unter 2 URIs online zu haben und dies mit einem meta-Tag kenntlich zu machen. Ich setzte dafür HTTP 301 Moved Permanently – Weiterleitungen ein und leite die Alternativ-URIs auf die Haupt-URI um. Das findet auch Google gut 😉
Doppelte URIs haben z.B. auch den Nachteil, dass Cachen nicht mehr richtig funktioniert – sowohl im Browser als auch im Proxy.
Wo ich mir eine meta-Tag-Kennzeichnung vorstellen kann ist z.B. die selbe Seite mit unterschiedlichen Anzeige-Optionen. Wie oben angesprochen z.B. die gleiche Liste mit unterschiedlicher Sortierung oder die Druckversion einer Seite oder ein anderes Template. Dafür setze ich momentan GET-Parameter ein und stelle in Google Webmaster Tools diese teilweise auf ignorieren.