rel=”canonical” lekarstwem na duplicate content

Mały news dnia w światku SEO. Google sugeruje umieszczanie w części <head> tagu <link> z atrybutem rel=”canonical” zawierającym podstawowy adres danej strony. Np. dla tego postu wpis taki miałby postać:

<link rel=”canonical” href=”http://tomasz.topa.pl/relcanonical-lekarstwem-na-duplicate-content.html” />

Dlaczego coś takiego umieszczać? Ano dlatego aby GoogleBot wiedział, że to ten adres należy traktować jako główny, a np. wszelkie inne formy (np. zawierające ID sesji, dane statystyk itp) były ignorowane i nie były traktowane jako osobne URL z tą samą treścią. Opisywane wcześniej śledzenie RSSów w Google Analytics znów ma sens bez obaw o problemy duplicate content.

Z ważnych rzeczy dotyczących nowego linku:

Is rel=”canonical” a hint or a directive?

It’s a hint that we honor strongly. We’ll take your preference into account, in conjunction with other signals, when calculating the most relevant page to display in search results.

Can this link tag be used to suggest a canonical URL on a completely different domain?

No. To migrate to a completely different domain, permanent (301) redirects are more appropriate. Google currently will take canonicalization suggestions into account across subdomains (or within a domain), but not across domains. So site owners can suggest www.example.com vs. example.com vs. help.example.com, but not example.com vs. example-widgets.com.

Serwis Yoast.com przygotował już i udostępnił odpowiednie pluginy automatyzujące dodawanie rel=”canonical” na stronach opartych o WordPress, Drupal i Magento.

Dzięki dla Majkela za cynk jeszcze przed przejrzeniem dzisiejszej pRaSSówki :)

Komentarze do wpisu "rel=”canonical” lekarstwem na duplicate content" (dodaj swój »)

  1. Paweł Rabinek

    piątek, 13 lut 2009 #Paweł Rabinek (WWW)

    Dobre strony raczej nie mają tego typu problemów, lub są one nie istotne. Moim zdaniem szkoda sobie zawracać tym głowę.

    Odpowiedz na to

    • Tomasz Topa

      piątek, 13 lut 2009 #Tomasz Topa

      Dobre strony na pewno już wcześniej jakoś się zabezpieczały przed duplicate content, np. odpowiednimi noindex. Z drugiej strony wdrożenie tego tagu nie jest jakimś specjalnie trudnym zadaniem, więc może warto poświęcić te 15 minut…

      Odpowiedz na to

  2. Tomasz Fiedoruk

    piątek, 13 lut 2009 #Tomasz Fiedoruk (WWW)

    Pytanie pozostaje co z „nofollow”, „noindex” i ogólnie robots.txt na naszych blogach? Czy można już pozbyć się tych zapisów czy też nie.

    Odpowiedz na to

    • Łukasz Więcek

      piątek, 13 lut 2009 #Łukasz Więcek (WWW)

      Przecież one mają też zupełnie inne zastosowanie, jak chociażby ochrona podstron/plików/folderów przed wścibskimi robotami.

      Odpowiedz na to

    • Tomasz Fiedoruk

      piątek, 13 lut 2009 #Tomek (WWW)

      Indexacja tagi/kategorie = duplicate content

      Odpowiedz na to

    • Tomasz Topa

      piątek, 13 lut 2009 #Tomasz Topa

      canonical ma raczej trochę inne zastosowanie… rozumiem, że przez noindex blokujesz podstrony kategorii i tagów przed indeksowaniem treści notek. Tam canonical z adresem pojedynczej notki Ci nic nie da.

      Wszystko się ładnie uzupełnia

      Odpowiedz na to

    • Tomasz Fiedoruk

      piątek, 13 lut 2009 #Tomasz Fiedoruk (WWW)

      Tylko czemu tego od razu nie ma w WP w standardzie :/

      Odpowiedz na to

  3. Nexik

    sobota, 14 lut 2009 #Nexik (WWW)

    canonical jest dla tych co nie moga zrobic 301. inny przyklad to wtedy kiedy programisci sie obijaja, a znasz podstawy html wklejasz kod i wszystko dziala :)

    pozatym matt cutts powiedzial ze cala sila danej strony link juice idzie w wybrane miejsce tak wiec jest to 301 dla niedeveloperow.

    ograniczenie tylko takie ze mozna stosowac tylko wewnatrz domeny z domeny A do domeny B canonical nie dziala

    Odpowiedz na to

  4. Lukem

    sobota, 14 lut 2009 #Lukem (WWW)

    Tomek zapytał parę komentarzy wyżej o robots.txt, a ja mam podobne pytanie – czy już nie wystarczy sitemap do tego celu? Akurat WP ma do tego dobrą wtyczkę i do pliku sitemap.xml nie trafia byle co.

    Chyba zaraz zapytam o to pod podlinkowanym wpisem na blogu Google…

    Odpowiedz na to

    • sobota, 14 lut 2009 #Mimic (WWW)

      Najlepiej mieć i to i to. Moim zdaniem bez sitemap ani rusz, ale często jednak radzi się wykorzystać robots.txt

      Trzeba by przeprowadzić eksperyment, żeby określić wpływ pliku robots.

      Odpowiedz na to

  5. niedziela, 1 mar 2009 #slawomir chojnacki (WWW)

    moim zdaniem takze nie ma to wiekszego znaczenia, poniewaz G i Y zdaja sobie sprawe z tego ze mozna to naginac…

    Odpowiedz na to

  6. wtorek, 9 lut 2010 #Slawek Fil (WWW)

    Tylko czemu tego od razu nie ma w WP w standardzie :/

    Odpowiedz na to

  7. środa, 19 maj 2010 #web design (WWW)

    Czy wiecie jak zrobić aby podstrony serwisu były indeksowane a jednocześnie aby część treści kilka powtarzających się zdań w obszernej stopce nie powodowało duplicate content?

    Odpowiedz na to


  8. Na blogu działa system WP Super Cache oraz filtr antyspamowy. Twój komentarz może się pojawić na stronie z pewnym opóźnienem - cierpliwości.

    Nowe komentarze do tego wpisu możesz również śledzić poprzez RSS.