Zasady optymalizacji ON-PAGE- cz.4 – Unikaj duplikowania treści

Unikaj duplikowania treści

Google promuje unikalne treści a wszelkie duplikaty uznaje za spam. Nowo powstałe serwisy buduj tak, by maksymalnie unikać duplikowania treści, zaś już działające przerób.

Duplikowanie treści to problem, z którym czasami jest trudno sobie poradzić, zwłaszcza w przypadku stron dynamicznych.

Duplikat pojawia się:

  1. w przypadku dostępności strony zarówno z „www” jak i bez „www” ( np. http://www.albertguz.pl i http://albertguz.pl)
  2. w przypadku opublikowania artykułu/wpisu w innym serwisie/dziale/kategorii wpisu ( najlepszym wówczas rozwiązaniem jest wskazanie Cannonicalem wersji oryginalnej artykułu z wersji dopublikowanej)
  3. w przypadku serwowania treści dla urządzeń mobilnych w subdomenie ( np. m.mojserwis.pl ) – ( najlepszym wówczas rozwiązaniem jest wskazanie Cannonicalem wpisu z wersji mobilnej na wersję desktopową )
  4. w przypadku automatycznego generowania treści 
    1. strony z feedami – jeśli strona składa się głównie z feedów produktów partnerskich i opisów produktów dostarczanych z innych stron, to prawdopodobnie nie będzie dobrze rankingowana w wynikach Google
    2. strony tłumaczone na różne języki – zwłaszcza jeśli są tłumaczone automatycznie na inny język – często są niepoprawne stylistycznie, nie mają sensu, dlatego Google uważa takie treści za mało potrzebne użytkownikowi
      Przykłady automatycznie generowanej treści:

      1. tekst przetłumaczony przez zautomatyzowane narzędzie bez korekt i przeglądu człowieka
      2. tekst powstały z maszynki do synonimów
      3. tekst powstały ze złączenia szczątkowych fragmentów tekstów z innych stron
      4. RSS

       

  5. w przypadku URLi z parametrami ( np przekazywanie danych między stronami, id sesji itp.). Ze względu na prawidłowe indeksowanie stron i unikanie duplikowania staraj się nie używać parametrów a jeśli już używamy, to wymieńmy je po znaku hasha „#” a nie „?”
domena.pl/plik.html#parametr=223

dla Googla hash oznacza, że ma do czynienia z zupełnie inną stroną. Z kolei nie wszystkie roboty wyszukiwarek indeksują strony dynamiczne ( z parametrami np. http://www.twojastrona.pl?page=2). Takie parametry nie tworzą nowej zawartości strony tylko tworzą duplikaty.

Generalnie URLe z parametrami, generowane automatycznie posiadają słabe rankingi w Google, ponieważ nie zapewniają unikalnej treści. Najlepiej od razu tworzyć przyjazne linki. Dodatkowo id sesji w urlach może tworzyć URL dłuższe niż 256 bajtów a jeśli tak jest to jest nie zgodnie z zaleceniami http. Może to prowadzić do błędów indeksowania Google z informacją, że adres URL nie istnieje lub przekierowanie URL jest zbyt długie.

Załóżmy, że jesteśmy na jakiejś platformie sprzedażowej  (np. Allegro.pl) i szukamy np. pościeli do sypialni.

URL strony głównej serwisu to w naszym przypadku http://allegro.pl  a link do strony z kompletami pościeli to np. http://allegro.pl/posciel-i-koce-komplety-poscieli-15986

Przypuśćmy, że masz już wynik wyszukiwania – znajdujesz się na stronie z pościelami. Teraz chcesz posortować je wg ceny rosnąco i przefiltrować po materiałach, wybierając tylko te zrobione z bawełny ( tu mamy do czynienia z nawigacją fasetową) – wtedy URL przyjmie postać:

http://allegro.pl/posciel-i-koce-komplety-poscieli-15986?order=p&a_enum%5B631%5D%5B1%5D=1

nawigacja fasetowa

 

Jak widzisz, po URLu kategorii http://allegro.pl/posciel-i-koce-komplety-poscieli-15986 mamy znak zapytania („?”) po którym znajdują się pary: parametr=wartość – jeśli jest więcej niż 1 parametr wyszukiwania, parametry łączone są ampersandem „&”.

Link kategorii http://allegro.pl/posciel-i-koce-komplety-poscieli-15986

oraz kategorii po filtrowaniu i sortowaniu: http://allegro.pl/posciel-i-koce-komplety-poscieli-15986?order=p&a_enum%5B631%5D%5B1%5D=1 

to dwa linki prowadzące do tej samej treści, różniące się jedynie sposobem rozmieszczenia na stronie oraz ilością zwróconych wyników w zależności od filtra. W ten sposób tworzy się duplikat i należy poinformować Googlebota o źródle oryginalnej treści za pomocą Cannonical.

<link rel=”cannonical” href="http://allegro.pl/posciel-i-koce-komplety-poscieli-15986" />

Co robić z duplikatami?

  • Jeśli na stronie mamy odnośniki
<a href="link-do-zduplikowanej-tresci"...>link</a>

do stron ze zduplikowaną treścią, takie linki należy zablokować dla robotów wyszukiwarek, tak samo jak strony z parametrami w URLu, nadając odnośnikom do stron atrybut rel=”noindex,follow”.

<a href="link-do-zduplikowanej-tresci" rel="noindex,follow">link</a>

Dzięki temu pozwalamy robotom wyszukiwarek śledzić linki na stronie, ale nie pozwalamy ich indeksować.

  • W przypadku podstron zawierających zduplikowaną treść załóżmy, że:

mamy stronę http://www.mojastrona.pl – stronę główną,

oraz podstronę http://www.mojastrona.pl/komputery?prod=apple

Na stronie głównej mamy odnośniki do różnych części serwisu oraz wyszukiwarkę. Po wpisaniu w wyszukiwarce wyszukiwanej frazy i wybraniu zakresu danych z których chcemy przeszukiwać ( np. w wyszukiwarce wpisujemy „Apple” a w kryteriach wyszukiwania: „Producent”), po kliknięciu w button „Szukaj” zostaną zwrócone wyniki z bazy danych serwisu. Wynik ( listing artykułów producenta o nazwie Apple) zwrócony jest do strony indeksu wyszukiwania. Strona ta jest zbudowana jak każda inna ( ma doctype, html, header, body itd..) a w treści wyświetla dane pobrane z bazy danych na podstawie zapytania, zbudowanego w oparciu o parametry wyszukiwania przekazane w URLu metodą GET ( wszystko co po „?” – w naszym przypadku parametrami są „prod” a wartością „apple”).

Taka strona indeksu wyszukiwania/ze zduplikowaną treścią powinna mieć w headzie strony metatag robots (1). Dodatkowo, jeśli w obrębie serwisu duplikujemy treść między np działami, należy podać za pomocą Cannonicala (2) link do źródła oryginalnej treści:

<!doctype html>
    <html>
    <head>
 (1)    <meta name="robots" content="noindex, follow" />
 (2)    <link rel="cannonical" href="http://twojastrona.pl/to-jest-oryginalna-tresc" />
    </head>
    <body>
....

Ostrożnie należy używać nawigacji fasetowej, która tworzy wiele duplikatów, filtrując wynik wyszukiwania po cechach produktu.

Wyszukiwanie np. po kategoriach lub cechach artykułu (np. nawigacja fasetowa – widać na powyższym obrazku w lewym boxie nawigacji – za pomocą nawigacji fasetowej przefiltrowałam wyniki i wybrałam tylko te z bawełny ) powoduje generowanie różnych URLi prowadzących tak naprawdę do jednego kontentu. Linki: http://www.twojadomena.pl/nazwa-kategorii oraz http://www.twojadomena.pl/nazwa-kategorii?sort=price to tak naprawdę dwa linki prowadzące do tej samej treści.

Cannonical nie zawsze działa i nie wyeliminuje wszystkich przypadków duplikacji treści.

Zapraszam do komentowania.

Poprzedni wpis – cz.3 – Poprawa metatagów i tagu title

Przejdź do początku serii wpisów – Zasady optymalizacji ON-PAGE serwisów nternetowych – cz. 1

Dodaj komentarz