Metody oceny unikalności tekstu

Metody oceny unikalności tekstu


Treść ma ogromne znaczenie w pozycjonowaniu. Jest ona oceniana przez wiele algorytmów, które starają się wskazać najlepszą i najbardziej wartościową, odpowiadającą danemu zapytaniu. Takie sprawdzanie treści odbywa się w kilku etapach. Poniżej przedstawię dwa z nich.

Pierwszy etap to przyporządkowanie tekstu do danego języka. Zbierane są wówczas słowa występujące na stronie i tworzona jest macierz będąca odzwierciedleniem ilości wystąpień tych słów.

Etap drugi polega na znalezieniu najbardziej relewantnych dokumentów dla podanej frazy. Odbywa się to w czasie odczytywania danych z indeksu wyszukiwarki, po zadaniu zapytania przez użytkownika.

Drugi etap jest kluczowy, gdyż użytkownik zadający zapytanie liczy na znalezienie wyników, które dadzą na nie odpowiedź. Odpowiednie dopasowanie treści zapytania do zbioru stron pozwala na łatwe znalezienie istotnych dokumentów. Ze zbioru odpowiadających dokumentów tworzony jest ranking na podstawie wielu czynników. Między innymi czynniki te dotyczą treści strony.

Jednym z istotnych parametrów tekstu jest jego unikalność. Według założeń algorytmu wyszukiwania unikalny tekst jest wyżej oceniany niż tekst powielony. Wiadomo, że wyszukiwarka Google stosuje kary za powieloną treść.

Kary te nie są nakładane zawsze. W przypadku danych niezmiennych (np. dane teleadresowe) algorytmy oceny stron nie przewidują kary za duplikację treści strony (tak przynajmniej podaje patent Google o rozpoznawaniu treści).

W większości przypadków duplicate content jest powodem obniżenia pozycji strony w wynikach wyszukiwania na wszystkie frazy.

Ciekawym aspektem jest sposób rozpoznawania tego, która strona jest właścicielem treści, a która ją skopiowała. Google potrafi to sprawdzić na kilka sposobów. Nie wszystkie z nich muszą być wykorzystywane, opisano je w wyżej wspomnianym patencie.

Sprawdzanie właściciela tekstu odbywa się poprzez przypisanie daty powstania do konkretnego dokumentu. Nie można ustalić jaka jest data powstania każdego dokumentu w sieci, dlatego też Google znalazło kilka sposobów na określenie przybliżonej daty powstania dokumentów.

Pierwszym z nich jest sprawdzenie daty zapisanej przez serwer w nagłówku HTTP. Jeśli jakiś dokument nie posiada takiej daty wówczas Google sprawdza jaka jest data pierwszego zaindeksowania podstrony przez Googlebota. Taką datę uznaje jako datę powstania dokumentu. Jeśli więc strony A i B mają tą samą treść moduł wyszukiwarki sprawdza kiedy pająk po raz pierwszy odwiedził obie strony. Strona ze wcześniejszym znacznikiem czasowym zostaje uznana za właściciela tekstu.

Metodą alternatywną do przedstawionej jest sprawdzenie kiedy pojawił się pierwszy link do danej podstrony. Jeśli trzy przedstawione metody nie dają jednoznacznej odpowiedzi na to, która strona jako pierwsza opublikowała tekst, wówczas sprawdzana jest data rejestracji domeny.

Większe i bardziej autorytatywne strony będą mogły liczyć na lepsze traktowanie. Metody te nie są idealne, ale w sposób optymalny wskazują właściciela treści.

W mojej opinii Google w łatwy sposób poradziło sobie ze sprawdzaniem kto jest autorem treści. Dzięki temu premiowane są strony tworzące unikalny i odpowiadający zapytaniom użytkownika content.

 

Foto: marketingowy.net

2 Komentarze

Dodaj własny
  1. 1
    Mariusz

    Oczywistym jest, że unikalność jest w cenie. Czasem można coś powielić, jeśli np. chodzi o dane teleadresowe, ale poza tym warto dbać o jak najlepszy wynik i zamieszczać unikalne treści nas promujące.

  2. 2
    Karol

    Unikalność tekstów oraz grafik na naszych stronach internetowych możemy sprawdzić bezpłatnie na stronie http://copyact.com/. Oprócz bezpłatnych funkcji testowania unikalności tekstu i zdjęć na stronie znajdziemy wiele dodatkowych rozwiązań, które pozwalają chronić nasze zasoby przed plagiatami.

+ Napisz komentarz