kwi 3 2010

Przemierzanie, indeksowanie, dostarczanie wyników

Google to skomplikowana “machina” dostarczająca nam chyba najtrafniejsze wyniki spośród wszystkich znanych nam wyszukiwarek.

Czy zastanawialiście się kiedyś jak wygląda cały proces od początku? Poniżej w dużym skrócie postaram się przedstawić 3 najważniejsze kroki.

1. Przemierzanie

Jest to proces wykrywania przez Googlebota nowych oraz zaktualizowanych stron www. Googlebot (pająk, robot) to nic innego jak program (aplikacja) przemierzająca strony, podążająca za linkami umieszczonymi na innych stronach.

Proces rozpoczyna się od przemierzania stron już zaindeksowanych. Przemierzanie danej strony może być dla Googlebota znacznie ułatwione w przypadku dostarczenia mapy strony. Możemy też wyłączyć z przemierzania strony, które chcemy ukryć. Wystarczy odpowiedni wpis w pliku robots.txt.

2. Indeksacja

Indeksacja jest przetwarzaniem przemierzonych stron. Przetwarzanie to polega na budowaniu indeksu Google, opartego o różnego rodzaju parametry – słowa kluczowe, poprawne wypełnienie atrybutów tagów html, linkowanie itd.

3.Wyniki wyszukiwania

W wyniku przetworzeń powstaje indeks słów kluczowych, pozwalający na zbudowanie indeksu wyszukiwania.

Kiedy użytkownik wprowadza interesującą go frazę do wyszukiwarki, Google stara wyświetlić możliwie najtrafniejsze wyniki. Ranking tych wyników ustalany jest po wykonaniu 2 kroku. Podczas ustalania rankingu brane jest pod uwagę ponad 200 czynników!!!


mar 16 2010

Google się zmienia

Od kilku dni korzystamy z nowego sposobu podpowiadania w Google.

Potentat z Mountain View, na wzór google.com, zaczął boldować (pogrubiać) części podpowiadanych fraz, których jeszcze nie wpisaliśmy.

Oprócz tej, kosmetycznej zmiany, przyciski “Szukaj w Google” oraz “Szczęśliwy traf” zostały przeniesione do wnętrza boksu z podpowiedziami. Znacznie ułatwia to nawigację. Strasznie irytowały mnie sytuacje w których, nawet jeżeli nie chciałem uzyskać żadnej podpowiedzi, nie mogłem bezpośrednio po wpisaniu hasła kliknąć na “szukaj” myszką.

Google się zmienia


mar 8 2010

Ban – czy na pewno strona dostała karę?

Nie zawsze brak naszej strony w wynikach wyszukiwania musi oznaczać bana nałożonego przez Google.

Dość powszechne są sytuacje, gdy strona pomimo spełniania wszystkich wymogów jakościowych zostaje usunięta z indeksu Google. Dlaczego tak się dzieje? Otóż roboty wyszukiwarek to nie ludzie, a więc nie widzą stron tak jak my:) Nie tyczy się to tylko treści czy grafiki, ale także sposobu w jaki strony są wywoływane. Kod który bez problemu przetwarzany jest przez przeglądarkę (dzięki temu widzimy stronę) może być nieczytelny lub wręcz niedostępny dla robotów wyszukiwarek.

Różne ustawienia serwera lub nie do końca poprawny kod mogą doprowadzić do sytuacji w której strona bez problemu wyświetli się użytkownikowi, natomiast robot nie uzyska do niej dostępu (np. błąd 500 serwera).

Pomocne może być tu narzędzie zaserwowane nam przez Google:  WebMaster Tools -> Pobierz jako Googlebot.

Jeżeli nagłówek jest nieprawidłowy powinniśmy o problemie poinformować admina serwera.


mar 2 2010

Google personalizuje wyniki

Nie od dziś wiadomo, że coraz większą rolę w pozycji strony odgrywa jej odwiedzalność przez poszczególnych userów. Już od jakiegoś czasu Google umożliwia personalizację wyników – umieszczanie interesujących nas stron wyżej od pozostałych na konkretną frazę.

Do tej pory funkcjonalność ta była dostępna tylko po zalogowaniu na konto Google. Wyniki dla osób niezalogowanych nie były personalizowane. Oczywiście mogły się nieznacznie różnić w przypadku trafienia na różne data center.

Dziś spotkałem się z zupełnie nowym zjawiskiem. Google zaczyna prezentować różne wyniki nawet niezalogowanym użytkownikom! Na pozycję wpływ ma to czy daną stronę wcześniej odwiedzaliśmy.

Dla przykładu, po wpisaniu frazy “Karpacz”, tylko dwie najwyżej notowane strony zajmowały swoją pozycję. Następne trzy były stronami odwiedzanymi w ostatnim czasie (dokładnie wczoraj). Kolejność tych stron była zgodna z kolejnością występowania w wynikach niespersonalizowanych (strona która w normalnych wynikach była najwyżej, tu była trzecia, kolejna czwarta itd.).

Żeby potwierdzić moje przypuszczenia wszedłem na Google za pomocą proxy. Tu się już nie zdziwiłem – wyniki były normalne.

Czy biorąc pod uwagę powyższe fakty, można stwierdzić, że wkrótce pozycjonowanie stron straci sens?:) Nie sądzę. Mechanizm jest prawdopodobnie dopiero wprowadzany, więc wszystko może się jeszcze zmienić.