Algorytm Google Caffeine wreszcie działa! Szybsza indeksacja

Po raz pierwszy Google wspomniał o nowej infrastrukturze indeksującej o nazwie Caffeine jeszcze w sierpniu 2009. Uruchomiono ją wówczas w jednym z data-center, a celem było zebranie opinii. Teraz Caffeine obsługuje już wszystkie zapytania z całego świata. Google nazywa Caffeine na swoim blogu „całkiem nowym systemem indeksowania internetu”, dzięki któremu indeks jest „przeszło 50% świeższy od poprzedniego i jest największym zbiorem treści jaki oferowaliśmy”.
Czym zatem właściwie jest Caffeine i co jego wdrożenie znaczy dla szukających i wydawców witryn?
Od Maile Ohye z Google’s Webmaster Central usłyszałam, że „internet rozszerza się i rozwija, a Caffeine będzie lepiej nadążać za tymi procesami. Zmienia się ekosystem, więc by dostarczyć szukającym możliwie najlepszych wyników, zmieniamy się i my”. Inny pracownik Google, Matt Cutts, dodaje z kolei „Caffeine daje korzyści zarówno szukającym, jak i wydawcom witryn. Wprowadzenie Caffeine oznacza bowiem, że każdy rodzaj treści (nie tylko treści klasyfikowane jako „real time”) będzie dostępny z wyszukiwarki w kilka sekund od zaindeksowania”.
Caffeine jest więc ulepszeniem infrastruktury indeksującej. Nie zmienia algorytmów ustalających ranking. Działa we wszystkich data-center, regionach i językach.
Treść jest szybciej dostępna
Wcześniej proces przeszukiwania internetu i indeksowania go był procesem „pakietowym”. Googlebot odwiedzał zestaw witryn, przetwarzał je („wyciągał” z nich treści, kojarzył anchor texty i linki zewnętrzne, by ustalić ich tematykę), a na końcu dodawał je do indeksu. Kiedy cały taki „zestaw” witryn uległ przetworzeniu, ich treści stawały się możliwe do znalezienia. Teraz Google odwiedza witrynę, przetwarza ją, a jej treść staje się dostępna z wyszukiwarki w zasadzie natychmiast. Dzięki temu indeks jest o ponad 50% świeższy, niż dotychczas.
Zwróć uwagę, że uruchomienie Caffeine nie musi oznaczać, że witryny będą odwiedzane przez robota częściej. Zmiana oznacza po prostu, że gdy już witryna zostanie odwiedzona przez robota, stanie się dostępna dla szukających szybciej, niż do tej pory. (Pamiętaj, że możesz oszacować częstotliwość odwiedzin googlebota sprawdzając logi serwera lub daty ostatniej kopii witryny – „cache’u”).
Google znacznie zwiększył pojemność pamięci
Chociaż indeks Google’a nie jest na razie większy, niż dotychczasowy, to nowa infrastruktura jest na to przygotowana. Jeśli Caffeine ma pomóc lepiej nadążać wyszukiwarce za rozwojem internetu, musi uwzględniać jego rozrastanie się. Internet powiększa się codziennie, i to dużo szybciej, niż ktokolwiek w czasach powstawania Google mógł przypuszczać.
Google znacznie zwiększył elastyczność w zakresie przechowywania informacji o dokumentach
Google zawsze starał się kojarzyć wiele informacji z przechowywanymi dokumentami. (W tym kontekście, przez „dokument” rozumiem każdy „kawałek” treści, jak podstrona, obrazek czy wideo). Przykładowo, gdy Google indeksuje daną podstronę, kojarzy z nią także informacje o linkujących do niej zewnętrznych witrynach i anchor texty linków. Wraz z wdrożeniem Caffeine wzrosnąć ma elastyczność w zakresie typów takich „kontekstowych” informacji. Jeśli zajdą w internecie zmiany polegające na pojawieniu się nowych typów informacji, które warto będzie kojarzyć z „dokumentem”, nie będzie trzeba pisać kodu na nowo. Zatem, choć Caffeine nie wpływa na ranking samo w sobie, taki związek może powstać w przyszłości, wraz z ewentualnym dodaniem nowych typów informacji kojarzonych z dokumentem.
[Aktualizacja]: Podczas wystąpienia na SMX Advanced, Matt Cutts dał przykład dodatkowych danych, jakie mogą być kojarzone z dokumentami: „wyobraźcie sobie przykładowo, że wcześniej mogliśmy skojarzyć stronę z jednym tylko krajem. Teraz natomiast moglibyśmy kojarzyć ze stroną wiele krajów jednocześnie”. (Zwróć uwagę, że Matt nie mówił o realnie wdrożonej funkcji, ale o przykładowych możliwościach wynikających z uruchomienia Caffeine).
Jak wydawcy treści mogą wykorzystać Caffeine?
Wydawcy skorzystają na wdrożeniu Caffeine w zasadzie bez żadnego wysiłku ze swojej strony. Trudno byłoby wskazać cokolwiek, co wydawcy powinni zrobić, by wykorzystać Caffeine jeszcze lepiej. Niektórzy zastanawiają się pewnie, czy zmiany oznaczają, że dotychczasowe zalecenia w zakresie poprawiania dostępności witryn dla robotów stają się teraz ważniejsze. Np. czy szybkość ładowania się strony, wokół której było ostatnio głośno, stała się teraz istotniejsza? Nie. Dowiedziałam się w Google, że wdrożenie Caffeine nie wpływa w żaden sposób na wagę czynników decydujących o odwiedzinach robota, zaindeksowaniu treści i ustaleniu rankingu. Caffeine powoduje po prostu, że treść strony szybciej jest dostępna w wyszukiwarce; przygotowany jednocześnie zostaje grunt pod wprowadzenie do algorytmu nowych czynników.
[źródło: Google’s New Indexing Infrastructure “Caffeine” Now Live]
Powyższy tekst zawiera prywatne poglądy Autora. Niekoniecznie muszą odzwierciedlać one poglądy Redakcji.
Nowszy artykuł: Jak usunąć tło w Google.pl?
Starszy artykuł: Aplikacje mobilne: inna nazwa wyszukiwania
Tagi: algorytm caffeine, indeksacja - indeksowanie, zmiany algorytmu Google
Podobne posty:
- Algorytm Google Caffeine dostępne dopiero za kilka miesięcy. Będzie real time search?
- Kolejna wersja Pandy już wdrożona
- Zmiana algorytmu premiuje świeże wyniki. Dla 35% wyszukań!
- „Miejsca” na miejsce Centrum Firm Lokalnych. Nowa nazwa, nowe funkcjonalności?
- Search Funnel Report, czyli jak jeszcze lepiej poznać intencje użytkownika
Osoby które odwiedziły tą stronę znalazły ją szukając:
- caffeine
- artykuły algorytmy
- wreszcie
- szybsza indeksacja w google
- szybsza indeksacja treści
- szybsza indeksacja google
- indeksacja search
- googlebot czestotliwosc
- googlebot częstotliwość
- google caffeine sprawnymarketing
|