Lekce 2 - SEO - Princip internetových vyhledávačů a Google PageRank
V minulé lekci, Úvod do SEO - Optimalizace webů pro vyhledávače, v kurzu SEO, jsme si udělali úvod do problematiky optimalizace webových stránek pro vyhledávače.
V dnešním dílu pochopíme, jakým způsobem vyhledávače weby hodnotí.
Se vznikem internetu začal být okamžitě problém s vyhledáváním, jelikož nikde neexistuje mapa všech webových stránek, které jsou na něm uložené. Když uživatel potřebuje nějakou informaci, musí nejprve nějakým způsobem zjistit adresu webu, který tuto informaci obsahuje.
Katalogy
Nejjednodušší řešení je mapu stránek ručně sestavit, říkáme ji poté katalog. Autoři webů přidají své stránky do katalogu, ve kterém následně uživatelé vyhledávají. Tímto způsobem dříve fungoval seznam.cz, než se přeorientoval na fulltextový vyhledávač. Největším katalogem byl dmoz.org, ve kterém bylo vloženo přes 4.000.000 stránek. Jeho činnost byla ukončena v březnu 2017.
Katalogy se v dnešní době již téměř nepoužívají a registrace do nich může vašemu webu i vážně ublížit. Získáte totiž zpětné odkazy (viz dále) ze stránek, na kterých není žádný obsah a jen spousta odkazů. Pokud se zaregistrujete do velkého počtu katalogů, může si váš web dokonce vysloužit i nehezkou penalizaci, protože Google pochopí odkazy jako nepřirozené a podezřelé (a to také jsou, když jste si je vytvořili sami ). Hodilo by se zmínit, že existují placené služby, které slibují zvýšení vašeho SEO pomocí registrace do takovýchto katalogů. Myslím, že se to v dnešní době již nevyplatí riskovat.
Katalogy dříve mívaly opravdu vysoké ranky, nyní je jejich význam zanedbatelný.
Vyhledávače
To, čemu říkáme vyhledávač, se skládá ze tří částí: Robota, který prohledává Internet. Jde odkaz po odkazu a snaží se projít co nejvíce webových stránek a jejich obsah ukládá do indexu. Robot se na již navštívené weby pravidelně vrací, aby zaznamenal aktualizace. Čím je web větší s častějšími aktualizacemi a čím je navštěvovanější, tím častěji se vrací.
Druhá část je index. Je to databáze webových stránek, které našel a uložil robot. Stránky v indexu jsou řazeny dle mnoha a mnoha kriterií (např. PageRank, Google těchto kriterií k řazení používá mnohem více). To je pro SEO podstatné.
Poslední částí je uživatelské rozhraní vyhledávače, tedy z uživatelského pohledu samotná stránka www.google.com, www.seznam.cz atd. Vyhledávací pole s tlačítkem Vyhledat. A následně zobrazení výsledků vyhledávání, které jsou seřazené dle relevance.
Možná vás napadá, jak Google přijde na stránku, která je na internetu nová a nikdo na ni ještě neodkazuje. O takové stránce můžete Googlu říci pomocí formuláře na https://search.google.com/…ole/sitemaps (Je potřeba splnit několik podmínek, viz https://support.google.com/…swer/7451001#…). Robotu Googlu se říká Googlebot, robotu Seznamu SeznamBot. Ve výchozím nastavení se roboti snaží indexovat vše, co jen jde. Nemusíme se o ně vůbec starat ani na web vkládat nějaké speciální značky. Někdy je žádoucí, aby roboti nějakou URL adresu neindexovali. K tomu se používají buď metaznačky v HTML kódu nebo soubor robots.txt. V seriálu se k tomuto tématu ještě vrátíme.
Hodnocení stránky vyhledávačem
Jedním z cílů SEO je zajistit, aby vyhledávač stránku co nejlépe ohodnotil. Hodnocení je jedním z klíčových kriterií, které dopomohou k lepším výsledkům zobrazení v SERP. Vyhledávač Google používá PageRank (dle spoluzakladatele Google Larryho Page ). Seznam používal S-Rank (zrušil jej v roce 2020).
PageRank
Kdyby vyhledávač jen naindexoval celý internet, nebylo by to příliš přínosné. Je na něm totiž obrovské množství webů (a jejich podstránek), mezi kterými se musí sofistikovanými algoritmy filtrovat, aby na konci zůstalo jen to, co uživatel opravdu hledá. Vyhledávač musí ve webovém indexu:
- Pochopit, o čem web je, aby ho mohl správně zařadit a nabízet ve výsledcích vyhledávání
- Přiřadit webu hodnocení vzhledem k jeho velikosti a kvalitě jeho obsahu
Google používá k hodnocení webů více než 200 různých algoritmů. Tím prvním a nejvýznamnějším algoritmem je Google PageRank (zkráceně GPR). Ačkoli PageRank není jediný algoritmus, který o pozici ve výsledcích rozhoduje, je jeho princip velmi důležitý.
Princip
Základním předpokladem je, že na kvalitní web odkazují ostatní weby. Čím je web zajímavější, tím více lidí si o něm povídá a zmiňují ho na svých stránkách v podobě odkazů. O těchto odkazech hovoříme jako o zpětných, jsou to odkazy z cizích webů na náš web. Zjednodušeně můžeme říci, že čím více webů na náš web odkazuje, tím jako zajímavější ho Google (nebo ostatní vyhledávače) vnímá.
Google přestal zobrazovat hodnotu PageRank zhruba v roce 2016 (respektive oficiálně přestal podporovat Toolbar PageRank). Interně PageRank stále používá. Je to proto, že hodnotících faktorů je dnes již mnoho a PageRank je jen jedním z nich a má tak malou (nebo dokonce zavádějící) hodnotu.
Dříve existovaly webové služby a různé další toolbary, které zobrazovaly PageRank a jejich obdoby i u jiných vyhledávačů. Dnes již nefungují, protože API Google již hodnotu PageRank neposkytuje.
Co PageRank ovlivňuje
Velmi jednoduše:
- kvalita a počet příchozích odkazů (za nekvalitní, nepřirozené, odkazy, může být váš web dokonce penalizován)
- PageRank propojovací stránky (tedy stránky, která na vaší stránku odkazuje)
- počet a kvalita odchozích odkazů (odkazování na reklamní, či nedůvěryhodný web by mohl Google opět sáhnut k penalizaci)
Přelévání ranků
Výsledná hodnota GPR našeho webu vychází ze součtu GPR všech webů, které na nás odkazují.
Čím větší GPR mají zpětné odkazy na náš web, tím pozitivnější vliv mají na celkové GPR našeho webu. Možná vás napadlo, co se stane, když na sebe 2 weby navzájem odkazují. Takový výsledný efekt je bohužel minimální. V rámci SEO je tedy v našem zájmu získat co nejvíce zpětných odkazů z co nejkvalitnějších webů a to ideálně tak, abychom my na tyto weby neodkazovali. Když náš web odkazuje na příliš mnoho ostatních webů, jeho GPR se snižuje.
Hodnoty
Pokud Google nějakou stránku vůbec nezná, rovná se její rank 0. Mezi vyššími hodnotami jsou stále vyšší propasti. Zatímco hodnot 1-3 je poměrně jednoduché dosáhnout, hodnoty 4 a výše získáte většinou jen když se webu opravdu intenzivně věnujete. Vysokých hodnot nelze v českých podmínkách rozumně dosáhnout. Pro lepší příklad si uveďme několik webů a jejich GPR (GPR se v čase mění, takže hodnoty jsou ilustrativní a dnes již neověřitelné):
- PageRank 10: twitter.com, usa.gov (americká vláda)
- PageRank 9: google.com -(opravdu, ani Google nemá hodnotu 10, takže my na ni můžeme zcela jistě zapomenout ), facebook.com, apple.com
- PageRank 8: microsoft.com
- PageRank 7: seznam.cz, idnes.cz
- PageRank 6: Google.cz, lupa.cz
- PageRank 5: lide.cz
Itnetwork míval na předchozí doméně GPR 4.
Níže přikládám sice starší, ale stále výstižný obrázek, díky kterému získáme představu o rozpětí hodnot GPR.
Vývoj internetu
Možná vás napadlo, že internet se přeci stále rozšiřuje. Stránky mají časem více a více článků a algoritmus ranku by se tomu měl nějak přizpůsobit. Je tomu tak, hodnocení Googlu je stále přísnější a přísnější. Aktualizace algoritmu přicházejí asi 2x za rok a musíme se často smířit s tím, že když se náš rank po updatu nezmění, je to ta nejlepší možná varianta Že Google sám sobě vypočítá 9 a ne 10 je toho důkazem.
Význam
Google PageRank bychom měli brát jako jeden ze SEO ukazatelů. Ačkoli je velmi důležitý, nemá smysl se bezhlavě zaměřovat pouze na něj. Weby děláte pro lidi a existuje spousta stránek, které nemají vysoké GPR a přesto jsou velmi populární. Google používá kromě GPR spoustu dalších algoritmů, o kterých si řekneme příště.
V další lekci, SEO - Další algoritmy Google a linkbuilding, si probereme algoritmy Google, téma penalizace a také si ukážeme, jak správně vytvářet zpětné odkazy.