Google penalizuje duplicitní stránky (aktualizováno)
Dnes jsem trochu přehodnotil svůj postoj k duplicitním stránkám. Google se totiž samozřejmě duplicitním stránkám brání. Slouží k optimalizaci stránek, kdy na několika webech provozujeme stejný obsah a vzájemným prolinkováním se snažíme weby dostat nahoru. Ve výsledcích hledání to pak může skončit úplným vytapetováním, kdy na první stránce výsledků je jedna firma s deseti stejnými weby.
Dnes uživatel Fathom na fóru Search Engine Watch v diskuzi Duplicate Content Penalty Timespan zmínil dobu, po kterou je daná stránka za duplicitní obsah penalizována. Jde o tříkolový systém:
- 30 dní
- 60 dní
- 90 dní
Pokud po uplynutí první penalizace se originální stránka změní a duplicitní ji znova zkopíruje, nastupuje druhé kolo penalizace trvající 60 dní. A třetí kolo danou stránku vyřadí na čtvrt roku.
Domnívám se, že Google určitým mechanismem určí originální stránku (podle stáří, počtu zpětných odkazů). A pokud se vyskytne kopie, tak je penalizována pouze tato kopie a originálního webu se to nijak nedotkne. Protože jinak by se takto daly jednoduše odstřelovat weby konkurence.
Přijde mi to jako logická a účinná obrana proti duplicitním stránkám.
PS: Uživatel Fathom tvrdí, že má informace přímo z Googlu z konference WMW PubCon od Matta Cutta.
Aktualizace 14. 1. 2004: Podle doplnění Matta Cutta jde pouze o ukázková čísla. Přesná si nechává Google pro sebe. Systém bude ale podobný.
Via Duplicate Content Penalty Timespan na Search Engine Roundtable.
Komentáře
Zajímavá informace. A nevíte někdo, jak to dělají české vyhledávače, hlavně Seznam? Vadí jim to a poukud ano, jak to postihují?
Kromě toho by mě zajímalo, jestli vyhledávačům vadí duplicitní odkazy, tedy např. když pomocí mod_rewrite odkazují dvě různé adresy (v rámci téže domény) na fyzicky naprosto stejný obsah.
praxe tato slova potvrzuje. Zkuste třeba v Google vyhledat "inferno media" - na http://www.inferno-media.cz se prakticky nedoklikáte (srovnejte s http://www.dgx.cz)
Velice efektivní je v tomhle Jyxo - stačí napsat a oni daný web neindexují (aneb jak likvidovat konkurenci :-)).
[1] Seznamu to jiste nevadi, protoze Seznam nema vlastni vyhledavani, ale pouziva Jyxo
[3]: Pouze když je to třeba celá duplicitní doména nebo velké množství neviditelného textu či podobně velké prohřešky.
mna by zaujimal diagnosticky nastroj, ktorym by som mohol "prebehnut" stranku, ci a kolko ma skryteho textu, proste vsetky tie mozne prehresky ;-)
ci uz ako Extension alebo webova sluzba. Tie techniky skryvania textu, cloakingu sa predsa daju zosumarizovat.
Jedneho tapetara poznam... Vtip spociva v tom, ze v prvej 10tke su rozne domeny so ZDANLIVO odlisnym obsahom (ten isty vlastnik). Spravidla staci mierne modifikovat text: zmazat, vymenit, poprehadzovat text a je vymalovane... :)
Mohl by prosim jeste nekdo (napr. pan Illich) odpovedet na druhy muj dotaz v [1]? Nikde na strankach Seznamu ani Jyxa jsem o tom nic nenasel.
[8] Osobně jsem ten druhý dotaz nepochopil. Pokud se na dvou URL nachází úplně stejný obsah, tak se jedná o duplicitní obsah. Vyhledávače si jednu vyberou a druhou penalizují.
No o to mi právě šlo - jestli vadí duplicita celých domén, nebo i duplicita konkrétních dokumentů v rámci jedné domény. Např. si představte, že na tato vaše stránka s článkem i komentáři se zobrazí jak při zadání http://www.zpravy.net/weblog/archiv/0501/google-penalizuje-duplicitni-stranky.php, tak i třeba při zadání http://www.zpravy.net/clanek0501 (s tím, že adresa se vnitřně přepíše pomocí mod_rewrite, například). Která bude penalizována?
[10] Ano, jedna z nich bude penalizována, která to bude záleží IMHO na stáří a počtech zpětných odkazů. Pokud jsou staré obě stejně, tak i na náhodě. Třeba podle toho, kterou Google dříve zaindexuje. Rozhodně doporučuji jednu z nich přesměrovat.
ale to není žádná penalizace. Google prostě zobrazuje obsah v jeho unikátní podobě. Pokud se tedy vyskytují duplicity, prostě je nezobrazuje.
Tabulka která "odhaluje" 30,60 a 90 denní souvislosti je myslím poněkud naivní. Uvědomte si, že google během 90 dnů stihne asi tak 2x změnit algoritmy indexace, takže když si dáme dohromady 1+1, zjistíme, že vypozorovat takovéto souvislosti je nemožné.
[12] Ty informace by neměly být vypozorované, ale pocházet přímo od Googlu. A o penalizaci se jedná, protože ta stránka je na 30 dnů vyřazena z výsledků.
nechci nijak zpochybňovat tyto informace, jen mi připadá "pochybné" označení, že pocházejí přímo z Google. Chybí totiž dodatek, zda-li jde o názor uklizečky nebo Larryho Page.
[8] Poloz dotaz do seo.nawebu.cz nebo primo na adresu MI
[12] Presne tak, proste se druha varianta nebude vyskytovat...
[2] to dgx:
Na tvuj dotaz "inferno medila" na google jsem InfernoMedia nasel na 14. miste - to je celkem slusne, ne?
Zda se mi to vsechno nejake podivne.
1. Pokud budu mit identicke stranky, pak je jednodussi je udrzovat na jednom miste a udelat presmerovani domen. Tak se vyhnu vsem problemum, o kterych je v clanku rec.
2. Pokud stranky identice nebudou, pak jen tezko lze rozlisit, kdy jsou si natolik podobne, aby byly penalizovany a kdy nikoliv. Nikdo nemuze po vyvojarich chtit, aby pro kazdeho zakaznika, kteremu vyvijeji web, vytvareli uplne novy design a strukturu stranky. To je nesmysl. Ve vetsine pripadu se pouzivaji predpripravene templaty, ktere se upravuji podle aktualnich potreb.
3. Vzhledem k tomu, ze to neni oficialni stanovisko Google a ani jsem nikde nenasel zadnou oficialni zpravu (pokud se mylim, tak me nekdo opravte), je to cele podle meho pouze humbuk a vtip nejakeho dobraka v diskusnim foru.
Neverte vsemu, co na internetu prectete... :o)
[16] kdo hledá, ten najde. Máš pravdu, v době psaní komentáře to skutečně bylo na cca 14 stránce (a před dvěma měsíci taktéž)
Další příspěvky
- Aktuální příspěvky
- Novější příspěvky
- Obsah jako základní kámen webu [18. ledna 2005 7:30]
- Domény .cz zatím bez diakritiky [14. ledna 2005 19:17]
- Historie Google.sk [13. ledna 2005 15:49]
- Starší příspěvky
- Google testuje obrázky ve výsledcích hledání [6. ledna 2005 19:35]
- Živě radí, jak na Vánoce 2005 [1. ledna 2005 12:45]
- B4Y společně s Business Tuesday [31. prosince 2004 17:52]
- Všechny příspěvky za měsíc leden 2005


