V posledních týdnech bylo možné zachytit, především na sociální síti Twitter, několik velmi zajímavých informací a potvrzení ze strany Google o souborech sitemap a jejich zpracování. Speciálně od známého dua John Mueller a Gary Illyes. Níže naleznete shrnutí pěti nejdůležitějších a nejzajímavějších informací, které zmínili o sitemap:
V Search Console lze vidět v sekci soubory sitemap více indexovaných stránek, než odeslaných
Je to divné, ale může se stát, že budete vidět v sekci Soubory sitemap ve službě Google Search Console více indexovaných stránek, než je počet odeslaných skrze sitemap. K této situaci dochází v případě, že máte odeslaných více sitemap najednou a některé URL se objevují ve více než jedné z nich.
Podle vyjádření Johna Muellera to vypadá, že jedna URL, odeslaná ve více sitemapách najednou, se do sekce Submitted (Odeslaných) URL započítá pouze jednou a bez duplicit. Oproti tomu v případě indexace, se stejná indexovaná URL, vyskytující se ve více sitemapách, může zobrazit jako několik zaindexovaných URL (přitom jde několikrát o tu samou). To způsobuje zmíněnou anomálii:
The same URL in multiple sitemaps is counted separately, which is why you could see something like that. I'd keep URLs in a single sitemap.
— John ☆.o(≧▽≦)o.☆ (@JohnMu) August 16, 2017
Google ignoruje tag v sitemapách
Podle jiného tweetu Johna, Google naprosto ignoruje tag v sitemapách. Pokud jej v sitemapách nyní používáte a je pro vás vyhledávač Google prioritou, můžete je pravděpodobně odstranit, jelikož pouze zabírají místo.
Pokud je ale pro vás jeden ze zdrojů návštěvnosti i vyhledávač Seznam, pak je podle jeho nápovědy vhodné tag <priority>
stále používat:
https://napoveda.seznam.cz/cz/fulltext-hledani-v-internetu/sitemap-xml/
Johnův tweet o tom, že Google ignoruje prioritu:
We ignore priority in sitemaps.
— John ☆.o(≧▽≦)o.☆ (@JohnMu) August 17, 2017
Tento tweet od Johna potvrdil první část článku z roku 2015 webu Seroundtable, který se věnoval zbytečnosti tagů <priority>
a <changefreq>
:
https://www.seroundtable.com/google-priority-change-frequency-xml-sitemap-20273.html
U tagu <changefreq>
prozatím nebylo potvrzeno ze strany Google, že by jej nepoužíval, ale pravděpodobně nebude mít téměř žádný význam také v sitemap.
Jako dvě nejdůležitější části každé sitemap, Google považuje tagy <loc>
a <lastmod>
(lastmod pouze, pokud je používán správně). Pokud se chcete dozvědět více o tom, jak správně používat a formátovat <lastmod>
, doporučuji si přečíst odpověď od Gary Illyese zde:
https://stackoverflow.com/questions/31349345/how-to-properly-format-last-modified-lastmod-time-for-xml-sitemaps?stw=2
Google nepodporuje zanořené sitemapy do klasických sitemap
Pokud do své sitemap vložíte seznam svých dalších sitemap, nebude Google schopen pravděpodobně tyto sitemap namapovat a bude je brát jako součást webu. Pokud již chcete Google pomoct namapovat ostatní sitemap vašeho webu, použijte sitemap index místo klasické sitemap.
We support sitemap index files, but not nested sitemap files (sitemap in sitemap index is OK, sitemap in sitemap not)
— John ☆.o(≧▽≦)o.☆ (@JohnMu) August 13, 2017
Google také nepodporuje zanořené sitemap index
Podobně jako u výše uvedených sitemap unvitř sitemap, Google nepodporuje ani sitemap indexy, zanořené do sitemap indexů. Pokud tedy do svého sitemap indexu umístíte rozcestník na další sitemap indexy, nebude nejspíše Google schopen se k těmto zdrojům dostat.
Nejlepším řešením je použít jeden centrální sitemap index:
Off-hand, it looks like you have sitemap index files in sitemap index files, which isn't supported.
— John ☆.o(≧▽≦)o.☆ (@JohnMu) June 28, 2017
Odeslání sitemap s NOINDEX stránkami může urychlit odstranění takových URL z indexu
Pokud máte jednu URL a chcete, aby se k ní Googlebot co nejdříve dostal, použijete Nástroj k odeslání URL od Google. Co když ale takových URL máte mnohem více?
Gary Illyes na Twitteru potvrdil, že vše co je vloženo do sitemap se obvykle zpracovává dříve. Takže pokud potřebujete dát rychle Google vědět o tom, že jste pro více stránek zakázali indexaci a neměly by se již zobrazovat ve výsledcích vyhledávání, jednoduše je dočasně přidejte do sitemap, kterou odešlete Google:
@nishanthstephen generally anything you put in a sitemap will be picked up sooner
— Gary "鯨理" Illyes (@methode) October 13, 2015