
Sitemap hiba az ABOUT YOU oldalán – mini tech seo esettanulmány
Nagyot ment az elmúlt hetekben az ABOUT YOU nevű online ruhabolt bevezető kampánya. Nagyjából a csapból is ők folytak. Plakátok, influencerek, online hirdetések. Bárhova néztél, ott voltak.
Nem volt ez másként velem sem. Reggelente a 9-es buszon ülve több plakátjukba én is belefutottam. Aztán amikor kiderült, hogy ez online ruhashop, akkor tudtam, hogy sokan a weboldal felé veszik az irányt.
Csak míg mások shoppingolni mentek az ABOUT YOU-ra, én tech SEO kutatásra készültem.
A többiek a termékeket nézegették. Én meg a robots.txt-t meg a sitemapet. Mások az árakat hasonlították össze, én meg a site crawl-okat. Mindenki olyan boldog lehetett, mint a lány ezen a lenti képen. Én legalábbis az voltam. 😀
Egy-két napos elemzés után elmondható, hogy az About You weboldala tök jól van összerakva tech SEO oldalon. Ez persze nem jelenti azt, hogy ne lenne rajta egy-két hiba, de a legfőbb dolgok tényleg szépen vannak implementálva.
Igazából egy dolgot találtam, amit biztosan javítani kéne, ez pedig nem más mint a sitemap.
Sitemap probléma
Maga a sitemap (webhelytérkép) egy dokumentum vagy oldal, amely tartalmazza az adott webhely összes oldalát és dokumentumát.
A szokásos helyén nem találtam (https://www.aboutyou.hu/sitemap.xml) és ez az üzenet fogadott:
Mondtam is magamnak:
Jawoll, schade. Unglücklich.
De aztán a robots.txt-ből könnyen megtaláltam a helyes sitemapet: https://www.aboutyou.hu/robots.txt
Nem kellett különösebben nyomozni, ott volt az utolsó sorban.
Úgyhogy neki is álltam és végigpörgettem.
Sitemap index
Itt több sitemap van becsomagolva egy ún. sitemap-indexbe. Első ránézésre minden oké is. Jó a formátum technikailag. Ma frissült is.
Sitemap crawl
De amikor elkezdtem az egyes sitemap-ekben található URL-eket megnézni, akkor egy érdekes dologra bukkantam.
Csináltam egy 10 ezer URL-es mintavételt és itt 919 URL nem 200-as response kódot dobott vissza. Ami egyben azt is jelenti, hogy ezek non-indexable URL-ek.
Ez az URL-ek több mint 9%-a, ami rengeteg. Emellett van két URL is a sitemapben, ami 404-es hibát dob.
A sitemapek technikai felépítésének egyik fontos feltétele, hogy abban csak canonical URL-ek szerepelhetnek.
Vagyis nem lehet benne sem 301, sem 302 (vagy bármilyen 3xx), sem 404, sem 410 (vagy bármilyen 4xx) sem 500-as (vagy bármilyen 5xx) hibakód sem. Ez ugyanis hibás jelzést küld a Google számára.
Elsőre nem teljesen egyértelmű mi a gond, mert azok az URL-ek, amik 302-vel irányítanak át, azoknál az átirányított URL-nél helyesen van megadva a canonical verzió.
Itt egy konkrét példa:
Az alábbi URL szerepel a sitemapben:
- (1) https://www.aboutyou.hu/p/for-love-i-lemons/koktelruhak-iris-hi-lo-4273344
- de ez 302-es átirányítással ide visz
- (2) https://www.aboutyou.hu/p/for-love-lemons/koktelruhak-iris-hi-lo-4273344
Vagyis szimplán csak egy -i- résszel rövidebb az URL. Igen ám, de az első link non-indexable. A (2) link már indexable és az is a canonical verzió, ahogy azt a source kódban látni lehet.
A probléma azért igazán érdekes, mert a canonical link helyesen szerepel, a sitemap mégis rossz. Vagyis ez arra utal, hogy a sitemap generálás folyamatában lehet valami hiba.
Az adott termék ugyanis teljesen up-to-date. 2019. szeptember 11-én, azaz ma került frissítésre. De valami miatt nem a végső, canonical databaseből dolgozik a sitemap. És nagyon sok ilyen fura URL kombináció van. Hol kötőjel helyett alulvonás van. Máshol szövegrészek hiányoznak.
Jön a kérdés: a probléma lokális vagy globális?
Lokális vagy globális probléma?
Ehhez meg kell nézni a német anyacég sitemapjét, végigfuttatni rajta ugyanezt a folyamatot. Ha ott is vannak hibás, non-indexable URL-ek a sitemapben, akkor igen. Ha nincsenek, akkor lokális, magyar piac / sitemap problémáról van szó.
Verdict: a probléma globális. A német oldal esetében is ugyanez a helyzet.
Az About You több piacon is jelen van, tehát ennek a technikai problémának a javítása több országot is érintene. Részben ezért is érdemes megcsinálni. Részben pedig azért, mert ez így technikailag rossz. Ráadásul a termékek közel 10%-át érintő hibáról van szó.
Ez persze nem jelenti azt, hogy a Google a belső linkeken keresztül ne tudná crawlolni a helyes URL-eket. Mert tudja. De az ilyen típusú hibák pont jók arra, hogy összezavarják a botot és komolyabb kavarodásokat eredményezzenek. Nem nagy számban ugyan, de én láttam már példát erre.
UI: Ha valaki olvassa ezt a cikket az ABOUT YOU-tól, akkor kérlek továbbítsátok a fejlesztők felé. Köszi! 🙂
Tetszett a cikk? Szeretnél még több ilyet olvasni?
Akkor iratkozz fel és küldünk egy emailt, ha hasonló cikket írunk!
Hozzászólások
Moderáld magad – vagy mi fogunk. :)
Na jó, nem fogunk, szóval csak ésszel!