Blog Sitemap hiba az ABOUT YOU oldalán – mini tech seo esettanulmány
aboutyou.hu sitemap hiba
Írta:

Sitemap hiba az ABOUT YOU oldalán – mini tech seo esettanulmány

Nagyot ment az elmúlt hetekben az ABOUT YOU nevű online ruhabolt bevezető kampánya. Nagyjából a csapból is ők folytak. Plakátok, influencerek, online hirdetések. Bárhova néztél, ott voltak.

Nem volt ez másként velem sem. Reggelente a 9-es buszon ülve több plakátjukba én is belefutottam. Aztán amikor kiderült, hogy ez online ruhashop, akkor tudtam, hogy sokan a weboldal felé veszik az irányt.

Csak míg mások shoppingolni mentek az ABOUT YOU-ra, én tech SEO kutatásra készültem.

A többiek a termékeket nézegették. Én meg a robots.txt-t meg a sitemapet. Mások az árakat hasonlították össze, én meg a site crawl-okat. Mindenki olyan boldog lehetett, mint a lány ezen a lenti képen. Én legalábbis az voltam. 😀

aboutyou.hu landing page

Egy-két napos elemzés után elmondható, hogy az About You weboldala tök jól van összerakva tech SEO oldalon. Ez persze nem jelenti azt, hogy ne lenne rajta egy-két hiba, de a legfőbb dolgok tényleg szépen vannak implementálva.

Igazából egy dolgot találtam, amit biztosan javítani kéne, ez pedig nem más mint a sitemap.

Sitemap probléma

Maga a sitemap (webhelytérkép) egy dokumentum vagy oldal, amely tartalmazza az adott webhely összes oldalát és dokumentumát.

A szokásos helyén nem találtam (https://www.aboutyou.hu/sitemap.xml) és ez az üzenet fogadott:

404 page

Mondtam is magamnak:

Jawoll, schade. Unglücklich.

De aztán a robots.txt-ből könnyen megtaláltam a helyes sitemapet: https://www.aboutyou.hu/robots.txt

Nem kellett különösebben nyomozni, ott volt az utolsó sorban.

aboutyou.hu sitemap

Úgyhogy neki is álltam és végigpörgettem.

Sitemap index

Itt több sitemap van becsomagolva egy ún. sitemap-indexbe. Első ránézésre minden oké is. Jó a formátum technikailag. Ma frissült is.

aboutyou sitemap index

Sitemap crawl

De amikor elkezdtem az egyes sitemap-ekben található URL-eket megnézni, akkor egy érdekes dologra bukkantam.

Csináltam egy 10 ezer URL-es mintavételt és itt 919 URL nem 200-as response kódot dobott vissza. Ami egyben azt is jelenti, hogy ezek non-indexable URL-ek.

Ez az URL-ek több mint 9%-a, ami rengeteg. Emellett van két URL is a sitemapben, ami 404-es hibát dob.

A sitemapek technikai felépítésének egyik fontos feltétele, hogy abban csak canonical URL-ek szerepelhetnek.

screaming frog aboutyou crawl

Vagyis nem lehet benne sem 301, sem 302 (vagy bármilyen 3xx), sem 404, sem 410 (vagy bármilyen 4xx) sem 500-as (vagy bármilyen 5xx) hibakód sem. Ez ugyanis hibás jelzést küld a Google számára.

Elsőre nem teljesen egyértelmű mi a gond, mert azok az URL-ek, amik 302-vel irányítanak át, azoknál az átirányított URL-nél helyesen van megadva a canonical verzió.

Itt egy konkrét példa:

Az alábbi URL szerepel a sitemapben:

  • (1) https://www.aboutyou.hu/p/for-love-i-lemons/koktelruhak-iris-hi-lo-4273344
  • de ez 302-es átirányítással ide visz
  • (2) https://www.aboutyou.hu/p/for-love-lemons/koktelruhak-iris-hi-lo-4273344

Vagyis szimplán csak egy -i- résszel rövidebb az URL. Igen ám, de az első link non-indexable. A (2) link már indexable és az is a canonical verzió, ahogy azt a source kódban látni lehet.

canonical link

A probléma azért igazán érdekes, mert a canonical link helyesen szerepel, a sitemap mégis rossz. Vagyis ez arra utal, hogy a sitemap generálás folyamatában lehet valami hiba.

Az adott termék ugyanis teljesen up-to-date. 2019. szeptember 11-én, azaz ma került frissítésre. De valami miatt nem a végső, canonical databaseből dolgozik a sitemap. És nagyon sok ilyen fura URL kombináció van. Hol kötőjel helyett alulvonás van. Máshol szövegrészek hiányoznak.

Jön a kérdés: a probléma lokális vagy globális?

Lokális vagy globális probléma?

Ehhez meg kell nézni a német anyacég sitemapjét, végigfuttatni rajta ugyanezt a folyamatot. Ha ott is vannak hibás, non-indexable URL-ek a sitemapben, akkor igen. Ha nincsenek, akkor lokális, magyar piac / sitemap problémáról van szó.

Verdict: a probléma globális. A német oldal esetében is ugyanez a helyzet.

Az About You több piacon is jelen van, tehát ennek a technikai problémának a javítása több országot is érintene. Részben ezért is érdemes megcsinálni. Részben pedig azért, mert ez így technikailag rossz. Ráadásul a termékek közel 10%-át érintő hibáról van szó.

Ez persze nem jelenti azt, hogy a Google a belső linkeken keresztül ne tudná crawlolni a helyes URL-eket. Mert tudja. De az ilyen típusú hibák pont jók arra, hogy összezavarják a botot és komolyabb kavarodásokat eredményezzenek. Nem nagy számban ugyan, de én láttam már példát erre.

UI: Ha valaki olvassa ezt a cikket az ABOUT YOU-tól, akkor kérlek továbbítsátok a fejlesztők felé. Köszi! 🙂

 


Hozzászólások

Moderáld magad – vagy mi fogunk. :)
Na jó, nem fogunk, szóval csak ésszel!