Blog Hogyan írj saját 404 hiba keresőt Google Sheetsben!
404 hiba - oldal nem található
írta:

Hogyan írj saját 404 hiba keresőt Google Sheetsben!

Ahogy egyre több online marketing eszköz kerül a piacra, úgy nő ezek használata is. Ma már szinte minden feladatra van legalább 5 eszköz, de még nagyon egyszerű feladatokra is találhatunk több megoldást. Egyik nap azon gondolkoztam, hogy kódolni kéne egy saját alkalmazást. Legyen az bármennyire primitív. Így alkottam meg néhány Javascript kódrészletből egy response code ellenőrzőt és saját 404-es hiba (oldal nem található) keresőt. Amit például broken link redirectekre lehet használni.

Script Editor

Első lépésként nyitottam egy Google Spreadsheetet, majd ott a Script Editort.

Itt két kódot hoztam létre. Az egyik a Status Code-ot adja vissza, a másik pedig törli a duplikált tartalmakat, url-eket majd a listámból.

Status Code kód

A kódrészlet így néz ki a gyakorlatban.

function getStatusCode(url){
   var options = {
     'muteHttpExceptions': true,
     'followRedirects': false
   };

   var response = UrlFetchApp.fetch(url, options);
   return response.getResponseCode();
}

Egyszerűen csak ezt kell bemásolni a Script Editorba.

Duplikált elemek törlése kód

Ez a kód törli a duplikált tartalmakat a sheetből. Erre alapból nincs szükség a status code ellenőrzéséhez. Nekem is csak azért kell, mert ebben az esetben hivatkozások (backlinkek) státuszát akarom ellenőrizni. És itt elég egy linket egyszer ellenőrizni, nem kell ugyanannak a linknek az összes előfordulását lefuttatni. Ezért az ismétlődéseket érdemes kiszűrni.

Backlinkek letöltése

Ezt követően fel kell tölteni valamilyen URL információval a Sheetet. Olyan URL-eket kell megadni, amit elemezni szeretnénk. Ez lehet a jelenlegi összes URL a weboldalaról, összes URL a webodalad egy régi verziójáról (pl https migráció előttről), régi cikkek amiket elmentettél, vagy akár egy weboldalra beérkező hivatkozások is. Én ez utóbbit válaszottam.

Ebben a lépésben Majestic SEO-ból az MKB Bank hivatkozásait töltöttem le. (De persze erre lehet használni Ahrefst, SEMRusht vagy MOZ-t is.)

mkb bank linkek

1506 indexelt backlinket másoltam be a Spreadsheetbe, futtattam rajta a duplikált url-ek kiszűrését (Run) a megírt scripttel. Így 192 egyedi URL-t kaptam.

404 hiba (oldal nem található)

Majd megírtam a Status Code-ot behívó függvényt. Simán csak a korábbi kódban definiált =getStatusCode() függvényt kell használni.

Ezt követően pedig bemásoltam a függvényt a B oszlop többi sorába és megkaptam mindegyik URL-hez a Response Code-ot.

200-as kódot kapnak azok, amikkel minden ok. 301-et amiket végelegesen átirányítottak, 307-et amit ideiglenesen áthelyeztek. 404 hiba pedig ott jelenik meg, ahol az oldal nem található.

Utolsó lépésként egy szűrővel (Filter) rászűrtem a 404-es hibakódokra.

Ezek azok a backlinkek, amik megszűnt oldalra mutatnak.

192 egyedi linkből 35 volt hibás. Ez 18,2%-os hibaarány. Ez elképesztően magas. Szinte minden 5-ik backlinkje hibás az MKB-nak.

Így néz ki egy konkrét 404 hibaoldal az MKB esetében.

404-es hibaoldal

Ez jellemzően akkor fordul elő, amikor valamilyen CMS migráció történik, új weboldalt készítenek és ezzel megváltozik az URL struktúra. De ezt a változás nem kezelik le megfelelő redirectekkel a fejlesztők. Ez egy meglepően gyakran előforduló és visszatérő hiba. Közepes és nagy cégeknél is.

Ezeket az URL-eket vagy updatelni vagy redirectelni kell, hogy a link equityt (link juicet) visszaszerezzük. Az updatelés itt azt jelenti, hogy a linkelő oldalon módosítani, módosíttatni kell a helyes linkre a rosszat. A redirect pedig egy sima átirányítást jelöl.

Ezt a 404-es hibaoldal keresést persze meg lehet csinálni Screaming Froggal, vagy bármilyen más status code ellenőrzővel. De néha jól esik látni és érteni, hogy mikor mi történik egy-egy eszközben. Sőt, akár létre is hozni a sajátunkat, pár sor kód megírásával.

Erre tökéletes volt ez a feladat.

Illetve magát a 404 hibakeresést érdemes 1-2 havonta újra és újra elvégezni. Ilyenkor pedig az összes oldalt ugyanabba a dokumentumba szoktam belerakni, csak egy másik tab-ra. Így évekre visszamenőleg látni lehet, hogy mennyi 404 hiba volt az oldalon. Ez abban segíthet sokat, hogyha van állandóan visszatérő problémaforrás (pl megszűnik egy termék, kifut, de nem irányítja át a rendszer automatikusan), akkor rendszer szinten lehet erre megoldást találni egy idő után és nem manuálisan kell mindig megcsinálni.

HTTPS migráció

Ez a megoldás egyébként hasznos lehet egy https migráció sikerességének tesztelésére is.

Itt az alábbi lépéseket kell tenni:

  1. Migráció előtt listázd az összes http oldalt
  2. Végezd el a migrációt
  3. Redirecteld a http-t https-re
  4. Ellenőrizd, hogy az összes http oldal 301 redirectet ad-e
  5. Ha a fenti script 404-et dob valahol, biztosan elrontottál valamit

A Google Scriptek egyébként kifejezetten hasznosak a napi szintű munkában. Nagyon sok workflowt lehet velük automatizálni, vagy csak megkönnyíteni. Esetleg ellenőrizni. Legyen szó egy-egy microtaskról, vagy visszatérő feladatokról. Korábban itt írtam a kedvenc Google SEO Scriptjeimről:

Itt pedig megtalálod a hozzá tartozó képzést is:

seo script vásárlás


Hozzászolások

Moderáld magad – vagy mi fogunk. :)
Na jó, nem fogunk, szóval csak ésszel!