Blog Miért támadják olyan sokan Brian Dean legutóbbi SEO esettanulmányát?
Brian Dean esettanulmány
Írta:

Miért támadják olyan sokan Brian Dean legutóbbi SEO esettanulmányát?

Nagyjából 1 hete jelent meg Brian Dean legújabb SEO esettanulmánya, ami viszonylag nagy vitát váltott ki a szakmában. Hozzáteszem, szerintem egyébként jogosan. Mindamellett, hogy én rengeteget tanultam Brian Deantől az évek során, ezzel a tanulmányával, pontosabban annak végkövetkeztetésével én se értek egyet több ponton sem. Maga a tanulmány egyébként nagyon érdekes és jól dolgokat tartalmaz. De pár dolog félrement benne.

A tanulmány háttere

Brian Dean 2020. április 28-án publikálta legújabb cikkét a blogján, ahol 11.8 millió Google találatot elemeztek és megnézték, hogy ezek milyen korrelációt mutatnak különböző mutatókkal.

Brian Dean SEO cikk

A cikkel kapcsolatban egy tweetet is kirakott, ahol összefoglalta a fő tanulságokat. És részben ez okozta a legnagyobb felháborodást. Ezeket főként Twitteren és iparági fórumokban lehet olvasni.

SEO esettanulmány

A felháborodás oka és mértéke kettős:

  • A SEO közösség a Twitteren a legerősebb a világon, tehát ha valaki itt jelenít meg egy ellentmondásos üzenetet, akkor tálcán kínálja a lehetőséget, hogy “megtalálják”
  • A cikk fő pontjai röviden és ezzel együtt elnagyoltan lettek megfogalmazva.

Ez a két tényező pedig elég volt ahhoz, hogy két részre essen a szakma. Van aki szerint ez a cikk nagyon jó. Van, aki pedig azt írta, hogy inkább káros. De mégis mi az igazság?

Azt tudni kell első lépésként, hogy ez az esettanulmány egy korrelációs elemzés. És itt jön az első és legfontosabb üzenet:

A korreláció nem feltétlenül jelent ok-okozati összefüggést.

Vegyük a klasszikus példát:

  • a 4 évszak közül nyáron van a legtöbb vízbefulladás Magyarországon
  • a 4 évszak közül nyáron esszük a legtöbb fagylaltot
  • tehát ez alapján a vízbefulladás és a fagylaltfogyasztás között pozitív korreláció van

De ez nem azt jelenti, hogy az emberek azért fulladnak vízbe, mert közben fagyit esznek. A korreláció még nem jelent tehát automatikusan ok-okozati összefüggést.

És ebből a szempontból problémás az összes ilyen “correlation study”. Lehet ilyeneket csinálni, viszont fontos megválasztani, hogy milyen korrelációkat nézünk, azok a mutatók mennyire függetlenek stb.

Ebből a szempontból Brian Dean tanulmánya már alapból hátrányból indít, mert teljesen jogos kritika ezekkel a tanulmányokkal kapcsolatban, hogy “Jó-jó, értjük az összefüggést. De ez nem jelent még ok-okozati viszonyt!”

A probléma ugyanis több rétű:

  • akik kevésbé tapasztaltak SEO téren a cikk elolvasása után rossz következtetéseket vonnak majd le
  • egyrészt ok-okozatként értelmeznek majd korrelációkat
  • másrészt ezeket utána tényként kezelik a saját munkájuk és a szakértőkkel való munka során
  • maga a tanulmány sok téren nem mozdítja előre a SEO szakmát, mert nem tartalmaz “actionable” tanácsot

Ennek ellenére van sok előnye és tanulsága is. Nézzük meg a cikk állításait általánosan, majd részletesen.

A kutatás következtetései

A tanulmány szerint fontos SEO faktorok (mert erős, pozitív a korreláció van a rangsorral):

  • Ahrefs Domain Rating (DR)
  • Rövid URL (Short URL)
  • Oldal hitelessége (Page authority)
  • Átfogó tartalom (Comprehensive content)
  • Linkek száma (Backlinks)

Ami a tanulmány szerint nem fontos faktor:

  • Schema markup használata
  • Oldalsebesség (Site speed)
  • Szavak száma (Word count)
  • Kulcsszó használata a címben (Title tags)

És akkor itt most térjünk is rá, hogy milyen problémák vannak tételesen ezzel az esettanulmánnyal.

A problémák

Ahrefs Domain Rating használata

A tanulmányban az Ahrefs Domain Rating mutatóját használták korreláció tesztelésére.

domain rating korreláció

A DR (Domain Rating) egy privát cég saját mutatója. Nem Google által fejlesztett szám, és nincs is általuk hitelesítve. A Domain Rating egy származtatott mutató, amit az Ahrefs nevű SEO cég fejleszt évek óta és azt mérti 0-100-as skálán, hogy egy domain mennyire hiteles. Gyakorlatilag ugyanazt próbálja mérni mint a MOZ által készített Domain Authority (DA) mutató.

Mi a gond ennek a használatával? Hogy maga a változó is úgy került létrehozásra, hogy visszaigazolja melyik domain hitelesebb, melyik kevésbé. Ezzel pedig próbálják modellezni a Google keresések során elfoglalt pozíciót. Vagyis a DR értéke jellemzően annál magasabb, minél hitelesebb egy oldal. És minél hitelesebb egy oldal, annál nagyobb az esélye, hogy top pozícióban lesz egy-egy keresésre.

Vagyis maga a mutató már természeténél fogva korrelál a Google rangsorral. Hisz pont ezért hozták létre!

Korrelációt általában nem illik egy olyan mutatóval magyarázni, aminek pont az célja, hogy pozitívan korreláljon. Nem beszélve arról, hogy a DR érték főként linkek mennyisége és minősége alapján áll elő. A fontos faktorok között pedig egyszerre szerepel a linkek száma (backlinks) és a DR (Domain Rating) is. Vagyis egyszer megjelenik a nyers szám (linkek száma), majd utána egy ebből képzett mutató (DR), ami már inkább tekinthető függő változónak. De majd a statisztikához nálam jobban értők kommentben kijavítják, ha nem így van.

Ugyanez igaz a Page Authority esetében is, ami nem domain szintű Ahrefs mutató, hanem konkrét URL-re vonatkozik. De ez szintén a linkekből táplálkozik. Tehát nem független változó.

Vagyis a 3 fontos (important) faktor közül 3 igazából ugyanaz. Mert ezek mind link alapú mutatók:

  • Csak van közte nyers adat (linkek száma)
  • URL-re vonatkozó származtatott link mutató (Page Authority)
  • domainre vonatkozó származtatott link mutató (Domain Authority)

Oldalbetöltési sebesség mutatója

Az oldalbetöltési sebességhez az Alexa domain speed-et használták. Nem mondom, hogy nem lehet ezt használni, de hogy iparági szinten nem ez a benchmark, az biztos. Bátran lehetett volna használni a Google hivatalos oldalbetöltési adatait, főleg ha már Google korrelációs tanulmányt készítenek.

Itt nyilván az okozta a problémát, hogy több mint 10 millió oldal adatait összegyűjteni nagyon sok munka. És az Alexatól könnyebb / olcsóbb volt ezeket begyűjteni.

11.8 milliós URL minta

Elsőre nagyon soknak tűnhet 11.8 millió URL, amit elemeztek. Itt fontos, hogy URL-ekről van szó és nem kulcsszavakról. Hogy ez most sok vagy kevés? Ha jó a mintavétel, akkor sok. Ha nem, akkor kevés.

Tegyük fel, hogy a hazai piacon akarok egy ilyet csinálni: ha csak az Emag, Index és HVG URL-jeit nézem meg, akkor máris kész vagyok ezzel a kb 10 millió URL-lel. Reprezentatív lesz a minta? Nagyon nem. De a “mennyiség” az megvan.

A jó egyébként az, hogy magát a kutatás háttéranyagát elérhetővé tették itt:

https://frontpagedata.com/projects/backlinko/rankings/4_final-report.html

Ebből azért kiderült, hogy bár 11.8 millió URL-ről volt szó, de ez 1.18 millió kulcsszót jelent. Hogy ez sok vagy kevés?

Én amikor a 23 ezres hazai webshop esettanulmányt csináltam, akkor csak a top10-ben szereplő kulcsszavak száma 1.19 millió volt. Ez nem azt jelenti, hogy az én kutatásom jobb lenne persze. Csak azt kell látni, hogy egy nagy szám még nem jelenti azt, hogy a tanulmány kellően széles körű.

És ezzel együtt jön elő egy másik probléma is: nem tudni hogy pontosan milyen területeket és iparágakat vizsgáltak. És szinte biztos, hogy csak angol nyelvű találatokat néztek. Azt pedig évek óta tudni lehet, hogy bár van egy Google core algoritmus, ezt nem minden nyelvre egy időben terjesztik ki. És vannak olyan országok, ahol más a rangsorolási faktorok ereje és súlya. Ezért egy angol adatbázison elvégzett kutatás nem biztos, hogy reprezentatív mondjuk magyar nyelven. Ezt egyébként én nem rónám fel konkrét hibának, de mint probléma azért meg kell említeni.

Rossz üzenetek

Aki kevésbé jártas SEO téren és mondjuk a számokat se szereti annyira, főleg nem korrelációk formájában, azok valószínűleg a cikk fő következtetéseit olvassák majd el. És ebből vonják majd le a tanulságokat. Ha pedig valaki csak ezt teszi, akkor súlyos károkat okozhat magának és az iparágnak is.

Ha elővesszük, hogy mi szerepelt a tweet-ben mint “nem fontos” keresőoptimalizálási szempont, akkor ezeket kapjuk.

Brian Dean nem fontos seo szempontok

Aki csak ennyit olvas, az mit mondhat?

  • “A strukturált adat nem fontos.” De, fontos. Főleg webáruházak vagy épp fizikai eseményeket szervező cégek esetében, ahol megjelenik az időpont, az ár, az árukészlet, az értékelések stb.
  • “Az oldalbetöltési sebesség nem fontos.” De az. Abban lehet igazság, hogy a site speed nem egy kritikusan fontos faktor a SEO rangsor során. Itt az a nem hivatalos álláspont, hogyha minden faktor azonos két oldal között (pl linkek és tartalom), akkor a site speed dönthet, hogy melyik van előrébb vagy hátrébb. Viszont másodlagos hatása biztosan nagyon erős, mert a lassan betöltő oldalnak rosszabb a konverziója. Ezzel pedig rengeteg pénzt lehet veszíteni. Szóval szigorúan SEO téren a site speednél arra kell törekedni, hogy a versenytársaknál legyünk picivel jobbak. Nem kell 100-as site speedeket produkálni. De a többi versenytárs 60-70-es szintet hoz, akkor mi is célozzuk meg a 70+ kategóriát. És ne 42-t teljesítsen az oldal a pagespeed teszten.
  • “A szavak száma nem számít”. Ezzel látatlanban nehéz vitatkozni, de ami az én álláspontom: ha rajtad kívül mindenki más 2000 szavas blogposzttal szerepel a top 10-ben, akkor nem hiszem hogy Te egy 150 szavas cikkel meg tudod őket előzni. A szavak számát én a top 10 találat átlagából és mediánjából szoktam levonni. Azt a nagyságrendet érdemes megcélozni. Ebből a szempontból a szavak száma szerintem igenis lényeges, de tényleg nem ez a legkritikusabb szempont.
  • “A cím (title tag) optimalizálása nem fontos”. Itt a tanulmány azt mutatta ki, hogy azok az oldalak, akiknél a címben benne volt a kulcsszó, azok nem feltétlenül szerepeltek jobban, mint akinél nem volt benne. A title tag szerintem a legfontosabb tartalmi SEO faktor, legalábbis a magyar piacon ez jött ki egy korábbi tesztemből. Angol piacon ezek hatása egyre kisebb, de továbbra is fontos elem.

Igazából úgy lehet ezt jól megfogalmazni, hogy linkek szempontjából minél inkább kompetitív egy piac, annál kisebb hatása van a cím optimalizálásának. Ha egy piacon kevés a link, kevesen hivatkozzák a top találatokat, akkor ott nagyon sokat számít a jó tartalmi SEO. De minél több a link (pl kompetitív angol tranzakciós kifejezések esetében), annál kisebb a title tag optimalizálás hatása.

Ezek a megállapítások így kiragadva azért veszélyesek, mert tévútra vihetnek sokakat. És előjönnek majd a “Brian Dean azt írta, hogy…” kezdetű érvelések. A szakértők és hozzáértők pedig hiába próbálják elmagyarázni, hogy de a cikk nem erről szól, nem ez az üzenet, ez sokak számára nem lesz kellően megnyugtató. Ez a nagy veszélye sok esettanulmánynak is, főleg ha csak kivonatolva jelenik meg a lényeg például Twitteren.

Egy fontos faktorról még nem esett szó, ez pedig a rövid URL használata.

Tegyük fel a kérdést így?

A rövid URL tényleg fontos SEO faktor lenne? Szerintem nem.

De tegyük fel a kérdést másként?

Miért használ valaki rövid URL-t? Mert mondjuk tartalmilag optimalizálja a cikket és odafigyel az URL-re is. És nem hagyja, hogy a címből automatikusan generált hosszú URL jelenjen meg.

Nézzünk erre egy-egy konkrét példát.

1. Title és URL is rövid

  • Title: Tartalmi optimalizálás
  • URL: /tartalmi-optimalizalas

2. Title hosszú, de az URL rövid

  • Title: A tartalmi optimalizálás 10 szabálya: így kell jó SEO cikket írni
  • URL: /tartalmi-optimalizalas

Vagyis itt, amit érdemes lenne vizsgálni, hogy milyen a title karakterszáma és az URL karakterszáma.

  • Ha megegyezik a title karakterszáma az URL számmal, akkor az URL azért rövid, mert a title is rövid.
  • Ha a title hosszú, de az URL rövid, akkor azt valószínűleg manuálisan módosították. Tehát a cikket optimalizálták! Tehát nem hagyták, hogy ez legyen az URL /a-tartalmi-optimalizalas-10-szabalya-igy-kell-jo-seo-cikket-irni

Tehát a rövid URL szerintem azért korrelál a SEO pozícióval, mert azokat a cikkeket optimalizálták. Az ok-okozati összefüggés tehát nem a rövid URL, hanem a tartalmi optimalizálás. Ezért pusztán a rövid URL-t kiemelni mint fontos SEO faktor, az szerintem hiba.

Ami jó benne

A hibák ellenére ez egy az esettanulmány alapvetően egyébként jó.

  • Az egyik, hanem a legnagyobb korrelációs esettanulmány, ami valaha készült.
  • A metodológiát és az adatok nagy részét publikálták egy háttértanulmányban. Ezért visszakövethető, hogy honnan jönnek az adatok, miért azokat választották. Máshol ez azért ritka.
  • Bebizonyosodott, hogy angol nyelvterületen a linkek ereje továbbra is jelentős. De egyre csökken a tartalmi optimalizálás szerepe.
  • A cikk kiváló link mágnes, mert sokan hivatkozzák blogokon, hírportálokon, közösségi médiában.

Ha tippelnem kéne, akkor egyébként az egész tanulmány pontosan az utolsó szempont miatt készült. Hogy minél nagyobb olvasottságot és ezzel együtt minél több linket szerezzen. Ezt pedig hozta is. Viszont fent leírt okok miatt ezt szakmailag a 3 legrosszabb Brian Dean cikk közé teszem, amit valaha olvastam.

Fontos, hogy itt a SEO szakmai érvekre hivatkozok csak. A kutatásba sok energia ment, a design szép, letisztult, 41 új domainről 133 új hivatkozást gyűjtött már 1 hét alatt is, több ezer megosztásnál és kommentnél jár. Szóval csak a számok alapján ez egy sikeres tartalom.

De nem szabad elmenni azok mellett a szakmai hibák mellett, amiket a cikk nem kezel megfelelően.

Korrelációs tanulmányt írni SEO téren nagyon nehéz. Sőt, borzasztóan nehéz. Ez a többségnek nem is szokott sikerülni, és pusztán szakmai alapon szerintem Brian Deannek sem sikerült.

A tanulmány maga egyébként nem annyira rossz, mint a következtetései. Ez utóbbiak viszont bántóan általánosra sikerültek (főleg Twitteren) és rengeteg támadási felületet adtak. Teljesen jogosan.

Ha egy mondatban kellene összefoglalnoma lényeget, akkor:

Erre az esettanulmányak Brian Dean-nek volt szüksége, a SEO szakmának és közösségnek nem.

A kérdés, hogy megéri elolvasni a tanulmányt vagy sem?

  • Szerintem megéri elolvasni. Mert lehet belőle tanulni, főleg ha összeolvasod ezzel a véleménycikkel és a Twitter kommentekkel az ő eredeti tweetje alatt.
  • Viszont azzal óvatosan bánnék, hogy azonnali következtetéseket vonjak le a tanulmányból.

Ugyanis lehet, hogy a vizsgált minta alapján úgy tűnik, hogy például az oldalbetöltési sebesség vagy épp a title tag (cím) optimalizálása nem fontos. De egyébként az. És ha valaki csak a cikkből vagy a kivonatból rossz következtetéseket von le, akkor a tanulmány szerintem inkább árt, mint használ a SEO iparágnak.


Hozzászólások

Moderáld magad – vagy mi fogunk. :)
Na jó, nem fogunk, szóval csak ésszel!