
Magyar STOP words lista
Amikor keresőoptimalizálás során szövegeket elemzünk, akkor gyakran kerülnek elő haszontalan szavak, kifejezések. Ennek részben az az oka, hogy a legtöbb SEO eszköz nem magyar nyelvre készült, ezért nincsenek kiszűrve a programokban. Van ahol erre nincs is lehetőség. Van, ahol erre azért odafigyeltek.
Klasszikus példa a TF-IDF elemzés során, hogy a magyar nyelvű szövegeknél névelők, jelzők, igék és általános kifejezések is előbukkannak. Ezeknek viszont SEO szempontból kevés hasznuk és relevanciájuk van.
Mi az a „stop word”?
A gyakorlatban ez az adott nyelven leggyakrabban használt szavakat jelenti.
Keresőmotoroknál például a „melyik a legjobb SEO platform” kifejezés esetében az algoritmus másképp priorizálja a „melyik, legjobb, a” szavakat, mint a „SEO platform” szókapcsolatot: ha ez nem így lenne, a találati lista tele lenne a „melyik, legjobb, a” szavakra erős tartalmakkal, aminek lehet, semmi köze nincs SEO platformokhoz. Pedig a keresési szándék alapján a felhasználó egyértelműen SEO platformokra kíváncsi, ha a „melyik a legjobb SEO platform” kifejezést üti be a keresőbe.
A magyar neten Hugyecz Gyuri oldalán a tutorial.hu-n van fent egy jó lista 2010-ből, amiből érdemes kiindulni.
https://www.tutorial.hu/egyeb/hungarian-stop-words/
Ezt viszont érdemes kiegészíteni még olyanokkal, mint a „jog fenntartva” vagy épp az „adatkezelési nyilatkozat”, amely szavak nagyjából minden hazai weboldalon megtalálhatóak.
- 2020
- a
- abban
- ad
- adatvédelmi nyilatkozat
- ahhoz
- ahogy
- ahol
- aki
- akik
- akkor
- alá
- alatt
- által
- Általában
- amely
- amelyek
- amelyekben
- amelyeket
- amelyet
- amelynek
- ami
- amíg
- amikor
- amit
- amolyan
- amúgy
- annak
- arra
- arról
- át
- az
- azért
- azok
- azon
- azonban
- azt
- aztán
- azután
- azzal
- bár
- be
- belül
- benne
- cikk
- cikkek
- cikkeket
- csak
- de
- e
- ebben
- eddig
- egész
- egy
- egyéb
- egyes
- egyetlen
- egyik
- egyre
- ehhez
- ekkor
- el
- elég
- ellen
- elő
- először
- előtt
- első
- emilyen
- én
- ennek
- éppen
- erre
- es
- és
- ez
- ezek
- ezen
- ezért
- ezt
- ezzel
- fel
- feladva
- felé
- főleg
- ha
- hanem
- hát
- hello
- helyett
- hiszen
- hogy
- hogyan
- hozzászólás
- hozzászólások
- ide
- ide
- igen
- így
- ill
- ill.
- illetve
- ilyen
- ilyenkor
- is
- ismét
- ison
- itt
- jó
- jobban
- jog fenntartva
- jól
- kategória
- kell
- kellett
- keressünk
- keresztül
- ki
- kívül
- komment
- között
- közül
- le
- legalább
- legyen
- lehet
- lehetett
- lenne
- lenni
- lesz
- lett
- maga
- magát
- majd
- már
- más
- másik
- meg
- még
- mellett
- mely
- melyek
- mert
- mi
- miért
- míg
- mikor
- milyen
- minden
- mindenki
- mindent
- mindig
- mint
- mintha
- mit
- mivel
- most
- nagy
- nagyobb
- nagyon
- ne
- néha
- néhány
- nekem
- neki
- nélkül
- nem
- nincs
- ő
- oda
- ők
- oka
- őket
- olyan
- ön
- os
- össze
- ott
- pedig
- persze
- rá
- s
- saját
- sem
- semmi
- soha
- sok
- sokat
- sokkal
- száma
- számára
- szemben
- szerint
- szerintem
- szerző
- szét
- szia
- szinte
- talán
- te
- tehát
- teljes
- ti
- több
- tovább
- továbbá
- üdv
- úgy
- ugyanis
- új
- újabb
- újra
- után
- utána
- utolsó
- vagy
- vagyis
- vagyok
- valaki
- valami
- valamint
- való
- van
- vannak
- vele
- vissza
- viszont
- volna
- volt
- volt
- voltak
- voltam
- voltunk
Website Auditor
Hol lesz ez hasznos? Például a Website Auditorban jön jól TF-IDF elemzésnél.
Ha az angol listát kiegészíted a saját magyar listáddal, akkor sokkal gyorsabban és hatékonyabban lehet átnézni a TF-IDF eredményeket. Itt arra érdemes figyelni, hogy olyan szavakat ne rakj fel a listára, ami egyes iparágakban fontos kifejezésnek számítanak (pl a „nyilakozat” szó fontos lehet jogi szövegeknél, ezért az „adatvédelmi nyilatkozat”-tól ne így próbálj megszabadulni).
Tetszett a cikk? Szeretnél még több ilyet olvasni?
Akkor iratkozz fel és küldünk egy emailt, ha hasonló cikket írunk!
Hozzászólások
Moderáld magad – vagy mi fogunk. :)
Na jó, nem fogunk, szóval csak ésszel!