frissítve: 2024.06.02
A magyar stop words lista egyszerűen csak egy gyűjtés, mert szükségem volt SEO kapcsán egy magyar „stop words” állományra és a neten egy nagyobb, teljes anyagot nem találtam, így összegyűjtöttem magam. kerestem „magyar stop words”, „magyar stop szavak”, „stopwords” stb… vonalon, nem hozott megfelelő eredményt.
Papp Gábor is írt ezzel kapcsolatban egy cikket, hogy mire lehet használni (SEO, Website Auditor – TF-IDF elemzés), érdemes elolvasni: Magyar STOP words lista
Benne van a korábbi cikkben ( Keyword Statistics – wordpress plugin ) említett „stopwords.js” tartalma is.
Screaming Frog SEO Spider esetén a JS editorban (Custom Javascript Snippet Editor) az alábbi listát lehet használni (meg persze kiegészíteni tetszés szerint):
const stopWords = ["Ez","A","Az","állat","a","az","egy","be","ki","le","fel","meg","el","át","rá","ide","oda","szét","össze","vissza","de","hát","és","vagy","hogy","van","lesz","volt","csak","nem","igen","mint","én","te","õ","mi","ti","õk","ön","ide","volt","ő","ők","ahogy","ahol","aki","akik","akkor","alatt","által","Általában","amely","amelyek","amelyekben","amelyeket","amelyet","amelynek","ami","amit","amolyan","amíg","amikor","abban","ahhoz","annak","arra","arról","azok","azon","azt","azzal","azért","aztán","azután","azonban","bár","belül","benne","cikk","cikkek","cikkeket","e","eddig","egész","egyes","egyetlen","egyéb","egyik","egyre","ekkor","elég","ellen","elő","először","előtt","első","éppen","ebben","ehhez","emilyen","ennek","erre","ez","ezt","ezek","ezen","ezzel","ezért","felé","hanem","hiszen","hogyan","így","illetve","ill.","ill","ilyen","ilyenkor","ison","ismét","itt","jó","jól","jobban","kell","kellett","keresztül","keressünk","kívül","között","közül","legalább","lehet","lehetett","legyen","lenne","lenni","lett","maga","magát","majd","már","más","másik","még","mellett","mert","mely","melyek","mit","míg","miért","milyen","mikor","minden","mindent","mindenki","mindig","mintha","mivel","most","nagy","nagyobb","nagyon","ne","néha","nekem","neki","néhány","nélkül","nincs","olyan","ott","őket","pedig","persze","s","saját","sem","semmi","sok","sokat","sokkal","számára","szemben","szerint","szinte","talán","tehát","teljes","tovább","továbbá","több","úgy","ugyanis","új","újabb","újra","után","utána","utolsó","vagyis","valaki","valami","valamint","való","vagyok","vannak","voltam","voltak","voltunk","vele","viszont","volna","alá","ha","is","ad","2010","szerző","helyett","amúgy","főleg","os","es","szerintem","oka","hozzászólás","soha","hozzászólások","száma","kategória","feladva","komment","szia","hello","üdv","szeretettel","köszönöm","köszönjük","mindneki","mindenkinek","mindenkit","akár","azok","azoknak","magunk","magunkat","magunkra","magunkkal","veletek","velük","sajnos","magam","külön","lesz","felett","alatt","mellett","egyszerre","helló","ember","hol","velem","közepette","pont","esetleg","rólam","rólunk","pici","picivel","sziasztok","rám","rajtam","mind","http","www","köszi","kis","igy","szó","akit","evvel","bele","tőle","tőlem","tőlünk","tőletek","tőlük","com","valamit","valaminek","valamiért","jogi nyilatkozat","copyright","minden jog fenntartva","ászf","rss","impresszum","cikkek","2024","január","február","március","április","május","június","július","augusztus","szeptember","október","november","december","1","2","3","4","5","6","7","8","9","10","11","12","13","14","15","16","17","18","19","20","21","22","23","24","25","26","27","28","29","30","31","•","-"];
közel 300 stop words – magyarul
a az egy be ki le fel meg el át rá ide oda szét össze vissza de hát és vagy hogy van lesz volt csak nem igen mint én te õ mi ti õk ön ide volt ő ők ahogy ahol aki akik akkor alatt által Általában amely amelyek amelyekben amelyeket amelyet amelynek ami amit amolyan amíg amikor abban ahhoz annak arra arról azok azon azt azzal azért aztán azután azonban bár belül benne cikk cikkek cikkeket e eddig egész egyes egyetlen egyéb egyik egyre ekkor elég ellen elő először előtt első éppen ebben ehhez emilyen ennek erre ez ezt ezek ezen ezzel ezért felé hanem hiszen hogyan így illetve ill. ill ilyen ilyenkor ison ismét itt jó jól jobban kell kellett keresztül keressünk kívül között közül legalább lehet lehetett legyen lenne lenni lett maga magát majd már más másik még mellett mert mely melyek mit míg miért milyen mikor minden mindent mindenki mindig mintha mivel most nagy nagyobb nagyon ne néha nekem neki néhány nélkül nincs olyan ott őket pedig persze s saját sem semmi sok sokat sokkal számára szemben szerint szinte talán tehát teljes tovább továbbá több úgy ugyanis új újabb újra után utána utolsó vagyis valaki valami valamint való vagyok vannak voltam voltak voltunk vele viszont volna alá ha is ad 2010 szerző helyett amúgy főleg os es szerintem oka hozzászólás soha hozzászólások száma kategória feladva komment szia hello üdv szeretettel köszönöm köszönjük mindneki mindenkinek mindenkit akár azok azoknak magunk magunkat magunkra magunkkal veletek velük sajnos magam külön lesz felett alatt mellett egyszerre helló ember hol velem közepette pont esetleg rólam rólunk pici picivel sziasztok rám rajtam mind http www köszi kis igy szó akit evvel bele tőle tőlem tőlünk tőletek tőlük com valamit valaminek valamiért jogi nyilatkozat copyright minden jog fenntartva ászf rss impresszum
Használjátok belátásotok szerint. :)
Megjegyzés: a duplikátumok kiszűréséhez a Remove Duplicate Lines from Text site-t használtam, tényleg jó, merem ajánlani.
Mire is jó ez?:)
Nekem tegnap pl. egy olyan dolog miatt kellett, hogy SEO kapcsán szerettem volna a stop words szavakat megszűrve vizsgálni szövegstatokat.
Vagy pl. a belinkelt cikk wp pluginjéhez is felhasználható.
Nekem nem tűnt fel, hogy bármilyen hátránya lenne ezen szavak használatának. Egy cím, url vagy leírás akkor válik emberek számára értelmessé, ha ezeket is tartalmazza a szöveg. A Google pedig mindig is azt mondta, hogy embereknek és ne robotoknak írjunk. Én ehhez tartom magam :)
Gábor, írtam én valahol hogy ezeket ne használják a szövegezéskor? :P
Így írtam: csak egy vizsgálat miatt kellett, ennyi .. :) Mivel anno is téma volt egy másik bejegyzés kapcsán, most kiegészítve tettem ki a listát.
Az embereknek kell írni szerintem is a szöveget, max odafigyelni arra, hogy ha lehet, az barátságos legyen a google számára is.
Nem írtad, nem is értettem félre. Talán kissé eltértem a tárgytól, vagy inkább túl általánosan tekintek rá.
Én már szinte teljesen figyelmen kívül hagyom a Google-t, mivel az is egyre inkább fejlődik, és megérti a szöveget. Már nem bajlódom kulcsszavakkal, ami eszembe jut, azt írom le.
Szerintem az on-site seo már nagyon értelmét vesztette. Persze vannak még fontos dolgok, mint a belső linkek, meg a könnyű indexelhetőség, de már láttam nagyon rosszul optimizált oldalt elől a találati listán. Szerintem a klasszikus seo meghalt, vagy haldoklik, főleg mióta már a szociális hálózatok egyre nagyobb hangsúlyt kapnak.
Szóval nem kulcsszavazok, nem cserélgetek linkeket, nem katalógusozok. Szerintem a stop szavakból is mítosz lesz lassan.
Ezek nekem gyűltek, most hogy elkezdtem használni a Tieid;)
szerintem, szerint, oka, akar, hozzászólás, soha, hozzászólások, akar, száma, kategória, feladva, megjelent, megjelenik, komment, kommentelt, szia, hello, üdv
Gábor, nem értek veled egyet, de nem szeretnélek győzködni ebben a témában. :)
Prof, köszi a gyűjtést, kiegészítettem vele a listát!
na még egy adag ;)
szeretettel, köszönöm, köszönjük, mindneki, mindenkinek, mindenkit, akár, azok, azoknak, magunk, magunkat, magunkra, magunkkal, veletek, velük, sajnos, magam, külön, lesz, felett, alatt, mellett, emberek, egyszerre, helló, ember, hol, velem, közepette, pont, esetleg, rólam, rólunk, pici, picivel, sziasztok, rám, rajtam, mind, http, www, köszi, kis, igy, szó, akit, evvel, bele, tőle, tőlem, tőlünk, tőletek, tőlük, com, valamit, valaminek, valamiért
lehet majd küldöm a scriptet is ami tudja használni… már egész szépen kulcsszavaz:)
Köszi, azt hiszem ezt szinte a „végtelenségig” lehet majd így gyűjteni, jöhetnek :)
Ha megvan a gyűjtő script, azt is szívesen kitenném a lapra, köszi!