Cele mai căutate cuvinte din dicționarul explicativ al limbii române
 
În ciuda aparențelor, jobul la SEOlium nu presupune doar să stai de dimineață până seara cu nasul în site-urile clienților, să studiezi SEO, sau să creezi strategii de promovare. Da, noi facem și asta, dar mai jucăm darts, facem schimb de cunoștințe sau pur și simplu – vreo nebunie. Cam așa ne-a și venit ideea să studiem ce cuvinte din Dicționarul Explicativ al limbii române sunt căutate de către români pe Google.
Home Blog Analiza rezultatelor Google pentru cele mai căutate cuvinte din DEX
Limba română, DEX 2009
Pentru analiza noastră, în prima etapă, am ales doar lista simplă a cuvintelor-titlu din DEX 2009.


DEX
2009
65290 de cuvinte, grupate după literă


Distribuția numărului de cuvinte din limba română, grupate după literă
În total, cuvintele din DEX însumează 540955 de litere (243139 vocale și 297816 consoane), având în medie o lungime de 8.29 litere. Printre cele mai lungi cuvinte se numără electroglotospectrografie (25), electroencefalografie (21), științifico-fantastic (20), pseudohermafroditism (20), imprescriptibilitate (20) și multe altele. Cele mai scurte cuvinte sunt foarte scurte: ac, an, dă, ie, im, in, iq, iz, om, os, ou, ro, șa, ud, uz, za, zi, ex, fa, ol, ax, cv, ia, ir, oi, ut etc.
În următoarea etapă scopul a fost să aflăm care cuvinte sunt mai des căutate și care generează cel mai bun rezultat. Pentru obținerea acestora, am utilizat instrumente oficiale de la Google, care este cel mai accesat și relevant motor de căutare în România.
  • Planificatorul de cuvinte cheie Google Ads – pentru estimarea volumului lunar de căutări al fiecărui cuvânt din DEX. Altfel zis, acest tool răspunde la întrebarea: de câte ori caută într-o lună românul cuvinte precum „casă”, „masă”, „carte”, „marte”?
  • Motorul de căutare Google – pentru căutarea propriu-zisă. Am verificat și stocat în baza noastră de date primele 5 pagini cu rezultate Google pentru fiecare cuvânt din dicționar 🙂
Pentru a ne eficientiza lucrul, am recurs la ajutorul a doi programatori, pentru care demersurile de acest fel sunt ca o bere vineri seara. Așa a luat naștere un serviciu numit Google Rank Tracker – program capabil să proceseze cele 65290 de cuvinte în 2 timpi și 3 mișcări – iar rezultatul îl vedeți mai jos.
Rezultatele căutărilor Google pentru fiecare cuvânt din DEX
Cele mai căutate cuvinte pe Google
Acum că avem toate datele, tot ce rămâne este să ne jucăm un pic. Pentru fiecare dintre cele 65290 de cuvinte din dicționarul explicativ al limbii române, versiunea 2009, am făcut două operații:
  1. Estimarea volumului lunar de căutări în Google
  2. Căutarea Google și stocarea primelor 5 pagini cu rezultate
Am obținut: 1048576 rezultate Google, care aparțin la 241046 site-uri web diferite. În tabelul de mai jos, cu 2 foi de calcul: Cuvinte și Domenii Web, sunt inserate valorile obținute și alte metrici drăguțe. În tabul Cuvinte sunt indicate toate cuvintele din DEX împreună cu numărul de căutări în Google (valoarea medie estimată pe lună). Este, însă, important să precizăm că uneori Google grupează cuvintele cu o formă asemănătoare, și contorizează doar suma tuturor căutărilor. De exemplu „transla”, „translare”, „trasator” se referă mai mult ca sigur la „translate”, iar Google oferă un rezultat comun. Există, deci, câteva excepții, dar au și ele dreptul la viață. Tabul Domenii Web este ceva mai interesant. Aici avem 7 metrici diferite care arată gradul de succes sau eșec al unui site în Google, pe diferite dimensiuni.
  • AveragePosition – poziția medie în Google (1 este foarte bine, 51 – foarte prost)
  • Visibility – vizibilitatea unui site în Google, practic – câți oameni dintr-o sută au văzut acest site între rezultatele căutărilor
  • KeywordCount – pentru câte cuvinte cheie apare un site în Google, din cele 65290
  • PageCount – cu câte pagini rankează un site în Google
  • Top1 – câte cuvinte cheie sunt pe primul loc
  • Top3 – câte cuvinte cheie sunt în primele 3 poziții Google
  • Top10 – câte cuvinte cheie sunt pe prima pagină
Dintre cele 241046 de site-uri care apar în Google – am ales să afișăm doar primele 10 mii, sortate descrescător după poziția lor medie. Celelalte site-uri au mai multe zerouri decât unități; ne puteți contacta pentru a vă trimite datele complete, utile în caz că doriți să faceți un studiu mai avansat.
Acestea sunt date publice și oficiale furnizate gratuit de Google. Credem că fiecare ar trebui să se joace puțin cu tabelul de mai sus (să caute cuvinte, să filtreze, sorteze etc.) și să-și facă propriile concluzii cu privire la caracterul „online” al românilor, după cum bine zice o zicală strămoșească „Spune-mi ce cauți pe internet și-ți voi spune cine ești”. Așadar, ne-am convins că românilor le place să fie informați, iar sursa principală o reprezintă probabil site-urile străine, motiv pentru care cam unul din trei români folosește serviciul Google Translate (cuvintele translare, translate, traduceri fiind căutate de peste 7 milioane de ori în fiecare lună). De asemenea, observăm că și prognoza meteo este o informație de interes. Circa unul din 4 români nu iese din casă fără să se informeze în prealabil despre starea vremii. Este plăcut faptul că românii sunt un popor interesat de știri. Haideți să vedem și domeniile care ne interesează cel mai mult. Presa galbenă este în capul clasamentului, un milion de căutări existând pe cuvântul „libertatea”. „Cancan”, „horoscop” și „ziar” iau medalii de argint, cu 823000 de căutări fiecare. Conform statisticii oferite de Google, comun pentru noi este și dragostea pentru sport. Nu-l practicăm atât de mult pe cât citim știri sportive, privim meciuri și ne interesează cele mai importante evenimente sportive. Cuvântul „sport” înregistrează 673000 de căutări în fiecare lună. Totuși interesul față de sport nu se oprește aici. O mare parte dintre români preferă să parieze pe evenimentele sportive, motiv pentru care în top regăsim multe căutări care se referă la domeniul pariurilor și site-uri de specialitate (jocuri, fortuna). Românii mai caută pe net și informații despre plăceri nevinovate precum muzică, firme de haine (Stradivarius), restaurante sau sex. De exemplu, cuvântul „muzică” generează 246 000 căutări. Fiind un popor atras de casă și pământ, regăsim în căutări cuvinte care se referă la mobilier pentru casă ori mașini și instrumente agricole. Cuvântul „tractor”, de exemplu, este căutat de 301 000 de ori. Dorința de a păstra datinile strămoșești este demonstrată și de căutarea abundentă a colindelor pe Google. Aproximativ de 50 000 de căutări înregistrează termenul „colind”, „colindă”, „colindat”.
Rezultatele din Google, agregate pe site-uri
Acum că am aflat ce se caută pe Google, haideți să vedem ce surprize ne ascund rezultatele motorului de căutare. Datele analizate sunt cele din tabul Domenii Web. Din cele 7 metrici, PozițiaMedie și Vizibilitatea ne arată site-urile care domină pentru majoritatea cuvintelor analizate. Celelalte ne arată potențialul site-urilor. E spectaculos faptul că cele mai multe pagini care apar între rezultatele căutărilor aparțin site-ului Google, anume – 161747, aproape de două ori mai multe decât Dexonline.ro. Totuși – anume Dexonline.ro apare mai mereu pe primele poziții. Mai mult decât atât – pentru 49961 din totalul celor 65290 de cuvinte, Dexonline este chiar pe primul loc, motiv pentru care putem spune cu încredere că acesta domină categoric piața online a definițiilor cuvintelor românești 🙂 Mai jos am încercat să prezentăm datele pe înțelesul tuturor, adică – grafic. Barele verticale arată primele 20 de domenii după proeminență (vizibilitate), iar pie chartul arată distribuția tuturor celor 1048576 de rezultate Google pe TLDuri (domenii de nivel superior: .ro, org, .com etc.).
Distribuția domeniilor după vizibilitate
Observăm că dicționarele, enciclopediile și resurse lingvistice domină căutările (dexonline.ro, wikipedia.org, archeus.ro, reverso.net și altele.) Găsim totuși și magazine online sau panouri de anunțuri (Emag și OLX), dar și giganți ai internetului, site-uri internaționale populare precum YouTube, Facebook sau Google. Printre lideri se numără și site-urile locale de informare: a1.ro, cancan.ro, libertatea.ro, csid.ro. Și fiindcă tot am analizat un dicționar întreg de cuvinte, haideți să vedem și cum se bat dicționarele între ele pentru un loc sub soare.
Distribuția vizibilității între dicționare
Într-un final – menționăm că pentru astfel de analize nu există sfârșit, dar noi trebuie să ne oprim aici. Altfel poți să sapi și să tot sapi și să nu mai dai de capăt. Mereu descoperi mereu ceva nou, sau ceva interesant. Pentru studiul nostru am ales doar lista simplă a cuvintelor-titlu din DEX, dar „lista de cuvinte” e un concept destul de fluid, în funcție de ce vrem să includem: nume proprii, termeni argotici, jargon obscur din diverse domenii de activitate, variante regionale, cu sau fără declinări și conjugări etc.