Nacionalistas - Tautininkas - Patriotas - Žygeivis - Laisvės karys (Kalba - Istorija - Tauta - Valstybė)
http://www.lndp.lt/diskusijos/

Ar žinote, kokie yra 10 pačių dažniausių lietuviškų žodžių? Koks yra dažniausias lietuviškas žodis?
http://www.lndp.lt/diskusijos/viewtopic.php?f=92&t=15054
Puslapis 11

Autorius:  Žygeivis [ 08 Vas 2023 00:26 ]
Pranešimo tema:  Ar žinote, kokie yra 10 pačių dažniausių lietuviškų žodžių? Koks yra dažniausias lietuviškas žodis?

Ar žinote, kokie yra 10 pačių dažniausių lietuviškų žodžių?


https://www.15min.lt/gyvenimas/naujiena ... 34-1168812

2019 07 13, 15:09
Ugnius Antanavičius Rubrikos AR ŽINAI redaktorius

Koks yra dažniausias lietuviškas žodis? O kokie yra 10 dažniausių lietuviškų žodžių, su kuriais mes susiduriame?

Į šį klausimą atsakyti nėra sunku. Vien rašant šią pastraipą, visi jie buvo pavartoti. Ir tai, kad taip padarėme, neturėtų stebinti.

Tai, kokie lietuviški žodžiai yra patys dažniausi, 2009 m. aprašė Vytauto Didžiojo universiteto mokslininkai.

Kaip jie tai ištyrė? Jie pasitelkė morfologiškai anotuotą tekstyną, kuris struktūra panašus į „Dabartinės lietuvių kalbos tekstyną“, taip pat sudarytą VDU.

Tačiau naudotas morfologiškai anotuotas tekstynas yra daug mažesnis – jį sudaro 790 tipiškiausių lietuvių kalbos tekstų, apimančių 4 rašytinės kalbos žanrus – mokslinę literatūrą, grožinę literatūrą, periodiką ir oficialius dokumentus. Drauge visus tekstus sudarė beveik milijonas žodžių.

Būtent juos visus išanalizavus ir suskaičiavus, koks žodis kiek kartų juose kartojasi, sudarytas lietuvių kalbos dažninis žodynas.

Paaiškėjo, kad dažniausias rašytinės lietuvių kalbos žodis – jungtukas „ir“.

O kokie yra 10 dažniausių lietuvių kalbos žodžių?

Dešimtuką matote žemiau.

Dar žemiau rasite informaciją, kiek kartų tekstyne pasikartojo tas žodis (arba jo formos – skirtingus to paties žodžio linksnius ir pan. žodynas traktuoja kaip tą patį žodį).

1. ir
2. jis
3. būti
4. tas
5. į
6. kad
7. aš
8. kuris
9. su
10. šis

Žodis „ir“ tekstyne pasikartojo 28 174 kartus, žodis „jis“ ir įvairios jo formos (jie, jo, jos ir t. t.) – 18 117 kartų, žodis „būti“ ir įvairios jo formos (buvo, yra, būtų ir t. t.) – 17 128 kartus, žodis „tas“ ir įvairios jo formos (ta, tie ir t. t.) – 8819 kartų, žodis „į“ – 8369 kartus, žodis „kad“ – 7487 kartus, žodis „aš“ ir įvairios jo formos (mūsų, mes, man ir t. t.) – 6522 kartus, žodis „kuris“ ir įvairios jo formos (kurie, kurio, kuriam ir pan.) – 5831 kartą, žodis „su“ – 5533 kartus, žodis „šis“ ir įvairios jo formos (šie, šios ir t. t.) – 5309 kartus.

Kokie dažniausi lietuviški daiktavardžiai?

Kaip matome, dažniausiai rašytinėje lietuvių kalboje sutinkami žodžiai , išskyrus „būti“, yra įvardžiai, jungtukai ir prielinksniai.

Tai suprantama – kalbant be šių žodžių išsiversti neįmanoma, jie daug universalesni negu daiktavardžiai ar veiksmažodžiai.

Tačiau kokie yra dažniausiai sutinkami kitų kalbos dalių žodžiai?

Žodynas pateikia atsakymą ir į šį klausimą.

5 lietuviškuose tekstuose dažniausiai sutinkami daiktavardžiai yra šie: darbas, žmogus, Lietuva, metai, laikas.

5 lietuviškuose tekstuose dažniausiai sutinkami veiksmažodžiai yra šie: būti, galėti, turėti, reikėti, nebūti.

5 lietuviškuose tekstuose dažniausiai sutinkami būdvardžiai yra šie: didelis, svarbus, naujas, geras, įvairus.

5 lietuviškuose tekstuose dažniausiai sutinkami prieveiksmiai yra šie: tik, labai, jau, dar, daug.

O jei skirtingas to paties žodžio formas laikysime skirtingais žodžiais?

Dažniausių lietuvių kalbos žodžių dešimtuką galima sudaryti ir kiek kitaip. Jei skirtingas to paties žodžio formas (pvz, jis ir ji), traktuojame kaip skirtingus žodžius, dešimtukas šiek tiek pasikeičia.

Tuomet jis atrodo taip:

1. ir
2. į
3. kad
4. yra
5. su
6. iš
7. o
8. ir
9. tai
10. buvo

Tai, kad „ir“ šiame sąraše yra dukart, nėra klaida: pirmąkart „ir“ į sąrašą pateko kaip jungtukas, antrąkart – kaip dalelytė.

„Ir“ kaip jungtukas tekstyne kartojasi 28 174 kartus, „į“ – 8369 kartus, „kad“ – 7487 kartus, „yra“ – 5621 kartą, „su“ – 5533 kartus, „iš“ – 5015 kartų, „o“ – 4816 kartų, „ir“ kaip dalelytė – 4539 kartus, „tai“ – 4178 kartus, „buvo“ – 3952 kartus.

Žodyno autoriai taip pat nustatė, kad daiktavardžiai sudaro 39,37 proc. tekstyno, veiksmažodžiai – 20,51 proc., įvardžiai – 8,71 proc., jungtukai – 7,62 proc., būdvardžiai – 7,33 proc., prieveiksmiai – 6,72 proc., prielinksniai – 4,65 proc., kitos kalbos dalys – po mažiau negu 2 proc.

Andriaus Utkos 2009 m. sudarytą dažninį rašytinės lietuvių kalbos žodyną, pagal kurį parengtas straipsnis, galite rasti čia:
http://donelaitis.vdu.lt/publikacijos/D ... odynas.pdf

Pirmąjį dažninį lietuvių kalbos žodyną dar 1977 m. sudarė Vida Žilinskienė, dirbusi su Vilniaus universitete buvusia skaičiavimo mašina „Minsk-22“.

Jau atkūrus Nepriklausomybę ji kartu su Laima Grumadiene parengė atnaujintą rašomosios lietuvių kalbos dažninį žodyną.

Puslapis 11 Visos datos yra UTC + 2 valandos [ DST ]
Powered by phpBB® Forum Software © phpBB Group
https://www.phpbb.com/