Kirjeiden tiheys venäjäksi. Kirjainten käyttötiheys venäjän kielessä Mitkä kirjaimet löytyvät useimmin sanoista

Tiedetään, että painokoneen tai PC:n näppäimistön kirjainasettelu ei ole satunnainen, vaan se noudattaa tiettyjä sääntöjä. Näin ollen useimmin käytetyt kirjaimet sijaitsevat näppäimistön keskiosassa ja vähemmän yleiset reunoilla. Tiedetään myös, että vokaalia käytetään useammin kuin konsonantteja. Nämä tiedot saatiin erityisellä kaavalla Venäjän kielen kansallisessa aineistossa.

Yleisimmät vokaalit

Kummallista kyllä, kirjain "o" on johtava kirjoitetun puheen käyttöjen määrä sekä vokaalien että konsonanttien joukossa. Sitä seuraavat "a" ja "ja", ja sen jälkeen alkavat konsonantit. Asiantuntijoiden mukaan o-kirjaimen käyttötiheys on prosentin kymmenesosa, kun taas muiden vokaalien käyttötaajuus vaihtelee seitsemästä kahdeksaan prosentin sadasosaan.

Suosituimmat konsonantit

Yleisimmin käytetty konsonantti on "n". Lisäksi suurin määrä venäjän kielen sanoja alkaa kirjaimella "p". Vokaalien joukossa "o" on johtava tässä suhteessa.

Venäjän puheen harvinaisin konsonantti on kirjain "f", jota käytetään vieraista kielistä tulevissa sanoissa sekä onomatopoeioissa, esimerkiksi "snort".

Tällaiset tilastot voivat olla hyödyllisiä tautogrammeja laadittaessa. Tämän sanapelin tarkoitus on luoda johdonmukainen tarina, jossa jokaisen sanan tulee alkaa samalla kirjaimella.

Venäjän kielen kirjaimien käyttötiheys

Tiesitkö, että jotkut aakkosten kirjaimet löytyvät sanoista useammin kuin toiset... Lisäksi vokaalien käyttötaajuus kielessä on suurempi kuin konsonanttien.

Mitkä venäjän aakkosten kirjaimet löytyvät useimmiten tai vähiten tekstin kirjoittamiseen käytetyistä sanoista?

Tilastot käsittelevät yleisten mallien tunnistamista ja tutkimista. Tämän tieteellisen suunnan avulla voit vastata yllä esitettyyn kysymykseen laskemalla venäjän aakkosten jokaisen kirjaimen numeron, käytetyt sanat ja valitsemalla otteen eri kirjoittajien teoksista. Omien etujensa vuoksi ja tylsyydestään tekemistä varten jokainen voi tehdä tämän itse. Viittaan jo tehdyn tutkimuksen tilastoihin...

Venäjän aakkoset kyrilliset. Olemassaolon aikana se koki useita uudistuksia, joiden seurauksena muodostui moderni venäläinen aakkosjärjestelmä, joka sisältää 33 kirjainta.

o – 9,28 %
a - 8,66 %
e – 8,10 %
ja -7,45 %
n – 6,35 %
t – 6,30 %
p – 5,53 %
s – 5,45 %
l - 4,32 %
sisään - 4,19 %
k – 3,47 %
n – 3,35 %
m – 3,29 %
v - 2,90 %
d – 2,56 %
I - 2,22 %
s – 2,11 %
b – 1,90 %
z – 1,81 %
b – 1,51 %
g – 1,41 %
th – 1,31 %
h – 1,27 %
yu - 1,03 %
x – 0,92 %
f – 0,78 %
paino - 0,77 %
c – 0,52 %
sch - 0,49 %
f – 0,40 %
e - 0,17 %
ъ – 0,04 %

Eniten käytetty venäläinen kirjain on vokaali " NOIN", kuten täällä on jo aivan oikein ehdotettu. On myös tyypillisiä esimerkkejä, kuten " PUOLUSTUS"(7 kappaletta yhdellä sanalla, eikä mitään eksoottista tai yllättävää; hyvin yleistä venäjän kielellä). Kirjaimen "O" suuri suosio selittyy suurelta osin sellaisella kielioppiilmiöllä kuin täysi vokaali. Toisin sanoen "kylmä" "kylmän" sijasta ja "pakkara" "vaahdon" sijaan.

Ja aivan sanojen alussa löytyy useimmiten konsonanttikirjain "". P" Tämä johtajuus on myös itsevarma ja ehdoton. Todennäköisesti selityksen tarjoaa suuri määrä etuliitteitä, jotka alkavat kirjaimella "P": pere-, pre-, pre-, pri-, pro- ja muut.

Kirjainten käyttötiheys on kryptausanalyysin perusta.

Kirjoitin hauskan PHP-skriptin. Ajoin kaikki Spectatorin tekstit sen läpi tarkistaakseni kielen. Kaikkiaan teksteissä käytetään 39 110 eri sanamuotoa. Kuinka monta erilaista tarkalleen? sanat- melko vaikea määrittää. Päästäkseni ainakin jotenkin lähemmäksi tätä lukua, otin vain sanan 5 ensimmäistä kirjainta ja vertasin niitä. Tuloksena oli 14 373 tällaista yhdistelmää. Olisi venyvää kutsua tätä "katsoja"-sanastoksi.

Sitten otin sanat ja tutkin niiden kirjainten toistotiheyttä. Ihannetapauksessa sinun on otettava jonkinlainen sanakirja kuvan täydentämiseksi. Et voi ajaa tekstejä, tarvitset vain ainutlaatuisia sanoja. Tekstissä jotkut sanat toistuvat useammin kuin toiset. Joten saatiin seuraavat tulokset:

o - 9,28 %
a - 8,66 %
e - 8,10 %
ja -7,45 %
n - 6,35 %
t - 6,30 %
p - 5,53 %
s - 5,45 %
l - 4,32 %
sisään - 4,19 %
k - 3,47 %
n - 3,35 %
m - 3,29 %
v - 2,90 %
d - 2,56 %
I - 2,22 %
s - 2,11 %
b - 1,90 %
z - 1,81 %
b - 1,51 %
g - 1,41 %
th - 1,31 %
h - 1,27 %
yu - 1,03 %
x - 0,92 %
f - 0,78 %
paino - 0,77 %
c - 0,52 %
sch - 0,49 %
f - 0,40 %
e - 0,17 %
ъ - 0,04 %

Suosittelen niitä, jotka menevät "Ihmeiden kentälle", opettelemaan ulkoa tämä taulukko. Ja nimeä sanat tässä järjestyksessä. Joten esimerkiksi näyttää siltä, ​​​​että tällaista "tuttua" kirjainta "b" käytetään harvemmin kuin "harvinaista" kirjainta "s". Meidän on myös muistettava, että sanassa on enemmän kuin yksi vokaali. Ja jos arvasit yhden vokaalin, sinun on alettava seurata konsonantteja. Ja lisäksi sana arvataan tarkasti sen konsonanttien perusteella. Vertaa: "**a**i*e" ja "sr*vn*t*". Molemmissa tapauksissa sana on "vertaa".

Ja vielä yksi huomio. Kuinka opit englantia? Muistaa? E kynä, e lyijykynä, e pöytä. Se mitä näen, on se, mistä laulan. Mitä järkeä?.. Kuinka usein sanot sanan "lyijykynä" normaalielämässä? Jos tehtävänä on opettaa puhumaan mahdollisimman nopeasti ja tehokkaasti, sinun on opetettava vastaavasti. Analysoimme kieltä ja korostamme yleisimmin käytetyt sanat. Ja alamme oppia heiltä. Enemmän tai vähemmän puhua englantia, vain puolitoista tuhatta sanaa riittää.

Toinen hemmottelua: muodostaa sanoja kirjaimista satunnaisesti, mutta ottaen huomioon esiintymistiheys, jotta se näyttää normaaleista sanoista. Ensimmäisessä kymmenessä "satunnaisessa" nelikirjaimassa sanassa "aasi" ilmestyi. Seuraavassa viidessäkymmenessä - sanat "ryntää" ja "NATO". Mutta valitettavasti on olemassa monia dissonanttisia yhdistelmiä, kuten "bltt" tai "nrro".

Siksi - seuraava askel. Jaoin kaikki sanat kahden kirjaimen yhdistelmiin ja aloin yhdistää niitä satunnaisesti (mutta ottaen huomioon toistotiheyden). Suurissa määrissä teräs tuottaa sanoja, jotka ovat samankaltaisia ​​kuin "normaali". Esimerkiksi: "koivdiot", "voabma", "apy", "depoid", "debyako", "orfa", "poesnavy", "ozza", "chenya", "retoria", "urdeed", "utoichi" , "stikh", "sapot", "gravda", "ababap", "obarto", "eleuet", "lyarezy", "myni", "bromomer" ja jopa "todebyst".

Mihin hakea... vaihtoehtoja on. Kirjoita esimerkiksi kauniiden merkkituotteiden, leikkisä nimien generaattori. Jogurteille. Kuten "memoliso" tai "utororerto". Tai - futurististen runojen generaattori "Burliuk-php": "opeldiy miaton, linoaz okmiaya... deesopen odesson."

Ja on vielä yksi vaihtoehto. Pitää kokeilla...

Jotkut tilastot venäjän sanojen käytöstä:

  • Sanan keskimääräinen pituus on 5,28 merkkiä.
  • Keskimääräinen lauseen pituus on 10,38 sanaa.
  • 1000 yleisintä lemmaa kattavat 64,0708 % tekstistä.
  • Vuoden 2000 yleisimmät lemmat kattavat 71,9521 % tekstistä.
  • 3000 yleisintä lemmaa kattavat 76,5104 % tekstistä.
  • 5000 yleisintä lemmaa kattavat 82,0604 % tekstistä.

Muistiinpanon jälkeen sain tämän kirjeen:


Hei Dmitry!

Analysoituaan artikkelin ”Kieli vie sinut Kiovaan” ja sen osan, jossa kuvailet ohjelmaasi, syntyi idea.
Kirjoittamasi käsikirjoitus näyttää minusta olevan tarkoitettu ehdottomasti ei "Ihmeiden kentälle" suuremmassa määrin, vaan johonkin muuhun.
Ensimmäinen järkevin käyttö skriptisi tulosten avulla on kirjainten järjestyksen määrittäminen mobiililaitteiden painikkeiden ohjelmoinnissa. Kyllä, kyllä ​​- kaikkea tätä tarvitaan matkapuhelimissa.

Jaoin sen aaltoina ()

Seuraava on jakauma painikkeilla:
1. Kaikki ensimmäisen aallon kirjaimet siirtyvät 4 painikkeeseen ensimmäisellä rivillä
2. Kaikki toisen aallon kirjaimet ovat myös saman ensimmäisen rivin lopuilla 4 painikkeella
3. Kaikki kolmannen aallon kirjaimet menevät kahdelle jäljellä olevalle painikkeelle
4. 4,5 ja 6 aaltoa menevät toiselle riville
5. 7,8,9 aaltoa menee kolmannelle riville ja 9. aalto menee kokonaan (huolimatta näennäisen suuresta kirjainten määrästä) 9. painikkeen kolmanteen riviin, joten 10. painike jää kaikenlaisille välimerkeille merkit (piste, pilkku jne.).

Mielestäni kaikki on selvää sellaisenaan, ilman yksityiskohtaisia ​​selityksiä. Voisitko kuitenkin käsitellä skriptilläsi (mukaan lukien välimerkit) seuraavat tekstit:

Ja julkaise sitten tilastot? Minusta se näytti? että tekstit heijastavat mahdollisimman paljon nykyaikaista puhettamme, mutta silti puhumme ja kirjoitamme tekstiviestejä.

Kiitos paljon etukäteen.

Joten on kaksi tapaa analysoida kirjainten toistotiheyttä. Menetelmä 1. Ota teksti, etsi siitä ainutlaatuisia (ei-toistuvia) sanamuotoja ja analysoi niitä. Menetelmä on hyvä tilastojen rakentamiseen venäjän kielen sanojen, ei tekstien, perusteella. Menetelmä 2. Älä etsi tekstistä ainutlaatuisia sanoja, vaan siirry suoraan kirjainten toistotiheyden laskemiseen. Saamme kirjainten tiheyden venäjän tekstissä, emme venäläisissä sanoissa. Luodaksesi näppäimistöjä ja muita asioita, sinun on käytettävä täsmälleen tätä menetelmää: tekstit kirjoitetaan näppäimistöllä.

Näppäimistöjen tulee ottaa huomioon kirjainten tiheyden lisäksi myös pysyvimmät sanat (sanamuodot). Ei ole niin vaikea arvata, mitkä sanat ovat yleisimmin käytettyjä: nämä ovat ensinnäkin virallinen puheenosat, koska niiden tehtävänä on palvella aina ja kaikkialla, ja pronominit, joiden rooli ei ole vähemmän tärkeä: korvata mikä tahansa asia/henkilö puheessa (tämä, hän, hän). No, tärkeimmät verbit (olla, sanoa). Yllä lueteltujen tekstien analyysin tulosten perusteella sain seuraavat "suositut" sanat: "ja, ei, tuossa, hän, minä, on, kanssa, hän, miten, mutta, hänen, tämä, to , a, kaikki, hän, oli, niin, sitten, sanoi, sillä, sinä, oi, at, hän, minä, vain, sillä, minä, kyllä, sinä, alkaen, oli, milloin, alkaen, varten, vielä, nyt , he sanoivat, jo, hän, ei, oli, hänen, olla, no, eikä, jos, ei mitään, täällä, hän itse, niin että, itselleen, tämä, ehkä, tuo, ennen, me, he, oliko, oliko, on kuin tai, hän" ja niin edelleen.

Palatakseni näppäimistöihin, on selvää, että näppäimistössä kirjainyhdistelmien "ei", "mitä", "hän", "on" ja muut tulisi olla mahdollisimman lähellä toisiaan tai jos eivät lähekkäin, niin jossain optimaalisessa tapa. On tarpeen tehdä tutkimusta siitä, miten sormet liikkuvat tarkalleen näppäimistön poikki, löytää "mukavimmat" asennot ja sijoittaa niihin yleisimmin käytetyt kirjaimet, unohtamatta kuitenkaan kirjainyhdistelmiä.

Ongelma on, kuten aina, yksi: vaikka olisi mahdollista luoda ainutlaatuinen näppäimistö, mitä tapahtuu miljoonille ihmisille, jotka ovat jo tottuneet qwerty/ytsukeniin?

Mitä tulee mobiililaitteisiin... Luultavasti siinä on järkeä. Ainakin kirjainten "o", "a", "e" ja "i" on oltava täsmälleen samassa näppäimessä. Välimerkit käyttötiheyden järjestyksessä: , . - ? ! "; :)(

Katso näppäimistösi "F"- ja "J"-näppäimiä ja näet pieniä vihjeitä. Tämä on oppaamme kosketuskirjoituksen maailmaan.

Kun aloin opiskelemaan kosketuskirjoitusta, kohtasin tunteen, että ulkoasussamme oli jotain vialla. Asia oli ristiriidassa venäjän kielen kirjainten esiintymistiheyden ja niiden sijainnin välillä näppäimistöllä.

Mikä on mielestäsi yleisin venäjän kielen kirjain? Ja jos olisit "Ihmeiden kentällä", minkä kirjaimen nimeäisit ensin? Yleisin kirjain on "O" ja vähiten yleinen on "F". Ei ole yhtään alkuperäistä venäläistä sanaa, joka alkaa kirjaimella "F".

Tässä on taulukko kirjaimien todennäköisyysjakaumasta venäläisissä teksteissä:

Todennäköisyys

Todennäköisyys

Todennäköisyys

Todennäköisyys

Kirjain "F" löytyy 45 kertaa vähemmän kuin "O", mutta se on samassa kätevässä paikassa kuin "O". Kuka oli henkilö, joka otti tämän standardin käyttöön? Löydät vastauksen tähän kysymykseen artikkelista Pilkun tragedia: "... ajattele, pilkku löytyy paljon useammin kuin piste, ja silti pilkku sijaitsee isoilla kirjaimilla. Tätä ei löydy millään kielellä maailmassa paitsi Venäjällä...".

Katsottuasi taulukkoa voit olla vakuuttunut seuraavasta: sokeasti kirjoittamista varten et voi oppia kaikkien kirjainten sijaintia, vaan vain esimerkiksi 20 - niitä esiintyy yli 90 prosentissa tapauksista. En usko, että usein kirjoittava henkilö ei muista avainten sijaintia ja työskentelee katsomatta niitä. Kaikki on tottumiskysymys. Huomaa: kaikissa palveluissa, joissa paperityötä tehdään, käyttäjät katsovat näppäimistöä, vaikka kirjoittavatkin hyvin nopeasti.

Mutta ymmärsin layoutia tehdessäni todennäköisyys on otettu huomioon. Vain se on suunniteltu niille... jotka kirjoittamalla etsiessään näppäimistöllä!!!

On helppo huomata, että kaikki yleisimmin kohdatut kirjaimet sijaitsevat näkölinjassa ja harvemmin kohdatut sijoittuvat reunalle.

Englanninkielisellä asettelulla tilanne on hieman huonompi:

Ohjelmat kosketuskirjoitukseen. Niitä on monia, voit katsoa arvosteluja osoitteessa http://www.urikor.net. Valitsin Solon ja Staminan. Päätin aloittaa Solosta. Se osoittautui maksetuksi, mutta esittely oli saatavilla. Suorittaaksesi 1! kirjoitusharjoitus 2 merkkiä tarvitaan lukea yli 10 sivua - eräänlainen "simulaattori" nopeaan lukemiseen.

Ja he eivät päästä sinua eteenpäin, ennen kuin olet lukenut kaiken ja täytät standardin. Olin melkein poistamassa ohjelmaa, kun sain Solon verkkosivuilta kirjeen, jossa he olivat kiinnostuneita edistymisestäni. Kirje oli pitkä, ja ajattelin: "Hyvin tehty, he oppivat kirjoittamaan nopeasti ja kirjoittamaan pitkiä kirjeitä kaikille."

Mutta tutkittuani kirjeen huolellisesti tajusin, että sen oli kirjoittanut vastaajarobotti, vaikka sen oli allekirjoittanut henkilö. Nyt ymmärrän, miksi kyselyssä minulta kysyttiin niin paljon kiinnostuksen kohteistani ja hiusten väristäni. Poistin yksin.

Itse työskentelin Stamina-ohjelman parissa. Se on tehty sielulla! Sinun ei tarvitse edes työskennellä ohjelman kanssa, vaan lataa se vain viitteeksi. Tämä on hauskin viittaus!


Kuinka muistin avaimet.
Opit "fyva" ja "oldzh" nopeasti. Kirjain jokaiselle sormelle. Yhteensä jo 8! En opettanut niitä Staminessa, vaan http://www.urikor.net-sivuston ohjelmassa. Ja sitten muistin itse liikkeet. Monilla ihmisillä on esimerkiksi vaikeuksia "i"-kirjaimen kanssa oppiessaan kosketuskirjoitusta. Asetettuani sormeni "fyva" ja "olj" päälle, jotta voin painaa "i" -näppäintä, minun on käännettävä oikean etusormeni täysi kierros.

Tällä kierrolla voin painaa vain "ja"-näppäintä. Jokaiselle sormelle muistin seuraavat liikkeet: "p" - vasen etusormi vasemmalle, "k" - ylös, "e" - ylös ja oikealle jne.

Ongelmia: koska asettelua ei ole optimoitu kosketuskirjoitusta varten, on käynyt ilmi, että samanlaiset kirjaimet ovat peilikuvia toisistaan, nämä ovat näppäimet "a" ja "o", "k" ja "g". Ja mikä vielä mielenkiintoista: etusormille annetaan harjoituksia samanaikaisesti!, eli He opettavat "a" ja "o", "e" ja "n", "p" ja "r" samaan aikaan.

Minun mielestäni tämä on väärä - aivoissa esiintyy sekavuutta. Ainakin olen välillä hämmentynyt. Kun opit kosketuskirjoitusta, ajattele liikkeitä - silloin on vaikea oppia uudelleen. Muuten, joillakin naisilla on ongelmia näppäimistön kanssa työskentelyssä; pitkien kynsiensä vuoksi he painavat muita näppäimiä.

Ja kun olin oppinut kaiken ja päättänyt kirjoittaa sokeasti, tuli seuraava vaihe - "laiskuutta". Joka päivä piti kirjoittaa paljon ja koska kurkistamisen nopeus on suurempi, kurkistin koko ajan. Parin kuukauden kuluttua voitin itseni ja teippasi sen Kaikki avaimet ovat tarroja videokaseteista.

Huomio: Jos et teippaa avaimia, tapa voittaa sinut. Kun työskentelen näppäimistöillä, joissa kirjaimet ovat näkyvissä, minulla on houkutus kurkistaa. Nyt ei ole paluuta ja tämä on ensimmäinen täysin sokeasti kirjoitettu artikkeli.

Miksi tarvitsen sitä. Toistaiseksi tunnen syvän tyytyväisyyden tunnetta. Nopeus on edelleen hieman pienempi kuin kurkistamalla ja virheitä on edelleen, mutta jo tätä artikkelia kirjoittaessani huomasin kuinka nopeus kasvaa ja joskus unohdan itseni, ja sitten katson - se on painettu. Tuntuu kuin tietoisuus poistaisi lohkoja.

On mielenkiintoista seurata, kuinka opit itse, koska et tule kokemaan sellaista uudelleen. Nyt aion opetella soittamaan pianoa. Luulen jopa osaavani pelata (!), minun tarvitsee vain Muista.

P.S.
Vuosi on kulunut. Kirjoitan vain koskettamalla ja suurella nopeudella. Jos työskentelet tietokoneella, muista oppia kosketuskirjoitus. Se on helpompaa kuin luulet.
Tässä on lyhyt muistiinpano Inna Igolkinalta siitä, kuinka hän oppi kirjoittamaan touch-touch.

Tiesitkö, että jotkut aakkosten kirjaimet löytyvät sanoista useammin kuin toiset... Lisäksi vokaalien käyttötaajuus kielessä on suurempi kuin konsonanttien.

Mitkä venäjän aakkosten kirjaimet löytyvät useimmiten tai vähiten tekstin kirjoittamiseen käytetyistä sanoista?

Tilastot käsittelevät yleisten mallien tunnistamista ja tutkimista. Tämän tieteellisen suunnan avulla voit vastata yllä esitettyyn kysymykseen laskemalla venäjän aakkosten jokaisen kirjaimen numeron, käytetyt sanat ja valitsemalla otteen eri kirjoittajien teoksista. Omien etujensa vuoksi ja tylsyydestään tekemistä varten jokainen voi tehdä tämän itse. Viittaan jo tehdyn tutkimuksen tilastoihin...

Venäjän aakkoset kyrilliset. Olemassaolon aikana se koki useita uudistuksia, joiden seurauksena muodostui moderni venäläinen aakkosjärjestelmä, joka sisältää 33 kirjainta.

o – 9,28 %
a - 8,66 %
e – 8,10 %
ja -7,45 %
n – 6,35 %
t – 6,30 %
p – 5,53 %
s – 5,45 %
l - 4,32 %
sisään - 4,19 %
k – 3,47 %
n – 3,35 %
m – 3,29 %
v - 2,90 %
d – 2,56 %
I - 2,22 %
s – 2,11 %
b – 1,90 %
z – 1,81 %
b – 1,51 %
g – 1,41 %
th – 1,31 %
h – 1,27 %
yu - 1,03 %
x – 0,92 %
f – 0,78 %
paino - 0,77 %
c – 0,52 %
sch - 0,49 %
f – 0,40 %
e - 0,17 %
ъ – 0,04 %

Eniten käytetty venäläinen kirjain on vokaali " NOIN", kuten täällä on jo aivan oikein ehdotettu. On myös tyypillisiä esimerkkejä, kuten " PUOLUSTUS"(7 kappaletta yhdellä sanalla, eikä mitään eksoottista tai yllättävää; hyvin yleistä venäjän kielellä). Kirjaimen "O" suuri suosio selittyy suurelta osin sellaisella kielioppiilmiöllä kuin täysi vokaali. Toisin sanoen "kylmä" "kylmän" sijasta ja "pakkara" "vaahdon" sijaan.

Ja aivan sanojen alussa löytyy useimmiten konsonanttikirjain "". P" Tämä johtajuus on myös itsevarma ja ehdoton. Todennäköisesti selityksen tarjoaa suuri määrä etuliitteitä, jotka alkavat kirjaimella "P": pere-, pre-, pre-, pri-, pro- ja muut.

Kirjainten käyttötiheys on kryptausanalyysin perusta.