Puheen ymmärrettävyys. Puheen ymmärrettävyys ja sen mittausmenetelmät

Tällä hetkellä on kehitetty melko suuri määrä objektiivisia menetelmiä, joista tärkeimmät ovat: AI (artikulaatioindeksi) - artikulaatioindeksi; %ALcons (konsonanttien artikulaatiohäviön prosenttiosuus) - konsonanttien artikulaatiohäviön prosenttiosuus; STI (puheensiirtoindeksi) - puheensiirtoindeksi; RASTI (nopea puheensiirtoindeksi) - nopea puheensiirtoindeksi; SII (puheen ymmärrettävyysindeksi) - puheen ymmärrettävyysindeksi jne. (standardit ISO / TR-4870, ANSI S3.2, S3.5; IEC 268-16 jne.).

Pysähdymme niiden analyysiin yksityiskohtaisemmin tässä artikkelissa, koska nykyaikaisten puheen ymmärrettävyyden tietokoneavusteisten arviointimenetelmien käyttö on erittäin hyödyllistä työskennellessäsi äänisuunnittelijana studioissa sekä teatteri- ja konserttisaleissa (varsinkin jos äänenvahvistusjärjestelmä on asennettu niihin), sekä arvioitaessa puhesignaalien laatua lähetyksen aikana. radiolähetyskanavien, puhelimen, puheenkäännösjärjestelmien jne. kautta.

Objektiiviset menetelmät puheen ymmärrettävyyden arvioimiseksi

Useiden vuosien kokemus eri tarkoituksiin käytettävien salien suunnittelusta (luokkahuoneet, luentosalit, elokuvasalit, teatterisalit jne.) ja lukuisten tutkimusten tulokset ovat osoittaneet, että puheen ymmärrettävyyttä huoneessa määräävät seuraavat akustiset ominaisuudet:

Suoran puhesignaalin taso kaikissa salin kohdissa;

Ulkoisen ja sisäisen melun taso;

Jälkikaiunta-aika;

Heijastuneiden signaalien rakenne, taso ja saapumissuunta.

Samaan aikaan hyvän puheen ymmärrettävyyden saavuttamiseksi tarvitaan: riittävän korkea hyötysignaalin suhde kohinatasoon (äänitysstudioissa sen on vastattava NC-15-käyrää) (kuva 1) , lyhyt jälkikaiunta-aika (jopa 1,1 s) ja heijastusrakenne, jolle on tunnusomaista kaiun puuttuminen ja voimakkaiden varhaisten heijastusten läsnäolo ja vähän myöhäisiä heijastuksia.

Riisi. 1 Standardoidut NC-kohinakäyrät

Jälkikaiuntaprosessin vaikutus puhesignaalin rakenteeseen näkyy selvästi esimerkissä oskilogrammeista, jotka on tallennettu vaimennettuun kammioon ja huoneeseen, jossa on korkea jälkikaiuntaarvo (kuva 2). Luonnollisesti puhesignaalin ajallisen rakenteen tällaisella merkittävällä muutoksella sen tunnistusprosessi heikkenee merkittävästi.


Riisi. 2 Puheen aaltomuoto
kaiuttomassa kammiossa ja sisätiloissa

Nykyiset menetelmät ymmärrettävyyden objektiiviseen arviointiin liittyvät jossain määrin lueteltuihin akustisiin ominaisuuksiin. Lisäksi puheen ymmärrettävyyteen vaikuttavat äänenvahvistusjärjestelmän parametrit, jos se asennetaan saliin (kuva 3), mistä mainittiin jo artikkelin ensimmäisessä osassa.


Riisi. 3 äänenvahvistusjärjestelmän parametria,
vaikuttaa ymmärrettävyyteen

Objektiiviset luettavuuden arviointimenetelmät voidaan jakaa kahteen ryhmään.

Ensimmäinen additiivinen ryhmä perustuu olettamukseen, että tuloksena saatava puheen ymmärrettävyys määräytyy yksittäisten taajuuskaistojen osien summan perusteella, ja panoksen suuruus riippuu signaali-kohinasuhteesta kullakin kaistalla.

Tämä ryhmä sisältää useita menetelmiä.

1. AI - Artikulaatioindeksi.

Artikulaatioindeksin käyttöä ehdotti G. Fletcher Bell Telephone Laboratoriesissa (USA) vuonna 1940.

Ajatuksena on, että puhesignaalin koko taajuusalue on jaettu useisiin kaistoihin (yleensä 20), joiden sisällä signaali-kohinasuhde määritetään. Oletetaan, että jokainen taajuuskaista antaa oman itsenäisen panoksensa puheen ymmärrettävyyteen. Nauhojen leveys valitaan siten, että kunkin nauhan vaikutus tuloksena olevaan ymmärrettävyyteen on sama.

Jokaisella kaistalla signaali-kohinasuhde lasketaan, painotetaan ja lasketaan yhteen, jotta saadaan artikulaatioindeksi: AI = ∑AIj, missä AI on artikulaatioindeksi, 0
Riisi. 4 Ymmärrettävyyden välinen suhde
ja artikulaatioindeksi AI

AI-arvot alle 0,3 vastaavat huonoa luettavuutta; 0,3 - 0,5 - tyydyttävä; 0,5...0,7 - hyvä; yli 0,7 - erittäin hyvä. Artikulaatioindeksin ja sanan ymmärrettävyyden välinen suhde englanninkielisessä puheessa on esitetty kuvassa 4. Kuten määritelmästä seuraa, huoneen melutasolla on pääasiallinen vaikutus artikulaatioindeksin arvoon, esimerkkejä AI-arvojen jakautumisesta ​Yleisön eri kohdissa kuvassa 1 esitettyjä NC-50:tä ja NC-35:tä vastaavilla melutasoilla on esitetty kuvissa 5a ja 5b.



Riisi. 5 AI artikulaatioindeksijakauma
yleisön eri kohdissa
eri melutasoilla: a-NC-50; b-NC-35

Voidaan nähdä, että ensimmäisessä tapauksessa artikulaatioindeksin arvo putoaa kaiuttimen lähellä olevasta 0,93:sta (93 %) 0,18:aan (18 %) kaukaisessa kohdassa, toisin sanoen huoneen ymmärrettävyys alapuolella olevalla päävyöhykkeellä on huono. 0,7 (70 %). Toisessa tapauksessa tekoäly putoaa 93 %:sta 62 %:iin, huoneen pääalueella se ylittää 70 %, joten vain NC-35:n alapuolella oleva melutaso mahdollistaa hyväksyttävän puheen ymmärrettävyyden yleisössä ilman äänen vahvistusta.

On huomattava, että Venäjällä tämä menetelmä kehitettiin yksityiskohtaisesti M.A.:n teoksissa. Sapozhkov ja muut, sitä kutsuttiin "formantin ymmärrettävyyden menetelmäksi", kun taas sen määritysmenetelmä on saanut joitain muutoksia. Laskelmia varten puhesignaalin taajuuskaista on 150 ... 7000 Hz, koska melkein kaikki venäläisen puheen vokaalien ja konsonanttien formantit sijaitsevat tällä kaistalla. (Formanttien määritelmää taajuuskaistoiksi, joissa on akustiset energiamaksimit ja niiden sijainti taajuusalueella, on käsitelty tämän artikkelin aiemmissa osissa). Tämä kaista on jaettu 20 osakaistaan, joiden todennäköisyys formanttien esiintymiselle kussakin kaistassa on 0,05.


Riisi. 6.a. Kf-kertoimen määrittäminen

Kohinalla peittämisen seurauksena formanttien havaitsemisen todennäköisyys pienenee (ensisijaisesti konsonanttien, koska ne ovat tasoltaan matalampia) ja siten puheen ymmärrettävyyden taso. Kokonaisformanttien ymmärrettävyyskerroin määritellään myös seuraavasti: AI = ∑AIj, missä AIj = 0,05Kf. Kf-kerrointa kutsutaan formanttihavaintokertoimeksi (tai k-kaistan ymmärrettävyyskertoimeksi). Se määritellään seuraavasti: ero Ef keskimääräisen puhetason kullakin kaistalla Bp ja keskimääräisen kohinan ja häiriötason välillä samalla kaistalla Bsh lasketaan: Ef = Bp-Bsh. Jokaisella kaistalla saadusta Ef:n arvosta määritetään kertoimen Kf arvo kaaviosta (kuva 6a). Tästä lasketaan edellä olevan kaavan mukaisesti kullekin kaistalle kerroin AIj ja sitten formantin ymmärrettävyyden kokonaiskerroin (artikulaatioindeksi). Tämän kertoimen suhde venäjän puheen tavun ymmärrettävyyden arvoon on esitetty kuvassa 6b. Mielenkiintoista on, että lähes puolet formanttien ymmärrettävyydestä menetettyjen tavujen ymmärrettävyydestä on 80%, eli puheella on riittävä.


Riisi. 6.b. Tavujen välinen suhde
ymmärrettävyys ja artikulaatioindeksi AI
(venäläinen puhe)

Helppokäyttöisyydestä huolimatta artikulaatioindeksin laskentamenetelmällä on useita merkittäviä haittoja: se ottaa huomioon vain kohinan vaikutuksen ymmärrettävyyteen, eikä ota huomioon muiden tekijöiden vaikutusta (jälkikaiunta-aika, heijastusrakenne jne.). ). Siksi se soveltuu paremmin viestintäjärjestelmien ymmärrettävyyden arvioimiseen, ja arvioitaessa ymmärrettävyyttä huoneessa, jonka jälkikaiuntaaika Trev > 0,5 s, se ei anna kovin hyvää yhteensopivuutta subjektiivisten arvioiden kanssa. Tätä menetelmää pidetään vanhentuneena, ja nykyaikaisessa käytännössä käytetään pääasiassa muita kriteerejä.

2. SII - puheen ymmärrettävyysindeksi. Sitä ehdotettiin AI-menetelmän jatkokehityksessä ja jopa sisällytettiin amerikkalaiseen puheen ymmärrettävyyden arviointistandardiin ANSI S3.5-1997.

Standardi ehdottaa neljää mittausmenetelmää, joista jokainen käyttää erilaista määrää ja kokoa taajuuskaistoja alueella 150...8500 Hz:

Kriittiset juovat (21 nauhaa);

1/3 oktaavin kaistat (18 kaistaa);

Samanarvoiset kriittiset kaistat (17 kaistaa);

Oktaavinauhat (6 kaistaa).

Jokaisessa niistä lasketaan signaali-kohinasuhde ja lasketaan sitten kokonais-SII-kerroin, joka voi vaihdella välillä 0-1.

Koska tässä käytetään kriittisiä vyöhykkeitä (niistä on kirjoitettu aikaisemmissa psykoakustiikan artikkeleissa), menetelmä antaa hieman paremman korrelaation subjektiivisten tutkimusten kanssa. Aika-alueen vääristymien huomioimiseen liittyvät ongelmat (jälkikaiunta, kaiku jne.) ovat kuitenkin edelleen olemassa.

3. %ALcons - konsonanttien artikulaatiohäviön prosenttiosuus (konsonanttien artikulaatiohäviön prosenttiosuus).

Tämän menetelmän kehitti hollantilainen W. Puetz - hänen ensimmäinen artikkelinsa julkaistiin vuonna 1971 JAESissa. Sittemmin hän on julkaissut monia teoksia tällä alalla, vuonna 1984 hän kehitti algoritmin mittauksiin TEF-analysaattorilla. Ajatuksena on, että ymmärrettävyyden objektiivista arviointia varten lasketaan konsonanttien katoamisprosentti, jotka pohjimmiltaan määräävät puheen semanttisen sisällön. Mitä suurempi tämä prosenttiosuus, sitä huonompi puheen ymmärrettävyys huoneessa. Suurin sallittu arvo on 10 % (edellyttäen, että huone on suhteellisen vapaa peittävästä melusta). Koulutustarkoituksiin ja varoitusjärjestelmiin käytettävien tilojen osalta se ei saa ylittää 5 %.

Ensimmäinen Puetzin ehdottama kaava konsonanttien ALcons prosentuaalisen häviön laskemiseksi oli seuraava:

%ALcons= 200D2RT602(N)/VQM missä:

D on etäisyys äänilähteestä (kaiuttimesta, laulajasta tai kaiuttimesta) kaukaisimpaan kuuntelijaan, m;

RT60 - normaali jälkikaiuntaaika, s;

V - huoneen tilavuus, m3;

Q - lasketun pisteen äänilähteen suuntaustekijä;

M on korjauskerroin, joka ottaa huomioon erilaisten akustisten ja sähköakustisten vaikutusten vaikutuksen (yleensä yhtä suuri kuin yksi);

N on kerroin, joka ottaa huomioon useiden lähteiden käytön järjestelmässä.

Jos huoneen äänittämiseen käytetään useita emittereitä ja ne ovat kaikki samoja, niin N määritellään akustisten järjestelmien kokonaismäärän suhteeksi niiden järjestelmien lukumäärään, jotka tuottavat suoraa ääntä lasketussa pisteessä.

Kuten tästä kaavasta seuraa, se ottaa huomioon huoneen äänenvoimakkuuden vaikutuksen, etäisyyden äänilähteeseen, äänilähteiden suuntaavuuden, suoran energian suhteen kaiuntaan jne. Se tarkoittaa myös, että tason %ALcons = 10 % saavuttamiseksi jälkikaiunta-aika ei saa ylittää 1,1 s. On myös havaittu, että kaiuttimien tuottaman paineen tason lisääminen johtaa parempaan ymmärrettävyyteen, kunnes signaalitaso saavuttaa +25 dB suhteessa taustamelutasoon. Paineen tason (säteilytetyn akustisen tehon) lisääminen, toisin kuin tavanomaiset ideat, ei vaikuta ymmärrettävyyden asteeseen, koska tämä johtaa sekä suorien että hajaäänien tason nousuun.

Tätä menetelmää käytetään laajasti käytännössä (etenkin Yhdysvalloissa), sen avulla voit ottaa huomioon jälkikaiuntavaikutuksen puheen ymmärrettävyyteen ja antaa joissain tapauksissa hyvän korrelaation subjektiivisten arvioiden kanssa.

Esimerkit %ALcons-arvojen laskemisesta huoneen eri kohdille (puheyleisö) jälkikaiunta-ajoilla 3,5 ja 1,2 s (kuvat 7a, b) osoittavat, että pitkällä jälkikaiunta-ajalla %ALcons-arvot saavuttavat 26 % prosenttia huoneen kaukaisista kohdista, mikä ei ole hyväksyttävää. Samaan aikaan vaimeammassa yleisössä suurimmalla osalla aluetta %ALcons ei ylitä 10 %, mikä takaa varsin tyydyttävän puheen ymmärrettävyyden.



Riisi. 7 Sisäjakelu
%ALcons-arvot: a-T = 3,5; b-T = 1,2 s

Mutta tällä menetelmällä on haittapuolensa: se perustuu mittaukseen kolmanneksella oktaavikaistasta noin 2000 Hz, koska konsonanttien pääenergia on keskittynyt tähän. Kaikkia muita taajuuksia ei yleensä käytetä, mikä voi johtaa merkittäviin virheisiin, erityisesti johtuen äänilähteen suuntaavuuden taajuusriippuvuudesta taajuudesta ja vastaavasta muutoksesta taajuusalueella suoran äänen tason ja äänitason suhteen. kaikuva sellainen. Lisäksi tämä menetelmä ei ota huomioon useita ymmärrettävyyden kannalta tärkeitä parametreja: signaali-kohinasuhde, myöhäiset heijastukset ja kaiut, taustakohinaspektri jne. Myöhemmin Pyutz kuitenkin ehdotti uutta tekniikkaa, joka mahdollistaa taustamelu huomioon ottaen. Samanaikaisesti ehdotetaan, että yllä olevan kaavan mukaan lasketut %ALcons-arvot kerrotaan kertoimella, joka ottaa huomioon huoneen melutason:

% AL "miinuksia \u003d% ALcons (1,071T-0,0285) 25 + (Ln-Ls), missä:

Ln - melutaso huoneessa, dB; Ls - puhesignaalin taso, dB.

Tämän kriteerin soveltamiseen liittyvät ongelmat (mahdollisuus tehokkaaseen käyttöön pääasiassa suhteellisen pienikokoisissa huoneissa, varhaisten heijastusten, kaiun jne. huomiotta jättäminen) ovat kuitenkin edelleen olemassa, joten työtä tämän kriteerin parantamiseksi jatketaan koko ajan.

Toinen ryhmä menetelmiä objektiivisen ymmärrettävyyden arvioimiseksi perustuu järjestelmän modulaation siirtofunktion arviointiin. Näitä ovat menetelmät STI, RASTI, STIPA jne.

1. STI - Puheensiirtoindeksi.

Modulaation siirtofunktion MTF (The Modulation Transfer Function) käyttöön perustuen kehitettiin erityinen ryhmä menetelmiä, joiden avulla voit objektiivisesti arvioida puheen ymmärrettävyyttä huoneessa.

Menetelmien ideana on, että kuten tämän artikkelin aiemmissa osissa on käsitelty, puhesignaali on lähdeäänisignaalin impulssivasteen konvoluutio (vokaalien kohdalla tämä on impulssisignaali, jolla on lähes harmoninen spektri, konsonanteille tämä on erimuotoinen kohinasignaali), jolla on impulssivaste äänikanava. Kuten kuvan 8 analyysi osoittaa, puhesignaalia voidaan likimäärin pitää tietynä laajakaistaisena signaalina (kaistanleveys 125...8000 Hz), jota moduloi toinen matalataajuinen signaali. Modulaation taajuus määräytyy sen nopeuden mukaan, jolla henkilö lausuu formantit (artikulaationopeus). Kokeet ovat osoittaneet, että modulaatiotaajuudet tavallisessa puheessa ovat alueella 0,63 - 16 Hz, todennäköisimpien modulaatiotaajuuksien ollessa alueella 5...7 Hz.

Modulaatiosyvyyden pienentäminen tekee puhesignaalista enemmän kohinaa muistuttavan ja johtaa siten sen ymmärrettävyyden heikkenemiseen. Kun puhesignaali kulkee minkä tahansa siirtotien tai huoneen läpi kaiun, vääristymän ja kohinan vuoksi signaalin ymmärrettävyys heikkenee, mikä voidaan arvioida sen modulaatiosyvyyden (signaalin verhokäyrän muodon muutoksen) perusteella. .


Riisi. 8 Puheen aaltomuoto

Siksi Houtgasin ja Steenekenin teoksissa vuonna 1971 ehdotettiin seuraavaa menetelmää ymmärrettävyyden arvioimiseksi: koko puhealue 125 Hz - 8000 Hz on jaettu seitsemään oktaavikaistaan. Oktaavikohinasignaali, jonka keskustaajuudet ovat 125, syötetään testattavan järjestelmän tuloon, esimerkiksi akustiseen järjestelmään, joka on asennettu siihen huoneen kohtaan, jossa kaiuttimen (kaiuttimen) tulisi sijaita; 250; 500 Hz; yksi; 2; 4 ja 8 kHz, joiden intensiteettijakauma oktaavikaistoina osuu yhteen puhesignaalin intensiteettijakauman kanssa. Tämä signaali moduloidaan harmonisella signaalilla, jonka modulaatioindeksi on 100 % (kuva 9): I(t) = I0(1+cos2πFt). Tässä tapauksessa sen akustisen järjestelmän suuntausominaisuuden, jonka kautta signaali lähetetään huoneeseen, tulee olla lähellä suuaukon suuntausominaisuutta. Moduloivan signaalin taajuudet vaihtelevat välillä 0,63 - 12,5 Hz yhden kolmasosan oktaavivälillä (yhteensä neljätoista taajuutta). Kohdassa, jossa kuuntelijan tulisi sijaita, signaali vastaanotetaan monisuuntaisella mikrofonilla, kun taas huoneessa esiintyvien kohinan ja jälkikaiuntaprosessien vuoksi signaalin muoto muuttuu ja sen modulaatiosyvyys pienenee.


Riisi. 9 Moduloidun signaalin tyyppi

Signaali voidaan nyt esittää muodossa: I(t) = I0(1+mcos(2πFt+ φ)), missä:

M - modulaatiosyvyyden laskua kuvaava kerroin. Se on modulaatiotaajuuden F funktio ja riippuu huoneen jälkikaiuntaajasta ja signaali-kohinasuhteesta (arvon 20lg(m(F)) riippuvuutta taajuudesta F kutsutaan modulaation siirtofunktioksi) ;

I0 - signaalin amplitudiarvo;

F - signaalin taajuus;

T - aika;

φ - alkuvaihe.


Riisi. 10 CIS-asteikko

Ehdotetussa menetelmässä mittaukset tehdään 98 pisteelle injektoidun kohinan seitsemälle oktaavikaistalle ja 14 modulaatiotaajuudelle. Tuloksena olevaa 98 pisteen matriisia käytetään STI:n (puheensiirtoindeksin) laskemiseen painottamalla m(F):n keskiarvo kullakin taajuuskaistalla niiden kokonaisvaikutuksen mukaan ymmärrettävyyteen. Esimerkki tällaisesta matriisista, joka on saatu käyttämällä MLSSA-tietokoneasemaa, on esitetty alla

Menetelmät ymmärrettävyyden mittaamiseksi STI:llä on otettu käyttöön kansainvälisessä standardissa IEC 268-16. Tämä menetelmä sisältää mittauksia laajalla taajuusalueella ja ottaa siksi huomioon jälkikaiunta-ajan taajuusriippuvuuden, taajuusvasteen epätasaisuuden ja muut taajuusriippuvaiset vaikutukset, mikä johtaa melko hyvään korrelaatioon subjektiivisten arvioiden kanssa.

Jotta eri menetelmillä saatujen ymmärrettävyyspisteiden tuloksia voitaisiin verrata, kehitettiin yhteinen CIS- ymmärrettävyysasteikko (IEC-60849 standardi), jonka avulla on mahdollista muuntaa eri menetelmillä (sekä subjektiivisilla että subjektiivisilla) saatuja ymmärrettävyysarvoja. objektiivi) toisiinsa (kuva kymmenen). Esimerkiksi STI-arvo 0,7 vastaa %ALcons-arvoa 3,8 %, mikä vastaa 94 %:n tavujen ymmärrettävyyttä ja tarjoaa hyvän ymmärrettävyyden huoneessa. STI-muutoksen rajat hyvän luettavuuden varmistamiseksi ovat 0,6...1,0.

2. RASTI - nopea puheensiirtoindeksi.

Koska ymmärrettävyyden laskeminen yllä olevalla menetelmällä on melko työläs menetelmä, Bruel & Kjaer on kehittänyt vaihtoehtoisen yksinkertaistetun menetelmän, joka sisältää mittauksia vain kahdella 500 Hz:n oktaavikaistalla modulaatiotaajuuksilla 1,02 / 2,03 / 4,07 / 8,14 Hz , sekä 2 kHz modulaatiotaajuuksilla 0,73 / 1,45 / 2,90 / 5,81 / 11,63 Hz. Lisäksi mittausprosessi etenee kuten edellisessä tapauksessa, rakennetaan matriisi, lasketaan modulaation siirtofunktion keskiarvo taajuuskaistoilla ja määritetään siitä normalisoitu RASTI-indeksi.

Tämän menetelmän toteuttamiseksi Bruel & Kjaer kehitti sopivat laitteet (B&K3361 RASTI Meter) ja ohjelmistot, joten tämä tekniikka hyväksytään lähes kaikissa eurooppalaisissa standardeissa. Koska mittaukset kuitenkin suoritetaan vain kahdella oktaavikaistalla, ne antavat jonkin verran yliarvioituja arvoja, koska ne eivät ota huomioon järjestelmän epätasaista taajuusvastetta ja vaihevastetta. Mittausprosessin nopeuttamiseksi entisestään yhtiö on ehdottanut menetelmää, jossa signaalit esitetään samanaikaisesti kahdella oktaavikaistalla kaikkien moduloivien signaalien kanssa samanaikaisesti.

Mittaukset tehdään jatkuvassa tilassa ja mahdollistavat rinnakkaisanalyysin kahdella oktaavikaistalla. Analyysin aikaväli vaatii vähintään 8 sekuntia. Hyvä luettavuus edellyttää, että RASTI-arvot huoneen eri kohdissa ovat vähintään 0,6. Sen arvioimiseksi tehdään mittauksia huoneen eri kohdista ja piirretään sen jakautumiskäyrät. Esimerkki on kuvassa 11.


Riisi. 11 Esimerkki RASTI-arvojen jakautumisesta huoneessa

On huomattava, että tarkasti ottaen menetelmät ymmärrettävyyden arvioimiseksi modulaation siirtofunktioiden avulla ovat sovellettavissa vain lineaarisiin järjestelmiin. Suurin osa todellisista järjestelmistä on epälineaarisia, varsinkin kun on kyse viestintäjärjestelmien ymmärrettävyyden arvioinnista (esimerkiksi puhelinkanavissa). Huoneen ilmatilaa voidaan pitää lineaarisena väliaineena, mutta mittauslaitteiden lineaarisuutta on valvottava tarkasti.

Yksinkertaisia ​​ja luotettavia menetelmiä luettavuuden arvioimiseksi etsitään jatkuvasti. Vuonna 2001 Bose ehdotti STI-mittaustekniikkaa, jossa on erityinen optimoitu testisignaali, joka on moduloitu kohina kuudella oktaavikaistalla ja jokaisessa oktaavissa on kaksi samanaikaista modulaatiotaajuutta. Tätä tekniikkaa kutsuttiin STI-PA:ksi (eli suunniteltu arvioimaan PA-äänenvahvistusjärjestelmiä).

Lisäksi digitaalisten äänenkäsittelymenetelmien kehitys ja tietokonekäsittelyn nopeuden lisääntyminen ovat mahdollistaneet tekniikan (Schroederin ehdottama) luomisen, jolla modulaation siirtofunktion arvot voidaan laskea signaalin impulssimittaukset sopivalla suodatuksella. Nykyaikaiset tietokonemetrologiset asemat TEF, MLSSA ja muut käyttävät juuri näitä menetelmiä ymmärrettävyyden laskemiseen.

Huomattakoon, että nykyisin yleisimpien puheen ymmärrettävyyden arviointimenetelmien lisäksi modulaation siirtofunktiolla, huoneiden arvioinnissa käytetään laajalti muitakin menetelmiä, esimerkiksi puheen ymmärrettävyyden arviointi selkeyskertoimella.

C50 - kirkkauskerroin. C50-kerroin määrittää musiikin äänen selkeyden (selkeyden), ja se lasketaan huoneessa heijastuneiden äänien aikaisen ja myöhäisen energian suhteena. Vuonna 1996 Marshall ehdotti tämän tekijän käyttämistä puheen ymmärrettävyyden arvioimiseen mittaamalla Eran/Elat-suhdetta useilla taajuuskaistoilla erityisellä painotuksella puhesignaalille. Mittaukset suoritetaan impulssivasteen analyysillä, jota seuraa tietokonekäsittely - signaalienergia ensimmäisten 50 ms:n sisällä kuuluu aikaisempaan. Mittausten yksinkertaisuudesta huolimatta menetelmä antaa hyvän korrelaation subjektiivisten arvioiden kanssa, mutta siinä on myös tiettyjä haittoja: se ottaa huomioon vain jälkikaiuntaprosessin vaikutuksen, ottaa huonosti huomioon vasteen häiritsevän osan rakenteen, mikä voi sisältää korkean intensiteetin myöhäisiä heijastuksia.

Nämä heijastukset johtavat usein kaikuihin, jotka heikentävät puheen ymmärrettävyyttä. Nämä puutteet on suurelta osin eliminoitu Nizen ehdottamassa kriteerissä, jota kutsutaan "kaikuasteeksi". Nize otti käyttöön uuden 33 ms:n rajan hyödyllisen ja häiritsevän energian välille, ja hyödyllinen energia otetaan painotusfunktiolla, joka pehmentää impulssivasteen jaon terävää rajaa. Kaikkia energiaa ei pidetä häiritsevänä, vaan ainoastaan ​​heijastusten energiaa, jotka ylittävät tietyn huoneen kaiuntaprosessin eksponentiaalisen käyrän. Myös muita tämän menetelmän muunnelmia tunnetaan.

Tällä hetkellä AES-standardikomitean erityinen ryhmä (puheenjohtaja P. Mapp) on mukana laatimassa kansainvälisiä suosituksia puheen ymmärrettävyyden arvioimiseksi. Tämän ryhmän asiantuntijat tekevät vertailevaa analyysiä eri menetelmistä ymmärrettävyyden arvioimiseksi. Näiden töiden yhteydessä saatiin erityisesti puheen ymmärrettävyyttä arvioivien eri kertoimien välille melko yksinkertaisia ​​analyyttisiä suhteita, joista voi olla hyötyä käytännön tilan arviointityössä.

Lopuksi on huomattava, että puheen ymmärrettävyyden arviointiongelma on erittäin monimutkainen, koska se ei riipu pelkästään objektiivisesti mitattavissa olevista tekijöistä (jälkikaiunta-aika, melutaso, varhaisten heijastusten rakenne jne.), vaan myös sellaisista tekijöistä, jotka voidaan mitata objektiivisesti. subjektiiviset tekijät, kuten kielen taitoaste, puhujan sanamuoto, kuuntelijan tuntemusaste viestin sisältöön, kuulonsa tila jne. Siksi on luotava automatisoitu tietokonejärjestelmä puheen objektiivista arviointia varten. ymmärrettävyys on vaikea ongelma, mutta koska se on äärimmäisen tärkeä viestintäjärjestelmien kehittämisen kannalta, sen ratkaisemisessa on mukana merkittäviä asiantuntijoita eri maissa, on toivottavaa, että tällainen riittävän luotettava järjestelmä saadaan aikaan.

3.2. Akustisen tiedustelun keinot Yleisesti ottaen akustinen tiedustelu suoritetaan sieppaamalla kohteen tuotantokohina ja sieppaamalla puheinformaatiota. Sovellustavan mukaan tekniset keinot akustisen tiedon poimimiseen voidaan jakaa kahteen laajaan kategoriaan: 1. keinot, jotka edellyttävät fyysistä tunkeutumista suojattuun tilaan: o radiovirheet; o kirjanmerkit, jotka lähettävät akustista tietoa infrapuna-alueella; o kirjanmerkit 220 V verkon kautta; o kirjanmerkit tiedonsiirrolla puhelinlinjan kautta; o Sanelulaitteet; o johdinmikrofonit; o "puhelimen korva". 2. välineet, jotka eivät vaadi fyysistä tunkeutumista suojattuihin tiloihin: o laitteet, jotka käyttävät laitteiden "mikrofoniefektiä"; o korkeataajuinen säätö; o stetoskoopit; o lasermikrofonit; o suuntamikrofonit. Tarkastellaanpa yksityiskohtaisemmin edellä lueteltuja akustisen tiedustelun keinoja. Radion kirjanmerkit. Näiden laitteiden tarkoituksena on lähettää akustista tietoa suojatusta kohteesta radiokanavan kautta. Kirjanmerkit voidaan tehdä erillisenä moduulina tai jäljitellä jokapäiväisten taloustavaroiden muotoa (tuhkakuppi, sytytin, laskin, mustekynä jne.). Radiokirjanmerkkien ulkoasu on esitetty kuvissa 3.4, 3.5, 3.6. Riisi. 3.4. Naamioitu radiokirjanmerkki sytyttimen muodossa Riisi. 3.5. Naamioitu radiokirjanmerkki kolikon muodossa Riisi. 3.6. Radiokirjanmerkki tavallisessa versiossa Radiokirjanmerkki välittää tietoa käyttämällä radioalueen sähkömagneettisia aaltoja. Vastaanottimen läsnäolo tässä piirissä on luonnollista. Mielenkiintoista on, että erilaisia ​​vastaanottimia voidaan käyttää, eikä kotitalouksien vastaanottimien (soitin, musiikkikeskus, nauhuri) ja erikoisten välillä ole perustavanlaatuisia eroja. Ainoa asia, joka määrää vastaanoton tässä tapauksessa, on taajuus, jolla radiokirjanmerkki toimii. Itse asiassa hyökkääjä ei välttämättä kuluta rahaa ostaakseen erityistä vastaanotinta ja vastaanottaa signaalia yleisillä välineillä lähetysalueella. Tietenkin tässä tapauksessa toinen henkilö, jolla on kotitalousvastaanotin radiokirjanmerkin alueella, voi myös vastaanottaa tämän signaalin, mikä lisää tunkeilijan havaitsemisen todennäköisyyttä. Radiovirheiden haittana hyökkääjän näkökulmasta on mahdollisuus havaita ne erityisellä ohjausvastaanottimella. Sulautetut laitteet, jotka lähettävät tietoa optisen kanavan kautta infrapuna-alueella, joka ei ole ihmissilmälle nähtävissä, jäävät ilman tätä haittaa. IR-lähettimien havaitseminen on luonnollisesti erittäin vaikeaa. Koska tiedot välitetään optisen kanavan kautta, välilehden on oltava hyökkääjän näköetäisyydellä. Pääsääntöisesti IR-lähettimet sijaitsevat ikkunoiden kehysten ulkopuolella, tuuletusaukoissa jne., mikä helpottaa niiden löytämistä. Esimerkki IR-anturin käytöstä on esitetty kuvassa 3.7.
Riisi. 3.7. Akustisen tiedon sieppaus IR-kirjanmerkkien avulla IR-kirjanmerkkien haittoja ovat korkea hinta ja korkea energiankulutus, mikä johtaa 15-20 tunnin keskimääräiseen toiminta-aikaan. Radion ja optisen kanavan lisäksi tiedon välittämiseen käytetään 220 V sähköverkon voimalinjoja ja puhelinlinjoja. Kirjanmerkkejä, jotka käyttävät sähköjohtoja tiedon välittämiseen, kutsutaan usein verkkokirjanmerkeiksi (kuva 3.8). Tällaisten kirjanmerkkien toimintaperiaate on samanlainen kuin radiokirjanmerkkien. Riisi. 3.8. Verkkoakustinen kirjanmerkki Sanelufonit kuuluvat myös akustisen tiedon poimimisen teknisiin välineisiin. Sanelukone - laite, joka tallentaa äänitietonauhan, johdon, sisäisen muistisirun. Eri ääninauhureiden tallennusaika vaihtelee 15 minuutista 8 tuntiin. Nykyaikaiset digitaaliset ääninauhurit tallentavat tietoja sisäiseen muistiin, mikä mahdollistaa jopa useiden tuntien kestävän keskustelun tallentamisen. Nämä ääninauhurit ovat käytännössä äänettömiä (koska pääkohinaa tuottavaa kasettia tai mekaanista nauha-asemaa ei ole), niillä on mahdollisuus tallentaa tallennetut tiedot tietokoneen muistiin jatkokäsittelyä varten. Suurin osa äänittimistä saa virtansa kymmeniä ja satoja grammoja painavista paristoista. Samaan aikaan nykyaikaiset ääninauhurit voivat olla kooltaan hyvin pieniä, joten ne voidaan sijoittaa minne tahansa suojatussa huoneessa. Riisi. 3.9. Miniäänitallennin Edic-Mini Tiny B21 Kuvassa 3.9 on esimerkki nykyaikaisesta digitaalisesta miniäänitallentimesta Edic-Mini Tiny B21, jolla on seuraavat ominaisuudet: aktivointi äänellä, paino 6 g, mitat 40x8x15 mm, käyttöaika jopa 60 tuntia käytettäessä sinkki-ilma-akkuja. Huoneen rakentamis- tai korjausvaiheessa siihen voidaan asentaa huomaamattomasti pieniä mikrofoneja, jotka on kytketty johdoilla signaalivastaanottimeen. Tällaisia ​​mikrofoneja kutsutaan langallisiksi. Kiinteissä järjestelmissä käytetään pääasiassa elektreettimikrofoneja, jotka varmistavat keskimääräisen puheen tallennuksen jopa 7-10 metrin etäisyydellä sen lähteestä. Tässä tapauksessa taajuusalue on 20 - 100 Hz - 6 - 20 kHz. Tällaisten mikrofonien virransyöttöön käytetään vakiojännitettä 9-15 V. Mikrofonissa on pääsääntöisesti vahvistin. Tietojen siirtoon ja vahvistimen virransyöttöön käytetään 2- tai 3-johtimia (kuvat 3.10, 3.11.). Riisi. 3.10. 3-lankainen mikrofoni Shorokh-8 Riisi. 3.11. 2-lankainen mikrofoni Mikrofonit asennetaan joko huomaamattomasti (naamioimattomina) tai naamioituna kodin esineiksi, toimistolaitteiksi jne. Useita mikrofoneja voidaan liittää yhteiseen kytkinlaitteeseen, jonka avulla voit ohjata samanaikaisesti useita huoneita ja tallentaa siepattuja keskusteluja äänitallentimeen. Akustisen (puhe)informaation siirtämiseen puhelinlinjan kautta käytetään "puhelinkorva"-tyyppisiä sulautettuja laitteita. Riisi. 3.12. "Puhelimen korva" TU-2 Tämä laite on salaa asennettu puhelinkoteloon tai puhelinpistorasiaan ja se on pääsääntöisesti erittäin herkkä elektreettityyppinen mikrofoni, jossa on vahvistin ja erityinen laite puhelinlinjaan kytkemiseen soitettaessa numeroita. tiettyyn kaavaan. Toimintaperiaate on seuraava. Henkilö soittaa numeroon, jossa kirjanmerkki "roikkuu". "Puhelimen korva" "hiljentää" kaksi ensimmäistä soittoa, joten puheluita ei kuulu huoneeseen. Soittaja katkaisee puhelun ja soittaa numeroon uudelleen. Varattu-ääni kuuluu luuriin, operaattori odottaa 30-60 sekuntia (väliaikainen salasana) ja varattu-signaalin päätyttyä soittaa numeroon äänimerkillä - mikrofoni kytkeytyy päälle ja operaattori kuulee kaiken, mitä puhelimessa tapahtuu. valvottu huone melkein mistä päin maailmaa tahansa, missä on puhelinlaite. Yhteys katkeaa, jos käyttäjä katkaisee luurin tai jos joku nostaa luurin valvotulla alueella. Kaikille muille tilaajille, jotka haluavat tavoittaa tämän numeron, kuuluu varattu signaali. Tämä työalgoritmi on tyypillinen, mutta saattaa vaihdella toteutuksen yksityiskohdissa vaatimuksista riippuen. Samaan aikaan laite saa virtansa puhelinlinjasta, eli sen käyttöikä on käytännössä rajoittamaton. Suuntamikrofonit Jos haluat järjestää keskustelujen kuuntelun huoneessa, johon ei pääse samalla tavalla kuin viereisiin huoneisiin, käytetään suuntamikrofoneja. Suuntamikrofonien säteilykuvio on kapea (5…35˚) ja vahvistus on yli 70…90 dB. NAM:n enimmäisalue tuumaa kaupungin olosuhteet ei ylitä 100-150 m, maassa alhaisella melutasolla tiedusteluetäisyys voi olla jopa 500 metriä tai enemmän. Suuntamikrofonien tyypit: paraboliset; tasaiset akustiset vaiheistetut ryhmät; putkimaiset tai liikkuvan aallon mikrofonit; elintyyppi; kaltevuus. parabolinen mikrofoni. Se on parabolinen ääniheijastin, jonka keskiössä on tavanomainen (ei-suuntainen) mikrofoni. Heijastin on valmistettu sekä optisesti läpinäkymättömästä että läpinäkyvästä (esim. akryylimuovista) materiaalista. Parabolisen peilin ulkohalkaisijan arvo voi olla 200 - 500 mm. Tämän mikrofonin toimintaperiaate on kuvattu kuvassa 3.13. Aksiaalisesta suunnasta tulevat, parabolisesta peilistä heijastuneet ääniaallot summautuvat vaiheeseen polttopisteessä A. Äänikenttä vahvistuu. Mitä suurempi peilin halkaisija, sitä enemmän laite voi tarjota vahvistusta. Jos äänen saapumissuunta ei ole aksiaalinen, niin parabolisen peilin eri osista heijastuneiden ääniaaltojen lisääminen, jotka saapuvat pisteeseen A, antaa pienemmän tuloksen, koska kaikki termit eivät ole samassa vaiheessa. Mitä voimakkaampi vaimennus on, sitä suurempi on äänen tulokulma akseliin nähden. Siten muodostuu vastaanoton kulman selektiivisyys. Parabolinen mikrofoni on tyypillinen esimerkki erittäin herkästä mutta heikosti suuntautuvasta mikrofonista. Parabolisten suuntamikrofonien ulkonäkö on esitetty kuvissa 3.14, 3.15. Putkimaiset mikrofonit eli "matkustavat" aaltomikrofonit Toisin kuin paraboliset mikrofonit ja litteät akustiset säleiköt, ne vastaanottavat ääntä ei tasossa, vaan tiettyä linjaa pitkin, joka osuu yhteen äänenlähteen suunnan kanssa. Niiden toimintaperiaate on havainnollistettu kuvassa 3.16.
Riisi. 3.13. Parabolisen mikrofonin toimintaperiaate Riisi. 3.14. Suuntamikrofonin "Super Ear - 100" ulkokuva Riisi. 3.15 Parabolisen suuntamikrofonin ulkonäkö
Riisi. 3.16 Putkimainen mikrofoni. Putkimaisen mikrofonin perusta on jäykän onton putken muodossa oleva ääniohjain, jonka halkaisija on 10-30 mm ja joissa on erityiset uritetut reiät, jotka on sijoitettu riveihin koko ääniohjaimen pituudella, ja jokaiselle rivit. On selvää, että kun ääntä vastaanotetaan aksiaalisuunnasta, on ilmeisesti lisätty vaiheeseen signaalit, jotka tunkeutuvat ääniohjaimeen kaikkien urillisten reikien kautta, koska aksiaalisen äänen etenemisnopeudet putken ulkopuolella ja sen sisällä ovat samat. Kun ääni saapuu tietyssä kulmassa mikrofonin akseliin nähden, tämä johtaa vaiheepäsopimattomuuteen, koska äänen nopeus putkessa on suurempi kuin sen ulkopuolella olevan äänen nopeuden aksiaalinen komponentti, minkä seurauksena vastaanottoherkkyys vähenee. Tyypillisesti putkimaisen mikrofonin pituus on 15-230 mm - 1 m. Mitä pidempi sen pituus, sitä enemmän sivu- ja takasuunnasta tulevat häiriöt vaimentuvat. Riisi. 3.17 Putkimaisen suuntamikrofonin PKI 2925 ulkokuva Riisi. 3.18 Miniatyyri suunnattu mikrofoni UEM-88 Urutyyppinen suuntamikrofoni. urkutyyppinen suuntamikrofoni voit kuunnella keskustelua jopa 1 km:n etäisyydeltä näköetäisyydellä. Tässä toteutuu periaate: "lähellä ei ole ketään, mutta siitä huolimatta olet hyvin napautettu." Ääniaaltojen resonanssiilmiön käyttö suuntajärjestelmissä johtaa mikrofoniin tulevan äänienergiasignaalin tason nousuun. Yksinkertainen suuntamikrofoni on sarja seitsemästä alumiiniputkesta, joiden halkaisija on 10 mm. Putken pituus määrittää äänisignaalin resonanssitaajuuden. Putkien pituuden laskentakaava on seuraava: L = 330/2F, jossa L on putken pituus metreinä; F on resonanssitaajuus hertseinä. Yllä olevan kaavan perusteella voit rakentaa taulukon 3.2, jossa N on putken numero. Taulukko 3.2
N
L, m
F, Hz

Riisi. 3.19. Suuntaputkien vaalijärjestelmä


Riisi. 3.20. Mikrofoni parabolisissa mikrofoneissa

Signaalin vahvistus tapahtuu käyttämällä erittäin herkkää mikrofonivahvistinta MU. Tämä suuntamikrofoni kattaa taajuusalueen 300 Hz - 3300 Hz, eli puhesignaalin päätietoalueen.

Jos on tarpeen saada parempi käsitys puheesta, on tarpeen laajentaa vastaanotettujen taajuuksien aluetta. Tämä voidaan tehdä lisäämällä resonanssiputkien määrää esimerkiksi 37 kappaleeseen. Tällainen resonanssijärjestelmä kattaa taajuusalueen 180 Hz - 8200 Hz.

Litteät vaiheistetut ryhmät.Tasomaiset vaiheistetut taulukot toteuttaa ajatus äänikentän samanaikaisesta vastaanotosta tietyn tason erillisissä pisteissä, jotka ovat kohtisuorassa äänilähteen suuntaan (kuva 2). Näihin kohtiin (A1, A2, A3...) sijoitetaan joko mikrofonit, joiden lähtösignaalit summataan sähköisesti, tai useimmiten ääniohjainten avoimet päät, esim. halkaisijaltaan riittävän pienet putket, jotka tarjoavat äänipalojen samanvaiheisen lisäyksen lähteestä jossain akustisessa summaimessa.

Riisi. 3.21. Tasainen vaiheistettu ryhmä

Lisälaitteen lähtöön on kytketty mikrofoni. Jos ääni tulee aksiaalisesta suunnasta, kaikki ääniohjaimien kautta etenevät signaalit ovat samassa vaiheessa ja lisäys akustisessa summaimessa antaa maksimaalisen tuloksen. Jos suunta äänilähteeseen ei ole aksiaalinen, vaan jossain kulmassa akseliin nähden, vastaanottotason eri kohdista tulevat signaalit ovat vaiheiltaan erilaisia ​​ja niiden lisäyksen tulos on pienempi. Mitä suurempi äänen tulokulma on, sitä voimakkaampi sen vaimennus on. Yleensä vastaanottavien pisteiden Аi määrä tällaisissa taulukoissa on useita kymmeniä. Rakenteellisesti litteät vaiheistetut sarjat on rakennettu joko attase-kotelon etuseinään myöhemmällä naamioinnilla tai liiviin, jota käytetään takin tai paidan alla. Tarvittavat elektroniset komponentit (vahvistin, paristot, nauhuri) sijaitsevat vastaavasti joko kotelossa tai vaatteiden alla. Siten litteät naamioidut vaiheistetut ryhmät ovat visuaalisesti salaliittoisempia kuin parabolinen mikrofoni.

gradienttimikrofoni. Se koostuu kahdesta melko pienikokoisesta ja lähekkäin sijaitsevasta erittäin herkästä mikrofonista M1 ja M2, joiden lähtösignaalit on sähköisesti (tai akustisesti) vähennetty toisistaan, toteuttaen äärellisissä eroissa äänikentän ensimmäisen derivaatan mikrofonin akselilla ja muodostaen lomakkeen kaavio cosQ, missä K on äänen saapumiskulma. Tämä varmistaa akustisten kenttien suhteellisen vaimennuksen sivusuunnista (0 - 90°). Korkean asteen gradienttimikrofonit ovat järjestelmiä, jotka toteuttavat 2., 3. ja korkeamman asteen tilajohdannaisia.

Suuntamikrofonien tärkein käyttäjäominaisuus on niiden kantama tietyissä olosuhteissa. R. Avoimessa tilassa ja isotrooppisissa ja kulmasta riippumattomissa ulkoisissa akustisissa häiriöissä toiminta-alue R liittyvät:

Spektrisignaali-kohinasuhteella q suuntamikrofonin lähdössä;

Puheen spektritason kanssa VR;

Ulkoisten akustisten häiriöiden spektritasolla Vsh tyyppisuhde:

q = Bp - Bsh - 20lg R+G - Bp , (1)

missä G- niin sanottu mikrofonin suuntaus (dB), Vp- mikrofonin akustisen herkkyyden kynnys (dB).

Riisi. 3.22. Yksinkertaisin gradienttimikrofoni

Kaavaan (1) sisältyvä kerroin G suunnattu toiminta luonnehtii ulkoisen akustisen häiriön suhteellisen vaimennusastetta: mitä suurempi se on, sitä voimakkaampi tämä vaimennus. Teoriassa se liittyy normalisoituun mikrofonin säteilykuvioon F (Q,j) tyyppisuhde:

,

missä Q-ääniaallon tulokulma mikrofonin akseliin nähden; j- ääniaallon tulokulma akseliin nähden kohtisuorassa olevan tason napakoordinaateissa.

Esimerkiksi varten putkimikrofoni, kun

,

missä l on äänen aallonpituus. a L- putken pituus, meillä on (at L > l .) :

G = 4 l/l. (neljä)

Samalla tavalla johdetaan likimääräinen kaava parabolisten mikrofonien ja vaiheistettujen litteiden ryhmien suuntakertoimelle:

G = 4π (S/l 2), (5)

missä S- sisääntuloaukon alue; l on äänen aallonpituus. Gradienttimikrofoneille n-th järjestyksessä optimaalista signaalinkäsittelyä

G=n (n+1), (6)

missä n on gradientin järjestys.

Tunnetuille määrän arvoille G kaava (1) on riittävä absoluuttisten arvioiden saamiseksi odotetusta signaali-kohina-spektrisuhteesta, jos olosuhteet tunnetaan. Mutta monissa tapauksissa tieto näistä ehdoista on epätarkkoja. Siksi on perusteltua käyttää ei absoluuttisia, vaan suhteellisia vaihteluväliestimaatteja, koska ne eivät vaadi tarkkaa tietoa ehdoista, koska vertailu tapahtuu, kun ne ovat yhtä suuret. Hyväksymällä tällaisen ideologian, verrataan suuntamikrofonien kykyjä ihmisen kuulokykyyn, joka ei ole aseistautunut erityislaitteilla. Muodollisesti voimme kirjoittaa sille samanlaisen suhteen kuin (1). Vertailun tuloksena saamme:

R = R0 x 10 0,05 (G-G 0) – 0,005 (D-Bp) , (7)

missä R0- kuuloelimen äänen kuuluvuusalue; R- suunta-alue

mmmikrofoni mikrofoni, jolla on sama ohjauslaatu; G0- ihmisen kuuloelimen suuntavaikutuskerroin (binouraalinen kuuntelutila); (D-Bp)- suuntamikrofonin ja kuuloelimen kynnysherkkyyden välinen ero.

Formantit ovat niitä alueita puheäänispektrissä, joissa energian pitoisuus on suurin. Formanttilähestymistapaa ehdotti ensimmäisen kerran vuonna 1929 D. Collard. Hän piti asemansa tiukasti 70-luvulle asti, kunnes ehdotettiin modulaatiolähestymistapaa, jonka avulla voit ottaa huomioon melun lisäksi myös jälkikaiuntahäiriöt, kaiun ja epälineaarisen vääristymän.

Formanttilähestymistapa on 80 vuoden olemassaolonsa aikana saanut monia kannattajia ja muunnelmia, mutta formanttimenetelmän vieraskielisestä versiosta, joka tunnetaan nimellä artikulaatioindeksi (AI), on tullut yleisin. Pääsemme siihen tarkastelemalla N. B. Pokrovskyn versiota ja siihen perustuvaa nykyaikaista kotimaista menetelmää puheen ymmärrettävyyden mittaamiseksi.

Pokrovskin menetelmä

Tämän menetelmän mukaan koko analysoitu taajuusalue jaetaan useisiin vierekkäisiin kaistaisiin, joissa kunkin sisällä formanttitodennäköisyystiheys, puhe- ja kohinaspektrit ovat suunnilleen vakioita. Artikulatorinen ymmärrettävyys on kunkin kaistan formanttien ymmärrettävyyden summa:


K- vierekkäisten kaistojen lukumäärä;
p k on todennäköisyys, että formantti pysyy sisällä k th taajuuskaista;
F 1 (f)- formanttitodennäköisyysjakaumafunktio;
f okei- kaistan keskitaajuus;
f nk- kaistan alempi rajataajuus;
f vk- kaistan ylempi rajataajuus;
P(E "k)- puheen havainnointikerroin, muuten todennäköisyys puheen peittämisen puuttumiselle kohinalla.

Puheen havaintokerroin riippuu formanttispektrin ja kohinaspektrin tasojen välisestä erosta. Riittävän korkeilla kohinatasoilla tämä on signaali-kohinasuhde kullakin taajuuskaistalla.


Suoraan sanottuna kunkin taajuuskaistan puhehavaintokerroinkäyrä on erilainen, mutta N. B. Pokrovskyn menetelmässä hän ehdotti myös, ettei tähän kiinnitetä huomiota ja että laskelmien yksinkertaistamiseksi käytetään yhtä käyrää. Menetelmävirhe kasvoissa.

Tietenkin Pokrovsky-menetelmän täydellisen kuvauksen saamiseksi on tarpeen antaa ainakin menetelmä havaintokertoimien muodostamiseksi, joukko kaavoja ja kommentteja, mutta koska tämä ei ole tämän artikkelin tarkoitus, siirrymme eteenpäin.

Melkein AI

Nykyaikaista venäläistä menetelmää ehdotti vuonna 2000 Zheleznyak Ya. . Sen on tarkoitus myös automatisoida laskelmat, jotka vaativat mitattujen arvojen lähentämistä analyyttisten suhteiden avulla.

Kuten aiemmin, artikulatorinen ymmärrettävyys määritellään lausekkeella:


Analyyttiset suhteet:



E "k- tehokas formanttituntemustaso taajuuskaistalla;
E k- puhesignaalin tehollinen tuntotaso taajuuskaistalla suhteellisen korkealla kohinatasolla, joka on yhtä suuri kuin signaali-kohinasuhde SNR;
∆B(f)- puheen keskimääräisen spektrin ja formanttien spektrin välinen ero;


D sk , D nk ovat signaalin ja kohinan hajonta, vastaavasti;


Sanallinen ymmärrettävyys lasketaan formantilla:


V. L. Kargashin ilmaisi mielipiteen, että tätä versiota pitäisi parantaa, nimittäin:
  • sinun on lisättävä toinen analyysikaista, jonka keskitaajuus on 8 kHz;
  • olisi otettava käyttöön mahdollisuus laskea yhden kolmasosan oktaavia;
  • havaintokerroin on suotavaa lähentää yksinkertaisemmalla funktiolla
Yllä oleva on läsnä AI-menetelmässä.

AI

Artikulaatioindeksin käyttöä ehdotti G. Fletcher vuonna 1940. Tästä menetelmästä on kaksi versiota:
  • kahdellekymmenelle yhtäläiselle nivelnauhalle;
  • kuudelle oktaaville tai viidelletoista yhden kolmasosan oktaaville
Harkitse tätä menetelmää kahdellekymmenelle yhtäläiselle nivelnauhalle. Puheen ymmärrettävyys määräytyy samalla kaavalla:


Koska laskelmat kuitenkin tehdään kahdellakymmenellä kaistalla, yllä oleva kaava tulee:


∆L i on puheen huipputason ja tehokkaan peittokohinatason välinen ero


Tällä tavalla


Voi herää kysymys, onko meillä oikeutta lähentää havaintokerrointa tällaisella lineaarisella suhteella? Meillä on, koska Pokrovsky-käyrillä saatu tulos on sama keskiarvo kuin lineaarisen riippuvuuden approksimaatiolla saatu tulos.
  • leikkaus vaikutus;
  • Menetelmää ei sovelleta:
    • jos puhesignaaliin vaikuttaa useat erilaiset häiriötyypit;
    • jos signaali on sekoitettu kaiuttimesta ja kaiuttimesta

    Kellari

    1. Puheviestintäkanavien akustinen osaaminen. Monografia / Didkovsky V. S., Didkovskaya M. V., Prodeus A. N. - Kiova, 2008. 420.
    Puhumme puhelimessa, kuuntelemme esityksiä ja puheita konserttisaleissa. Jotkut meistä yrittävät salakuunnella jonkun toisen keskustelua, toiset tekevät salakuuntelun mahdottomaksi. Kaikissa edellä mainituissa tapauksissa oli kuitenkin tilanteita, joissa vieras melu häiritsi tarvittavan kuulemista niin paljon, että sanoista tuli yksinkertaisesti lukukelvottomia. Tällaisten ongelmien välttämiseksi ennen polkujen toimintaa suoritetaan puheviestintäkanavien akustinen tutkimus.

    Puheviestinnän kanava tai polku (tai puheinformaation siirtokanava) on fyysinen väline, polku, jonka kautta ääni kulkee lähettämisestä vastaanottamiseen. Se voi olla ilma-, sähköakustinen, värähtely-, parametrinen, optoelektroninen kanava, mutta emme viivyttele niissä, koska tavoitteenamme on mitata polun laadun tärkein kriteeri - puheen ymmärrettävyys.

    Puheen ymmärrettävyyden mittausmenetelmät voidaan tiivistää luettelona:

    • Subjektiivinen:
      • Puhtaasti subjektiivinen menetelmä;
      • esineistetty;
      • Tonaalinen;
    • Tavoite:
      • Muoto:
        • AI (Articulation Index);
        • SII (puheen ymmärrettävyysindeksi);
      • Modulaatio:
        • STI (puheensiirtoindeksi - puheensiirtoindeksi);
        • RASTI (Rapid STI);
        • STIPA (STI äänenvahvistusjärjestelmille);
        • STITEL (STI televiestintäjärjestelmille);
      • %ALcons (konsonanttien artikulaatiohäviön arviointi);
    Tietysti on edelleen Neuvostoliiton Pokrovskin, Bykovin, Sapožkovin menetelmiä, mutta emme koske niihin ainakaan toistaiseksi, koska yllä olevat menetelmät tarjoavat parhaan tuloksen.

    Emme tietenkään pysty kattamaan kaikkea kerralla, joten aluksi tarkastelemme eroja objektiivisten ja subjektiivisten menetelmien välillä ja tarkastelemme myös jälkimmäisiä yksityiskohtaisemmin.

    Puhdasta subjektivismia

    Puheen ymmärrettävyyden arvioinnissa puhtaasti subjektiivisella menetelmällä on mukana puhuja-auditori-pari. On kätevää tarkastella heidän työtään esimerkissä radioaseman testaamisesta CCIR:n (International Advisory Committee for Radio Communications) suositusten mukaisesti: radiokanavan lähetyspuolella kuuluttaja lukee tekstin, kun taas tilintarkastaja vastaanottava puoli arvioi polun viiden pisteen (tai jollain muulla) asteikolla. On vaikea olla huomaamatta tämän lähestymistavan ilmeistä suurta haittaa, nimittäin väistämätöntä vaikutusta testaavien ihmisten puheen ja kuulon ominaisuuksien tulokseen.

    Ratkaisu tähän ongelmaan on yhtä ilmeinen kuin itse ongelma.

    objektiivisuus

    Yleisin objektivoitu menetelmä on artikulaatiomenetelmä. Se koostuu siitä, että ennen mittausten aloittamista testikanavaan luodaan normaalit akustiset olosuhteet (melutasot). Mukana on useita tarkastajia, ja julistaja lukee tavallisen tekstin sijaan erityisesti koottuja tavutaulukoita (artikulaatiotaulukoita). Auditoijat kirjoittavat kuulemansa muistiin ja lähetysistunnon lopussa tarkastavat taulukonsa kuuluttajien kanssa. Oikein kuultujen tavujen suhde niiden kokonaismäärään on puheen ymmärrettävyyden arvio, joka ilmaistaan ​​prosentteina tai yksikön murto-osina.

    Huomaa, että suuremmalla määrällä saneluja ja vastaavasti hyväksyttyjä tavuja eri tekijöiden vaikutuksesta lasketaan keskiarvo. Tekijöiden vaikutus on vieläkin keskiarvoisempi, jos testeihin osallistuu eri kuuluttajien ja tarkastajien ryhmät. Tämä on artikulaatiomenetelmän objektivisointia. Ei kuitenkaan vain tässä. Sellaisten ääniyhdistelmien lukeminen, joilla ei ole semanttista kuormaa, auttaa saamaan objektiivisia tuloksia, koska kun vastaanotat sanoja tai lauseita, voit ajatella ja palauttaa polun vääristämän elementin.

    Mitä tulee tilintarkastajiin, on mielipide, että näiden pitäisi olla erityisesti koulutettuja ryhmiä, mutta GOST R 50840-95 vaatii päinvastoin. Itse kallistun enemmän jälkimmäiseen.

    Edut:

    • Yleisyys (menetelmä soveltuu kaikentyyppisille reiteille);
    • Yksinkertaisuus (menetelmä ei vaadi erityistä teknistä tietämystä käyttäjiltä)
    Virheet:
    • Hankala mittausmenettely (vaatii huomattavasti aikaa, materiaalia ja henkilöresursseja);
    • Artikulaatiotaulukoiden luominen (mittaustulokset vaihtelevat jokaisen uuden taulukkotyypin mukaan);
    • Tulosten riippuvuus käyttäjien koulutusasteesta;
    • Inhimillinen tekijä (vaikutus puheen ja kuulon ominaisuuksien tulokseen)

    Objektiivisuus. Osa 2

    Harkitse toista objektiivista subjektiivista menetelmää - tonaalista, jonka mukaan kuuluttaja korvataan puhtaiden äänien generaattorilla. Tämä keinotekoinen ääni on itse asiassa tavallinen kartiomainen kaiutin, joka tuottaa signaaleja siten, että eri taajuuksilla syntyvä äänenpainetaso vastaisi formanttispektrikäyrää. Tilintarkastajat eivät lähde minnekään. Nyt heidän tehtävänsä on yksinkertaisesti määrittää, kuuluuko signaali tietyllä taajuudella vai ei.
    Taajuudet, joilla mittaukset tehdään
    250 500 650 800 990 1125 1300 1500 1700 1875
    2050 2225 2425 2725 3100 3500 3850 4550 6150 8600

    Formanttisensaation tasoa mitataan siirtymällä hitaasti vaimenemiseen, kunnes ääntä ei enää kuulu, sitten vaimennusta tulee vähentää, kunnes ääni ilmestyy. Kaksi vaimennusarvoa on keskiarvotettu - tämä on mittaustulos.

    Formantin puheen ymmärrettävyys määritetään taulukosta:

    dB % dB % dB % dB % dB % dB %
    1 0.04 10 0.65 19 1.92 28 3.22 37 4.28 46 4.75
    2 0.09 11 0.76 20 2.07 29 3.37 38 4.37 47 4.78
    3 0.14 12 0.89 21 2.2 30 3.51 39 4.46 48 4.8
    4 0.19 13 1.03 22 2.36 31 3.64 40 4.52 49 4.82
    5 0.24 14 1.18 23 2.5 32 3.75 41 4.57 50 4.85
    6 0.3 15 1.32 24 2.65 33 3.87 42 4.62 51 4.88
    7 0.37 16 1.47 25 2.79 34 3.97 43 4.66 52 4.95
    8 0.46 17 1.62 26 2.93 35 4.08 44 4.69
    9 0.55 18 1.77 27 3.08 36 4.18 45 4.72
    dB - sävytuntemustaso; % - formantin puheen ymmärrettävyys

    Yleinen formanttien ymmärrettävyys määritellään komponenttien summana:
    Puheen ymmärrettävyyden mittaamisen suorittamiseksi riittää määrittämään tavun ymmärrettävyys:

    Edut:
    • Et tarvitse kuuluttajien ryhmää;
    • Mittausaika lyhenee merkittävästi;
    • Artikulaatiopöytiä ei tarvita
    Virheet:
    • Mittaushenkilöstön teknisen koulutuksen vaatimukset lisääntyvät;
    • Prosessin automatisoinnin mahdottomuus;
    • Inhimillinen tekijä

    Miten...

    … erot objektiivisten ja subjektiivisten menetelmien välillä? Luulen, että olet jo arvannut, että koko asia on inhimillisessä tekijässä tai pikemminkin sen puuttuessa, koska mittauksissa käytetään keinotekoista ääntä, suuta ja korvaa.

    Harkitse yksinkertaisinta objektiivista menetelmää.

    Ensinnäkin testattavan polun vastaanottopäähän luodaan toimintaolosuhteita vastaava melutaso. Seuraavaksi mitataan kohinataso tekokorvan lähdössä kriittisellä kuulotaajuuskaistalla, kun tämän kaistan keskitaajuus on yhtä suuri kuin mittausäänen taajuus. Tämä melutaso on korjattava, tarvitsemme sitä edelleen. Tämän jälkeen polun sisäänmenoon syötetään kohinan sijasta äänisignaali. Äänen intensiteettitaso mikrofonissa otetaan sellaiseksi, että vaimennussäätimen ehdollisen nollapisteen kohdalla äänenpainejakauma vastaa formanttispektrikäyrää. Edelleen vaimennussäädön avulla saavutamme sen, että äänisignaalin taso polun lähdössä tulee yhtä suureksi kuin aiemmin tallentamamme kohinataso. Vaimennussäätimen lukema on mittauksen tulos.

    Formantin ja tavun ymmärrettävyyden määrittämiseksi käytä samoja menetelmiä kuin tonaalisessa menetelmässä.

    Edut:

    • tarkkuus ja nopeus;
    • Puhujia ja tilintarkastajia ei vaadita;
    • Mahdollisuus täysin automatisoida mittausprosessi
    Virheet:
    • Mittaushenkilöstön teknisen koulutuksen vaatimukset lisääntyvät

    Loppu

    Yleensä näiden sanojen jälkeen ei pitäisi olla mitään, paitsi krediittejä, joten puhun erittäin lyhyesti: se oli "nickname_below", katso meitä milloin tahansa sinulle sopivana ajankohtana. Ja kiitos huomiosta!

    Puheen akustiset ominaisuudet

    Puhesignaali on monimutkainen taajuus- ja amplitudimoduloitu kohinaprosessi, jolle on tunnusomaista seuraavat parametrit: äänenpaine, taajuusalue, puhesignaalin taso, dynaaminen alue.

    Äänenpaine - lisäpaine, joka syntyy väliaineessa ääniaaltojen kulun aikana. Väliaineessa leviäessään ääniaalto muodostaa kondensaatioita ja harvinaisuuksia, jotka aiheuttavat lisämuutoksia paineeseen suhteessa sen keskiarvoon. Äänenpaine on äänen tärkein kvantitatiivinen ominaisuus. Äänenpainetaso - suhteellisella asteikolla mitatun äänenpaineen arvo referenssipaineeseen p0 = 20 μPa, joka vastaa sinimuotoisen ääniaallon, jonka taajuus on 1 kHz, kuulokynnystä:

    Dynaaminen alue - hetkellisen signaalitehon Pmax maksimiarvon suhde hetkellisen tehon Pmin minimiarvoon tai logaritmisina yksiköinä:

    Tässä lausekkeessa Pmax:n arvoksi otetaan sellainen signaalitehoarvo, joka voidaan ylittää vain 2 %:n aikana kokonaislähetysajasta ja Pmin:n arvoksi sellainen signaalitehoarvo, joka on ylitettävä 98 % kokonaisajasta. Äänilähetysohjelman lähetyssignaalien dynaaminen alue:

    Puhujan puhe - 25..35 dB;

    Taiteellinen lukema - 40..50dB;

    Laulu ja musiikki-instrumentit - 45..55dB;

    Sinfoniaorkesteri - jopa 65 dB.

    Puhesignaalin energiaspektri on taajuusalue, jolle signaalin pääenergia on keskittynyt (kuva 2.2). Kuvasta seuraa, että puhe on laajakaistaprosessi, jonka taajuusspektri ulottuu 50..100 Hz:stä 8000..10000 Hz:iin. On kuitenkin todettu, että puheen laatu on varsin tyydyttävä, kun spektri on rajoitettu 300...3400 Hz:n taajuuksiin. Näitä taajuuksia pidetään tehokkaan puhespektrin rajoilla. Määritetyllä taajuuskaistalla tavujen ymmärrettävyys on noin 90 %, lauseiden ymmärrettävyys yli 99 % ja äänen tyydyttävä luonnollisuus säilyy.


    Kuva 2.2 - Puheen spektraalinen koostumus.

    Puhesignaalin spektriä (energian tai amplitudin jakautumista taajuuksilla) kuvaavin tärkein parametri ovat formantit (kuva 2.3), jotka määritellään energian pitoisuudeksi rajoitetulla taajuusalueella. Formantille on ominaista taajuus, leveys ja amplitudi. Formantin taajuus otetaan formantin sisällä olevan maksimiamplitudin taajuudeksi. Toisin sanoen formantti on jokin amplitudipurske spektrikaaviossa ja sen taajuus on tämän purskeen huipputaajuus.


    Kuva 2.3 - Puheenmuodot.

    Puheen ymmärrettävyys ja sen mittausmenetelmät

    puheäänen akustinen ymmärrettävyys

    Selkeys on oikein vastaanotettujen puheelementtien lukumäärän suhde lähetettyjen elementtien kokonaismäärään. Koska ääniä, tavuja, sanoja ja lauseita pidetään elementeinä, erotetaan ääni, tavu, sanallinen, fraasi, semanttinen ja formantti ymmärrettävyys. Kaikki ne ilmaistaan ​​samaa järjestelmää testattaessa erilaisilla numeerisilla arvoilla, koska ennakoidun viestin oikeiden arvioiden prosenttiosuus on aina suurempi kuin odottamattomalle - ennakointiaste lausetta kuunneltaessa on korkeampi kuin silloin, kun kuunnella yksittäisiä sanoja.

    Ymmärrettävyyttä mitataan erityisen koulutetun kuuntelijaryhmän avulla tekemällä objektiivisia tilastollisia tutkimuksia.

    Taulukossa 2.1 on esitetty ymmärrettävyyden ja ymmärrettävyyden välinen suhde.

    Taulukko 2.1

    Puheen ymmärrettävyys on ymmärrettävyyden foneettinen ominaisuus, ja se määräytyy kouluttamattomien kuuntelijoiden neuvotteluprosessissa.

    Selkeyden arvosana:

    Erinomainen - täydellinen selkeys ilman kysymyksiä;

    Hyvä - harvinaisten sanojen tai nimien erilliset uudelleenkysymykset ovat tarpeen;

    Tyydyttävä - on vaikea puhua, tarvitaan toistuvia kysymyksiä;

    Suurin sallittu - vaaditaan useita samasta materiaalista tehtyjä kysymyksiä, kun yksittäiset sanat siirretään kirjaimella täydellä kuulolla.

    Joten GOST 50840-95:n mukaisesti viestintäkanavan kautta lähetetyn puheen ymmärtäminen, jossa on korkea huomiojännitys, toistuvat kysymykset ja toistot, havaitaan alle 25-40%:n tavulla ymmärrettävyyden ollessa pienempi. yli 25 %:ssa on johdonmukaisen tekstin lukukelvottomuus (viestintähäiriö). Ottaen huomioon sanallisen ja tavuisen ymmärrettävyyden suhteen voidaan laskea, että kommunikaatiokatkoksia havaitaan, kun sanallinen ymmärrettävyys on alle 71 %.

    Puheinformaatiovuodon kanavan ja vastaavasti sen turvallisuusasteen arviointitehtävä rajoittuu tarkasti puheen ymmärrettävyyden mittaamiseen tai laskemiseen ja arvon vertaamiseen vaadittuun. Tiedon suojaus itsessään koostuu puheen ymmärrettävyyden vähentämisestä tietovuotokanavassa heikentämällä hyödyllisen signaalin tasoa.

    artikulaatiomenetelmä. Tämä menetelmä perustuu päävaatimuksen täyttymisasteen arviointiin - lähetetyn puheen ymmärrettävyyden varmistamiseen. Ymmärrettävyyden mitta on arvo, joka määritellään oikein vastaanotettujen puheelementtien lukumäärän suhteeksi riittävän suureen lähetettyjen kokonaismäärään ja ilmaistaan ​​prosentteina tai yksikön murto-osina - puheen ymmärrettävyys. Menetelmää näiden määrien määrittämiseksi kutsutaan artikulaatiomenetelmäksi.

    Luettavuusmittaukset tekevät erityisesti valitut ja koulutetut tiimit. Testit koostuvat puheen artikulaatioelementeistä koostuvien taulukkosarjojen lähettämisestä, kuullun tallentamisesta ja oikein vastaanotettujen elementtien keskimääräisen prosenttiosuuden laskemisesta. Käytetyistä artikulaatiotaulukoista (tavu, sana, fraasi) riippuen mitataan seuraavan tyyppisiä ymmärrettävyyttä:

    äänten ymmärrettävyys - D;

    tavujen ymmärrettävyys - S;

    sanojen luettavuus - W;

    lauseiden ymmärrettävyys - J.

    Lähetys- ja vastaanottojakson lopussa vastaanotettuja ja lähetettyjä taulukoita verrataan ja oikein vastaanotettujen elementtien prosenttiosuus lasketaan.

    Riittävän suurelle mittausmäärälle, ts. kun ymmärrettävyyden prosenttiosuus lasketaan suurelta määrältä hyväksyttyjä tavuja (suuruusluokkaa useita satoja ja enemmän), erilaisten satunnaistekijöiden vaikutuksesta ja yksittäisten operaattorien subjektiivisista ominaisuuksista lasketaan keskiarvo ja artikulaatiomittaukset antavat vakaat, objektiiviset ja toistettavat tulokset . Tällaisista mittauksista saadut ymmärrettävyysarvot ovat arvioita testattavan reitin laadusta. Tämä arvio luonnehtii testattua polkua (tapauksessamme varatun huoneen ilmatila + rakennusrakenteet). Koska välitetyistä tavuista puuttuu semanttinen merkitys, monien subjektiivisten tekijöiden vaikutus on suurelta osin eliminoitunut.

    On todettu, että jokaiselle kansalliskielelle kaikki ymmärrettävyystyypit: ääni - D, tavu - S, sana - W ja fraasi - J liittyvät toisiinsa yksiselitteisillä funktionaalisilla riippuvuuksilla muotoa S=f(D), W= f(S), J= f(W), jotka pysyvät muuttumattomina kaikissa lähetysolosuhteissa tosielämän poluilla. Siitä, että sellaiset ymmärrettävyyden tyypit, kuten D, S, W, J, ovat yksiselitteisiä riippuvuuksia, jotka voidaan mitata suoraan artikulaatiotaulukoilla, voidaan päätellä seuraavaa: mittaukset erityyppisillä taulukoilla eivät täydennä toisiaan, vaan ovat yksinkertaisesti toisiaan vastaavat (näiden mittausten tuloksena saatavien reitin laatua koskevien tietojen mielessä). Tämä tarkoittaa, että kaiken tyyppistä ymmärrettävyyttä ei tarvitse mitata. Riittää, kun mitataan vain yksi näistä suureista, ja loput saadaan vastaavista suhteista tai kaavioista. Siksi tarkoituksenmukaisin on mitata ymmärrettävyyden tyyppi, joka tässä tapauksessa on edullisin, ts. samalla mittaustarkkuudella se vaatii minimaalisen vaivan, rahan ja ajan kulutuksen niiden tuottamiseen. Artikulaatiotestejä suoritettaessa on kuitenkin parempi käyttää tavua ja sanallista ymmärrettävyyttä, koska. vähentää testitulosten riippuvuutta artikulaattorien subjektiivisista ominaisuuksista (esimerkiksi muistettavuudesta).

    Yllä olevat kokeelliset tutkimukset ovat osoittaneet seuraavat suhteet venäjän ja englannin puheen eri tyyppien ymmärrettävyyden välillä:


    Kuva 2.4a - Tavujen ymmärrettävyyden riippuvuus formanttien ymmärrettävyydestä.


    Kuva 2.4b - Tavujen ymmärrettävyyden riippuvuus äänten ymmärrettävyydestä.


    Kuva 2.4c - Sanojen ymmärrettävyyden riippuvuus äänten ymmärrettävyydestä.


    Kuva 2.4d - Fraasien ymmärrettävyyden riippuvuus tavujen ymmärrettävyydestä.


    Kuva 2.4e - Fraasien ymmärrettävyyden riippuvuus sanojen ymmärrettävyydestä.

    Artikulaatiomenetelmän etuna, joka johti sen laajaan käytännön soveltamiseen, on se, että menetelmä antaa objektiivisen kvantitatiivisen arvion puheensiirron laadusta sen pääpiirteen - ymmärrettävyyden - mukaan, ja tämä arviointi voidaan suorittaa melko korkealla tasolla. tarkkuudesta.

    Formantin ymmärrettävyyden raja-arvo, jolla puheviestin merkitys on mahdollista ymmärtää, on siis 15 %, mikä vastaa 25 % sanan ymmärrettävyydestä. Vuotokanavan estimointitehtävä rajoittuu analysoitavan kanavan puheen ymmärrettävyyden mittaamiseen tai laskemiseen ja saadun arvon vertaamiseen vaadittuun.