Разборчивость речи в основном зависит от. Понятность и разборчивость речи

Глава 10. ПОНЯТНОСТЬ И РАЗБОРЧИВОСТЬ РЕЧИ .
10.1. ВВЕДЕНИЕ.
Основной характеристикой любого канала передачи речи является понятность речи. Для определения этой характеристики применяется статистический метод с участием большого числа слушателей и дикторов. Понятность речи - определяющая характеристика тракта передачи речи, так как если тракт не обеспечи­вает полной понятности ее, то никакие другие преиму­щества его не имеют значения - он не пригоден к эксплуатации.

Для непосредственного определения этой качествен­ной характеристики есть только один метод: статисти­ческий с участием большого количества операторов (слушателей и дикторов). Разработан косвенный, коли­чественный метод определения понятности речи через ее разборчивость.

Разборчивостью речи называют относительное или процентное количество принятых элементов речи из общего числа переданных по тракту. Элементы речи - это слоги, звуки, слова, фразы (команды), цифры. Со­ответственно этому есть слоговая, звуковая, словесная, смысловая и цифровая разборчивость. В практике ис­пользуют преимущественно слоговую, звуковую и сло­весную разборчивость. Для измерений разборчивости разработаны специальные таблицы слогов, звукосочетаний и слов с учетом их встречаемости в русской ре­чи (аналогичные таблицы есть и для других языков). Звуковых таблиц нет, так как звуки, кроме гласных, отдельно не произносятся, а для измерений звуковой разборчивости пользуются слоговыми таблицами или таблицами звукосочетаний. Все эти таблицы называют артикуляционными.

Измеряют разборчивость с помощью группы трени­рованных слушателей и дикторов, называемой артику­ляционной бригадой, поэтому метод измерений назы­вают артикуляционным . Тренировка бригады необходи­ма, так как иначе результаты измерений некоторое время будут расти при неизменных условиях, по мере натренированности артикулянтов. Тренировку проводят до тех пор, пока артикулянты не будут давать стабиль­ные результаты при заданных условиях измерений. Дольше всего артикулянты тренируются на слоговых таблицах. Бригаду составляют из молодых людей без нарушений слуха и речи.

Артикулянты дают наибольшие возможные значения разборчивости речи в заданных условиях работы трак­та. Поэтому для определения связи между разборчи­востью, измеренной артикулянтами , и понятностью ре­чи для обычных абонентов в тех же условиях были проведены массовые испытания. В этих испытаниях участвовали самые разнообразные люди из числа по­тенциальных абонентов общим числом более 2000 че­ловек. Были взяты самые разнообразные тракты с раз­личными условиями их работы. Разговор велся по спе­циальным разговорникам в обе стороны, как при теле­фонных переговорах. При этом контролировалось по­нимание абонентами друг друга. Оценка ставилась по пятибалльной системе: отлично, если понятность была полная, без каких-либо переспросов; хорошо, если бы­ли отдельные переспросы редко встречающихся слов или неизвестных названий, фамилий и т. п., о которых нельзя догадаться по смыслу; удовлетворительно, если требовались частые переспросы и слушатели сообщали, что трудно разговаривать; предельно допустимо, если требовались неоднократные переспросы одного и того же материала с передачей отдельных слов по буквам с полным напряжением слуха; срыв связи, если або­ненты не могли понять друг друга и отказывались от разговора. Одновременно для каждого из условий испытаний и каждого тракта были измерены величины разборчивости речи с помощью тренированной брига­ды.

Та блица 10.1

В табл. 10.1 приведены градации понятности речи и соответствующие им величины разборчивости. Одно­временно с указанными испытаниями были измерены статистические зависимости между слоговой, словес­ной, звуковой и смысловой разборчивостью для рус­ской речи.

Кроме этого, был разработан ускоренный метод из­мерения разборчивости речи - метод выбора . Он осно­ван на следующем. Каждая таблица составлена из не­скольких групп слов. В каждой группе подобраны сло­ва, по звучанию сходные между собой. Диктор пере­дает из каждой группы только одно слово. Слушатели имеют перед собой таблицу и должны отметить то слово, которое, по их мнению, было передано. Чередо­вание слов изменяется в случайном порядке. Опреде­ляется процент правильно принятых слов. Между коли­чеством принятых слов по этому и артикуляционному методам установлена статистическая связь. Этот метод не требует длительной тренировки слушателей, но точ­ность его ниже артикуляционного.

Зависимость между понятностью речи и ее разбор­чивостью, приведенная в табл. 10.1, справедлива, когда идет прием самой разнообразной информации. В тех же случаях, когда идет обмен информацией с гораздо меньшим объемом (т. е. при ограниченном словаре), понятность речи будет выше, чем в общем случае при той же разборчивости речи. Например, для диспетчер­ской связи полная понятность речи получается при сло­говой разборчивости речи около 40%, что соответст­вует удовлетворительной понятности в общем случае. Поэтому при расчете устройств, подобных диспетчер­ской связи, ориентируются на меньшие величины раз­борчивости речи, чем при расчетах систем широкого применения. Но в каждом случае необходимо предва­рительно знать величину разборчивости, при которой будет полная понятность передаваемой информации.
^ 10.2. ФОРМАНТНЫЙ МЕТОД ОПРЕДЕЛЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ.
Был предпринят ряд попыток для нахождения непо­средственной связи между разборчивостью речи, с од­ной стороны, характеристиками трактов передачи речи и условиями ее приема и передачи, с другой, но не бы­ло получено приемлемых результатов. Только при по­средстве формантной теории, разработанной Флетчером и Коллардом, удалось установить эту связь.

Форманты звуков речи заполняют весь частотный диапазон от 150 до 7000 Гц. Средняя вероятность по­явления формант в том или ином участке диапазона для каждого языка вполне определенна. Условились делить весь частотный диапазон на 20 таких полос, чтобы в каждой из них вероятность появления формант была одинаковой. Соответствующие полосы назвали полосами равной разборчивости. Они определены для ряда языков, в том числе и для русского. Оказалось, что при достаточно большом количестве передаваемого материала вероятности появления формант подчиняют­ся правилу аддитивности. Вследствие этого вероятность появления формант в каждой полосе равной разборчи­вости равна 0,05.

Если слушать речь в условиях шумов и помех, то ее разборчивость получается меньшей, чем в их отсутст­вие. Дело в том, что форманты имеют различные уров­ни интенсивности: у громких звуков выше, чем у глу­хих. Поэтому при увеличении уровня шумов сначала маскируются форманты с низкими уровнями, а затем с более и более высокими. Вследствие этого по мере увеличения уровня шумов и помех вероятность вос­приятия формант постепенно уменьшается. Коэффи­циент, определяющий это уменьшение, называют ко­эффициентом восприятия или коэффициентом разбор­чивости w . Таким образом, в каждой полосе равной разборчивости вероятность приема формант будет ΔА = 0,05 w .

Так как в основном вся энергия звуков речи сосре­доточена в формантах, то уровни формант практически совпадают с уровнями звуков речи. На рис. 10.1 показано распределение уровней речи, т. е. интегральная вероятность появления уровня не менее заданного в за­висимости от разности между средним уровнем речи, определенным за длительный интервал времени, и за­данным уровнем. Эта вероятность практически совпа­дает с вероятностью распределения формант. Заметим, что это распределение почти не зависит от частоты.

Порог слышимости в шумах (см. § 2.7) определяет­ся спектральными уровнями шумов. Для флуктуационных шумов величина порога слышимости почти не за­висит от времени. Вследствие этого разность между средним спектральным уровнем речи и спектральным уровнем шумов будет определять вероятность появле­ния формант выше уровня шумов. Но разность между уровнем сигнала и уровнем порога слышимости назы­вают уровнем ощущения . Следовательно, коэффициент разборчивости w определяется уровнем ощущения фор­мант

где B р - средний спектральный уровень речи; В ш - спектральный уровень шумов.

Коэффициент разборчивости может быть определен с помощью графика рис. 10.1. Для примера на этом рисунке показаны уровень ощущения Е и соответст­вующий ему коэффициент разборчивости w .

Между формантной и другими видами разборчивости экспериментально были найдены зависимости. Для сло­говой разборчивости такая зависимость приведена на рис. 10.2. Интересно отметить, что при формантной разборчивости, равной 0,5 (принимается только поло­вина всех формант), слоговая разборчивость равна 80%, т. е. получается почти полная понятность речи

Это характеризует избыточность речи и комбинацион­ную способность человеческого мозга.


Рис. 10.1. Интегральное рас­пределение уровней речи: 1 - для непреобразованного сигна­ла; 2 - для предельно-ограниченно­го по амплитуде


Рис. 10.2. Зависимость сло­говой разборчивости от формантной

Звуковые единицы характеризуются различными свойствами в зависимости от различных факторов их рассмотрения. Образованию звуковых единиц соответствует артикуляционный фактор, который называют анатомо-физиологическим. Акустический фактор относится к свойствам звуковых единиц в результате работы произносительных органов и определяет звучание речи. Восприятие звуков человеком относится к персептивному фактору.

Первоначально описания звуковых систем осуществлялось на основе

анализа артикуляций. Но с развитием техники акустического анализа звуков исследователи приходят к выводу, что акустические характеристики речи наиболее важны. Современная фонетика учитывает тесную связь и взаимообусловленность между артикуляционными и акустическими характеристиками речи.

Исследования восприятия речевых единиц показывает, что они воспринимаются не так, как любые другие звуки. Это объясняется, как способностью человека преобразовывать их в соответствующие артикуляции, так и функциональными свойствами речевых звуковых единиц.

Звуки речи являются сложными звуками в основном из-за того, что процесс речеобразования сопровождается резонансными явлениями, собственные частоты которых изменяются в зависимости от того, какой звук в данный момент произносится.

Источник звука вызывает в системе резонаторов речеобразующего тракта собственные колебания. Звуки на собственных частотах резонаторов являются наиболее усиленными. Собственные частоты резонаторов называют формантами звука, так как они формируют характерное звучание гласных и согласных.

Частоты формант определяются конфигурацией речевого тракта и свойства источника звука на них не влияет. Это одно из важнейших положений акустической теории речеобразования. Это положение позволяет связывать частоты формант только со спецификой артикуляции и по частотам формант судить о положении артикуляционных органов.

Число формант, существенно характеризующих определенный звук речи, исследователи определяют по разному, но в большинстве случаев исследователи считают, что в образовании определенного звука участвуют четыре форманты.
^ Основные параметры звукового поля. Устанавливается следующий минимальный набор критериев, характеризующих параметры звукового поля, формируемого СЗО (системой звукового обеспечения) :

· показатель разборчивости речи;

· диапазон эффективно воспроизводимых звуковых частот;

· неравномерность поля уровней на озвучиваемой поверхности;

· номинальный уровень звукового давления (УЗД).
Электроакустический расчет выполняется для всей озвучиваемой поверхности. Под озвучиваемой поверхностью подразумевается плоскость параллельная полу помещения, а в случае озвучивания открытых пространств - параллельной поверхности земли. Высота этой поверхности относительно уровня пола при наличии сидячих зрительских мест принимается равной 1.2 м, а для стоящих слушателей - 1.6 м.
Конечным критерием оценки разборчивости речи является ее понятность. Она представляет собой субъективную категорию с 5 градациями, указанными в графе 1 табл.1. При определении понятности следует исходить из ее связи с расчетными (или измеренными) критериями. В графах 2 и 3 табл. 1. данная связь показана для слоговой разборчивости русской речи и для быстрого индекса передачи речи (RASTI) .

Таблица 1


Понятность

Отлич

ная


Хоро

шая


Удовлетвори

тельная


Плохая

Недопустимо плохая

Слоговая разборчивость S,%

/Справочник ./


80-100

55-80

44-55

25-40

>25

^ RASTI /МЭК 268-16/

0.75-1.00

0.60-0.75

0.45-0.60

0.30-0.45

>0.30

Для проектируемых СЗО должна быть обеспечена разборчивость речи, соответствующая ее понятности не хуже "хорошей".

В отдельных случаях, оговоренных в ТЗ на проектирование, допускается обеспечение "удовлетворительной" понятности речи. Такой подход допустим лишь в тех случаях, когда особенности очень гулкого помещения не позволяют снизить значение его времени реверберации на средних частотах менее чем до 2.0-2.5 с. Типичным примером таких помещений являются залы-памятники архитектуры, а также культовые сооружения.

Расчет разборчивости речи производится для всех озвучиваемых поверхностей. Помимо электроакустических и геометрических параметров СЗО, к исходным данным для расчета разборчивости речи относятся время реверберации озвучиваемого помещения (RT60, с) и ожидаемый в нем уровень акустических шумов (LN, дБ). Оба эти показателя устанавливаются в виде набора значений на частотах стандартного октавного ряда в пределах эффективно воспроизводимого диапазона частот. Значения RT60 и LN заимствуются из соответствующих разделов проекта, посвященных акустическому решению помещений и их защите от шума. При отсутствии этих данных в указанных разделах проекта, значения RT60 должны быть вычислены отдельно, а значения LN могут быть приняты как допустимые значения октавных УЗД, указанных в нормативной документации на данный тип помещений (например, согласно МГСН 2.04-97). При расчете RT60 может быть использована традиционная методика.

Диапазон эффективно воспроизводимых частот определяется как участок амплитудно-частотной характеристики с неравномерностью не более ± 3 дБ в октавных полосах.

Неравномерность поля уровней на озвучиваемой поверхности DL в дБ определяется отдельно в октавных полосах в заданном для данного типа СЗО по выражению:

где LMAX и LMIN соответственно максимальные и минимальные значения общих уровней звукового давления (с учетом прямого звука и диффузной составляющей поля) на озвучиваемой поверхности, вычисляемые при работе СЗО на установленных для отдельных акустических излучателей значениях подводимой электрической мощности, которые не должны превышать значений номинальной электрической мощности, оговоренных в ТУ на данный вид акустического излучателя.

^ Речевые СЗО.

Основным требованием к речевой СЗО является обеспечение достаточной разборчивости речи на всей озвучиваемой поверхности.

Расчет электроакустических параметров следует проводить для октавных полос со среднегеометрическими частотами 500, 1000 и 2000 Гц.

Минимально допустимые регламентируемые настоящим Руководством параметры поля речевой СЗО приведены в табл. 2

Таблица 2.


^ Параметр звукового поля

Уровень комфорта

I

II

разборчивость

отл.

хор.


200 - 4000 Гц

200 - 6300 Гц


2 дБ

3 дБ

уровень звукового давления

см. п. 5.2.11 (минимальное допустимое значение - 80 дБ)

^ Трансляционные музыкально-речевые СЗО.

Основными требованиями к трансляционным музыкально-речевым СЗО являются обеспечение достаточной разборчивости речи на озвучиваемой поверхности, соответствующей местам постоянного или временного пребывания людей, а также обеспечение возможности высоко качественного прослушивания музыки.

Расчет электроакустических параметров следует проводить для октавных полос со среднегеометрическими частотами 250, 500, 1000, 2000 и 4000 Гц по формуле (1).

Минимально допустимые регламентируемые настоящим Руководством параметры поля трансляционной музыкально-речевой СЗО приведены в табл. 3.

Таблица 3.


^ Параметр звукового поля

Уровень комфорта

I

II

разборчивость

отл.

хор.

диапазон эффективно воспроизводимых частот

60 - 16000 Гц

100 - 12500 Гц

неравномерность поля уровней на озвучиваемой площади

2 дБ

3 дБ

уровень звукового давления

см. п. 5.2.11 (минимальное допустимое значение - 90 дБ)

^ Концертные музыкально-речевые СЗО.

К категории концертных музыкально-речевых относятся системы, предназначенные звукового обеспечения концертных выступлений, театральных постановок, музыкально-речевых шоу-программ, кино- и видеопоказа и решения других задач, требующих особо высокого качества звучания.

Расчет электроакустических параметров следует проводить для октавных полос со среднегеометрическими частотами 125, 250, 500, 1000, 2000, 4000, 8000 Гц.

Минимально допустимые регламентируемые настоящим Руководством параметры поля речевой СЗО приведены в табл. 4

Таблица 4.


^ Параметр звукового поля

Уровень комфорта

I

II

разборчивость

отл.

хор.

диапазон эффективно воспроизводимых частот

45 - 18000 Гц

80 - 12500 Гц

неравномерность поля уровней на озвучиваемой площади

2 дБ

3 дБ

уровень звукового давления

см. п. 5.2.11 (минимальное допустимое значение - 100 дБ)

^ 10.3. МЕТОДЫ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ.
Введение . Одним из методов повышения разборчи­вости речи является снижение уровней шумов и помех. Но в большинстве случаев они бывают заданными и не зависят от нас, хотя иногда можно снизить помехи от диффузного звука (путем уменьшения акустического отношения), от шумов, проникающих под заглушки, и т. п. Остается возможность манипулирования уровня­ми речи у слушателя по прямому звуку. Это возможно следующим образом: повышением уровня голоса гово­рящего, приближением микрофона ко рту и уменьше­нием неравномерности озвучения (путем приближения минимального уровня прямого звука к максимально­му), увеличением индекса тракта. Последний способ возможен только при условии, что в системах звуко­усиления не достигнут предельный индекс тракта, а в других системах - рациональный. И, наконец, есть еще способ повышения разборчивости речи - способ такой компрессии динамического диапазона речевого сигнала, при которой происходит повышение уровней слабых звуков речи при сохранении уровней громких звуков речи. Для систем с обратной акустической связью этот метод непригоден, так как возникает самовозбуждение системы. А в остальных системах сла­бые уровни речи повышаются на величину компрессии динамического диапазона.

Из компрессоров наиболее применимы ограничите­ли уровня, действие которых сводится к выравниванию пиковых уровней громких звуков, при этом не изменя­ются соотношения между уровнями слабых звуков. Подробно об этом будет сказано в курсе «Радиове­щание».

^ Амплитудное ограничение. Рассмотрим предельный случай компрессии речи - предельное амплитудное ограничение , при котором речевой сигнал превращается в последовательность прямоугольных импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами. При моду­ляции сигнала передатчика таким речевым сигналом получается телеграфный режим работы. А это означает, что все звуки речи будут иметь одинаковый и притом максимальный уровень на приеме. Если при передаче неограниченной речи слабые звуки маскировались по­мехами, то при таком способе передачи они окажутся выше уровней помех и разборчивость будет выше, чем при приеме неограниченной речи. Правда, качество зву­чания и разборчивость речи в отсутствие помех будут ниже, чем для неограниченной речи, но остаются еще в допустимых пределах. Оказывается, что предельно ог­раниченный речевой сигнал для слуха будет иметь распределение по частоте и по уровням, не очень силь­но отличающееся от распределений неограниченной ре­чи. На рис. 10.1 приведено среднее распределение уров­ней для предельного ограничения речи (кривая 2 ) и без него (кривая 1 ), крутизна кривой изменяется толь­ко вдвое, а на рис. 10.3 приведены спектральные оги­бающие звуков речи также для обоих условий (полу­чаются несколько сглаженные форманты). Это объяс­няется тем, что слух имеет «комплект» узкополосных фильтров и, когда в одном или нескольких фильтрах уровень в данный момент повышается, то в других он уменьшается и наоборот, в результате чего в каждом из них процесс происходит с переменным уровнем.

В случае непредельного ограничения или компрес­сии результат получается промежуточный между пре­дельным ограничением и передачей неограниченной, некомпрессированной речи.

^ Вокодерная связь . Вокодер представляет со­бой устройство, в передающей части которого из речевого сигнала выделяются параметры, определяющие информативность речи. К этим параметрам относятся спектральные огибающие звуков речи и параметры ос­новного тона речи, т. е. признаки звуков речи, медлен­но изменяющиеся во времени. Параметр основного тона управляет частотой генератора основного тона, на­ходящегося в приемной части вокодера.

Рис. 10.3. Спектраль­ные огибающие зву­ков речи до ограничения (сплошные кри­вые) и после (пунктирные) : а ) звука «э»; б ) зву­ка «м»
Напряжение от этого генератора, создающего импульсы, сходные с им­пульсами гортани, подается на сложный фильтр, ими­тирующий акустическую систему речевого тракта для звонких звуков речи. При синтезе глухих звуков речи генератор создает шумовое напряжение, подаваемое на фильтры, имитирующие систему для глухих звуков речи. Параметрами этих фильтров и уровнем звуков речи управляют параметры, выделенные на передаю­щем конце, в результате чего восстанавливается спект­ральная огибающая речевого сигнала. Качество и разборчивость восстановленного сигнала получаются до­статочно высокими.

В зависимости от типа выделяемых параметров ре­чевого сигнала есть вокодеры полосные, гармониче­ские, формантные и фонемные. В полосных выделяется комплекс ординат спектра в узких полосках, в гармо­нических - коэффициенты Фурье от разложения спек­тральной огибающей в сумму гармоник, в формантных - частоты и амплитуды формант, в фонемных - какой звук произнесен. Так как эти параметры изменя­ются во времени со скоростью произнесения звуков речи (8-10 звуков в секунду), то частотный диапазон каждого параметра не превышает 20-25 Гц. Кроме то­го, в каждом из перечисленных типов вокодеров выде­ляется параметр (частота) основного тона голоса.

В полосных вокодерах берут 12-18 полос. Динами­ческий диапазон каждого параметра не превышает 25 дБ, поэтому при переводе параметров в импульсную форму достаточен четырехзначный код (16 значений по 1,5 дБ), а во времени достаточно 50 отсчетов в се­кунду. Необходимая пропускная способность для спект­ральных параметров требуется 18х4х50=3600 имп/с Ш на передачу основного тона еще 1200 имп/с, а всего 4800 имп/с. В настоящее время уже достигнуто высокое значение разборчивости речи и качества ее при скоро­сти в 2400 имп/с. В гармоническом вокодере требуемая скорость передачи несколько меньшая.

В наиболее распространенном типе формантного вокодера выделяются четыре формантных частоты и четыре формантных уровня. Динамический диапазон этих параметров - не более 20 дБ, поэтому достаточ­ны трехзначный код (8 значений по 2,5 дБ) и 40 отсче­тов в секунду. Всего получается 8х3х40 = 960 имп/с и 240 имп/с отводится на передачу мелодии основного тона. Требуемая скорость передачи параметров полу­чается равной 1200 имп/с.

Для фонемного вокодера требуемая скорость пере­дачи пока еще не ниже 300 имп/с, при этом теряется информация об индивидуальности говорящего.

Применение вокодеров дает повышение разборчи­вости речи в условиях радиопомех, так как сигналы пе­редаются в телеграфном режиме со специальным по­мехоустойчивым кодированием. Речь, передаваемая с помощью вокодерной связи, идет с высоким уровнем и хорошей разборчивостью даже при наличии сильных помех и замираний. Хорошая помехоустойчивая радиосвязь получается при формантном кодировании. Ее при­меняют на линиях KB связи.

Импульсная форма сигнала дает возможность коди­рования речи аналогично кодированию телеграфной передачи. Такую закодированную речь невозможно под­слушать современными методами. Кроме того, вокодерная связь дает возможность значительного увеличения числа каналов в импульсных системах связи. Для обыч­ного речевого сигнала требуется пропускная способ­ность около 50 000 имп/с. В этом канале можно разме­стить около десяти передач при использовании полосно­го вокодера и около 40 при использовании формантного.

Понятность речи 1 является качественной характеристикой тракта. Для ее непосредственного определения есть только один метод: статистический с участием большого числа операторов (слушателей и дикторов). Разработан косвенный, количественный метод определения понятности речи через ее разборчивость.

Разборчивостью речи называют относительное или процентное количество принятых специально тренированными слушателями (артикулянтами) элементов речи из общего количества переданных по тракту (см. ). В качестве элементов речи применяют слоги, звуки, слова, фразы (команды), цифры. Соответственно этому есть слоговая, звуковая, словесная, смысловая и цифровая разборчивость. В практике используют преимущественно слоговую, звуковую и словесную разборчивость. На рис. 10.5 приведены статистические зависимости между слоговой словесной и звуковой разборчивостью для обычных телефонных переговоров на русском языке. В табл. 10.2 приведены градации понятности речи и соответствующие им значения разборчивости, измеренные артикулянтами.

Таблица 10.2. (см. скан) Разборчивость речи для различных градаций понятности передачи

Рис. 10.5. Зависимости: а - между словесной и слоговой разборчивостью речи; между звуковой и слоговой разборчивостью речи

Таблица 10.3. (см. скан) Нормы на допустимые искажения трактов речевых информационных передач

Понятность речи была определена для обычных абонентов в процессе обычных телефонных переговоров. При этом понятность считалась отличной, если переговоры велись без переспросов; хорошей, если были отдельные переспросы редко встречающихся слов или неизвестных фамилий, названий и т.п., о которых нельзя догадаться по смыслу; удовлетворительной, если требовались частые переспросы и слушатели сообщали, что трудно разговаривать; предельно допустимой, если требовались неоднократные переспросы одного и того же материала в передаче отдельных слов по буквам и с полным йапряжением слушателей. В табл. 10.3 даны допустимые искажения для трактов речевой связи и информационных трактов.

ФОРМАНТНЫЙ МЕТОД РАСЧЕТА РАЗБОРЧИВОСТИ РЕЧИ

Форманты звуков речи заполняют весь частотный диапазон Гц. Этот частотный диапазон делят на 20 полос равной разборчивости. В табл. 10.4 приведены границы таких полос для русского языка. Там же приведены и средние значения частоты для этих полос. Вероятность появления формант в каждой полосе равной разборчивости равна 0,05. При слушании речи в условиях шумов и помех разборчивость получается меньшей, чем в их отсутствие. Коэффициент, определяющий это уменьшение, называют коэффициентом восприятия или коэффициентом разборчивости до, т. е. в каждой полосе равной разборчивости вероятность приема формант .

Рис. 10.6. Зависимость коэффициента разборчивости речи от уровня ощущения ее формант: 1 - для обычной речи; 2 - для предельно ограниченной по амплитуде

Коэффициент разборчивости до определяется уровнем ощущения формант где средний спектральный уровень речи; спектральный уровень шумов.

На рис. 10.6 показано распределение спектральных уровней речи, т. е. интегральная вероятность появления уровня не менее заданного уровня речи, определенного за длительный интервал времени, и заданного уровня (кривая У). Эта вероятность практически совпадает с вероятностью распределения формант. Заметим, что это распределение почти не зависит от частоты. Кривая 2 соответствует предельно ограниченной речи (по амплитуде).

Коэффициент разборчивости до для гладких шумов 1 может быть определен с помощью рис. 10.6 и табл. 10.5. Для примера на этом рисунке показаны уровень ощущения (равным разности спектральных уровней речи и шумов и соответствующий ему коэффициент разборчивости дол. Он также может быть определен по приближенным формулам (см. § 10.7).

Для каждой полосы равной разборчивости коэффициент разборчивости в общем случае будет разный

Поэтому суммарная вероятность приема формант, называемая разборчивостью формант.

Мы разговариваем по телефону, мы слушаем выступления и речи в концертных залах. Некоторые из нас пытаются подслушать чужой разговор, иные – сделать прослушку невозможной. Однако для всех наведенных выше случаев бывали такие ситуации, когда посторонний шум настолько мешал услышать нужное, что слова становились попросту неразборчивыми. Чтобы таких проблем не возникало, перед эксплуатацией трактов проводится акустическая экспертиза каналов речевой коммуникации.

Канал, либо тракт речевой коммуникации (или канал передачи речевой информации) – это физическая среда, путь, который проходит звук от отправления к приему. Это может быть воздушный, электроакустический, вибрационный, параметрический, оптико-электронный канал, однако не будем останавливаться на их рассмотрении, так как наша цель – измерение важнейшего критерия качества тракта – разборчивость речи.

Методы измерения разборчивости речи можно коротко подать в виде списка:

  • Субъективные:
    • Чисто субъективный метод;
    • Объективизированный;
    • Тональный;
  • Объективные:
    • Формантные:
      • AI (Индекс артикуляции);
      • SII (Индекс разборчивости речи);
    • Модуляционные:
      • STI (Speech transmission index – Индекс передачи речи);
      • RASTI (Быстрый STI);
      • STIPA (STI для систем звукоусиления);
      • STITEL (STI для телекоммуникационных систем);
    • %ALcons (Оценка потерь артикуляции согласных);
Конечно, есть еще советские методы Покровского, Быкова, Сапожкова, однако трогать их не будем, по крайней мере пока, так как приведенные выше методы обеспечивают лучший результат.

Разумеется, охватить все и сразу мы не в силах, потому для начала рассмотрим отличия объективных методов от субъективных, а также поподробнее остановимся на последних.

Чистый субъективизм

В оценке разборчивости речи чистым субъективным методом участвует пара диктор-аудитор. Их работу удобно рассматривать на примере тестирования радиостанции по рекомендациям МККР (Международного Консультативного Комитета по Радиосвязи): на передающей стороне радиоканала диктор читает текст, в то время как аудитор на принимающей стороне выставляет оценку тракта по пятибалльной (или какой-либо другой) шкале. Тяжело не заметить очевидный большой недостаток такого подхода, а именно неизбежное влияние на результат особенностей речи и слуха тестирующих людей.

Решение этой проблемы такое же очевидное, как и сама проблема.

Объективизированность

Наиболее распространенным объективизированным методом является метод артикуляции. Он заключается в том, что перед началом измерений в испытуемом канале создаются нормальные акустические условия (уровни шумов). Участвуют несколько аудиторов, а диктор вместо обычного текста читает специально составленные таблицы слогов (артикуляционные таблицы). Аудиторы записывают услышанное и по окончанию сеанса передачи сверяют свои таблицы с дикторскими. Отношение правильно услышанных слогов к их общему числу и есть оценка разборчивости речи, которая выражается в процентах либо в долях единицы.

Отметим, что при большем числе продиктованных и соответственно принятых слогов влияние различных факторов усредняется. Влияние факторов еще более усредняется, если в испытаниях принимают участие различные группы дикторов и аудиторов. В этом и заключается объективизированность артикуляционного метода. Однако не только в этом. Получить объективные результаты помогает начитка именно звукосочетаний, не имеющих смысловой нагрузки, так как при приеме слов или фраз можно додумать и восстановить искаженный трактом элемент.

Что касается аудиторов, есть мнение, что это должны быть специально натренированные бригады, однако ГОСТ Р 50840-95 требует совершенно обратное. Лично я больше склоняюсь к последнему.

Достоинства:

  • Универсальность (метод применим к любому типу тракта);
  • Простота (метод не требует у операторов специальных технических знаний)
Недостатки:
  • Громоздкость процедуры измерений (требуются значительные затраты временных, материальных и человеческих ресурсов);
  • Создание артикуляционных таблиц (с каждым новым типом таблиц результаты измерений отличаются);
  • Зависимость результатов от степени тренерованости операторов;
  • Человеческий фактор (влияние на результат особенностей речи и слуха)

Объективизированность. Часть 2

Рассмотрим еще один объективизированный субъективный метод – тональный, согласно которому диктор заменяется генератором чистых тонов. Этот искусственный голос на деле – обычный громкоговоритель без диффузора, который генерирует сигналы таким образом, чтобы уровень звуковых давлений, создаваемый на различных частотах, соответствовал бы кривой спектра формант. Аудиторы никуда не деваются. Теперь их задача – это просто определить, слышен ли сигнал на данной частоте или нет.
Частоты, на которых проводятся измерения
250 500 650 800 990 1125 1300 1500 1700 1875
2050 2225 2425 2725 3100 3500 3850 4550 6150 8600

Уровень ощущения формант измеряется путем плавного ввода затухания до исчезновения слышимости звука, затем затухание следует убавлять до момента появления звука. Два значения затухания усредняются – это и есть результат измерения.

Формантная разборчивость речи определяется по таблице:

дБ % дБ % дБ % дБ % дБ % дБ %
1 0.04 10 0.65 19 1.92 28 3.22 37 4.28 46 4.75
2 0.09 11 0.76 20 2.07 29 3.37 38 4.37 47 4.78
3 0.14 12 0.89 21 2.2 30 3.51 39 4.46 48 4.8
4 0.19 13 1.03 22 2.36 31 3.64 40 4.52 49 4.82
5 0.24 14 1.18 23 2.5 32 3.75 41 4.57 50 4.85
6 0.3 15 1.32 24 2.65 33 3.87 42 4.62 51 4.88
7 0.37 16 1.47 25 2.79 34 3.97 43 4.66 52 4.95
8 0.46 17 1.62 26 2.93 35 4.08 44 4.69
9 0.55 18 1.77 27 3.08 36 4.18 45 4.72
дБ - уровень ощущения тона; % - формантная разборчивость речи

Общая формантная разборчивость определяется как сумма составляющих:
Для окончания измерения разборчивости речи достаточно определить слоговую разборчивость:

Достоинства:
  • Не нужна бригада дикторов;
  • Значительно сокращается время измерений;
  • Не нужны артикуляционные таблицы
Недостатки:
  • Повышенные требования к технической образованности измеряющего персонала;
  • Невозможность автоматизации процесса;
  • Человеческий фактор

А как же…

… отличия объективных методов от субъективных? Думаю, вы уже догадались, что все дело в человеческом факторе, а точнее в его отсутствии, так как для измерений используют искусственный голос, рот и ухо.

Рассмотрим простейший объективный метод.

Прежде всего, на приемном конце испытуемого тракта создается уровень шума, соответствующий условиям работы. Далее измеряется уровень шума на выходе искусственного уха в критической полосе частот слуха, при этом средняя частота этой полосы равна частоте измерительного тона. Этот уровень шума обязательно нужно зафиксировать, он нам еще понадобится. После этого вместо шума на вход тракта подают тональный сигнал. Уровень интенсивности звука на микрофоне берется таким, чтобы при условном нуле на регулировщике затухания распределение звуковых давлений соответствовало кривой спектра формант. Далее с помощью регулирования затухания добиваются, чтобы уровень тонального сигнала на выходе тракта стал равен зафиксированному нами ранее уровню шума. Показания регулятора затухания – результат измерения.

Чтобы определить формантную и слоговую разборчивости, пользуются теми же способами, что и в тональном методе.

Достоинства:

  • Точность и быстрота;
  • Не требуются дикторы и аудиторы;
  • Возможность полной автоматизации процедуры измерений
Недостатки:
  • Повышенные требования к технической образованности измеряющего персонала

The End

Обычно после этих слов и быть ничего не должно, ну разве что титры, потому буду предельно краток: это был «никнейм_внизу», смотрите нас в любое удобное для вас время. И спасибо за внимание! 3.2. Средства акустической разведки В общем случае акустическая разведка осуществляется перехватом производственных шумов объекта и перехватом речевой информации. По способу применения технические средства съема акустической информации можно подразделить на две большие категории : 1. средства, требующие физического проникновения в защищаемые помещения: o радиозакладки; o закладки с передачей акустической информации в ИК-диапазоне; o закладки с передачей по сети 220 В; o закладки с передачей информации по телефонной линии; o диктофоны; o проводниковые микрофоны; o "телефонное ухо". 2. средства, не требующие физического проникновения в защищаемые помещения: o аппаратура, использующая "микрофонный эффект" устройств; o высокочастотное навязывание; o стетоскопы; o лазерные микрофоны; o направленные микрофоны. Рассмотрим более подробно перечисленные выше средства акустической разведки. Радиозакладки. Назначением этих устройств является передача по радиоканалу акустической информации с защищаемого объекта. Закладки могут быть исполнены в виде отдельного модуля или имитировать формой повседневные предметы обихода (пепельницу, зажигалку, калькулятор, авторучку и т.д.). Внешний вид радиозакладок представлен на рисунках 3.4, 3.5, 3.6. Рис. 3.4. Камуфлированная радиозакладка в виде зажигалки Рис. 3.5. Камуфлированная радиозакладка в виде монеты Рис. 3.6. Радиозакладка в обычном исполнении Радиозакладка передает информацию с помощью электромагнитных волн радиодиапазона. Естественным является обязательное наличие приемника в данной схеме. Интересно, что приемники могут использоваться разные и принципиальных отличий бытовых приемников (плеер, музыкальный центр, магнитофон) от специальных нет. Единственное, что определяет в данном случае прием - частота, на которой работает радиозакладка. Фактически злоумышленник может не тратиться на покупку специального приемника и принимать сигнал стандартными средствами в широковещатетельном диапазоне. Конечно, в этом случае другой человек с бытовым приемником в радиусе действия радиозакладки сможет тоже принять данный сигнал, что увеличивает вероятность обнаружения злоумышленника. Недостатком радиозакладок с точки зрения злоумышленника является возможность их обнаружения специальным приемником контроля. Этого недостатка лишены закладные устройства, передающие информацию по оптическому каналу в ИК-диапазоне, который не видим для глаза человека. Естественно обнаружить ИК-передатчики крайне сложно. Ввиду того, что информация передается по оптическому каналу, закладка должна находиться в области прямой видимости злоумышленника. Как правило, ИК-передатчики располагаются с внешней стороны оконных рам, в вентиляционных отверстиях и т.п., что облегчает задачу их поиска. Пример применения ИК-датчика показан на рисунке 3.7.
Рис. 3.7. Перехват акустической информации с помощью ИК-закладки К недостаткам ИК-закладок можно отнести высокую стоимость и высокое потребление энергии, в результате чего среднее время работы составляет в 15-20 часов. Кроме радио и оптического канала для передачи информации используются линии электропитания силовой сети 220 В и телефонные линии. Закладки, использующие линии электропитания для передачи информации, часто называют сетевыми закладками(рис. 3.8). Принцип работы таких закладок схож с радиозакладками. Рис. 3.8. Сетевая акустическая закладка К техническим средствам съема акустической информации относятся также диктофоны. Диктофон - устройство, регистрирующее голосовую информацию ленту, проволоку, внутреннюю микросхему памяти. Время записи различных диктофонов колеблется в пределах от 15 минут до 8 часов. Современные цифровые диктофоны записывают информацию во внутреннюю память, позволяющую производить запись разговора длительностью до нескольких часов. Эти диктофоны практически бесшумны (т.к. нет ни кассеты, ни механического лентопротяжного механизма, производящих основной шум), имеют возможность сброса записанной информации в память компьютера для ее дальнейшей обработки. Питание большинства диктофонов обеспечивается батарейками, вес которых составляет десятки и сотни грамм. При этом современные диктофоны могут иметь очень маленький размер, позволяющий размещать их где угодно в защищаемом помещении. Рис. 3.9. Мини-диктофон Edic-Mini Tiny B21 На рисунке 3.9 приведен пример современного цифрового мини-диктофона Edic-Mini Tiny B21, который имеет следующие характеристики: активация по голосу, вес 6 г, размеры 40x8x15 мм, до 60 часов работы при использовании воздушно-цинковых батареек. На стадии строительства или ремонта помещения в нем скрытно могут быть установлены маленькие микрофоны, которые по проводам соединяются с приемником сигнала. Такие микрофоны называют проводными. В проводных системах используются в основном электретные микрофоны, обеспечивающие регистрацию речи средней громкости на удалении до 7-10 м от его источника. При этом частотный диапазон составляет от 20 – 100 Гц до 6 – 20 кГц. Для питания таких микрофонов используется постоянно напряжение 9-15 В. Как правило, микрофон снабжается усилителем. Для передачи информации и питания усилителя используются 2-х или 3-х проводные линии (рисунки 3.10, 3.11.). Рис. 3.10. 3-х проводной микрофон Шорох-8 Рис. 3.11. 2-х проводной микрофон Микрофоны устанавливаются либо скрытно (немаскированые), либо маскируются под предметы обихода, офисной техники и т.д. Несколько микрофонов могут заводиться на общее коммутирующее устройство, позволяющее одновременно контролировать несколько помещений и осуществляющее запись перехваченных разговоров на диктофон. Для передачи акустической (речевой) информации по телефонной линии используются закладные устройства типа "телефонное ухо". Рис. 3.12. "Телефонное ухо" ТУ-2 Данное устройство тайно монтируется в корпус телефона или телефонную розетку и представляет собой, как правило, высокочувствительный микрофон электретного типа с усилителем и специальным устройством для подключения к телефонной линии при дозвоне по определенной схеме. Принцип работы следующий. Человек производит телефонный звонок по номеру, на котором "висит" закладка. "Телефонное ухо" "умалчивает" первые два звонка, таким образом, в помещении телефонные звонки не раздаются. Вызывающий кладет трубку и опять набирает этот номер. В трубке будет звучать сигнал "занято", оператор ждет 30-60 с (временной пароль) и после прекращения сигнала "занято" набирает бипером номер - включается микрофон и оператор слышит все, что происходит в контролируемом помещении практически из любой точки мира, где есть телефонный аппарат. Разрыв связи произойдет, если оператор положит трубку или если кто-то поднимет телефонную трубку в контролируемом помещении. Для всех остальных абонентов, желающих дозвониться по этому номеру, бу дет слышен сигнал "занято". Данный алгоритм работы является типовым, но может отличаться в деталях реализации, в зависимости от требований. При этом питание устройства осуществляется по телефонной линии, то есть срок службы его практически не ограничен. Направленные микрофоны Если требуется организовать прослушивание разговоров в помещении, доступ в которое так же, как и доступ в соседние помещения, невозможен, то используются направленные микрофоны. Направленные микрофоны имеют узкую диаграмму направленности (5…35˚) и коэффициент усиления более 70...90 дБ. Максимальная дальность действия НАМ в условиях города не превышает 100 – 150 м, за городом при низком уровне шумов дальность разведки может составлять до 500 м и более. Виды направленных микрофонов: параболические; плоские акустические фазированные решетки; трубчатые, или микрофоны "бегущей" волны; органного типа; градиентные. Параболический микрофон. Представляет собой отражатель звука параболической формы, в фокусе которого расположен обычный (ненаправленный) микрофон. Отражатель изготавливается как из оптически непрозрачного, так и прозрачного (например, акриловая пластмасса) материала. Величина внешнего диаметра параболического зеркала может быть от 200 до 500 мм. Принцип работы этого микрофона поясняется на рисунке 3.13. Звуковые волны с осевого направления, отражаясь от параболического зеркала, суммируются в фазе в фокальной точке А. Возникает усиление звукового поля. Чем больше диаметр зеркала, тем большее усиление может обеспечить устройство. Если направление прихода звука не осевое, то сложение отраженных от различных частей параболического зеркала звуковых волн, приходящих в точку А, даст меньший результат, поскольку не все слагаемые будут в фазе. Ослабление тем сильнее, чем больше угол прихода звука по отношению к оси. Создается, таким образом, угловая избирательность по приему. Параболический микрофон является типичным примером высокочувствительного, но слабонаправленного микрофона. Внешний вид параболических направленных микрофонов представлен на рисунках 3.14, 3.15. Трубчатые микрофоны, или микрофоны "бегущей" волны.В отличие от параболических микрофонов и плоских акустических решеток, принимают звук не на плоскости, а вдоль некоторой линии, совпадающей с направлением на источник звука. Принцип их действия поясняется на рисунке 3.16.
Рис. 3.13. Принцип работы параболического микрофона Рис. 3.14.Внешний виднаправленного микрофона «Супер Ухо – 100» Рис. 3.15.Внешний вид параболического направленного микрофона
Рис. 3.16.Трубчатый микрофон. Основой трубчатого микрофона является звуковод в виде жесткой полой трубки диаметром 10-30 мм со специальными щелевыми отверстиями, размещенными рядами по всей длине звуковода, с круговой геометрией расположения для каждого из рядов. Очевидно, что при приеме звука с осевого направления будет происходить сложение в фазе сигналов, проникающих в звуковод через все щелевые отверстия, поскольку скорости осевого распространения звука вне трубки и внутри нее одинаковы. Когда же звук приходит под некоторым углом к оси микрофона, то это ведет к фазовому рассогласованию, так как скорость звука в трубке будет больше осевой составляющей скорости звука вне ее, вследствие чего снижается чувствительность приема. Обычно длина трубчатого микрофона от 15-230 мм до 1 м. Чем больше его длина, тем сильнее подавляются помехи с боковых и тыльного направлений. Рис. 3.17.Внешний вид трубчатого направленного микрофона PKI 2925 Рис. 3.18.Миниатюрный направленный микрофон UEM-88 Направленный микрофон органного типа.С помощью направленного микрофона органного типа можно прослушать разговор на расстоянии до 1 км в пределах прямой видимости. Здесь имеет место принцип: "поблизости никого нет, но тем не менее вас хорошо прослушивают". Использование явления резонанса звуковых волн в направленных системах приводит к увеличению уровня сигнала звуковой энергии, который поступает в микрофон. Простой направленный микрофон представляет собой набор из семи алюминиевых трубок диаметром 10 мм. Длина трубки определяет резонансную частоту звукового сигнала. Формула для расчета длины трубок имеет следующий вид: L = 330/2F, где L - длина трубки в метрах; F - резонансная частота в герцах. Исходя из вышеприведенной формулы, можно построить таблицу 3.2, где N - номер трубки. Таблица 3.2
N
L, м
F, Гц

Рис. 3.19. Избирательная система из направленных трубок


Рис. 3.20. Микрофон в параболическом улавливатели

Усиление сигнала происходит за счет использования высокочувствительного микрофонного усилителя МУ. Этот направленный микрофон перекрывает диапазон частот от 300 Гц до 3300 Гц, т. е. основной информационный диапазон речевого сигнала.

Если необходимо получить более качественное восприятие речи, то необходимо расширить диапазон принимаемых частот. Это можно сделать путем увеличения количества резонансных трубок, например, до 37 штук. Такая резонансная система перекрывает диапазон частот от 180 Гц до 8200 Гц.

Плоские фазированные решетки. Плоские фазированные решетки реализуют идею одновременного приема звукового поля в дискретных точках некоторой плоскости, перпендикулярной к направлению на источник звука (рис. 2). В этих точках (А1, А2, А3...) размещаются либо микрофоны, выходные сигналы которых суммируются электрически, либо, и чаще всего, открытые торцы звуководов, например трубки достаточно малого диаметра, которые обеспечивают синфазное сложение звуковых пален от источника в некотором акустическом сумматоре.

Рис. 3.21. Плоская фазированная решетка

К выходу сумматора подсоединен микрофон. Если звук приходит с осевого направления, то все сигналы, распространяющиеся по звуководам, будут в фазе, и сложение в акустическом сумматоре даст максимальный результат. Если направление на источник звука не осевое, а под некоторым углом к оси, то сигналы от разных точек приемной плоскости будут разными по фазе и результат их сложения будет меньшим. Чем больше угол прихода звука, тем сильнее его ослабление. Обычно число приемных точек Аi в таких решетках составляет несколько десятков. Конструктивно плоские фазированные решетки встраиваются либо в переднюю стенку атташе-кейса с последующим камуфляжем, либо в майку-жилет, которая надевается под пиджак или рубашку. Необходимые электронные блоки (усилитель, элементы питания, магнитофон) располагаются соответственно либо в кейсе, либо под одеждой. Таким образом, плоские фазированные решетки с камуфляжем визуально более конспиративны по сравнению с параболическим микрофоном.

Градиентный микрофон . Он представляет собой два достаточно миниатюрных и близкорасположенных высокочувствительных микрофона М1 и М2, выходные сигналы которых электрически (или акустически) вычитаются друг из друга, реализуя в конечных разностях первую производную звукового поля по оси микрофона и формируя диаграмму вида cosQ , где Q - угол прихода звука. Тем самым обеспечивается относительное ослабление акустических полей с боковых направлений (О - 90°). Градиентными микрофонами высоких порядков называют системы, реализующие пространственные производные 2-го, З-го и более старших порядков.

Основной пользовательской характеристикой направленных микрофонов является дальность их действия в конкретных условиях R . Для открытого пространства и изотропных и независимых по угловым направлениям внешних акустических помех дальность действия R связана:

Со спектральным отношением сигнал/помеха q на выходе направленного микрофона;

Со спектральным уровнем речи Вр;

Со спектральным уровнем внешних акустических помех Вш соотношением вида:

q = Bp - Bш - 20lg R+G - Bп , (1)

где G - так называемый коэффициент направленного действия микрофона (дБ), Вп - пороговая акустическая чувствительность микрофона (дБ).

Рис. 3.22. Простейший градиентный микрофон

Входящий в формулу (1) коэффициент G направленного действия характеризует степень относительного подавления внешних акустических помех: чем он больше, тем сильнее это подавление. Теоретически он связан с нормированной диаграммой направленности микрофона F (Q,j) соотношением вида:

,

где Q - угол прихода звуковой волны по отношению к оси микрофона; j - угол прихода звуковой волны в полярных координатах плоскости, перпендикулярной оси.

Например, для трубчатого микрофона , когда

,

где l - длина волны звука. а L - длина трубки, имеем (при L > l .) :

G = 4 L/l . (4)

Аналогично выводится приближенная формула для коэффициента направленного действия параболических микрофонов и фазированных плоских решеток:

G = 4π (S/l 2), (5)

где S - площадь входной апертуры;l - длина волны звука. Для градиентных микрофонов n -го порядка при оптимальной обработке сигналов

G=n (n+1), (6)

где n - порядок градиента.

При известных значениях величины G формула (1) достаточна для получения абсолютных оценок ожидаемого спектрального отношения сигнал/помеха, если известны условия. Но во многих случаях знания этих условий бывают неточны. Поэтому более оправданно использовать не абсолютные, а относительные оценки дальности, как не требующие точных знаний условий, поскольку сопоставление происходит при их равенстве. Принимая такую идеологию, сравним возможности направленных микрофонов с возможностями не вооруженного специальными устройствами человеческого слуха. Формально для него можно записать соотношение, аналогичное (1). В результате сравнения получим:

R=R0 x 10 0,05 (G-G 0) – 0,005 (D-Bп) , (7)

где R0 - дальность слышимости звука органом слуха; R - дальность действия направленного

мммикрофона микрофона с тем же качеством контроля; G0 - коэффициент направленного действия органа слуха человека (режим биноурального прослушивания); (D-Bп) - разность пороговой чувствительности направленного микрофона и органа слуха.

РАЗБОРЧИВОСТЬ РЕЧИ

В помещениях, предназначенных для слушания речи, основное значение имеет ее разборчивость. Разборчивостью речи называют относительное или процентное количество правильно принятых слушателями элементов речи из общего количества произнесенных. Элементы речи - это слоги, звуки, слова, фразы. Соответственно этому различают слоговую, звуковую, словесную, смысловую разборчивость речи.

Определение разборчивости речи осуществляется с помощью специальных артикуляционных таблиц, читаемых диктором в исследуемом помещении. Поэтому данный метод исследования называют артикуляционным. Образцы артикуляционных таблиц слогов приведены в прил. IV (табл. I, 2). Количество слушателей определяется размерами помещения. Обычно в исследовании участвуют не менее 20 слушателей, равномерно распределяемых по всему помещению. Слушатели записывают, в бланки элементы речи так, как они их услышали. Затем слушатели меняются местами и записывают следующие артикуляционные таблицы. Статистическая обработка полученных результатов позволяет оценить разборчивость речи в различных местах помещения.

В помещениях, в которых слоговая разборчивость равна или более 85%, разборчивость речи считается отличной. Неудовлетворительной разборчивости речи (около 40%слоговой разборчивости) соответствует примерно 90%разборчивости фраз.

Разработан ускоренный метод оценки разборчивости речи - метод выбора. Он отличается тем, что сходные по звучанию слова сгруппированы в таблицы (см. прил. IV, табл. 3). Диктор зачитывает из каждой группы сходных слов только одно слово, а слушатели, имея таблицы, отмечают то слово, которое, по их мнению, было зачитано, затем определяют процент правильно принятых слов. Данный метод требует меньшей тренировки слушателей, но он менее точен, чем артикуляционный.

На разборчивость речи оказывают влияние следующие факторы: время реверберации, громкость речи, соотношение уровня постороннего шума (внутри помещения или проникающего снаружи) и уровня громкости речи, а также форма и размеры помещения. На учете данных факторов основан метод расчета разборчивости речи, предложенный Кнудсеном. Так, при времени реверберации около 0,5 с разборчивость речи наибольшая; при увеличении времени реверберации разборчивость речи ухудшается примерно на 10% на каждую секунду времени.

Лучшая разборчивость речи наблюдается при уровне речи 70¸80 дБ. Если уровни речи и мешающего шума примерно одинаковы, разборчивость речи снижается до 60%.

Исходя из сказанного, время реверберации Т не может увеличиваться неограниченно, так как разборчивость звуковых сигналов ухудшается. Поэтому для помещений в зависимости от источника звука должен быть установлен максимальный объем согласно табл. 2, а в зависимости от этого объема и времени реверберации - максимальная разборчивость речи (рис. 46).

Метод Кнудсена позволяет оценить разборчивость речи, не проводя артикуляционных испытаний, то есть на стадии проектирования.

Точность метода невысокая, и в последнее время предложен ряд более совершенных способов расчета разборчивости речи, авторами которых являются Рейхард, Низе и другие.

Четкость и разборчивость речи в зале, а также качество воспринимаемых музыкальных звуков зависит от силы прямого звука и первых полезных звуковых отражений. Таковыми считаются отражения, поступающие к слушателю с временем запаздывания, по сравнению с прямым звуком, не более 0,05 с для речи и 0,15 ¸ 0,20 с для музыки. Энергия ранних звуковых отражений, как и энергия прямого звука, относится к полезной звуковой энергии. К "бесполезной" относится вся остальная звуковая энергия, представляющая собой реверберирующий фон в помещении.

Рис. 46. Влияние времени реверберации Т на разборчивость речи Р в зависимости от объема помещения, м (по Кнудсену):

а - 707; б - 11300; в - 45200

Результирующий эффект восприятия звука в помещении с точки зрения его разборчивости зависит от величины относительного воздействия на слушателя полезной и "бесполезной" частей звуковой энергии. Это отношение называется коэффициентом разборчивости, величина которого определяется по формуле (15)

где - звукопоглощение при 100%-ном заполнении зала для частот 500-2000 Гц;

α - средний коэффициент звукопоглощения при тех же условиях;

Путь первых отражений от источника звука до точки наблюдения, пришедших в течение первых 0,05 (0,15¸0,20) с;

α 1 , α 2 , ... α n - коэффициенты звукопоглощения поверхностей, от которых пришли прямые полезные отражения.