Электроакустические устройства
Конспект лекций
Copyright © Эдуард Семенов, 2001

ВВЕДЕНИЕ. ЗВУК. ЗВУКОВЫЕ ЯВЛЕНИЯ

Начнем издалека, поскольку наша задача не только выяснить, какие бывают микрофоны и динамики, но и почему они такие, для чего они и как их сделать лучше.

Первоначально слуховая система использовалась, вероятно, как система безопасности. В отличие от зрения область чувствительности слуха составляет полный телесный угол. И сегодня система оповещения гражданской обороны основана именно на звуковом информировании: сирены и пр.

В дальнейшем на основе звуковых взаимодействий развилась речь - вторая сигнальная система. Это то, что сделало человека человеком.

Репрезентативная система - система восприятия через органы чувств и внутреннего моделирования окружающей действительности.

В репрезентативной системе выделяются подсистемы, соответствующие основным органам чувств:

1. визуальная;

2. аудиальная;

3. кинестетическая (тактильные ощущения);

4. рациональная (дигитальная).

Прочие органы чувств несущественны. Подсистема, доминирующая при восприятии человеком окружающей действительности, называется ключевой репрезентативной системой. Подсистема, доминирующая при построении внутренних моделей действительности, называется ведущей репрезентативной системой.

На рис. 1.1 представлено распределение людей по группам в зависимости от ключевой репрезентативной системы [1]. Аудиальная система здесь только на третьем месте, но это распределение характеризует в основном объем, а не качество, информации, поступающей по данному информационному каналу. Более адекватно важность информации отображает распределение по ведущим системам (рис. 1.2).


Рис. 1.1. Распределение людей по группам в зависимости от ключевой репрезентативной системы


Рис. 1.2. Распределение людей по группам в зависимости от ведущей репрезентативной системы

Можно видеть, что аудиальная система входит в состав ведущей репрезентативной системы у примерно 36-и процентов людей.

До того, как аудио канал стал использоваться в качестве второй сигнальной системы, он также использовался для передачи чувств и настроения посредством высоты, громкости и тембра звука. Это и стало, вероятно, объективной предпосылкой для возникновения музыки.

Никакое искусство ко времени появления звукозаписи так не нуждалось в технических средствах воплощения. Звук в отличие от масляных красок, бронзы и гранита вещь эфемерная и существует только в момент извлечения. В нотах может быть зафиксирована только мелодия, а часть музыки, связанная с непосредственной красотой звука и особенностями исполнительской интерпретации существует только в момент ее исполнения. Таким образом, запись можно рассматривать не только как "музыкальные консервы", но и как окончательно оформленное музыкальное произведение.

Первая электроакустическая система это, конечно, телефон. Изобретен Александром Беллом в 1876 г. В его честь названа универсальная единица измерения в логарифмических шкалах (и, в частности, силы звука) - Белл.

В 1877 г. появилась первая система звукозаписи - фонограф - и с этого момента началась новая жизнь музыкального искусства. Фонограф считается изобретенным Томасом Эдисоном. Он не был электроакустической системой, но быстро выяснилось, что чисто механическая запись очень неудобная и неточная. Надо было очень близко садится музыкантам к раструбу рекордера, с молоточков пианино снимали смягчающие удар подушечки, в студии создавалась неестественно большая реверберация (стены обивали железом). И вот в 1898 году Вальдемар Паульсен (Дания) придумал переводить звуковые колебания в электрический ток, намагничивать стальную проволоку. Также в начале ХХ века происходил переход от чисто механической грамзаписи к записи с промежуточным преобразованием сигнала в электрический ток: механические колебания воздуха переводились в электрический сигнал, который затем усиливался вакуумными лампами и управлял электромагнитом, смещающим резец рекордера.

Изобретения телефона и устройств записи звука привели к возникновению новой отрасли науки и техники - электроакустики. Электроакустика - изучает технические средства перевода звуковых колебаний в электрический сигнал и обратного перевода электрического сигнала в максимально похожие звуковые колебания. Основные области применения электроакустики это:

1) звукоусиление;

2) передача звука на большие расстояния (радиовещание, составляющая телевизионного вещания);

3) запись звука с целью хранения и последующего воспроизведения. Звукозаписью чаще называют процесс, а результат звукозаписи называется фонограммой.

Исходя из определения электроакустики, курс делится на два больших раздела.

1. Изучение объекта воспроизведения (первоначальных звуков) и условий его похожего воспроизведения (специфика распространения звука и особенностей слуха человека).

2. Методы перевода звукового поля в электрическую форму и возбуждения похожего звукового поля в другом помещении.

Дадим несколько определений.

Звук. Слово "звук" определяет два понятия: первое - звук как физическое явление; второе - звук как ощущение.

1. В результате вибрации (колебания) какого-либо упругого тела, например струны, возникает волнообразное распространение колебаний воздушной среды. Источником звука является колеблющееся тело. Оно приводит в колебательное движение прилегающие к нему частицы упругой среды (как правило, воздуха), которые заставляют колебаться соседние частицы и т.д. Процесс распространения колебаний частиц упругой среды называют звуковой волной.

2. Звуковые волны улавливаются слуховым органом и вызывают в нем раздражение, которое передается по нервным волокнам в головной мозг, возбуждая ощущение звука.

Звуковое поле - одна из форм существования материи, проявляется в виде кинетической энергии колеблющихся материальных тел, а также звуковых волн в твердой, жидкой и газообразной средах, обладающих упругой структурой.

Первичное помещение - помещение, в котором источниками звука создается звуковое поле (называемое первичным), подлежащее копированию при воспроизведении электроакустическими устройствами.

Помещение прослушивания - помещение, в котором прослушивается создаваемое электроакустическими преобразователями звуковое поле.

Конец формы

РАЗДЕЛ 1. ИЗЛУЧЕНИЕ, РАСПРОСТРАНЕНИЕ И ВОСПРИЯТИЕ ЕСТЕСТВЕННЫХ ВОЛН

Электроакустика - наука о технических средствах перевода звуковых колебаний в электрический сигнал и обратного перевода электрического сигнала в максимально похожие звуковые колебания. Поэтому начнем с изучения объекта копирования - естественных (существующих без помощи электроакустики) звуковых волн.

Жизненный цикл звука можно представить в виде следующих этапов: излучение, распространение, восприятие. Будем рассматривать их по порядку.

ЛЕКЦИЯ 2. ИЗЛУЧЕНИЕ

Многие учебники по электроакустике начинаются рассмотрением теории распространения звуковых волн. Это наукообразно, но по существу неправильно, поскольку звуковые волны это носитель, теория звуковых волн его математическая модель, а объектом являются источники звука. С рассмотрения объекта передачи мы и начнем.

2.1. Естественные источники звука, параметры, виды

Основные типы источников звука, с которыми имеет дело электроакустика, следующие.

1. Музыкальные источники.

2. Речевые источники.

3. Звук как таковой (например, в охранных системах).

2.1.1. Музыкальные источники

Для начала определим некоторые из используемых музыкальных терминов. Сложность в том, что нельзя рассматривать характеристики источников в отрыве от свойств слуха и наоборот. Но с чего-то надо начинать, поэтому рассмотрим характеристики источников звука, полагаясь пока на Ваше обыденное знание о свойствах слуха.

Все звуки, используемые в музыке, по периодичности спектра можно разделить на:

1) тональные (имеющие выраженную периодичность со слышимой частотой);

2) нетональные (шумовые).

Основные слышимые свойства установившегося тонального звука следующие: высота, громкость, тембр. При организации звуков в систему большое значение имеет также длительность.

Высота звука определяется частотой колебаний издающего тональный звук тела.

Громкость - слуховая оценка мощности источника звука. Наиболее близким по смыслу физическим параметром является огибающая звукового сигнала. Реально же ощущение громкости складывается из оценки дальности до источника звука (из двух источников, создающих одинаковое звуковое давление у барабанной перепонки, более громким ощущается более удаленный), спектрального состава (более звонкий звук оценивается более громким; это связано с учетом априорной информации о меньшей линейности процессов большей амплитуды), а также наличия и характера реверберации.

Спектр периодического сигнала (представление его в виде суперпозиции синусоидальных колебаний) является линейчатым, т.е. в суперпозиции участвуют только кратные частоты (поскольку закончить период все синусоиды должны в той же фазе, что и начинали, иначе следующий период будет другим по форме). Наиболее глухим, без призвуков, слышится звук, максимально близкий к синусоиде. Чисто синусоидальный звук называется чистым тоном. А под собственно тоном (основным тоном) понимается наименьшая по частоте составляющая в ряду кратных частот спектра тонального звука, имеющая определенную высоту и обозначаемая определенной нотой.

Остальные составляющие спектра тонального звука с частотами, кратными тону, называемые обертонами (нем. obertone - высшие тона), частичными тонами, призвуками, гармониками, определяют тембр (слышимый характер) звука.

В отличие от громкости и высоты, тембр не является одномерной характеристикой и не ощущается параметрически, например, в виде слуховой оценки уровней обертонов, поэтому его аналитическое описание (в виде совокупности частных характеристик) чрезвычайно затруднительно. В лучшем случае для его характеристики используются слова из слуховой области ощущений, например:

1. Глухой / звонкий - физически означает низкий / высокий уровень обертонов. Причем нечетные гармоники и гармоники высших порядков способствуют ощущению звонкого тембра в большей степени.

2. Бубнящий - физически означает наличие низкочастотного сигнала значительной амплитуды с малым уровнем обертонов и медленно изменяющейся громкостью.

2. Рокочущий - физически означает небольшое периодическое изменение громкости и (или) высоты звука. В спектральной области означает возникновение боковых полос вокруг тона и гармоник.

3. Шепелявый, свистящий, шипящий, шумящий (для нетональных звуков) - означает наличие в звуке непериодических, случайных колебаний с достаточно широким непрерывным спектром. Первые три характеристики используются в основном по отношению к высокочастотным шумам.

Неплохим вариантом является также использование для описания тембра общих характеристик динамических процессов: отрывистый, резкий, слитный, вибрирующий. Но этого часто недостаточно и тогда используется множество слов из других областей ощущений - густой, мягкий, жесткий, прозрачный. Это следствие попытки передать непараметрическое ощущение тембра путем его ассоциации с другими явлениями. Такие описания желательно использовать только по необходимости, т.к. велика вероятность отличия ассоциаций собеседника от Ваших собственных.

Все три характеристики (высота, громкость, тембр) являются весьма парадоксальными. Вот некоторые (далеко не все) признаки этого.

1. Кривая огибающей, которая определяет громкость, может быть построена не единственным образом. Точный способ и параметры, которыми руководствуется слуховой аппарат, неизвестны.

2. Частота, определяющая ощущение высоты, и спектр, определяющий тембр, требует для своего определения некоторого времени. Однако высота, громкость и тембр слишком длительного тона на слух воспринимаются с большими погрешностями.

Ряд кратных частот, включающий основной тон и обертоны, называется натуральным звукорядом [2]. Звукорядом вообще называется расположение звуков по высоте. Полный звукоряд современной музыкальной системы состоит из 88 звуков с частотами от 16 до 4176 Гц. Такой шаг сетки приблизительно соответствует разрешающей способности слуха по частоте (хотя существуют и мнения о значительно большей разрешающей способности слуха [8]). Звуки, входящие в звукоряд называются ступенями. Ступени, частоты которых укладываются в ряд 1,2,4,8,16..., при одновременном воспроизведении сливаются, поэтому все ступени этого ряда имеют одинаковые наименования. Интервал между ними называется октавой (от лат. octava - восьмая), потому что этот интервал разбит на семь частей, и каждый восьмой звук образует интервал в 1 октаву. Так что термин "октава" - музыкальный и в технику пришел, вероятно, через электроакустику.

Семь ступеней, образующие октаву, называются до, ре, ми, фа, соль, ля, си. Весь звукоряд состоит из 7 полных и двух неполных октав:

субконтроктава (3 звука);

контроктава;

большая октава;

малая октава;

1-4 октавы;

5 октава (1 звук).

Музыкальный строй - ряд абсолютных частот ступеней. Современный музыкальный строй делит каждую октаву на 12 частей (называемых полутонами), причем ля 1-й октавы имеет частоту 440 Гц. Расстояние в два полутона называется целым тоном. Полутона определяют все основные ступени звукоряда (рис. 2.1, белые клавиши) и 5 дополнительных частот (черные клавиши).


Рис. 2.1. Фрагмент клавиатуры фортепиано

Промежуточные 5 ступеней считаются образуемыми от основных (альтерация) и называются так же, но с добавлениями: если повышать основную ступень на 0,5 тона, то добавляется "диез", если понижать, то "бемоль". Повышение / понижение на тон называется "дубль-диез" / "дубль-бемоль". При этом образуется ситуация, когда один звук может называться по-разному (энгармонизм звуков).

Диапазон музыкального инструмента - диапазон частот его тонов.

Форманта - область частот (не зависящая от высоты звука), в которой заметно усиливается звучание попадающих в нее обертонов или основного тона. Это своеобразное описание "амплитудно-частотной характеристики" музыкального инструмента.

Вибрато - небольшое периодическое изменение высоты (частотное вибрато) или амплитуды (амплитудное вибрато) музыкального звука. Периодичность вибрато находится в пределах от 5 до 7 Гц. Вероятно, красота вибрато связана с погрешностями слухового восприятия монохроматического звука.

Фазы музыкального звука

1. Атака.

2. Стабильная фаза.

3. Затухание.

Атака - переходный процесс, характеризующий установление музыкального звука. Это короткий (от долей до десятков мс), но важнейший этап звучания, в большой степени определяющий узнаваемость и натуральность звучания музыкальных инструментов (эффект присутствия). Попробуйте воспроизвести фонограмму "задом-наперед", при этом атака и затухание меняются местами. Определить вид музыкального инструмента оказывается практически невозможным.

Чередованием стабильных фаз создается мелодия.

Затухание определяет пространственность и глубину звука. В значительной степени характер затухания зависит от акустических свойств помещения.

Виды музыкальных источников

[А. Лихницкий. О музыке, ее исполнении и качестве звучания. "Аудио Магазин" N3(4) 1995].

Совет: сопоставьте приводимые частотные диапазоны со стремлением обеспечить воспроизведение электроакустической аппаратурой диапазона от 20 Гц до 20 кГц.

Певческий голос - диапазон от 80 до 1000 Гц для мужского голоса и от 160 до 1300 Гц для женского.

Основные характеристики качества:

1) тональный баланс между нижней (около 500 Гц) и верхней (около 3000 Гц) формантами. Нижняя форманта отвечает за теплоту и округлость звучания голоса, верхняя - за его блеск;

2) живость (изменчивость), динамические оттенки;

3) чистота вибрато и интонации;

4) разборчивость артикуляции.

Смычковые инструменты.

1) скрипка - диапазон от 136 до 2000 Гц;

2) альт - от 131 до 1100 Гц;

3) виолончель - от 65 до 700 Гц;

4) контрабас - от 41 до 240 Гц.

Все перечисленные инструменты занимают разные частотные диапазоны, однако имеют сходные признаки звучания.

Характеристики качества (и собственно инструмента, и исполнения):

1) тональный баланс между тремя ее формантами: первая - на частотах от 220 до 300 Гц (отвечает за полноту и звучность инструмента), вторая - в диапазоне частот от 600 до 800 Гц (у скрипок Страдивари она на частоте 630 Гц) и третья - в диапазоне от 1400 до 4500 Гц. Последняя форманта отвечает за сочность, "светлоту" и "полетность" звука.

2) пропорции между первыми ее шестью обертонами.

Как и в случае певческого голоса, главным для достижения натуральности звучания скрипки является передача живости (изменчивости) ее "голоса", чистоты интонации и вибрато, а также яркость воспроизведения штрихов. Все эти особенности звучания описываются критерием "ясность".

В противоположность описанному встречается очень детальное, ясное воспроизведение звучания смычковых инструментов, но звук при этом может восприниматься как "резкий" и "рваный", исчезает ощущение "пения". Такое звучание вызывает чувство дискомфорта и утомляет. Опыт показывает, что очень трудно добиться такой передачи звука смычковых, при которой в той или иной мере не наблюдался бы один из указанных дефектов.

Щипковые инструменты. Все щипковые инструменты характеризуются быстрой атакой (от 1 до 5 мс) и длительным затуханием звука (от 1 до 5с).

1) клавесин - диапазон от 87 до 1400 Гц;

Звук клавесина чрезвычайно богат обертонами, которые заполняют практически весь средневысокочастотный диапазон слухового восприятия.

Характеристики качества: нежность, тонкость и очень высокая детальность звука.

1) акустическая гитара - от 81 до 1300 Гц.

Ее значение в экспертизе качества звучания электроакустической аппаратуры заключается в ее распространенности и общеизвестности тембра и характера звукоизвлечения. При воспроизведении через аудиосистему звучания гитары нужно обратить внимание на то, как звучит щипок - следует добиваться сходства с натуральным его звучанием.

2) арфа - от 34,6 до 3320 Гц. "Глиссандо" - быстрое проведение пальца одной руки (или пальцев обеих рук) по струнам инструмента.

3) контрабас щипковый - от 41 до 240 Гц.

Клавишные инструменты

Рояль - диапазон от 27,5 до 4186 Гц. Относительно глухой слабоокрашенный звук. Наилучшим образом подходит для проявленного воспроизведения мелодии.

Характеристики качества:

1) специфики тембров нижнего регистра (с присутствием легкого рокотания);

2) звучность среднего регистра;

3) яркость верхнего регистра;

4) разделенность звуков при игре staccato;

5) динамические оттенки.

Дефекты, наиболее часто встречающиеся при воспроизведении через аудиосистему звучания рояля: это неотчетливая или "надтреснутая" атака, а также неестественный или окрашенный тембр звучания его регистров. Невысокий уровень обертонов позволяет осуществлять слуховую оценку коэффициента гармоник аппаратуры.

Деревянные духовые инструменты.

1) флейта поперечная - диапазон от 261 до 2093 Гц;

2) кларнет - от 139 до 1500 Гц;

3) гобой - от 233 до 1568 Гц;

4) английский рожок - от 165 до 1800 Гц;

5) фагот - от 58 до 622 Гц.

Благодаря различию частот формант и специфическому распределению обертонов каждый инструмент этой группы имеет ярко выраженную индивидуальность.

Характеристики качества.

1) гладкость" и "текучесть" звучания (объясняется быстрым спадом к высоким частотам энергии обертонов);

2) плавность и чистота интонации.

Медные духовые инструменты

1) концертная труба - диапазон от 185 до 1046 Гц;

2) валторна - от 61 до 700 Гц;

3) тромбон - от 81 до 520 Гц.

Характеристики: яркое, выразительное звучание, особенно в области атаки. Атака длится от 20 до 100 мс и характеризуется быстрой и очень сложной перестройкой обертонального состава.

Ударные инструменты

1) кастаньеты - спектр в диапазоне от 0,6 до 16 кГц;

2) ксилофон - спектр распространяется до 9 кГц;

3) тарелка (большая оркестровая) - от 800 Гц до 18 кГц;

4) тарелка джазовая - от 500 Гц до 18 кГц;

5) малый барабан - спектр распространяется до 4 кГц. Сухой трескучий звук.

6) литавра большая - от 87 до 800 Гц. Чистый, звонкий и глубокий бас.

Все ударные инструменты характеризуются резкой атакой (меньше 1 мс у кастаньет и ксилофона и около 16 мс у большой литавры) и слабо выраженным тональным характером их звучания.

Характеристики качества:

1) динамика,

2) ясность передачи атаки,

3) отсутствие "окраски".

Электронные музыкальные инструменты рассматривать не будем в силу того, что их звук не может непосредственно охарактеризовать качество системы копирования звука, более того, он сам часто копирует "живые" источники звука. Кроме того, электронные инструменты совершенствуются гораздо меньшее время и рано судить об их качестве и особенностях тембра. Хотя и по отношению к электронному звуку можно различить более и менее верное звучание, например по уровню интермодуляции, наличию дисгармоничных и других призвуков, не укладывающихся в гармонический ряд.

Цель рассмотрения характеристик музыкальных инструментов - инициировать более внимательное отношение к звуку - объекту копирования.

2.2. Искусственные источники

Искусственные источники звука являются предметом исследования электроакустики и будут рассматриваться в дальнейшем.

Электроакустические устройства
Конспект лекций
Copyright © Эдуард Семенов, 2001

ЛЕКЦИЯ 3 (4 ЧАСА). РАСПРОСТРАНЕНИЕ ЗВУКОВЫХ ВОЛН В ПРОСТРАНСТВЕ И ВЕЩЕСТВЕ

Звуковые волны, достигающие приемника, можно разделить на прямые и отраженные.

3.1. Прямая волна

Определение звука, звуковой волны, звукового поля уже давались.

Звуковой луч - направление распространения звуковой волны.

Фронт волны (волновой фронт) - поверхность, проходящая через точки с одинаковым "этапом" (фазой) колебания.

Иногда разделяют понятия волнового фронта и волновой поверхности. Под волновой поверхностью понимают поверхность равных фаз, а под волновым фронтом поверхность, разделяющую области пространства, куда волна уже дошла и куда еще нет. Это полезно в тех случаях, когда интересуются импульсными или однократными акустическими воздействиями на объект; для электроакустики такая ситуация не характерна.

Фронт перпендикулярен лучу.

Не путать волновой фронт с диаграммой направленности.

3.1.1. Классификация звуковых волн по направлению колебаний частиц

1) продольные;

2) поперечные.

Продольная звуковая волна - волна, в которой частицы среды колеблются в направлении луча.

Поперечная звуковая волна - волна, в которой частицы колеблются в направлении, перпендикулярном лучу.

Тип волны, распространяющийся в среде, зависит от того, каким образом возбуждается волна и от того, как и каким частицам передает свою энергию текущая частица.

Примеры.

1. В тонком и длинном отрезке вещества может распространяться как продольная, так и поперечная волна, в зависимости от направления возбуждения. Они даже могут распространяться одновременно, и суммарная волна будет иметь промежуточный угол.

2. Граница раздела сред разной плотности. Например, при распространении волны по водной поверхности, волна сжатия немедленно трансформируется в высоту столбика воды, т.е. волна поперечная.

3. Однородная среда.

3.1. При возбуждении пульсирующей сферой существует продольная волна.

3.2. При возбуждении колеблющейся мембраной. В плоскости мембраны существует поперечная волна, перпендикулярно мембране - продольная волна, а в промежуточных углах волна, занимающая промежуточное положение между продольной и поперечной.

В однородной среде, однако, не может существовать поперечная волна в чистом виде, без сопоставимых уровней продольных составляющих на соседних лучах. Кроме того, человеческий слух реагирует главным образом на продольную составляющую звуковой волны.

Надо сказать, что этот момент изучен слабо и доминирует представление, что звуковые волны бывают только продольные. Недоучет необходимости передачи типа волны, возможно, снижает достоверность звучания электроакустических систем.

Звуковое давление pзв - разность между мгновенным давлением звукового поля pмгн и статическим атмосферным давлением (p0). Измеряется в паскалях (сила в 1 Н, приложенная к площади 1 кв. м.). Атмосферное давление ~105 Па. Звуковые давления речи и музыки имеют величину до 100 Па.

Вопрос о том, является звуковое давление векторной величиной или нет, довольно сложный. Как всякая сила, звуковое давление имеет направление. Однако, под давлением понимается сила, перпендикулярная к поверхности. И если оговорена ориентация поверхности, то это однозначно указывает направление вектора давления и ничего кроме его модуля (скаляра) больше указывать не требуется. Для наиболее часто рассматриваемого случая продольной волны, звуковое давление направлено либо по, либо против луча, поэтому его векторные свойства опускают, рассматривают только проекцию звукового давления на луч и говорят о нем как о знакопеременном скаляре: в момент сжатия звуковое давление положительно, в момент разряжения отрицательно.

Скорость распространения звуковой волны (скорость звука) сзв в среде зависит от массы молекул или атомов и расстояния между ними. А они в свою очередь зависят от химического состава вещества, его температуры, а для газов и давления. Для технических расчетов достаточно считать

,

где Т - температура, К. При нормальном атмосферном давлении и Т=290 К (170С) скорость звука 340 м/с.

Колебательной скоростью v называется скорость смещения частиц среды от положения покоя. Для продольной волны считается положительной, если частицы смещаются в направлении луча и отрицательной в противном случае. В общем случае колебательная скорость величина векторная и о знаке можно говорить только по отношению к проекции этого вектора на луч. Не путать со скоростью звука. Скорость звука не зависит от звукового давления, а колебательная скорость возрастает с увеличением звукового давления и частоты звука. Значения колебательной скорости на несколько порядков ниже скорости звука.

Длина волны - расстояние, на которое переместится фронт звуковой волны за один период колебания источника.

3.1.2. Связь между звуковым давлением и колебательной скоростью

Рассмотрим плоский участок волнового фронта площадью S. Распространение продольной волны, т.е. смещение частиц вещества вдоль луча, происходит благодаря тому, что давление перед этой поверхностью больше, чем давление за ней на величину dpзв. Таким образом, вдоль луча имеется отрицательный дифференциал давления dpзв (т.к. положительным дифференциалом считается увеличение параметра вдоль оси). Эта разность давлений вызывает приложение к поверхности S силы, направленной вдоль луча F=-dpзвS. Масса вещества, к которой приложена эта сила будет , где r -плотность воздуха (~1,2 кг/м3), dr - дифференциал расстояния вдоль луча, на котором определяется дифференциал давления. Записанный для этого случая второй закон Ньютона F=ma называют уравнением движения среды:

-dpзвS=r *dr*S*dv/dt,

.

3.1.3. Плоская волна

Плоской волной называется волна с плоским фронтом. При этом лучи являются параллельными.

Образуется поблизости от колеблющейся плоскости или если рассматривается небольшой участок волнового фронта точечного излучателя. Причем абсолютная площадь этого участка может быть тем больше, чем дальше мы находимся от излучателя. То, что излучатель считается точечным, также говорит о большом расстоянии до него. Кроме того, точечность излучателя говорит о том, что рассматривается только прямая волна.

Лучи, охватывающие участок плоскости рассматриваемого волнового фронта, образуют "трубу". Амплитуда звукового давления в плоской волне не уменьшается при удалении от источника, т.к. не происходит растекания энергии за пределы стенок этой трубы. Если иметь ввиду практически реальные случаи, то это соответствует остронаправленному излучению, например, излучению электростатических панелей большой площади, рупорных излучателей.

Единственное, чем отличаются сигналы в различных точках луча плоской волны, это временной сдвиг. Если звуковое давление на некотором участке плоского волнового фронта является синусоидальным pзв=pзвm*exp(jWt), то на расстоянии r по лучу pзв=pзвm*exp(jW(t-r/cзв))= pзвm*exp(j(Wt-r*W/cзв))= pзвm*exp(j(Wt-k*r)), где r/cзв - время пробега звуковой волной расстояния r, k= W/cзв=2p/l - волновое число. k определяет фазовый сдвиг между сигналами во фронтах плоской волны, находящихся на расстоянии r.

Реальные звуковые волны являются более сложными, чем синусоидальные, однако выкладки, проводимые для синусоидальных волн, справедливы и для несинусоидальных сигналов, если не рассматривать частоту как константу, т.е. рассматривать сложный сигнал в частотной области. Это возможно, и даже более адекватно восприятию звука человеком, до тех пор, пока процессы распространения волн остаются линейными (в сфере интересов электроакустики это практически всегда так).

3.1.4. Удельное акустическое сопротивление среды

Определим отношение звукового давления и колебательной скорости для синусоидальной волны. Из уравнения движения среды:

,

.

Из этой записи следует, что:

1) колебательная скорость и звуковое давление связаны линейной зависимостью, точнее прямой пропорциональностью;

2) коэффициент связи вещественный, следовательно, v и pзв имеют одинаковые фазы.

Произведение называется удельным акустическим сопротивлением среды za. Это аналог электрического сопротивления, если звуковое давление сопоставить с напряжением, а колебательную скорость с током. При нормальном атмосферном давлении и температуре 200С za=413 кг/(м2с).

Если удельное сопротивление среды умножить на некоторую площадь поверхности, то получим сопротивление, оказываемое средой этой поверхности (сопротивление излучения): . Размерность . Таким образом, колеблющееся тело испытывает со стороны среды сопротивление, подобное трению: оно также требует от источника колебаний совершения работы (см. пункт "Энергетические характеристики звукового поля"), но связано не с переводом энергии в тепло, а с оттоком мощности в пространство.

Сами по себе удельное сопротивление среды и сопротивление излучения от частоты не зависят, но, для того, чтобы развить то же звуковое давление на низких частотах, нужна большая амплитуда смещения или большая площадь, т.к. .

3.1.5. Сферическая волна

Волна, фронт которой представляет собой сферу, называется сферической.

Лучи при этом совпадают с радиусами сферы. Сферическая волна формируется в следующих случаях.

1. Размеры источника много меньше длины волны и расстояние до источника позволяет считать его точкой. Такой источник называется точечным.

2. Источник представляет собой пульсирующую сферу.

В обоих случаях предполагается, что переотражения волны отсутствуют, т.е. рассматривается только прямая волна. Чисто сферических волн в сфере интересов электроакустики не бывает, это такая же абстракция, как и плоская волна. В области средневысоких частот конфигурация и размеры источников не позволяют считать их ни точкой, ни сферой. А в области низких частот непосредственное влияние начинает оказывать как минимум пол. Единственная близкая к сферической волна формируется в заглушенной камере при малых габаритах излучателя. Но рассмотрение этой абстракции позволяет уяснить некоторые важные моменты распространения звуковых волн.

На больших расстояниях от излучателя сферическая волна вырождается в плоскую.

На расстоянии r от излучателя звуковое давление может быть представлено в виде:

,

где pзв1 - амплитуда звукового давления на расстоянии 1 м от центра сферы. Уменьшение звукового давления с удалением от центра сферы связано с растеканием мощности на все большую площадь - 4pr2. Суммарная мощность, перетекающая через всю площадь волнового фронта не меняется, поэтому мощность, приходящаяся на единицу площади уменьшается пропорционально квадрату расстояния. А давление пропорционально корню квадратному из мощности, поэтому оно уменьшается пропорционально собственно расстоянию. Необходимость нормирования к давлению на некотором фиксированном расстоянии (1 м в данном случае) связана с тем же фактом зависимости давления от расстояния, только в обратную сторону - при неограниченном приближении к точечному излучателю звуковое давление (а также колебательная скорость и смещение молекул) неограниченно увеличивается.

Колебательную скорость молекул в сферической волне можно определить из уравнения движения среды:

.

Дифференцирование выполним по формуле производной произведения:

.

Преобразуем в экспоненциальную форму: . Итого, колебательная скорость , фазовый сдвиг относительно звукового давления (рис. 3.1). Упрощенно говоря, наличие фазового сдвига между звуковым давлением и колебательной скоростью связано с тем, что в ближней зоне с удалением от центра звуковое давление гораздо быстрее убывает, чем запаздывает.


Рис. 3.1. Фазовый сдвиг колебательной скорости относительно звукового давления в зависимости от расстояния до центра сферической волны, выраженного в длинах волн

На рис. 3.1 можно видеть две характерные зоны.

1. Ближняя r<<l.

2. Дальняя r>>l.

Сопротивление излучения сферы радиуса r:

.

Т.е. не вся мощность расходуется на излучение, часть запасается в некоем реактивном элементе и затем возвращается излучателю. Физически этому элементу можно сопоставить массу соколеблющегося с излучателем воздуха (присоединенная масса среды):

,

.

Легко видеть, что присоединенная масса среды уменьшается с ростом частоты.

На рис. 3.2 представлена частотная зависимость безразмерных коэффициентов вещественной и мнимой составляющих сопротивления излучения. Излучение эффективно, если Re(z(r))>Im(z(r)). Для пульсирующей сферы это условие выполняется при kr>1.


Рис. 3.2. Частотные характеристики безразмерных коэффициентов активной и реактивной составляющих компонент сопротивления излучения для пульсирующего шара

В заключение отметим, что выше не учитывалось затухание волны в воздухе. В качестве первого приближения это допустимо, основной источник затухания волны в помещении прослушивания - поглощение ее поверхностями помещения (см. Лекцию 4).

3.1.6. Энергетические характеристики звукового поля

Потоком энергии в бегущей волне называется мощность, перетекающая через единицу площади поверхности волнового фронта.

В бегущей волне поток энергии равен модулю вектора Умова:

.

По смыслу pзв - сила, приложенная к площади, v - скорость, т.е. перемещение в секунду. Таким образом, размерность , т.е. мощность, перетекающая через единицу площади (причем мощность-то величина скалярная).

Сложности конструирования этого вектора состоят в том, что и рзв, и v - векторы, но для продольной волны их положение не произвольно, а определяется фронтом, поэтому ранее мы их рассматривали как скаляры. То же касается и вектора Умова: он сонаправлен с лучём, если знаки рзв и v совпадают (для плоской волны это всегда так), и противонаправлен по отношению к лучу, если знаки знаки рзв и v различны. В сферической волне при малом числе длин волн до источника в некоторые моменты времени энергия перетекает обратно к источнику, т.е. в ближней зоне имеет место реактивное циркулирование мощности. Тогда средний поток энергии определяется математическим ожиданием модуля вектора Умова за период сигнала:

и называется интенсивностью звука. Размерность та же -[Вт/м2].

Интенсивность отражает активную составляющую мощности звука. Обладает векторными свойствами в связи с тем, что определяется относительно элемента площади волнового фронта.

Интенсивность звука синусоидальных колебаний

и .

.

Для плоской волны

; ; т.к. .

Для сферической волны

.

Полная мощность звуковой волны

, где S - волновой фронт.

Для сферической волны . Для среды без потерь P не зависит от r. Отсюда следует квадратичный закон убывания интенсивности в сферической волне:

=> ;.

r1=1 м, к примеру.

3.1.7. Плотность звуковой энергии

Плотностью звуковой энергии e называется энергия, содержащаяся в единице объема среды распространения.

Время пробега волной единицы длины по лучу 1/сзв => e =I/сзв; [e]=[Вт/м2]/[м/с]=[Вт*с3]=[Дж/м3].

Плотность энергии через давление:

.

Плотность энергии в отличие от интенсивности величина скалярная, и поэтому может применяться и в тех случаях, когда определение лучей и волновых фронтов затруднительно или невозможно, например, при распространении звуковых волн в помещениях.

ЛЕКЦИЯ 4 (6 ЧАСОВ) ОТРАЖЕННЫЕ ВОЛНЫ

Звуковое поле в пространстве с отражателями определяется не только характеристиками источника(ов), но и отражателей. Отражатель - тоже источник звука, только не самостоятельной волны, а связанной с первоисточником стационарным отношением. Таким образом, имеет место поле нескольких когерентных источников, для которого характерны многолучевость, интерференция и стоячие волны.

Интерференция (лат. inter между + ferens (ferentis) несущий, переносящий) - явление зависимости амплитуды суперпозиции когерентных синусоидальных или близких к ним сигналов от разности фаз между слагаемыми.

В этих условиях очень сложно определять волновые фронты и лучи, поэтому интенсивность, как привязанную к волновому фронту, практически не применяют для характеристики многолучевого поля. Применяют плотность энергии, т.к. объем лишен векторных признаков.

Звуковое поле в присутствии отражателей можно разделить на прямую волну от источника и совокупность отраженных, называемую реверберацией (от ср.-век. лат. reverberatio - отражение). Их соотношение зависит от расположения источника и отражателей и от формы (длины) волны.

Если на прямой линии между источником и приемником имеется акустически непрозрачное препятствие, то говорят о блокировании прямой волны.

4.1. Общие замечания о свойствах и роли реверберации

Реверберация - ряд задержанных копий сигнала, приходящих к слушателю или микрофону из различных направлений. Поэтому:

1. Реверберационный сигнал имеет многомерный, пространственный, векторный характер. Реверберация не может быть представлена, как это часто делается, в виде описания звукового давления в точке приема.

2. Реверберация не может быть корректно зафиксирована ненаправленным микрофоном. Это легко проверяется простым экспериментом - сравнением слухового ощущения реверберации, прослушиваемой одним ухом и двумя. Если разместить ненаправленный микрофон на месте слушателя, то уровень реверберации в фонограмме будет значительно больше того, который ощущал слушатель. Для более адекватной записи нужен либо направленный микрофон, либо ближе расположенный. Вообще, реверберационно сбалансировать фонограмму - это искусство.

3. Реверберация на слух добавляет грандиозности, видимо по древней ассоциации с большими пещерами и горами.

4. Реверберация удлиняет время восприятия сигнала и способствует, в связи с этим, его более точному анализу.

5. Реверберация сказывается главным образом не на амплитуде сигнала, а на его распределении во времени (или, в частотной области, на фазовой структуре). Это обусловливает действие реверберации как согласованного с сигналом фильтра: звуковой сигнал это, в основном, резонирование чего-либо (даже тарелки), т.е. относительно медленное изменение слышимых характеристик. А ряд наиболее опасных искажений - нетональный хруст импульсно-кодовой модуляции, подвесок динамических головок - это нерезонансного характера шумы. Реверберация же не позволяет быстро меняться основным слышимым характеристикам звука (например, спаду громкости) и в этом смысле выступает как фильтр, сохраняющий музыкальный сигнал и подавляющий помехи.

Можно наблюдать, насколько сильно выигрывает звучание посредственной системы в помещении с хорошей реверберацией. Причем это нельзя объяснить добавлением благородного послезвучия, оно уже и так есть в фонограмме, а именно фильтрацией искажений. И наоборот, высококачественная система не особенно и нуждается в качественном помещении прослушивания. Хотя есть мнение, что эта самая высококачественная система, чтобы быть таковой, уже содержит элементы реверберационной фильтрации ("рандомизации фаз" по А. Лихницкому), например рупорные громкоговорители, недодемпфированные резонансы и пр.

Реверберация используется также при электронном облагораживании искаженных записей.

Единого подхода к описанию реверберационного процесса нет, поэтому рассмотрим несколько альтернативных подходов, с разных сторон описывающих это явление.

Существуют два принципиально различных подхода к анализу реверберационного поля в помещении:

1) детерминированное описание;

2) статистическое описание.

4.2. Детерминированное описание реверберационного процесса

Для полного детерминированного описания реверберационного процесса нет ни возможности, ни смысла (в связи с высокой чувствительностью такого описания к малым изменениям обстановки). Детерминированный подход исходит из полезности точного вычисления хотя бы некоторых характеристик реверберационного процесса хотя бы для простейших абстрактных геометрических форм.

Первый частный случай, который мы рассмотрим, это падение плоской волны на плоскую преграду.

4.2.1. Геометрическая акустика

Упав на преграду, волна:

1) частично отражается;

2) частично поглощается;

3) частично проникает через преграду (с точки зрения приема в помещении это то же, что и поглощение).

Эти процессы (рис. 4.1) для плоских волны и преграды могут быть описаны законами геометрической акустики.


Рис. 4.1. Диаграмма, поясняющая процессы отражения и преломления звуковой волны, падающей на преграду

1. Угол падения равен углу отражения.

2. Отношение синуса угла падения к синусу угла преломления равно отношению скоростей звука в двух соприкасающихся средах.

Отношение энергии отраженного сигнала к энергии падающего называется коэффициентом отражения b.

Отношение энергии поглощенного поверхностью сигнала (включая перевод в тепло и звукопроводность) к энергии падающего называется коэффициентом поглощения a.

Отношение энергии прошедшего через поверхность сигнала к энергии падающего называется коэффициентом звукопроводности g.

a, b, g зависят от:

1) материала поверхности;

2) конструктивных особенностей (конфигурации) поверхности;

3) частоты сигнала;

4) угла падения волны.

Очевидно a+b=1.

4.2.2. Модель синусоидальных резонансов

Данный раздел обычно фигурирует в литературе под названиями "волновое описание" или "волновая теория". Однако звуковую волну иначе как волну и нельзя рассматривать; то, что называется в данном случае волной, есть не волна вообще, а синусоидальная волна и предметом рассмотрения являются резонансные явления по отношению к синусоидальным волнам.

Частота, на которой возникает резонанс, называется собственной частотой (в данном случае помещения прослушивания). Совокупность собственных частот называется спектром собственных частот.

Спектр собственных частот реально рассчитать только для простых геометрических форм. Для параллелепипеда длиной l, шириной b и высотой h с идеально жесткими отражающими поверхностями:

(*),

где g,q,r - целые числа. Каждой тройке чисел соответствует одна из собственных частот помещения. Об амплитуде и фазе сигнала на данной частоте речь не идет, поскольку они зависят от точки съема и возбуждения.

Спектр собственных частот линейчатый. Средний интервал между соседними резонансами уменьшается с частотой в линейном (рис. 4.2, а) и тем более в логарифмическом масштабе (рис. 4.2, б), что более адекватно восприятию высоты человеком.


(a)

(б)
Рис. 4.2. Спектр собственных частот помещения прослушивания размером (5,5х3,5х2,7) м. (а) - масштаб по оси частот линейный, (б) - логарифмический

С практической точки зрения это плохо для низких частот - на резонансных частотах происходит усиление или ослабление (в зависимости от точки съема) частот звукового сигнала, совпадающих с собственными частотами. В связи с этим воспроизведение глубокого баса без искажения тембра в помещениях малого объема невозможно. Таким образом, можно говорить об ошибочности традиционной цели получить от акустической системы (АС) наименьшую нижнюю граничную частоту. Более адекватным решением в помещениях небольшого объема являются АС с относительно высокой граничной частотой с правильной установкой в помещении для использования усиливающего действия резонансов.

Кроме того, ситуацию можно улучшить выбором соотношения l/b/h для наиболее равномерного распределения резонансов по частоте, непараллельными поверхностями и увеличением звукопоглощения.

Число собственных частот Dn, приходящееся на интервал частот DF называется плотностью спектра собственных частот. Вообще-то это не совсем настоящая плотность, т.к. используются конечные разности, а не дифференциалы.

Если для заданного DF Dn велико (в области ВЧ), то использование формулы (*) для вычисления затруднительно. Можно использовать приближенную формулу, найденную вычислением среднего ожидаемого количества резонансов, приходящихся на заданный интервал DF:

где F0 - средняя частота выделенного диапазона DF.

Средний интервал между смежными собственными частотами:

.

DFср обратно пропорциональна объему помещения и очень быстро убывает в сторону ВЧ.

Из этих формул следует, что в области ВЧ структура спектра собственных частот главным образом зависит от объема, а не формы, помещения.

Общее число собственных частот в диапазоне 0..F:

,

L=4(l+b+h); S=2(lb+lh+bh).

При Dn настолько велико, что спектр любого реального звука, даже тонального в стабильной фазе, перекрывает одну или несколько собственных частот и преимущественного усиления или ослабления отдельных звуков не происходит. Однако на синусоидальном сигнале генератора неравномерность АЧХ помещения вполне ощущается вплоть до самых высоких частот. В этом состоит недостаток данного метода анализа характеристик помещения: собственные колебания представляются набором сигналов, которых реально не бывает. Для недисперсионной распределенной структуры собственными колебаниями правильней считать периодическую последовательность d-импульсов (а для дисперсионной еще более сложный сигнал). Это удобно тем, что резко снижается число собственных функций.

По отношению к структурам с дисперсией (в основном затухания) собственными функциями являются затухающие синусоиды или последовательности d-импульсов. Огибающая затухающего сигнала является экспоненциальной:

,

где d - декремент затухания,

e - установившаяся амплитуда,

e(t) - текущая амплитуда (линейно спадает в логарифмическом масштабе).

Если развивать эту мысль, то можно собственной функцией помещения считать одну функцию, образующуюся в результате его возбуждения d-импульсом (рис. 4.3):

,

где ai и ti - соответственно амплитуда и время запаздывания i-того отзвука (для прямого звука i=0),

x(t) - сигнал, излучаемый источником звука.


Рис. 4.3. Отклик помещения на
d-импульс

Если еще учесть дисперсию групповых скоростей, то импульсы искажаются по форме.

Число повторений, приходящих в точку приема за время от t до t+Dt:

,

средний интервал между отзвуками:

.

Если вначале процесса структура его дискретна, то в конце, с учетом дисперсии, отражения сливаются. Начальный участок несет информацию об индивидуальных особенностях помещения и мест прослушивания (хорошие/плохие места). Завершающий участок определяет гулкость. Наступает он примерно через 100 мс (в больших помещениях ~200 мс). Это время достижения диффузного поля (см. Статистическое описание).

4.2.3. Среднее распределение энергии во времени для концертного зала

1. 5¸ 20% - прямой звук.

2. 70¸ 80% - энергия дискретных отражений.

3. 10% - завершающий участок.

Дискретную фазу также можно разделить на раннюю и позднюю, граница 50 мс для речи и 80 мс для музыки. При звучании музыки максимальный эффект пространственности достигается, если первое отражение запаздывает на 20...30 мс, а последующие три размещаются на интервале 45...75 мс. Для речи максимальная разборчивость достигается, если первый запаздывающий отклик приходит не позже 10...15 мс, а последующие три в интервале 25...35 мс. Отсутствие участка дискретных отражений приводит к ощутимому ухудшению качества звука. Можно сказать, что ранние отражения повышают разборчивость и прозрачность, а более поздние - пространственное впечатление.

Важная особенность реверберационного процесса - пространственность прихода дискретных отражений. Есть залы, и даже фонограммы, в которых слышно блуждание эха.

Но есть и обратная точка зрения: в приукрашивании реверберацией нуждается только плохой звук, а действие ее сводится к расфокусированию звука. Кто слышал хороший оркестр на открытом воздухе, тот поймет о чем речь.

4.3. Статистическое описание реверберационного процесса

Важной характеристикой реверберационного процесса являются его векторные свойства. Если в установившемся реверберационном поле все направления прихода волн равновероятны, то оно называется изотропным.

Конечно, в каждый конкретный момент времени волновой фронт в точке приема ориентирован вполне определенным образом, но в процессе приема отражений из разных направлений вращается в пределах полного телесного угла.

Если плотность энергии во всех точках некоторого объема постоянна, то поле в этом объеме называется однородным.

Поле, одновременно являющееся изотропным и однородным, называется диффузным.

Практически близкое к диффузному поле возникает, если:

1) отражателей очень много и расположены они хаотически (например, лес);

2) структура излучаемого сигнала не допускает существенных интерференционных явлений. Для этого сигнал должен быть достаточно широкополосным, т.е. спектральная плотность мощности должна быть значительной в достаточно широком диапазоне частот. На фазовый спектр особенных ограничений не накладывается, т.е. сигнал может быть шумоподобным, импульсным, линейно-частотно-модулированным и т.д. Единственное, что нужно учитывать во временном или фазовом смысле, это то, что спектральная плотность мощности характеризует среднюю ситуацию в точке за некоторый промежуток времени. Т.е. если диффузность оценивается, например, импульсным сигналом, то нужно подождать, пока точки приема достигнут все энергетически значимые переотражения. Если это шумоподобный сигнал, то его длительность должна быть больше времени установления в помещении.

Практически идеально диффузного поля не бывает. Степень приближения к нему оценивается при помощи индекса (коэффициента) диффузности:

,

где , , .

Iср - средняя интенсивность звука в пределах полного телесного угла,

DIi=Ii-Iср.

DI - среднее отклонение интенсивности звука.

m0 - среднее относительное отклонение интенсивности звука, измеренное в заглушенной камере для того же относительного расположения тех же излучателя и приемника.

Индекс диффузности зависит от расстояний между приемником, излучателем и отражателями. Если m=m0 => iд=0 - полностью заглушенное помещение. Если m=0 => iд=1 - поле абсолютно диффузно. Для большинства залов iд=0.65 - 0.75. При увеличении V> 10000 м3 iд уменьшается. Его увеличивают звукорассеивающими конструкциями.

Вообще понятия диффузности и однородности сложные и противоречивые. Например, для обеспечения направленного приема нужна значительная апертура, а это противоречит требованию точечного приема.

4.3.1. Средний коэффициент и фонды звукопоглощения

В качестве характеристической величины, не зависящей от угла падения волны, используется коэффициент звукопоглощения для диффузного поля. Т.к. в диффузном поле все направления прихода волны равновероятны, то:

,

где - коэффициент звукопоглощения при угле падения волны j .

Взвешенная коэффициентами звукопоглощения сумма всех поверхностей, с которыми взаимодействует волна, называется фондом звукопоглощения:

.

Фонд звукопоглощения делится на:

1. основной - стены и неподвижные элементы конструкции;

2. дополнительный - люди, предметы обстановки;

3. добавочный - проникновение энергии в щели и отверстия.

Добавочный фонд образуется из-за усечения основного видимой частью помещения. В отношении дополнительного фонда трудно оценить площадь поверхности образующих его предметов. Если известен индивидуальный фонд звукопоглощения Ak k-того предмета и их количество Lk, то дополнительный фонд равен:

.

Общий фонд звукопоглощения в первом приближении является суммой основного, дополнительного и добавочного:

.

Физическую осмысленность фонд звукопоглощения приобретает при определении среднего коэффициента поглощения:

.

Т.е. это способ усреднения поглощательной способности поверхности помещения. С другой стороны фонд звукопоглощения можно трактовать как площадь идеального звукопоглотителя с a=1, имеющую такую же поглощательную способность, как и реальная поверхность, которую этот фонд характеризует.

4.3.2. Средняя длина и время пробега звуковой волны

Путь волны в помещении можно представить в виде ломаной линии. Средняя длина (математическое ожидание) ребра этой линии называется средней длиной пробега волны, а время, за которое волна проходит это расстояние - средним временем пробега. Точные значения средней длины и времени пробега зависят от размеров, конфигурации помещения и положения точек возбуждения и съема сигнала. Вычисление их затруднительно. Приближенные расчеты показывают, что lср=4V/S, tср=4V/(cзвS), среднее число отражений в единицу времени nсрзвS/4V.

Сами по себе коэффициент поглощения, среднее время и длина пробега волны мало о чем говорят, но в совокупности они позволяют описать процесс нарастания и спада энергии в помещении.

4.3.3. Нарастание звуковой энергии в помещении

Пусть в момент времени t=0 начал работать источник звука мощностью P. Через tср-0 источник отдаст энергию E=Ptср. Часть энергии поглотится при отражении и в момент tср+0 энергия будет E=Ptсрb. В последующие моменты времени:

2tср-0: ,

2tср+0: ,

3tср-0: ,

ntср-0: .

, =>

.

b<1, поэтому lnb<0. Величина называется реверберационным коэффициентом поглощения. Для a<0.2 a'» a.


Рис. 4.4. Связь между средним и реверберационным коэффициентами звукопоглощения

Таким образом:

.

Переходя к плотности получим:

(*).

Из (*) следует, что процесс нарастания энергии в помещении происходит по экспоненциальному закону (линейно в логарифмической шкале) и тем быстрее, чем больше фонд звукопоглощения A и меньше объем помещения.

Второе слагаемое в скобках стремится к 0 при t-0, поэтому в установившемся режиме . В этом случае мощность, излученная источником, равна мощности, поглощенной поверхностями помещения. e0 растет с увеличением P и уменьшением А.

Следует напомнить, что (*) верна только для диффузного поля, в реальном помещении процессам установления энергии свойственны флуктуации.

4.3.4. Спад звуковой энергии

Имеем установившуюся e0, в момент времени t=0 источник звука выключается. Далее:

t=tср+0: ,

t=2tср+0: ,

t=ntср+0: .

Как и ранее

.

Процесс спада также экспоненциальный (линейный в логарифмической шкале) и тем короче, чем больше А и меньше V. Коэффициент, определяющий скорость изменения давления, один и тот же и для нарастания, и для спада, т.е. чем больше время реверберации, тем медленнее и нарастание.


Рис. 4.5. Зависимость плотности звуковой энергии в помещении от времени при включении и выключении источника

Потери энергии происходят также в воздухе из-за его вязкости, теплопроводности и молекулярного поглощения. Они могут быть описаны соотношением , где , m - коэффициент затухания, равный обратному значению того пути l, на котором e уменьшается в e раз. , где h - коэффициент вязкости.

С учетом поглощения звука в воздухе:

.

В связи с тем, что звукопоглощение в воздухе пропорционально квадрату частоты, оно влияет на процесс изменения плотности звуковой энергии в основном на высоких частотах. Однако, чем больше помещение, тем больше длина свободного пробега и тем на меньших частотах начинает сказываться поглощение в воздухе.

4.3.5. Стандартное время реверберации

Стандартным временем реверберации ТР называется время затухания звука на частоте 512 Гц на 60 дБ.

.

Решив уравнение относительно ТР, получим:

.

Итак, ТР зависит в первую очередь от отношения объема помещения к фонду звукопоглощения, а на ВЧ еще и от поглощения энергии в воздухе (Tp уменьшается с ростом поглощения).

Для помещений небольшого объема и на частотах более 1000 Гц вторым слагаемым можно пренебречь. При частоте сигнала свыше 4 кГц сказывается поглощение в воздухе и время реверберации уменьшается.

4.3.6. Акустическое отношение и эквивалентная реверберация

Стандартная реверберация характеризует изменение плотности энергии диффузного поля в помещении в целом. Однако при реальном прослушивании диффузной можно считать только совокупность отраженных сигналов, помимо которой существует еще и прямой звук. Соотношение плотностей энергии отраженного и прямого звука зависит от акустических свойств помещения, размещения источника и приемника, влияет на ощущение реверберации и называется акустическим отношением R.

Определим акустическое отношение для диффузного поля и сферической волны. Плотность энергии прямого звука сферической волны:

Плотность энергии отраженного звука eотр определяется как часть установившейся плотности e0, которая остается через tср после выключения источника:

.

.

R определяет акустический баланс между прямым и отраженным звуками. Для музыки R=6-8, для органной музыки до 10-12.

Для направленного источника

,

где - коэффициент осевой концентрации источника звука,

D(j) - характеристика направленности (зависимость уровня звукового давления от направления излучения),

j - угол между акустической осью источника и направлением на точку прослушивания.

R растет при увеличении расстояния между источником и точкой прослушивания, увеличении Тр, использовании ненаправленных источников уменьшении aср и V. Изменение акустического отношения воспринимается как изменение времени реверберации. Факт зависимости акустического отношения от направленных свойств излучателя говорит о большой важности характеристик направленности. В целом ненаправленные излучатели интенсивней озвучивают поверхности помещения, в связи с чем их звучание в большей степени зависит от характеристик помещения. Кроме того, направленные свойства излучателей, как правило, изменяются с частотой, поэтому реверберационная накачка помещения производится звуком с другой частотной характеристикой давления. Это приводит к искажению тонального баланса даже в том случае, если АЧХ излучателя на акустической оси равномерная. Известно довольно много разновидностей акустических систем, в которых разработчики стараются получить ту или иную характеристику направленности (рупоры, монополи, диполи, биполи, контрапертурные АС и т.д.).

Расстояние, при котором R=1, называется радиусом гулкости rгул. Для одиночного источника

.

Внутреннее пространство сферы с радиусом, равным радиусу гулкости - та зона, в которой влияние помещения незначительно. Поэтому в акустически неблагоприятных помещениях (слабо заглушенных, малого объема, с тонкостенной резонирующей мебелью) рекомендуется расположение точки прослушивания на расстоянии, меньшем радиуса гулкости. Эту же рекомендацию можно дать любителям сфокусированного, камерного звука.

4.3.7. Эквивалентная реверберация

Поле в точке прослушивания после выключения источника меняется скачком - исчезает прямой звук. Величина скачка определяется акустическим отношением. В идеально диффузном поле R=-, eпр=0 и скачек отсутствует. Два процесса спада энергии, со скачком и без, оцениваются как эквивалентные по гулкости, если точка их пересечения отстоит от момента исчезновения прямой волны в точке прослушивания на Dt=0,2 c.


Рис. 4.6. Сопоставление реального спада плотности энергии и спада в диффузном поле

Время, за которое энергия эквивалентного процесса уменьшается на 60 дБ, называется эквивалентным временем реверберации Тэр.

,

где - коэффициент направленности приемника,

Eп1 - чувствительность приемника к прямому звуку,

Eп2 - чувствительность приемника к диффузному звуку.

Тэр<Тр. Для R>3 Тэр»Тр, для концертных залов это практически всегда так, для электроакустических систем не всегда.

4.3.8. Оптимальная реверберация

Оптимальным является время реверберации, при котором программа воспринимается наилучшим образом. Исследована зависимость разборчивости (артикуляции) от времени реверберации для различных объемов помещения. Процентная артикуляция - это отношения числа правильно понятых слогов артикуляционной таблицы к общему их числу.


Рис. 4.6. Зависимость процентной артикуляции от времени реверберации

Наибольшая разборчивость обеспечивается при Т60>1 с, т.е. оптимальная скорость затухания реверберации > 60 дБ/с. Причем недостаток реверберации также уменьшает разборчивость. Объясняется это, вероятно, двумя моментами.

1. Удлинение звуков позволяет слуховому аппарату более точно проанализировать характеристики звука и больше времени дается на смысловое восприятие. Вполне вероятно, что в условиях недостаточной реверберации более активно используется кратковременная слуховая память в качестве "устройства выборки-хранения" отрывистого звука на время его распознавания.

2. Реверберация отфильтровывает быстрые изменения трех слышимых характеристик звука: высоты громкости и тембра и подавляет щелкающие или хрустящие помехи звуку.

4.4. Элементы архитектурной акустики

При проектировании акустически благоприятных помещений необходимо учитывать два ключевых момента:

1) геометрию помещения;

2) звукопоглощение поверхностей помещения.

4.4.1. Геометрия помещения

При выборе геометрии следует стремится к равномерному распределению резонансных частот. Этому способствуют.

1. Выбор соотношения размеров сторон помещения. Самая неблагоприятная форма в этом смысле - куб, поскольку некоторые собственные частоты, соответствующие разным тройкам чисел g, q, r (см. выше), совпадают.

2. Использование непараллельных и криволинейных поверхностей.

Законы геометрической акустики сохраняют свою силу и для криволинейных поверхностей.


Рис. 4.7. Отражение звуковых волн от вогнутой (а) и выпуклой (б) поверхностей (И - источник звука)

Из рисунка видно, что при отражении звуковых лучей от вогнутой поверхности происходит их фокусировка с образованием мнимого источника звука. В этой точке звуковое давление возрастает, что означает увеличение неравномерности звукового поля. Поэтому при проектировании помещений допустимы поверхности либо с малым (не более 40 см), либо с большим (в четыре и более раз больше длины помещения) радиусом кривизны.

Выпуклые поверхности способствуют рассеянию отраженных волн, способствуя однородности звукового поля.

4.4.2. Звукопоглощающие материалы и конструкции

Для достижения оптимального времени реверберации в помещении, при заданном отношении объема к площади, необходимо получить определенный средний коэффициент звукопоглощения поверхностей помешения. Кроме того, звукопоглощающие материалы ипользуются не только при отделке помещений, но и в акустических оформлениях громкоговорителей. Можно провести следующую классификацию звукопоглощающих материалов и конструкций.

1. Пористые.

1.1. С жестким скелетом.

1.2. С упругим скелетом.

2. Резонансные.

2.1. Мембранные.

2.2. Перфорированные.

Пористые звукопоглотители с жестким скелетом представляют собой недеформируемый звуковой волной скелет (гравий, пемза, шлак) плюс вяжущие материалы (цемент, алебастр, синтетические смолы). Характеризуются невысоким звукопоглощением (на высоких частотах больше, на низких - меньше).

Стенки пористых поглотителей с упругим скелетом способны неупруго деформироваться под действием звуковой волны с переводом части энергии в тепло. Это такие материалы как:

1) войлок;

2) вата;

3) стекловолокно;

4) драпировки, ковры.

Звукопоглощение заметно выше, чем у поглотителей с жесткими стенками, и также более эффективно в области ВЧ. Звукопоглощение минимально при расположении вплотную к стене и максимально при размещении на расстоянии четверти длины волны от стены.


Рис. 4.8. Частотные характеристики коэффициента звукопоглощения для пористых материалов: 1 - известковая штукатурка по деревянной обрешетке; 2 - ковер с ворсом, лежащий на бетонном полу; 3 - арболитовая плита толщиной 2 см; 4 - фиброакуститовая плита толщиной 2,5 см; 5 - драпировка на стене; 6 - драпировка на расстоянии 10 см от стены

Звукопоглощение резонансных поглотителей имеет максимум на их резонансной частоте. Резонанстные мембранные поглотители представляют собой тонкие пластины, неупруго колеблющиеся под действием звуковой волны. В основном они используются для звукопоглощения в области НЧ, поскольку их резонансные частоты проще сделать низкими.


Рис. 4.9. Завсисмость изменения коэффициента звукопоглощения от частоты для панелей, резонирующих на нижних частотах: 1 - фанера толщиной 3 мм с воздушным промежутком 5 см; 2 - то же, края задемпфированы ватой; 3 - фанера толщиной 6 мм с воздушным промежутком 10 см, края задемпфированы ватой; 4 - оконное стекло

Перфорированные резонаторные поглотители представляют собой пористый материал, примыкающий к стене, закрытый жесткой перфорированной решеткой. Звукопоглощение достаточно равномерное в широком диапазоне частот с тупым максимумом на средних частотах. Диаметр и шаг отверстий позволяют рерулировать положение максимума.


Рис. 4.10. Эскиз конструкции (а) и зависимость коэффициента звукопоглощения перфорированных резонаторных панелей от частоты при различной их толщине d, диаметре отверстий D, расстоянии между отверстиями d и расстоянии от стены h (б): 1 - d=3 мм, D=7 мм, d=3 см, h=5 см; 2 - d=3 мм, D=7 мм, d=3 см, h=10 см; 3 - d=3 мм со щелью 45 мм, расстояние между щелями 6,5 см, фанера подклеена тканью; 4 - d=3 мм со щелью 45 мм без подклейки тканью с заполнением воздушного промежутка матами из асбестовой ваты

Требуемая частотная характеристика звукопоглощения формируется комбинацией перечисленных видов поглотителей.

Традиционно, для достижения максимально диффузного поля, стремятся разместить звукопоглотители равномерно по поверхности помещения. Однако есть иной, неплохо обоснованный подход.

4.4.3. Концепция LEDE

Аббревиатура от Live End - Dead End. Автор Don Davis, создана концепция в 1978 году. Согласно этой концепции передняя стена и передняя половина помещения являются "меpтвыми", поглощающими.

Задняя стена и задняя половина являются "живыми", отражающими. При такой обработке помещения обеспечивается "оживление" звучания реверберацией и в то же время реверберационное дополнение максимально разнесено с прямой волной по углу, что обеспечивает минимальное маскирующее и расфокусирующее действие реверберации.

Изначально LEDE предназначалась для студий звукозаписи, однако практика, по мнению приверженцев концепции, показала универсальный характер возможного использования основных принципов обработки помещений по LEDE.

ЛЕКЦИЯ 5 (4 ЧАСА). ВОСПРИЯТИЕ: ОБЩИЕ ЗАМЕЧАНИЯ, ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА СИГНАЛА

5.1. Общие замечания о слуховом восприятии

Вопрос описания, моделирования слуха и восприятия является краеугольным, поскольку определяет критерии качества звукозаписи/воспроизведения и, таким образом, облик электроакустической аппаратуры в целом.

Восприятием называется отражение объектов и явлений в виде образов или символов. Речь пойдет о восприятии звуковых явлений.

С точки зрения системотехники слуховой образ есть неязыковая модель звукового поля. Для нее характерны все свойства, присущие моделям вообще. Важнейшие из них:

1. Целостность. Множество вызвавших образ характеристик поля воспринимается как новая самостоятельная единица - собственно образ.

2. Обособленность от фона. Обратная сторона целостности.

3. Различимость частей. Возможность различить отдельные составляющие образа, называемые признаками образа.

4. Неразделимость на части. Это свойство проявляется двояко:

1) отдельно взятый признак воспринимается не так, как он воспринимался в составе образа;

2) образ, из которого изъят признак, не обладает свойствами целого образа.

5. Эмерджентность. Свойства образа не являются суммой свойств признаков образа.

Перечисленные свойства образов человеку не просто полезны, а необходимы, но иногда проявляется и их оборотная сторона. С точки зрения все той же системотехники образ является агрегатом-оператором, который задает внешнюю целостность входящих в образ признаков. Общими свойствами всех агрегатов являются:

1) потеря части информации о входящих в образ признаках;

2) возможность неадекватного агрегирования.

Практически с этими свойствами сталкивается всякий, кто пытается проанализировать слуховой образ (анализ, точнее декомпозиция, есть операция, обратная агрегированию). В связи с неразделимостью образа на части и в связи с тем, что анализируемый экземпляр образа является единственным, аналитик собственными руками необратимо разрушает то, что он анализирует.

Типичные составляющие (элементы) образов называются ощущениями. Ощущения, относительно которых не все ясно, называются сложными (например, тембр). Ощущения, которые не обнаруживают составной структуры или она очевидна, называются простыми (примеры: высота тона, громкость). Ощущения могут быть зафиксированы в измерительных шкалах. Сложные ощущения можно зафиксировать в самой слабой шкале - шкале наименований. Эта шкала не допускает упорядочивания. Простые ощущения измеримы в более сильных шкалах:

1) порядковых - допускают упорядочивание без указания расстояний между измерениями;

2) интервальных - допускают численную характеристику расстояний между измерениями;

3) шкалах отношений - есть физически обусловленный нуль шкалы;

4) абсолютных - и ноль и единица измерения физически обусловлены.

Исследование соотношений между результатами чувственных экспериментов и физическими параметрами раздражителей составляет предмет психофизики. Раздел психофизики, посвященный звуковым образам, называется психоакустикой.

В механизме слухового восприятия можно выделить две составляющие:

1) акустоэлектрическое преобразование звукового сигнала;

2) обработка нервной системой.

Будем рассматривать их по порядку.

5.2. Акустоэлектрическое преобразование сигнала

Акустоэлектрическое преобразование звукового сигнла осуществляется по следующим этапам.

1. Трансформация звукового давления.

2. Преобразование перемещения барабанной перепонки в сжатие жидкости внутреннего уха.

3. Механоэлектрическое преобразование звукового сигнала с функциональным Фурье-подобным преобразованием.

Рассмотрим их.

5.2.1. Трансформация звукового давления

Выполняется наружным ухом (рис. 5.1), конкретно - ушной раковиной (аурикулой) 1. Кроме того, на этом этапе осуществляется акустическая пространственная обработка сигнала. В зависимости от направления прихода волны в спектре сигнала формируются характерные зоны подъема и спада АЧХ, получившие название пеленговых зон (подробнее см. Лекцию 6).


Рис. 5.1. Устройство органа слуха

5.2.2. Преобразование перемещения барабанной перепонки в сжатие жидкости внутреннего уха

Выполняется это преобразование в среднем ухе. При этом происходит также дальнейшая трансформация звукового давления.

Барабанная перепонка вогнута внутрь и натянута. Ее перемещение воздействует на систему рычагов, состоящих из трех слуховых косточек: молоточка 4, наковальни 5 и стремени 6, шарнирно соединенных между собой суставами и оснащенными мышечным аппаратом из двух мышц 7. Рукоятка молоточка прикреплена к барабанной перепонке, основание стремени закрывает собой овальное окно, за которым находится внутреннее ухо. Стремя в овальном окне может совершать возвратно-поступательные движения. Коэффициент трансформации давления от барабанной перепонки к овальному окну ~ 1:100. С целью защиты барабанной перепонки от повреждения, полость внутреннего уха соединена евстахиевой трубой с носоглоткой. Это обеспечивает выравнивание статического давления по обе стороны ее.

5.2.3. Механоэлектрическое преобразование сигнала с функциональным Фурье-подобным преобразованием

Необходимость предварительного функционального преобразования связана с тем, что скорость обработки сигнала центральной нервной системой значительно ниже скорости изменения звукового сигнала (частота a-ритма головного мозга около 7 Гц). Осуществляется механоэлектрическое преобразование во внутреннем ухе, точнее в улитке. Расположена улитка в височной кости. Там же расположены элементы вестибулярного аппарата - органа определения пространственного положения. Совмещение уха и вестибулярного аппарата способствует более точному отслеживанию перемещений ушей с целью выделения пространственных характеристик источника звука из изменений ушных сигналов при перемещении головы. На рисунке улитка показана спрямленной, фактически же она свернута в спираль наподобие настоящей улитки. Длина канала улитки составляет ~35 мм.

Пространство улитки разделено двумя мембранами (основной мембраной 10 и мембраной Рейснера 11) на три заполненных жидкостями спиральных канала:

1) лестницу преддверия 12 (заполнена перилимфой);

2) серединную лестницу (заполнена эндолимфой);

3) лестницу барабана 13 (заполнена перилимфой).

Овальное окно является входом в лестницу преддверия. Лестница барабана также соединена со средним ухом упругой мембраной. Перилимфатические полости соединены между собой через отверстие в вершине улитки - геликотрему. Эндолимфа и перилимфа имеют разные вязкость и плотность. Основная мембрана представляет собой аморфную ненатянутую перепонку, закрепленную по краям. Длина ее около 32 мм, ширина у овального окна около 0,1 мм и вблизи геликотремы 0,5 мм. Со стороны эндолимфы на основной мембране расположен кортиев орган 16, покрытый покровной мембраной 17. Кортиев орган содержит множество волосковых клеток, чувствительных к давлению и деформациям основной мембраны. С волосковыми клетками контактируют окончания нервных волокон. В кортиевом органе производится преобразование давления в электрические импульсы. Кроме того, некоторые волосковые клетки (называемые "наружными") получают команды от мозга: при больших уровнях сигнала они удлиняются и снижают амплитуду колебаний основной мембраны, а при очень малых уровнях сигнала дополнительно раскачивают мембрану.

Теперь мы подошли к вопросу о динамических процессах в улитке. Этот вопрос на сегодня не является вполне ясным, ряд нижеперечисленных утверждений, возможно, будут со временем дополнены или пересмотрены. Итак:

1. В жидкостях внутреннего уха волновые процессы отсутствуют, т.к. во всем слышимом диапазоне длина волны в них больше длины мембраны, поэтому к мембране по всей ее длине приложено одно и то же давление.

2. Т.к. мембрана закреплена по краям, избыточное давление вызывает прогиб мембраны. Мембрана колеблется в режиме бегущей волны. Стоячие волны не возникают потому, что отражение от вершины улитки практически отсутствует. Это утверждение выдвинуто Георгом Бекеши.

3. Направление распространения волны зависит не от точки возбуждения (давление со стороны жидкости на все точки мембраны одинаковое), а от распределения жесткости мембраны. Волна распространяется от более жесткого конца (овального окна) к менее жесткому (геликотреме).

4. Зависимость прогиба основной мембраны y от удаления от овального окна x и частоты может быть описана следующей функцией (рис. 5.2):

.

yмах - функция с одним максимумом по x. Расположение максимума на оси x однозначно связано с частотой, что позволяет приписать основной мембране шкалу частот.


Рис. 5.2. Семейство зависимостей амплитуды колебания основной мембраны от удаления от стремени для разных частот сигнала

В то же время надо понимать, что волны всех частот пробегают по всем участкам мембраны и, если некоторый участок и вибрирует сильнее, то это не единственный и, возможно, даже не главный фактор частотной селективности кортиева органа. Вероятно, большую роль в обострении (и вообще в формировании) частотной избирательности кортиева органа играют процессы "торможения" чувствительности рецепторов, прилегающих к участку наибольшего возбуждения. Это свойственно и другим сенсорным системам человека. Вероятно для того, чтобы не исключать этот эффект, нобелевский лауреат Георг Бекеши, получивший примию за исследование процессов в улитке, в качестве модели кортиева органа использовал собственную руку и писал о работе своей модели: "Хотя бегущая волна распространялась по всей длине мембраны почти с одинаковой амплитудой, мне казалось, что вибрирует лишь участок мембраны длиной 2...3 сантиметра" (общая длина модели составляла 30 см). Поэтому правильней фильтрующие функции рис. 1 рассматривать как результат интегрального действия механических свойств улитки и торможения чувствительности рецепторов вокруг экстремума.

Ширина экстремума функций рис. 5.2 определяет ширину зоны возбуждения кортиева органа по частоте и называется критической полосой слуха. Косвенно критическая полоса слуха оценивается по исследованию маскировки чистого тона полосой шума с той же средней частотой. До определенного предела безразлично, увеличиваем ли мы спектральную плотность мощности шума или расширяем его полосу. Этот предел и соответствует ширине зоны возбуждения.


Рис. 5.3. Зависимость ширины частотной группы слуха от частоты сигнала

Скорость изменения узкополосного сигнала пропорциональна его полосе частот, поэтому данное функциональное преобразование позволяет снизить требования к скорости обработки давления на отдельных участках кортиева органа до физиологически реальных пределов.

Важно отметить, что для спектральных составляющих, входящих в одну частотную группу, на слуховое восприятие влияют фазовые соотношения между ними. Т.е. наклон фазовой характеристики не должен превышать некоторой величины, за которой компоненты в одной частотной группе существенно расфазируются. Определить этот наклон (а это по существу групповое время запаздывания (ГВЗ)) можно как величину, обратную ширине частотной группы:


Рис. 5.4. Оценка порога чувствительности слуха к фазовременным искажениям исходя из ширины частотной группы слуха

Этот же эффект можно рассматривать и с другой стороны: как игнорирование слухом частотной неравномерности (дисперсии) группового времени запаздывания величиной несколько миллисекунд. Это должно рассматривать не как досадный недостаток разрешающей способности, а как полезный эффект, который игнорирует типичные и не несущие полезной информации искажения сигнала при его излучении и распространении. Это свойство, однажды возникнув в процессе эволюции, влечет за собой самые глобальные последствия:

1) основными слышимыми свойствами сигнала становятся его спектральные признаки: высота и тембр;

2) практическую значимость приобретают сигналы хоть и широкополосные, но с относительно медленно меняющимися свойствами: периодические сложной формы (тональные) и шумоподобные (нетональные);

3) точная форма сигнала не является существенной (как, например, для видеосигнала), поэтому прямое сравнение форм звуковых сигналов, например, по методу наименьших квадратов, совершенно бессмысленно (равно как и наблюдение их на экране осциллографа) - энергия разности двух идентичных на слух сигналов может быть сопоставима с энергией самих сигналов;

4) аналогичное игнорирование фазовых соотношений между различными частотными группами при хранении сигнала позволяет строить эффективные алгоритмы компрессии звукового сигнала, например, mpeg, vqf.

Итак, небольшие искажения ГВЗ и формы сигнала являются допустимыми, однако уложиться под кривую, приведенную на рисунке довольно сложно; часто на это вообще не обращают внимания.

Нельзя не отметить, что функциональное преобразование сигнала в кортиевом органе только лишь подобно преобразованию Фурье. Иначе и быть не может, поскольку "чистое" преобразование Фурье некаузально и вообще физически нереализуемо. Внимания этому моменту уделяется недостаточно, в частности, непосредственно приписывать кортиеву органу шкалу частот, строго говоря, некорректно. За неимением лучшей модели, этим подходом можно пользоваться, но помнить при этом о его упрощенности.

Колебания основной мембраны нелинейны. При уровнях сигнала свыше 90 дБ это становится существенным. Новобразования, появившиеся в результате нелинейности колебаний мембраны сложно отличить от физически поступающих в ухо звуков и сделать это можно только для простейших сигналов, таких как набор нескольких синусоид с заранее известными параметрами.

5.3. Обработка сигнала нервной системой

В процессе обработки участвуют две важнейших составляющих.

1. Память. В памяти хранятся врожденные и накопленные жизненным опытом образы и реакции. Важнейшим свойством памяти является хранение характерных, типичных черт образа и нивелирование случайных, не имеющих отношения к делу характеристик. Иными словами в памяти хранятся обобщенные образы "скрипка вообще", "певческий голос вообще" и т.д. На этом свойстве основывается все современное здание Hi-Fi (high fidelity - высокая верность (англ.)) и Hi-End (high end - наивысшая точка (англ.)), т.к. практически значимой для слушателя является верность именно внутренним, хранящимся в памяти, образам звуков.

2. Внимание - осознаваемое субъектом ограничение поля восприятия, фокусирование восприятия на определенной его части. Например, благодаря вниманию человек способен выделить голос собеседника из шума толпы или звучание отдельного инструмента в оркестре.

Сканирование поля восприятия - перевод внимания с одних аспектов поступающего потока информации на другие. Это очень важный процесс, поскольку исследования показывают, что одновременно может восприниматься один (или очень небольшое количество) образов.

Установка на доминанту - априорная (доопытная) готовность субъекта к селективному восприятию отдельных аспектов явления, включая предполагаемый результат восприятия. Обычно установки формируются как обобщение предыдущего опыта восприятия похожих явлений или как отображение текущих целей воспринимающего субъекта. В других случаях формирование установок происходит под действием авторитетного мнения или мнения большинства. Это тоже учет опыта, только чужого, если нас удастся убедить, что это опыт. Это полезно, но только в том случае, если при конфликте установки с чувственным опытом приоритет остается за реальными ощущениями. Не особенно преувеличивая, можно сказать, что тренировка слуха музыкантом или аудиофилом представляет собой выверенную систему установок на доминанту.

Прямое сравнение образа и объекта невозможно, т.к. объект описывается в терминах физики, а образ в терминах ощущений. Но можно говорить об адекватности образа, если выводы, сделанные наблюдателем, подтверждаются опытом. Неадекватный образ называется иллюзией.

Константностью восприятия называется поддержание адекватности образов в условиях, когда физические воздействия на органы чувств (стимулы) подталкивают к обратному. Примером служит поддержание постоянной оценки мощности источника звука при его перемещениях.

Порог - значение стимула, при котором он начинает восприниматься. Большинство порогов зависят от действия других стимулов. Возможные варианты совместного действия стимулов следующие.

1. Индифферентное - стимулы не влияют на пороги друг друга.

2. Синергичное - один или оба порога понижаются (демаскировка). Взаимно демаскируются, как правило, компоненты корреляционно связанные друг с другом. Например, после того как Вы включили радиоприемник, можете заметить, что у соседей включена та же программа, хотя до этого Вы ничего не слышали. Механизм демаскировки в данном случае состоит в концентрации внимания на демаскирующем сигнале и, соответственно, похожих на него. Взаимная демаскировка проявляется, вероятно, и по отношению отдельным элементам сигнала, однако, содержательное исследование этого эффекта крайне затруднено неразделимостью образа на части, проявляющейся в этом случае особенно остро.

3. Антагонистическое - один или оба порога повышаются (маскировка). В этом случае один из стимулов называется маскером.

Стимулы не обязательно должны иметь одинаковую природу. Из других сенсорных систем по отношению к слуху особенно заметна (деаскировка со стороны зрительной системы. Например, в телевизионных системах искажения звука в целом менее заметны. Это пример маскировки. Визуальный захват источника звука повышает точность локализации (демаскировка). И наоборот, отсутствие зрительной информации приводит к искажениям в получаемых эмоциях, даже если звуковой сигнал передан совершенно точно. Поэтому математически точная передача даже трехмерного звукового поля не является безусловным идеалом. Возможно, более похожее на живой концерт ощущение человек испытает от в чем-то гипертрофированного (т.е. формально искаженного) звучания.

5.3.1. Кодирование сигналов в нервной системе

Волосковые клетки и нейроны работают в бинарном режиме. С волосковой клеткой контактирует "входной" отросток нейрона - дендрит, оканчивающийся синапсом. Между синапсами и источниками сигнала (в данном случае волосковыми клетками) имеется небольшой промежуток, называемый синаптической щелью. При акустическом воздействии волосковые клетки выделяют в синаптическую щель вещество, называемое медиатором. Плазма нейрона имеет электролитические свойства - ее молекулы разделены на положительно и отрицательно заряженные ионы. Медиатор изменяет разность потенциалов, приложенную к клеточной мембране, и через нее возникает обмен ионами между плазмой нейрона и межклеточной жидкостью. Этот процесс занимает 1-2 мс. Электрохимический процесс распространяется вдоль нейрона и дойдя до выходного отростка - аксона, завершается выделением медиатора в следующую синаптическую щель. Скорость распространения сигнала по аксону 0,1-10 м/с.

Надо отметить, что модели механизмов кодирования сигнала и обработки в центральной нервной системе носят характер достаточно обоснованных, но, все-таки, гипотез: точно известны лишь входной звуковой сигнал, результат обработки и некоторые сведения о видах активности групп нейронов и взаимосвязях отделов нервной системы. "Срисовать" алгоритм работы мозга крайне сложно в силу большого количества, однотипности элементов нейронной сети и затруднительности неразрушающего исследования.

По современным представлениям слух использует два разных алгоритма кодирования сигнала.

1. На частотах до 3-4 кГц кодируется форма сигнала. Нейроны имеют разные пороги срабатывания, поэтому сигнал кодируется номером нейрона с самым высоким порогом и числом сработавших нейронов. Однако частота следования импульсов в отдельно взятом нейроне не может превышать 300-400 Гц, т.к. на выделение медиатора и восстановление электрического равновесия уходит 1-2 мс. Поэтому на средних частотах близкорасположенные нейроны объединяются в группу (до 10 нейронов) и возбуждаются периодами сигнала по очереди (это положение называется теорией залпов). Этот алгоритм требует периодической структуры сигнала на протяжение порядка 10 периодов, что в частотной области означает узкополосный сигнал с шириной полосы около 300-400 Гц. Это обеспечивается функциональной фильтрацией сигнала в улитке. Таким образом, диапазон частот кодируемого сигнала достигает 3-4 кГц.

2. На частотах выше 4 кГц возможности организации последовательной работы нейронов исчерпываются, и кодируется не сам сигнал, а его огибающая. Сигнал нейрона уже не несет информации о частоте, частотная информация извлекается из точки его подключения к коритеву органу. Иными словами, для определения высоты тона используется положение максимума амплитуды бегущей волны на основной мембране.

В пользу изменения алгоритма определения частоты свидетельствует и тот факт, что музыкальный звукоряд простирается только до 4 кГц. Замена кодирования мгновенных значений сигнала на частотах выше 4 кГц кодированием огибающей имеет весьма важные последствия.

1. Разрешающая способность по частоте в диапазоне высоких частот заметно падает.

2. Наиболее важным становится наличие высокочастотного сигнала с определенной огибающей и не столь важно, какая у него частота заполнения (в пределах трети октавы).

3. Если огибающая высокочастотного сигнала является периодическим сигналом звуковой частоты, то ее частота и воспринимается в качестве высоты тона. В спектральной области это означает, что в качестве высоты тона воспринимается не какая-либо физически существующая частота, а период сложного сигнала.

3. Разделимость сигналов нескольких источников заметно падает, если они не содержат спектральных составляющих ниже 4 кГц. Если же низкочастотные составляющие присутствуют, то разделение, вероятно, производится "присоединением" высокочастотного призвука к низкочастотному сигналу со сходным поведением во времени.

Итого: до 4 кГц царство тонального звука (деревянные духовые, фортепиано), а выше - царство нетонального (атаки, щипки струн и т.д.). Использование этого факта при конструировании АС может быть очень продуктивным: СЧ/ВЧ раздел на частоте 4 кГц с хорошим акустомеханическим спадом АЧХ среднечастотного громкоговорителя позволяет получить мягкий тональный звук и не отягощенный интермодуляцией нетональный.

ЛЕКЦИЯ 6 (4 ЧАСА). СОБСТВЕННО ВОСПРИЯТИЕ

Восприятие в целом можно разделить на 2 составляющих:

1) восприятие содержания звука;

2) восприятие пространственных характеристик источника звука.

Будем рассматривать их по порядку.

6.1. Восприятие содержания

Под восприятием содержания будем понимать восприятие эмоций и информации, закодированных во временной форме сигнала вне зависимости от ее пространственных характеристик. Собственно, эмоции - это тоже информация, но особого рода.

В этой связи перед нервной системой стоит 2 задачи:

1) селекция нужного источника;

2) собственно извлечение информации из формы сигнала.

Условие, при котором сигналы источников можно разделить: два сигнала можно разделить, если один из них нельзя представить как второй, измененный по амплитуде и сдвинутый во времени (причем это касается не отдельных периодов времени, а всего сигнала). В противном случае мы слышим либо эхо, либо один кажущийся источник звука (КИЗ), расположенный между излучателями.

Если указанное условие выполняется (а оно выполняется даже для исполнителей, поющих в унисон), то разделить сигналы Вы можете только в том случае, если в Вашей слуховой памяти есть образцы разделяемых сигналов по отдельности. Эти образцы не обязательно должны быть точными (например, голос конкретного человека), достаточно, чтобы эти образцы описывали то, что присуще сигналам по отдельности, но не присуще их суперпозиции. Образцы слуховых образов, хранящихся в слуховой памяти можно разделить на врожденные и приобретенные.

Наиболее правдоподобная гипотеза того, как конкретно осуществляется разделение источников, состоит в том, что выполняется корреляционное (или какое-либо другое) сравнение поступающей смеси сигналов с имеющимися образцами. Если обнаружен аддитивно существующий в смеси интересующий нас компонент, то формируется соответствующий образ.

Теперь относительно собственно восприятия содержания.

В восприятии музыкального произведения можно выделить три уровня восприятия:

1) восприятие звука (восприятие основных характеристик отдельных фрагментов звуковой волны);

2) восприятие эмоций, заложенных в отдельные музыкальные фразы;

3) восприятие музыкального произведения в целом.

Они не лучше и не хуже друг друга, это звенья одной цепи. Далее рассмотрим только первый, т.к. вторые - вопрос музыкальной культуры и между ними и традиционными научными методами - зияющая пропасть. Основные слышимые характеристики звука - громкость, высота, тембр. Рассмотрим первые две, т.к. относительно третьей пока можно высказать только самые общие соображения.

6.1.1. Восприятие громкости

Человек оценивает не то, на сколько изменилась мощность источника, а во сколько раз она изменилась. Это позволяет иметь больший динамический диапазон и более стабильную относительную погрешность.

Уровни

В связи с логарифмической зависимостью слухового ощущения от возбуждающего стимула характеристики звуковых сигналов также выражают в логарифмической шкале. Но логарифм можно брать только относительно безразмерных положительных величин. Поэтому логарифмируют не сам параметр p, а его отношение к некоторому опорному p0 (нулевому в логарифмической шкале):

.

Значение логарифма вещь, конечно, безразмерная, но к ней для удобства принято добавлять наименование: Бел (в честь Александра Белла). Бел - крупная единица, соответствует изменению параметра в 10 раз. Поэтому повсеместно применяется одна десятая Бела - децибел [дБ]. Это соответствует изменению параметра ~1,26 раз и примерно соответствует порогу чувствительности слуха к изменению громкости.

Значения параметров, выраженные в логарифмической шкале (конкретно, в дБ) называются уровнями.

По причине невозможности логарифмирования неположительных величин невозможно вычислять уровень мгновенного значения знакопеременной величины (звукового давления и т.д.). Когда говорят об уровнях, речь идет только об огибающей или мгновенной амплитуде. Это одновременно является и положительным и отрицательным моментом. Плюс состоит в том, что слух фиксирует огибающую как одну из характеристик звука, как текущую громкость. Минус в том, что нет ни однозначного математического описания того, что такое огибающая, ни точного представления о том, как именно определяется текущая громкость слуховым аппаратом. В связи с этим, наряду с указанием значения уровня, указывают и способ определения огибающей (пиковые уровни, квазипиковые уровни, средние уровни).

Для того, чтобы значение уровня не зависело от того, какая из характеристик (линейных или энергетических) является параметром, уровень вычисляют различным образом для линейных и энергетических характеристик:

для энергетических параметров (мощность, энергия, интенсивность, плотность энергии): ;

для линейных параметров (давление, колебательная скорость, напряжение, ток): .

Классификация уровней

По физической природе параметра:

1) акустические;

2) электрические.

По существу опорного уровня:

1) абсолютные (опорный уровень физически обусловлен);

2) относительные.

Физически обусловленные нули акустических уровней:

pзв0=2*10-5 Па, I0=10-12Вт/м2, e=3*10-15 Дж/м3. Соотношения эти неточно укладываются в формулы взаимосвязи интенсивности, давления, и плотности мощности (см. Лекцию 3), но тем не менее ограничиваются одной значащей цифрой, поскольку характеризуют они самый тихий звук, который еще может быть воспринят человеком, а эта величина не слишком стабильная и от индивида к индивиду, и в зависимости от характера звука. При нормальных атмосферных условиях акустические уровни по давлению, интенсивности и плотности энергии равны: Np»NI»Ne, поэтому обычно не указывают, по какому физическому параметру вычисляется акустический уровень.

Условный нуль абсолютных электрических уровней: 1 мВт@600 Ом. При этом p0=1 мВт, u0=0,775 В, I0=1,29 мА. Уровни мощности, напряжения и тока в одной и той же точке могут различаться в зависимости от сопротивления нагрузки. Поэтому к названию децибела добавляется наименование физической величины, по которой измеряется уровень: дБн, дБт, дБм. дБ/Вт, дБ/мкВ означает уровень относительно Ватта и микровольта соответственно.

Статика восприятия громкости

По отношению к громкости есть два параметра:

1. Уровень громкости - это уровень тона частотой 1 кГц, субъективно равного по громкости оцениваемому сигналу. Единица измерения - фон. Недостаток этой единицы - опора на синусоидальный сигнал - сигнал, который в естественных условиях не встречается и воспринимается с заметными погрешностями. Уровень громкости - это не громкость, это уровень сигнала с нивелированием частотной зависимости чувствительности слуха. Изменение уровня громкости, например с 40 до 80 фон не означает, что субъективная громкость изменяется вдвое.

2. Собственно субъективная громкость измеряется в сонах. 1 сон - громкость тона 1 кГц при уровне 40 дБ. Двукратное увеличение субъективного ощущения громкости происходит при увеличении уровня сигнала до 50 дБ.

G(сон)=2(L(фон)-40)/10 40<L<120.

Графически зависимость субъективной громкости от уровня громкости представлена на рис. 6.1.


Рис. 6.1. Связь между уровнем громкости и громкостью

Для f=1000 Гц, когда уровень громкости в фонах численно равен уровню в дБ:

Эта зависимость носит название закона Стивенса (степенная зависимость громкости от характеристик поля): громкость в средней части звукового диапазона частот пропорциональна линейным характеристикам звукового сигнала в степени 0,6 или энергетическим характеристикам в степени 0,3.

Динамика восприятия громкости

Динамику восприятия громкости можно разделить на 2 составляющих:

1) по времени;

2) по амплитуде.

Динамика восприятия громкости по амплитуде

Основное понятие в этом отношении - дифференциальный порог по уровню громкости. Зависит от того, предъявляется ли сигнал для сравнения. Для L>40 дБ составляет 0,5...1 дБ (что и объясняет распространение дБ в качестве единицы уровня).

Динамика восприятия громкости по времени

Интервал времени, в течение которого вычисляется большая часть характеристик сигнала, составляет от 80 до 140 мс (в зависимости от экземпляра субъекта) и называется временным окном слухового анализатора. Средняя величина составляет около 100 мс.

После восприятия атаки сигнала чувствительность слуха притупляется на 30...40 мс. Этот феномен называется законом первой волны и служит для подавления реверберации. Полезно отметить, что снижается чувствительность обоих ушей, даже если сигнал подается на одно. Сигнал, приходящий после 30...40 мс, уже воспринимается как эхо.

6.1.2. Восприятие высоты

Статика

Числовое значение частоты в Гц, как и расположение высоты в музыкальном звукоряду, отражают не субъективное ощущение высоты, а параметры стимула, который это ощущение вызывает. Субъективное ощущение высоты тона H измеряется в мелах (здесь можно усмотреть аналогию с уровнем громкости в фонах и громкостью в сонах). Зависимость субъективного ощущения высоты от частоты сигнала представлена на риc. 6.2. Видно, что на высоких частотах ощущаемая высота растет медленнее, чем частота сигнала. Это объясняется насыщением импульсной активности нейронов и сменой алгоритма определения высоты. Для того чтобы определиться с единицей изменения высоты, устанавливают численное соответствие между высотой и частотой в некоторой точке. В качестве такой точки выбирается либо "до" малой октавы (131 Гц), либо 1000 Гц. Первый вариант более удобен, поскольку обеспечивает численное соответствие высоты и частоты в наиболее употребительном диапазоне.


Рис. 6.2. Зависимость субъективного ощущения высоты от частоты сигнала

Динамика

Высота тона в диапазоне 100-1000 Гц определяется приблизительно за 5 периодов сигнала вне зависимости от его частоты и за 5 мс при более высоких частотах.

Алгоритм определения высоты, как и многие другие алгоритмы обработки информации в нервной системе, плохо работает на стационарном сигнале. В слуховой коре больших полушарий мозга имеются группы клеток, которые никак не реагируют на чистые тоны, зато реагируют на изменение параметров сигнала, причем одни нейроны реагируют только на повышение частоты, другие - только на понижение, третьи на любое изменение. Эти частотные детекторы реагируют на частотную модуляцию с частотой до 7...12 Гц и наибольшую чувствительность имеют, когда во временное окно слухового анализатора укладывается половина периода частоты модуляции, что соответствует частоте модуляции 3,5-6 Гц. Этим свойством слухового аппарата объясняется большое эстетическое значение вибрато. А для электроакустики это означает недопустимость эффекта Доплера (возникает, когда излучение некоторого тона сопровождается перемещением подвижной системы излучателя другими компонентами сигнала), детонации (знакопеременные отличия скорости воспроизведения сигнала от скорости записи) и джиттера (знакопеременное несоответствие момента выдачи очередного отсчета в цифровых системах номинальному значению).

Кривые равной громкости

Кривые равной громкости (рис. 6.3) отображают зависимость уровня громкости от частоты. Измеряются они установкой такого уровня сигнала заданной частоты, чтобы он был равногромким сигналу частотой 1 кГц. Это своего рода АЧХ слуха, причем изменяющаяся с уровнем громкости.


Рис. 6.3. Стандартные кривые равной громкости: 1 - порог слышимости; 2 - порог болевого ощущения

Воспринимаемый диапазон частот составляет в лучшем случае 16 Гц - 20 кГц. Данный диапазон частот называется звуковым. Более низкие частоты называются инфразвуковыми и слухом не воспринимаются, но могут ощущаться в виде кинестетических ощущений. Наиболее значимы при таком восприятии частоты, совпадающие с резонансными частотами различных органов тела: желудка, мембраны, легких и т.д. Они составляют единицы Гц. Кроме того, излучение чистого инфранизкого тона без заметных на слух гармоник (которые уже попадают в звуковой диапазон) чрезвычайно сложная задача, поэтому наличие инфранизких частот может фиксироваться косвенно по наличию заметных гармоник.

Нужно отметить, что никакая частота или узкий диапазон частот не воспринимаются отдельно хотя бы потому, что для широкополосного сигнала энергия, переносимая на отдельной частоте, очень мала. Кроме того, чувствительность слуха по отношению к одним компонентам сигнала может меняться под воздействием других, поэтому непосредственная неслышимость некоторого диапазона частот не повод утверждать, что этот диапазон частот не вносит вклада в общее ощущение от звука.

Неравномерность чувствительности слуха вызвана следующими обстоятельствами:

1) плавный спад в области НЧ: волосковые клетки, как и многие другие, реагируют не на наличие, а на изменение стимула;

2) выброс чувствительности в окрестности 3-4 кГц: резонанс слухового прохода;

3) спад в области ВЧ, достаточно быстрый, в ультразвуковой области ~60 дБ/окт, связан с фильтрующими свойствами среднего уха и с тем, что экстремум колебаний кортиева органа оказывается вблизи точки крепления основной мембраны. С возрастом верхняя граница диапазона слышимых частот снижается.

6.2. Восприятие пространственных характеристик

Локализация источника звука - процесс определения его пространственных координат.

Кажущийся источник звука (КИЗ) - субъективный звуковой образ источника звука, располагаемый определенным образом в пространстве. Положение и количество КИЗ не всегда адекватно расположению и количеству реальных источников звука. Более того, задача электроакустики в плане передачи пространственных характеристик - именно формирование иллюзий, неадекватных КИЗ, поскольку положение акустических систем фиксировано, а пространственные характеристики первичных источников меняются.

Процесс локализации можно разделить на две части:

1) угловая локализация;

2) локализация по дальности.

Будем рассматривать их по порядку.

6.2.1. Угловая локализация

По современным представлениям человек использует четыре дублирующих и дополняющих друг друга механизма угловой локализации. Результатом их совместного применения является точность, которая на фоне размера апертуры и количества антенн (2 шт., разнесенные на ~ 20 см) является просто невероятной.

1. По азимуту (b).

1.1. b=00.

1.1.1. Широкополосный сигнал: ±1%.

1.1.2. Непрерывный тон, положение головы фиксировано: ±5%.

1.2. b=±400, непрерывный тон, положение головы фиксировано: ±15%.

1.3. b=±900, широкополосный сигнал: ±5%.

2. По углу места для сложных сигналов: ±2%.

3. По дальности.

3.1. Звуки метронома, речь на расстоянии 3-5 м: ±2%.

3.2. Часовой механизм на расстоянии 1 м: 55%; 8 м: 22%.

3.3. щелчки, звонки, тональные импульсы на расстоянии 0.5-1.5 м: 13-15%.

Заметные ошибки локализации в обыденной обстановке явление весьма редкое.

Механизмы угловой локализации следующие:

1) анализ кода, заложенного в моноуральный (воспринимаемый одним ухом, точнее каждым ухом в отдельности) сигнал углозависимой АЧХ ушной раковины;

2) анализ бинауральных различий ушных сигналов;

3) анализ изменений ушных сигналов, возникающих при перемещении головы;

4) использование информации, поставляемой другими сенсорными системами.

Будем рассматривать их по порядку.

Использование углозависимой АЧХ ушной раковины

Положение пеленговых полос (специфических для данного направления участков подъема или провала АЧХ) приведено в таблице.

Направление прихода звука по углу места (e)

F, кГц

Спереди (e=-150...450)

0,25...0,6; 3...7

Сзади (e=+1350...1650)

0,7...1,8; 9...14

Сверху (e=-450...1350)

7...9

Данный механизм нормально работает, если спектр звука перекрывает несколько пеленговых полос. При этом большое значение имеет предварительное знакомство слушателя со спектром локализуемого источника.

Это единственный способ локализации по углу места при неподвижной голове и отсутствии информации о положении источника со стороны других сенсорных систем. Он является причиной возникающей иногда иллюзии вертикального разделения КИЗ при расположении громкоговорителей в одной плоскости.

Ниже 250 Гц размеры ушей и головы не позволяют иметь существенную зависимость АЧХ от угла и этот механизм не в состоянии определить направление на источник. Важно, однако, отметить, что источников, спектр которых был бы полностью сосредоточен в диапазоне до 250 Гц, практически не бывает (даже при специальном стремлении к этому, как в случае с так называемыми сабвуферами), поэтому большинство источников звука по углу места локализуются.

Анализ бинауральных различий ушных сигналов

Это основной механизм локализации по азимуту. Обеспечивает локализацию в пределах b=±900.

В бинауральных различиях ушных сигналов можно выделить две составляющих:

1) амплитудные различия, возникающие вследствие экранирующего действия головы;

2) фазо-временные различия, возникающие за счет разной длины пути волны до ушей.

Анализируются обе составляющих, что обеспечивает дублирование и взаимодополнение результатов. Важно, чтобы результаты амплитудных и фазовых оценок не конфликтовали друг с другом. Подсознательный конфликт разных механизмов оценки параметров звука (не только пространственных) может вызывать непонятный дискомфорт при прослушивании. В ряде случаев такую ситуацию могут создавать электроакустические системы, например, при прослушивании на стереотелефоны фонограммы с "интенсивностной" стереофонией в отсутствие "временной".

Основная проблема измерения фазовой составляющей бинауральных различий - неоднозначность определения направления, т.к. на частотах выше ~800 Гц разность фаз может составлять несколько периодов. Решается эта проблема тем, что на каждую волосковую клетку действует узкополосный сигнал и неоднозначность фазового сдвига можно устранить, анализируя фазовый сдвиг огибающих. Это эквивалентно измерению не фазового сдвига, а скорости изменения фазового сдвига с частотой (а это есть групповое время запаздывания). Такой способ корректно работает в диапазоне ширин критической полосы слуха до 800 Гц, т.е. до 3-4 кГц. В области более высоких частот работа данного механизма локализации может быть нарушена при доминировании в огибающей периодического сигнала с частотой более 800 Гц, т.е. и сдвиг огибающих может превышать один период. Однако это маловероятно, диапазону частот свыше 4 кГц присущи в основном атональные звуки с небыстрой огибающей. К тому же работает дублирующий механизм анализа амплитудных различий.

Наибольшее значение при оценке сдвига огибающих имеет нарастающий фронт волны. Кроме того, лучше, если сигнал имеет при этом длящееся продолжение, это удерживает на нем внимание и способствует наиболее точному определению как тембральных, так и пространственных характеристик. Таково большинство музыкальных звуков.

Ниже 250 Гц различия ушных сигналов несущественны и этот механизм также не работает.

Пространственная дифференциация нескольких источников звука обеспечивается большим количеством каналов обработки.

Синтез апертуры при сканирующих движениях головы

Из изменений ушных сигналов при перемещении головы можно извлечь информацию о пространственных координатах источника. Например, если при повороте головы не происходит изменений ушных сигналов, то источник имеет угол места 900. Этот механизм является одной из причин эффекта локализации звука внутри головы при прослушивании передач через головные телефоны и подъема центра стереопанорамы при чрезмерной ее ширине, поскольку в обоих случаях при повороте головы ушные сигналы изменяются меньше, чем должны были бы при данном угловом положении КИЗ.

Поворот головы в горизонтальной плоскости может служить основой для решения вопроса спереди / сзади, а качание влево-вправо - для решения вопроса сверху-снизу. Эту же задачу выполняет слежение за спектром в пеленговых зонах. Некоторые эксперименты показывают, что если между этими двумя механизмами возникает конфликт, то приоритет имеет оценка, полученная при сканирующих движениях головы.

Для нормальной работы этого механизма необходима информация о направлении и скорости перемещения головы. Такая информация поставляется тремя сенсорными системами:

1) зрительной системой;

2) вестибулярным аппаратом (датчики вестибулярной системы - полукружные каналы, совмещены с улиткой);

3) тензомоторными датчиками шейных мышц.

6.2.2. Локализация по дальности

Механизм локализации по дальности наименее изученный и наименее точный. Точность определения дальности составляет в лучшем случае 13% (щелчки, звонки, тональные импульсы на расстоянии 0,5-1,5 м). Но и это для пассивного пеленгатора с базой около 20 см - поразительный результат. Вероятно, основной причиной локализации звука внутри головы при прослушивании на стереотелефоны является корректная локализация действительного источника звука по дальности.

Более-менее определенно можно указать лишь параметры, на которые в принципе можно ориентироваться при локализации по дальности.

1. Громкость звука. В совокупности со сведениями о мощности источника и условиях распространения это позволяет определить дальность.

2. Спектральный состав. При удалении источника звука высокие частоты затухают быстрее. Если известен спектральный состав сигнала источника, то можно определить дальность.

3. Кривизна волнового фронта.

4. Акустическое отношение (связано с дальностью).

5. Изменение ушных сигналов при перемещениях.

6. Использование информации от других сенсорных систем.

Полезно отметить следующие экспериментально установленные феномены локализации по дальности.

1. При увеличении громкости звука и неизменном положении источника КИЗ приближается к слушателю.

2. При удалении источника звука на расстояние более 3 м КИЗ начинает отставать от источника. Таким образом, при бесконечном удалении источника слуховой образ не может удаляться бесконечно далеко. Граница, за которую не может удалиться кажущийся источник звука, называется акустическим горизонтом.

Большое значение имеет ознакомление с источником, т.к. для корректной локализации по дальности нужны сведения о мощности и спектральном составе сигнала источника.

Конец формы

 

Конец формы

 



Hosted by uCoz