Главная ->  Электроакустические и звукотехнологические устройства 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 [ 58 ] 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74

сигналов fi[t), gi[t)- Далее все обработанные спектральные полосы вводятся в блок распознавания ходов 2, который определяет, наному нэ хранящихся в nawHTU набору признаков больше всего соответствует ход. ноступнв-тий на вход. Полученную в результате этого сравнения информацию используют в блоке J прн формнрованнн слухом ощущения одного нлн нескольких прос раиственных слуховых объектов.

Основная идея, положенная в основу рассмотренной и всех других кор-реляцио- ных оделей с ха, исходит нз предположения о том. что няформа-ция, н ход! я дли р ров н и ощущени всюкацнв и цротяжениостн слухе, го о ъе та вы еляется нз функции орреляцин двух ушных сигналов. Так, напрьмер бинаура .ьиые когерентные сое авлнюшне ушных сигналов могут распознаваться по максимуму норреляциони функции. Высота и ши-ринв максимумов по воляют судить о степ нн когерентности сигналов, а их положение на оси задержек - о значении средних бнлауральных задержек н. следовательно ковых смещениях источников звука Бинауральные различии амплитуд ушных сигналов выделить из корреляционной функции довольно сложно. Однако чтобы н нх учесть в модели, были сде.. ны два дополнительных долущевни.

1. Ушной сигнал бо1ьшего уровня возбуждает больше чувствительных клеток, чем сигнал меньшего уровня. Следовательно, бинауральные разтичия ушных сигналов приводят н тому, что в центральную нервную систему от од иого уха поступает больше импучьсов, чем от другого М жво показать, что это повышает вероятность того, что на модели Джеффри (1948) совпадения будут приходиться на одну и ту же сторону (Давид, Гутмаи п Ваи-Бергейк. 1959). Этот вывод получен на основе статистического анализа, которого мы здесь касаться не будем.

2. Второе предположевне состоит в том, что различия уровней лерекодв-руются слухом во временные различия. Возможные механизмы такого преобразования рассмотрены выше в § 2.4.3 (см. рис. t07,ci). Правда, там же было указано и на то, что в определенных условиях временные н анп.-штуд- ые различии звуков оцениваются слухом раздельно. Это явтение корреляционная модель объяснить не может.

Для одного частного случая - объяснения, каким образом слух определяет место с ух в г объекта относительно медианной плоскости (c-ieaa нлн справа). Сойерс и Черри (1957) предлож ли считать опредепяющим отношение площадс! под кривыми кратковремеввых норреляциони ых функций. Взве. и!иваюши и к эффици~нтами, учитывающими бнпауральные различия ушных сигиал о ут служить нх уровни.

Подводя итог, можно сказать, что рассмотренная модель бииаурального коррсляциоквого анализа позволяет объяснить процесс выде.чсння c=iyxoM из ушных сигнал в таких составляющих, которые между собой полностью илн частично ко е ентны Мотель позволяет также объяснить процесс выде.=1ения информации необходимой для формирования эффекта латерализацин и размывания литерализации слуховых объектов. В то же время модель в представленном здесь виде не может объяснить процесс выделения информации, необходимой для ф рмнрования ощущения направления н слуховому объекту н диета нн д него К проблема пространстаенного слуха, которые могут бьть объяснен., корреляциониои моделью, относится спад порога смещения латералнэацпи &(Сф=0)мкв прн увелнчеяви длительности сигнала до 250 мс (Тобиаш н Церлин. 1951; Хаутгаст н Пломп. 1968; см. рнс. 96).

Здесь можно упомянуть также результаты экспериментов по исследованию латералнзации в случае, когда яа два уха подавались тональные нмпульсы, раэ.шчавшнсся по цен ральной частоте (Е та Соне н Ннмура, 1968; Перро, Бриггс и Перро. 1970). Максимальное различие центральных частот Ы/К при котором слуховой объект ошущался как един >е целое, с умеиыне-пнем длительности сигнала увели ивается По иабл ням Турлова и Эльфнера (1959) ощущение единого слухового объекта раэиочастотных тоиов сохраняется н в случае, когда частоты кратны между собой. Это явление тайнее может быть объяснено с помощью корреляционной модели.

Поллак (1971) и Трнттип (1959) измеряли абсолютный слуховой порог



при изменении бинауряльного ноэффнпнента корреляция ушных сигналов. Было установлено, что основным ирнтернем для экспертов прн этой служили взменення протяженности слухового объекта Еслн периодически изменять бинауральный коэффициент корреляции ушвых сигналов, то в такт с этимп изменениями слуховой объект начинает пульсировать: как бы набухает, становясь диффузным, и сокращается приобретая четкие границы. Этот эффект, получивший в литературе не совсем то .ное название бинауральное корреляционное биение , был тщательно исследован Грубером (1967). Коэффициент Корреляция ушных сигналов он изменял следующим образом: на оба головных телефона додавал шумовой сигнал от одного генератора. Амплитуды сигналов нодулир вались по прямоугольному закону (г убниа модуляции - 1(Ю%). Благодаря взан ным с ещ ння прямоу ьных огибающих прн иенз-менном положении несущего шума можно было произвольно изменять коэффициент корреляции.

3.2.Z Бинауральное распознаванне сигналов

в вседневной жизни можно наблюдать следующую картину. В помещении находктся несколько человек н оживленно п р говарнваются. Между тем каждый слушатель ожет выде нть нз обще о шу а нитересуюий голос и noHHwaib его даже когда гов ряшнй обращ и в другую сторону. Если же с-уша ель прн рывает одно ухо. то ра рчивость речи за--°тио уменьшается Этот ннте ныЙ пснхоакустнческнй эффект был назван Черрн (1953) эффектом вечерни,...- (-Cocktailparty-Effekl ). Вообще, когдв мешающий сигнал N приходит нэ одного направления, а полезный сигнал S -нэ другого, то прн бннауральном слушании маскирующее действие помехи оназы-вается значительно слабее, чем при моиауральиом. При ноличсствеином анализе этого эффекта исходят из порога маскировки полезного сигнала Порог маснировкн - это уровень, прн котором маскируемый сигнал минимальио распозваетсн иа фоне помехи. Порог маскнровкв аналогичен абсолютному слуховому порогу (см. § 3.1.2). Для сравиеяия в ка11естве опорного служит выраженный в децибелах порог маснировкн при моиауральиом слушании. Из исго вычитают (выражеинын также в децибелах) порог маскировки при данных условиях исследования. Полученную разность порогов маскировки обозначают сокращеиио БРУМ - бинауральная ра иость уровпей маскировки. В исследоеаннях с речевыми сигналам вивсго порогов маскировки используют пороги, соответствующие определенной разборчивости речи. Тан возинн-ло еще одно понятие - бинауральная разность уровней разборчивости (Б РУР).

Только за последние 5 лет появилось более 100 работ посвященных исследованиям БРУМ и БРУР в разных условиях слуш нн Пионер ими в этой области являются работы Хнрша (1948). Ликлндера (1948) Хнрша и Вебстера (1949) Кока (1950). Хавннна и Стевенса (1950) Джеффри БлоД-жетта и Дитери жа (1952) Аиа нтическнй об ор литератур до 1969 г сделан Грнном и Хем ивгом (1969) Проблема бннаурального распознавания сигналов касается пространственных свойств слуха лишь косвенно потому что здесь дело обстоит в распозна-анни сигнвлов. а не пространственных ирнзнаков слуховых объектов С я ь с проблемами пространствеин го слуха прослежпваетси здесь, во-первых, постольку, поскольку пря бннауральион рас-оозиаванни сигналов и при пространственном слушании в принципе необходимо взаимодействие двух ушей. и. во-вторых, потому что БРУМ и БРУР оказываются положительными в случае, когда вызываемые полезным сигналом и помехой слуховые объекты при раздельном слушании лолнруются в разных местах.

* Коэффщиент корреляции - это значение нормированной корреляционной функции при г=0.



в hoime параграфа мы вернемся к этому вопросу. Не вдаваясь н под-робвостя, рассмотрим теперь в общих чертах проблему бииаурального рас-поэиаваиня сигналов. Для обозиачеиня способа подачи звуков слушателю будем пользоваться следующими сокращениями, принятыми в литературе: S - полезный сигнал: W -сигиал помехи (шум): m - монауральное прослушн-ваиие (одностороннее); ф. О, п~днхотическая подача сигнаюв (двусторон-ияя) с бннауральным сдвигом фазы О, л или ф; t - днхотическая подача сигналов с бинауральной временной задержкой Тф; и - днхотическая подача би- вуральио некоррелированных сигналов.

Тан, например, запись Л/в. означает, что сигнал помехи подастся днхо-тическим способом с бннауральным сдвигом фазы на 180**. я полезный сигнал- монаура-1Ьно. Запись NnSm означает, что полезный сигнал н помеха подаютсв на каждое ухо мопотнческн.

Основные соотношения полезного сигнала н помехи характеризуются следующей иерархией зпачсинй БРУМ, предложенной Хнршсм (условия легко создаются с помощью го-ювных телефонов):

N S, БРУМ = О дБ (Номинальные условнн)

N Sj БРУМ = О?

WoS BPyM = 0-15 дБ?]

NjS БРУМ О?

AeS.n БРУМ = 6-9 дБ

fS БРУМ = 9- 12 дБ

Лц5 БРУМ =12-15 дБ

БРУМ является фуницией частоты. На рис. 156 показан график частотной зависимости БРУМ для NoS в случае, когда полезным является синусоидальный сигнал, а помехой - плфокополосвый шум. Штриховкой показана область значений, полученных Дюрлахом (1963). Шенкелем (1964). Рабнне-ром, Лоуренсон н Дюрлахом (1966). Видно, что своего максимума кривая БРУМ достигает в области от 200 до 300 Гц, затем с увеличением частоты сигнала быстро стЕадает. Выше 3 кГц БРум остается неизменной на уровне приблизительно 3 дБ.

Большой разброс результатов в области нижних частот следует, по-видимому, объяснять различиями уровней в экспериментах. Спедует также учитывать, что при уменьшении частоты (как это видно иа рис 73) повышается стуховой порог. Подробнее зависимость БрУМ от уровня сигналов будет рассмотрена ниже.

Спад кривой БРУМ с ростом частоты иногда объясняют, лредлолагвя. что определяющей для разности уровней маскнровкн явтяется бинауральная временная задержка между ушными сигналами Одиано. как правильно отмечает Шсикель (1956). в этом случае БРУМ с ростом частоты Должна стремиться н О, потому что

Тф. ак -Ит 2/f = 0. (68)

На рнс. 157 приведены графики завнсимостн БРУМ от бинауральных фа-эовых и временных задержек тональных импульсов и последовательностей импульсов (режимы Л/о5,И NoS), полученные по резу1ьтатам энсперкментов Шенкеля (1964). Фланагана н Уотсона (1968). Видно, что максимального значения БРУМ достигает прн бнвауральных временных задержках от 1.5 до 2 мс. Синусоидальные тона н последовательности импульсов с частотой

Часто в качестве номинального используется н днотнческий способ подачи полезного сигнала н помехи, т. с. режим NoSo. На значеяних БРУМ это почти Не сказывается.



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 [ 58 ] 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74