WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!


Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 8 |

Находим сумму S= S1+ S2+.... Теперь находим уровень громкости N=33lg(S1+ S2+...)+40 фон Также рассчитываем уровень громкости широкополосного шума, занимающего несколько критических полосок. Спектральный состав шума разбиваем на критические полосы. Определяем уровни громкости в каждой полосе (как интеграл интенсивности шума) N1, N2,... Nk. Находим S1, S2,... Sk. Суммируем S= Si и находим N=33lgS+40 фон Нелинейные свойства звука.

При большой интенсивности чистого тона порядка 100 фон ухо слышит субъективно 2-ю гармонику с уровнем 88 фон, третью – с уровнем 74 фон и т.д. Это явление обнаруживается в эксперименте с ‘бегущим’ тоном.

При двух чистых тонах, не попадающих в fкр ухо слышит тоны разностной и суммарной частот. Например, при чистых тонах в 60 фон уровень громкости разностного тона – около 40 фон, а при 80 дБ (f1=1000Гц) громкость разностного тона достигает фон.

При срезании частотного диапазона ниже 1000Гц ухо при высокой громкости подчеркивает низкие частоты из-за нелинейности слуха. Этим объясняется то, что при плохой передаче низких частот слушатель стремится их слушать на юольшей громкости, получая впечатление повышенной громкости звучания низких частот по сравнению со средними частотами.

5.2.6 Эффект маскировки Эффект маскировки заключается в том, что на фоне мешающего тона происходит при восприятии звукового сигнала увеличение порога слышимости (ПС) этого сигнала, рис. 5.12. Например, если собеседники негромко разговаривают тет-а-тет у громко журчащей воды из крана и сносно слышат друг друга, то уже с расстояния в несколько метров услышать их разговор невозможно.

5.3 Восприятие высоты звука.

5.3.1 Общие характеристики.

Восприятие высоты звука и разницы высот тонов самое сложное субъективное слуховое ощущение. Оно зависит от многих исходных условий: запоминаем ли мы высоту тона или сравниваем тоны одномоменто или последовательно во времени;

слушаем ли чистый тон или сложный звук; слушаем ли девиацию частоты и др.

В диапазоне 16Гц – 20кГц человек может запомнить не более 250 градаций частоты, причем число их резко уменьшается с уменьшением интенсивности звука. В среднем человек с музыкальным слухом может запомнить 100...150 градаций частот. Это число соответствует количеству критических полосок слуха. Эти соседние градации отличаются не менее чем на 4%. Поэтому самые лучшие музыканты не могут по памяти заметить разницу в звучании фильмов снятых для кино (24 кадра в сек) при демонстрации их на телевидении (25 кадров в сек).

Однако при сравнении тонов человек может различать изменение частоты до 0,15...0,3%. А по биениям частот двух тонов можно обнаружить разницу частот до десятых долей Гц.

При медленном изменении (девиации) частоты тона по синусоидальному закону слух обнаруживает это изменение, когда девиация составляет около 2% от критической ширины полоски слуха. Например, на частотах до 500Гц fкр = 100Гц, а минимальное ощущение девиации равно1,8Гц. На частотах больше 500Гц fкр составляет 17% от fнес, а минимальное ощущение девиации равно 35% от fнес, т.е. 2% от fкр. На рис. 5.13 и 5.представлены графики зависимости fдев.min от интенсивности L несущей, ее частоты fнес и частоты модуляции Fмод.

F, Гц дев min.

F = 4 кГц нес F = 2 кГц нес F =,0 2 кГц нес F, Гц мод 4Гц – наиболее заметная частота мобуляция Рис. 5.13 Зависимость fдев.min от fмод и fнес при L = 70дБ Fдев min.

Рис. 5.14 Зависимость fдев.min от L при fнес = 1кГц, fмод = 4Гц.

Для L > 40дБ fдев.min = const F = k F Рис. 5.15 Зависимость дифференциального порога различения частот от частоты при L = 70дБ 5.3.2 Дифференциальная чувствительность к изменению высоты тона.

На рис. 8.15 представлен график зависимости от частоты дифференциального порога различения частот F/F= k при сравнении тонов, снятых экспериментально для интенсивности звука 70 фон.

Взяв в диапазоне частот 0,5...5кГц среднее значение k=0,0015 получим согласно формуле (1-7.6) количество различимых градаций частоты Fmax lg Fmin M = = = 1536градаций lg(1+ k) lg(1+ 0,0015) При уменьшении интенсивности звука величина k возрастает. Для сравнения чисел различных градаций частоты при разных громкостях звука можно воспользоваться приводимой ниже таблицей Уровень громкости F/F=k Число различных градаций частоты 20 фон 0,0044 40 фон 0,0018 70 фон 0,0015 80 фон 0,00106 5.3.3 Шкала ощущения высоты тона.

Ощущение высоты тона измеряют в мелах. Высоту тона F=1000Гц при уровне 40дБ над ПС принимают равной 1000 мел.

Изменение числа мел на какую-либо величину означает пропорциональное изменение ощущения высоты тона, измеряемое методом сравнения ‘в 2 раза’.

Зависимость Н[мел](F[Гц]) нелинейна, рис. 5. Приближенно, как видно по рисунку, этот масштаб линеен до частоты 800...1000Гц и практически точно логарифмичен для частот 1000...10000Гц. Такой комбинированный масштаб для практики неудобен, и применяют логарифмический масштаб.

За единицу высоты тона в этом случае применяют октаву и ее доли. Считают, что на слух расстояние по высоте тона между двумя звуками кажутся одинаковыми, если отношения частот их одинаковы.

Расстояния по высоте тона – интервалы музыкальные.

Отношения частот:

1/1 – унисон 1/2 – октава 2/3 – квинта 3/4 - кварта 4/5 – большая торция 5/6 или 6/7 – малая торция 7/8 или 8/9 – большая секунда (тон) 15/16 – малая секунда (полутон) В технике используют отношения частот:

1/2 – октава 1/2 – полуоктава 1/2 – третьоктава Музыкальный интервал. Если взять интервал Н=12lg2(F1/F2), то в этом случае единичный интервал равный 2 с хорошей точностью соответствует полутону и в октаве получаем 12 полутонов.



Сказанное относится к гармонической шкале ощущений высоты тона, т.е. к ощущению связанному с одновременным звучанием нескольких музыкальных тонов.

Оценка разницы высот следующих друг за другом тонов оказывается отличающейся от гармонической высоты. Например, частоты 100 и 150Гц кажутся отстоящими по высоте дальше друг от друга, чем частоты 1000 и 3000Гц, хотя отношения частот одинаковы –2/3 (квинта).

Ощущение расстояния по высоте, вызываемое последовательными тонами называют мелодичной высотой звука. До частоты 500Гц мелодические и гармонические октавы совпадают.

А в интервале от 500 до 8000Гц укладываются 4 гармонические октавы (lg2(8000/500)=4), и только около 2,5 мелодических октав.

На рис. 5.17 представлено сравнение всех рассмотренных шкал.

5.3.4 Восприятие тембра звука.

Ом установил, что ухо как бы анализирует периодический звук по отдельным гармоническим составляющим и они вызывают раздельное ощущение. При определенной тренировке можно мысленно разделить сложное периодическое колебание на гармоники, которые в нем присутствуют. Эта особенность слуха тесно связана со способностью различать звуки речи. Спектр звука придает ощущению звучания характерную окраску.

Эту окраску называют тембром. Существуют понятия тембра скрипки, тромбона, органа и т.п., а также тембра голоса: звонкий, когда подчеркнуты высокочастотные состовляющие;

глухой, когда они подавлены и др.

Связь между физическими свойствами звука и слуховыми ощущениями удобно представить в виде следующей наглядной диаграммы.

интенсивность уровни громкости частота высота тона спектр тембр Рис. 5.16 Ш кала мел как функция частоты Рис.5.17 Сравнение шкал 5.4 Инерция слуха (временные характеристики) При исчезновении раздражающей силы слуховое ощущенея исчезает не сразу, а постепенно уменьшается до нуля это эффект слухового впечаления. Время, в течение которого ощушение по уровню громкости уменьшается на 8,7 фон, называют постоянной времени слуха. Она зависит от многих параметров. В среднем 150...200мс.

Слуховое впечатление дает возможность сравнивать частоты двух тонов при быстром переключении с одного на другой и обнаруживать небольшую разницу частот.

Слуховое впечатление приводит к послемаскировке сигнала. Послемаскировка тем длиннее, чем выше уровень предшествующего сигнала. Для речи это явление называется самомаскировкой. Она для речи имеет порядок (-24)дБ. Поэтому уровень ощущения речи по отношению к среднему ее уровню не превышает 24 дБ только из-за самомаскировки.

Восприятие импульсов звука Для тонального импульса с длительностью Т > 200мс ПС такой же, как и для непрерывного тона. При Т < 200мс:

Jпс(T)= Jпс()*(200/T) (J в Вт/м2) Для периодически повторяющихся импульсов ПС при fпов > 200Гц равен порогу непрерывного тона. При fпов < 200Гц ПС быстро увеличивается.

Минимальное время восприятия (опознания) высоты тона зависит от интенсивности и частоты.

J, дБ F, Гц Tпор, мс количество периодов, необходимых для опознания высоты тона, N= Tпор*F 80 125 24 80 1000 10 10(при 6-8 периодах ощущается тон со щелчком) 40 125 40 40 1000 22 Для точного опознания высоты тона требуется 100мс (100 периодов F =1000Гц) Два тональных следующих друг за другом звука с перерывом Т* 20...40мс воспринимаются как один неоднородный. При Т* 40...80мс те же сигналы воспринимаются как два, но взаимно связанные.

Временной порог различения интервалов тишины между двумя звуками * Т 0,5...2мс.

Эхо. Два звука с длительностями T < 50мс, ексли один из них запаздывает на время Тзап < 50мс всегда воспринимаются слитно. Пороговое время запаздывания для раздельного восприятия зависит от отношения уровня последующнего звука (эха) к предыдущему.

На рис. 5.18 представлена кривая зависимости порогового времени запаздывания Тзап.пор от разницы в дБ L интенсивности последующего звука к предыдущему.

Кривая на рисунке обозначает следующее. Если для заданного L имеем Тзап > Тзап.пор, то эхо воспринимается раздельно. Например, если для L = -10дБ Тзап =75мс, то эхо воспринимается раздельно. Если же такое же запаздывание будет при L = -20дБ, то эха мы не услышим.

-(-9L + 75),L < -Tзап. пор 50, L > -Рис. 5.6. Характеристики речи 6.1 Уровнеграмма Мгновенное значение звукового давления акустического сигнала речи непрерывно изменяется во времени в широком диапазоне. Зависимость мгновенного значения акустосигнала от времени измеряется прибором с постоянной времени не более 15..20 мс и называют объективной уровнеграммой, т.к. она необходима для определения прохождения сигнала через аппаратуру. Либо измеряют прибором с постоянной времени 120..200 мс – субъективная уровнеграмма для оценки воспроизведения сигнала слуховым органом человека.

Уровнеграмму рассматривают как случайную величину и строят интегральную кривую распределения вероятности Р превышения уровнеграммы над заданным уровнем L. По вероятности Р=0,02 определяют Lmax, а по P=0,98 Lmin, рис. 6.Определено, что, как речевые, так и музыкальные сигналы имеют распределение близкое к нормальному.

Величину D= Lmax - Lmin называют динамическим диапазоном. Его величины для разных видов сигналов:

Речь диктора 25..35 дБ Телефонный разговор 35..45 дБ Симфонический оркестр 65..75 дБ Среднее значение уровнеграммы Lср можно измерить прибором с большой постоянной времени. Для длительного среднего уровня постоянную времени прибора берут равной 15 с для речи и 1 мин для музыки.





Величину П = Lmax –Lср называют пик-фактором.

Звуковые давления и мощность, развиваемые голосом человека, при произнесении речи показаны в таблице 6.Табл. 6.Пиковая Пик- Область Условия произнесения Расстоя Среднее звук.

мощность, фактор, наивысших речи ние, см давление, Па мВт дБ пиков, Гц Речь телефонная:

Средний уровень 2,5 2 0,24 12 250.. Громкая 2,5 4 4,0 18 500.. тихая 2,5 1 0,025 8 250..Разговор 100 0,05 0,5 10 250..Динамические характеристики в дБ приведены в таблице 6.Табл. 9.Уровень звукового давления Нормальная речь Шепот крик Min Среднее max Мгновенное пиковое значение Пиковое значение речи 58 67 79 87 Среднеквадратичное значение речи 46 55 65 75 Минимальное значение 30 39 49 59 Область, занимаемая речью в координатах интенсивность-частота показана на рис. 6.6.2 Спектр сигнала речи В основе кратковременного спектрального анализа лежит допущение, что в пределах относительно короткого интервала времени речь можно считать стационарным процессом. Тогда спектр t,( tS ) x( e- j d ) = h(t - ) x - переменная интегрирования h(t) – весовая функция – временное окно через которое просматривается лишь часть сигнала, примыкающая к анализируемому моменту времени. Эффективную длительность функции h берут порядка 20..30 мс.

Часто вместо кратковременного спектра рассматривают мгновенный энергетический спектр:

,( tS ) x Наиболее распространенный метод измерения кратковременного спектра – гребенка полосовых фильтров.

Представим спектр в виде:

tt,( tS ) x( h(t - ) d - j x( ) sin( ) h(t - )d =a(,t) - j b(,t) ) = cos( ) x - Энергетический спектр,( tS ) a (,t) += b22 (,t) x Отсюда следует, что измерить (получить) энергетический спектр нетрудно. Надо сигнал x(t) умножить на cos(t) и sin(t), отфильтровать с помощью фильтров с импульсными откликами h(t), возвести в квадрат и просуммировать, рис. 6.Cos(t) a(,t) Фильтр h(t) квадратор |f(t)|Устройство |f(,t)| извлечения x(t) корня Фильтр h(t) квадратор b(,t) Sin(t) Рис. 6.2 Схема получения мгновенного амплитудного спектра речи.

Это не единственный и не наиболее простой способ. Часто на практике дело упрощают физически аппроксимируя временную огибающую a(,t) и b(,t) формой на выходе полосового фильтра путем детектирования сигналов a(,t) и b(,t), и пропускания результата через фильтр низкой частоты. Аналогично получают и энергетический спектр, измеряя энергию на выходе каждого полосового фильтра гребенки. Берется компромисс между шириной полосового фильтра и разрешением во времени.

Большое распространение получила цифровая обработка сигналов. Пусть речевой сигнал x(t) представлен последовательностью отсчетов x(nT). 0 n N-1, Т – интервал дискретизации.

Тогда спектр дискретного речевого сигнала N - )( xS (nT ) = e- nTj xД n=Согласно теории отсчетов (Котельникова) в частотной области для ограниченной во времени функции (на интервале NT) спектральная плотность однозначно определяется заданием своих дискретных значений в точках = k, k = 0,1,2,… NT Обозначив = получим окончательное выражение для дискретного NT преобразования Фурье (ДПФ) N -jk- nT kS )( = xД x(nT ) e n=Дискретный спектр, в отличие от аналогового, будет по частоте периодическим с периодом N=2/T.

Обратное ДПФ, которое переводит ДПФ в исходную последовательность отсчетов дается выражением N -jlk bTx )( kS = )( e xД N k =Здесь объем операции на ЭВМ порядка N2 комплексных умножений и сложений.

Известны искусственные приемы экономных по числу операций определения ДПФ, называемые быстрыми преобразованиями Фурье (БПФ). Если N степень числа 2, то БПФ требует не N2 а Nlog2N операций. Например, при N=1024 получается 99% экономии вычислительных операций.

6.3 Речевые звуки С физической точки зрения речь – это последовательность звуков речи с паузами между группами. Оптимальным считается темп речи 60..80 слов в 1 мин с интервалами между словами около 1с, а допустимый темп – до 120 слов в 1 мин.

Каждому человеку свойственна своя манера произносить звуки речи (своего рода устный подчерк). Но при всем многообразии произношения, звуки – это физические реализации ограниченного числа обобщенных звуков речи, называемых фонемами.

Фонема – это что человек хочет произнести, а звук речи – то, что человек фактически произносит. Фонема по отношению к звуку играет ту же роль, что и образцовая буква, называемая графемой, по отношению к ее реализации.

В русском языке 41 основная фонема:

Сонорные – л, ль, р, рь, м, мь, н, нь, й;

Щелевые –ж, ш, з, зв, в, вь, с, сь, ф, фь, х, хь;

Взрывные – б, бь, д, дь, г, гь, п, пь, т, ть, к, кь;

Аффрикаты – ц, ч (комбинация глухих взрывных и щелевых) Гласные – а, о, у, э, и, ы.

Гласные е, я, ё, ю – это составные фонемы йе, йа, йо, йу При произнесении звуков через речевой тракт проходит либо тональный импульсный сигнал, либо шумовой, либо и тот и другой вместе. Речевой тракт – это сложный акустический фильтр с рядом резонансов, создаваемых артикуляционными органами речи. Вследствие этого равномерный тональный или шумовой спектр превращается в спектр с рядом максимумов и минимумов, рис. 6.Максимум спектра называется формантами, а резкие провалы – антиформантами.

Pages:     | 1 |   ...   | 3 | 4 || 6 | 7 |   ...   | 8 |










© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.