Научный журнал
Фундаментальные исследования
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

МОДУЛЯЦИОННЫЙ АНАЛИЗ-СИНТЕЗ ЗВУКОВЫХ СИГНАЛОВ И ПЕРСПЕКТИВЫ ЕГО ИСПОЛЬЗОВАНИЯ В ЦЕЛЯХ ШУМОПОНИЖЕНИЯ

Уваров В.К. 1 Редько А.Ю. 1
1 МК ГБОУ ВО «Санкт-Петербургский государственный институт кино и телевидения»
Модуляционная теория имеет широкий спектр применения, основанный на обработке сигналов во временной области, в частности, ее можно применить как основу для решения проблем обработки широкополосных звуковых сигналов при передаче их по узкополосному радиоканалу, в т.ч. по каналу телефонной связи. В модуляционной теории сигнал описывается как сложномодулированный (одновременно по амплитуде и частоте) процесс в виде произведения огибающей (амплитудно-модулирующей функции сигнала) и косинуса фазы (частотно-модулированной функции сигнала). Характерной особенностью данной теории является выделение информационных параметров сигнала, число которых возрастает после каждой последующей ступени его разложения по модулирующим функциям (многоступенное разложение). Это открывает возможность воздействовать на выделенные информационные параметры разного уровня и добиваться желаемого вида обработки сигнала. Применение модуляционной теории с осуществлением многоступенного разложения позволит провести новые исследования по изучению природных модуляций звуковых сигналов с целью совершенствования технических средств радиосвязи, использующих речевые сигналы как основную передаваемую информацию. Проведенный обзор позволил сделать вывод об актуальности перспективы применения модулирующих функций для обработки звуковых сигналов. Раскрыты перспективы применения в целях шумопонижения операции деления-умножения мгновенной частоты сигнала без выделения модулирующих функций. Даны предпосылки ее использования, разработаны методики проведения исследования возможности применения операции деления мгновенной частоты для шумопонижения при передаче частотно-компрессированных сигналов в двух вариантах: следящее частотное шумопонижение и динамическая фильтрация.
модуляционный анализ-синтез
мгновенная частота
шумопонижение
1. Аблазов В.И., Гупал В.И., Згурский А.И. Преобразование, запись и воспроизведение речевых сигналов. – Киев: Лыбидь, 1991. – 207 с.
2. Агеев Д.В. Активная полоса частотного спектра функции времени // Труды ГПИ. – 1955. – Т. 11. – № 1.
3. Гиппернрейтер Ю.Б. Восприятие высоты звука: Автореф. дис. канд. психол.наук. – М.: 1960. – 22 с.
4. Ишуткин Ю.М. Разработка теории модуляционного анализа-синтеза звуковых сигналов и её практическое применение в технике записи звука кинофильмов: Автореф. дис.на соискание уч. ст. д. т. н. – М.: НИКФИ, 1985. – 48 с.
5. Ишуткин Ю.М., Уваров В.К. Основы модуляционных преобразований звуковых сигналов / Под ред. Уварова  В.К. – СПб.: СПбГУКиТ, 2004. – 102 с.
6. Ишуткин В.М. Перспективы обработки звуковых сигналов по их модулирующим функциям / В сб.: Проблемы звукотехники // Труды ЛИКИ, Вып. XXXI. – Л.: ЛИКИ, 1977. – С. 102–115.
7. Корсунский С.Г. Влияние спектра воспринимаемого звука на его высоту // Пробл.физиол.акуст. – 1950. – Т. 2. – С. 161–165.
8. Маркел Дж.Д., Грэй А.Х. Линейное предсказание речи: Пер. с англ. / Под ред. Ю.Н. Прохорова, В.С. 3вездина. – М.: Связь, 1980. – 308 с.
9. Маркин Д.Н., Уваров В.К. Результаты практических исследований соотношений между спектрами сигнала, его огибающей, косинуса фазы и мгновенной частоты. Деп. рук. № 181кт-Д07, ОНТИ НИКФИ, 2007. – 32 с.
10. Маркин Д.Н. Разработка метода и технических средств компандирования спектров речевых сигналов. Автореф. дис. на соискание уч. ст. к.т. н. – СПб.: СПбГУКиТ, 2008. – 40 с.
11. Муравьев В.Е. О современном состоянии и проблемах вокодерной техники // Современные речевые технологии сборник трудов IX сессии Российского акустического общества, посвящённой 90-летито М.А. Сапожкова. – М.: ГЕОС,1999. – 166 с.
12. Орлов Ю.М. Динамический фильтр-шумоподавитель // ТКиТ. – 1974. – № 10. – С. 13–15.
13. Сапожков М.А. Речевой сигнал в кибернетике и связи. Преобразование речи применительно к задачам техники связи и кибернетики. – М.: Связьиздат, 1963. – 452 с.
14. Уваров В.К., Плющёв В.М., Чесноков М.А. Применение модуляционных преобразований звуковых сигналов / Под ред. В.К. Уварова. – СПб.: СПбГУКиТ, 2004. – 131 с.
15. Уваров В.К. Сжатие частотного диапазона звуковых сигналов для улучшения качества звука при кинопоказе: Автореф.дис. канд.тех. наук. – Л.: ЛИКИ,1985. – 22 с.
16. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: Пер. с нем. – М.: Связь, 1971. – 255 с.
17. Gаbor D. Theory of communications. – The Journal of the institute of Electrical Engineers, Part III (Radio and Communication Engineering), Vol. 93, № 26, November 1946. – Р. 429–457.
18. Ville J.A. Theorie et application de la notion de signal analytique. – Cables a Transmissions, 2A, № 1, January, 1948. – Р. 61–74; translated from the French in I. Selin, «Theory and applications of the notion of complex signal». – Tech. Rept. T-92, The RAND Corporation, Santa Monica, CA, August 1958.

Модуляционная теория имеет широкий спектр применения, основанный на обработке сигналов во временной области, в частности, ее можно применить как основу для решения проблем обработки широкополосных звуковых сигналов при передаче их по узкополосному радиоканалу, в т.ч. по каналу телефонной связи.

Проведенный обзор методов обработки звуковых сигналов [1, 4, 5, 8, 11, 13] выявил перспективность модуляционного анализа-синтеза, разработанного Ю.М. Ишуткиным в 70-х годах прошлого столетия для обработки и измерения искажений [4]. В дальнейшем модуляционная теория получила свое развитие в работах его учеников и последователей [9, 14].

Модулирующие функции колебания сложной формы

В середине ХХ века независимо двумя учеными Д. Габором и Дж. Вие [17, 18] была создана теория аналитического сигнала, дающая возможность описывать в виде явной функции времени любой случайный процесс. Именно эта теория стала математической основой, на базе которой впоследствии была сформирована модуляционная теория звуковых сигналов.

При некоторых нежестких ограничениях любые колебания сложной формы могут быть представлены в виде произведения двух явных функций времени

uvar01.wmf, (1)

где s(t) – исходный звуковой сигнал,

S(t) – неотрицательная огибающая сигнала, амплитудно-модулирующая функция;

cos φ(t) – косинус фазы сигнала, частотно-модулированная функция;

φ(t) – текущая фаза сигнала, фазо-модулирующая функция сигнала.

uvar02.wmf – мгновенная частота сигнала, частотно-модулирующая функция сигнала.

Модулирующие функции S(t), φ(t) и ω(t) сигналов являются действительными функциями действительного аргумента t. В общих случаях модулирующие функции нельзя определить, исходя из самого исходного сигнала s(t): его необходимо дополнить вторым сигналом, называемым опорным s1(t) и уже для пары этих сигналов {uvar03.wmf, uvar04.wmf} можно определить модулирующие функции. Вид этих функций в равной степени зависит от обоих сигналов.

Дж. Габор впервые в 1946 году показал необходимость опорного сигнала при определении модулирующих функций и применил для этого прямое преобразование Гильберта к исходному сигналу s(t) [17]. В теоретической радиотехнике это привело к понятию аналитического сигнала. Однако теория аналитического сигнала была разработана для узкополосных колебаний.

Модулирующие функции широкополосного сигнала

Впоследствии строгие математические представления о модулирующих функциях были распространены и на широкополосные звуковые сигналы. Однако выбор опорного сигнала предполагается произвольным, и выдвигаются лишь требования к ортогональности основного и опорного сигналов [4]. Тем не менее на сегодняшний момент именно преобразование Гильберта рассматривается как удобный в техническом отношении способ построения пары ортогональных сигналов.

Так как в общем случае звуковые сигналы являются непериодическими и их можно считать квазипериодическими лишь на отдельных достаточно коротких интервалах времени, в модуляционной теории для определения опорного сигнала используется прямое преобразование Гильберта с ядром Коши

uvar05.wmf, (2)

где Н – оператор преобразования Гильберта, интеграл (2) является сингулярным, т.е. не существует в обычном смысле в точке t = τ, его следует понимать как интеграл Лебега, а его значение в точке t = τ как главное значение по Коши.

Две функции, связанные между собой преобразованием (2), называются сопряженными по Гильберту. Из теории преобразования Гильберта известно, что эти функции удовлетворяют условию ортогональности, то есть их скалярное произведение равно нулю на всей области определения

uvar06.wmf. (3)

Выражение (3) представляет собой определенный интеграл, понимаемый в смысле Лебега. Т – означает область значений переменной t, по которой ведется интегрирование.

В геометрическом представлении амплитудно-модулирующая функция S(t) это сигнальный вектор, вращающийся вокруг начала координат с угловой частотой ω(t), при этом сигнал может развиваться быстро или медленно, но только в прямом, а не в обратном направлении. Это означает, что обе модулирующие функции могут принимать любые положительные и отрицательные значения (причем ничем не ограниченные) и каждая имеет в общем случае постоянную и переменную составляющие:

uvar07.wmf

и

uvar08.wmf, (4)

где S0 – постоянная составляющая (среднее значение) огибающей сигнала;

SS(t) – огибающая переменной составляющей огибающей сигнала;

cos ωS(t) – косинус фазы переменной составляющей огибающей сигнала;

ω0 – среднее значение мгновенной частоты сигнала (несущая частота);

ωd(t) – девиация мгновенной частоты сигнала;

ωm(t) – модулирующая частота сигнала.

Многоступенное модуляционное преобразование

Из изложенного выше следует, что процесс разложения сигнала по его модулирующим функциям можно продолжить – провести многоступенное модуляционное разложение [6] .

Первая ступень разложения дает пару модулирующих функций первого порядка (см. формулу 4)

uvar09.wmfuvar11.wmf и uvar12.wmf.

Вторая ступень разложения дает дополнительно две пары модулирующих функций второго порядка. При этом огибающая первого порядка S1(t) дает огибающую огибающей и мгновенную частоту огибающей: S21(t) и ω21(t).

Вторая ступень разложения мгновенной частоты первого порядка ω1(t) дает огибающую мгновенной частоты и частоту мгновенной частоты: S22(t) и ω22(t).

После третьего разложения получаются еще четыре пары модулирующих функций третьего порядка и т.д.

Перечисленные после формулы (4) параметры модулирующих функций различных порядков являются важными информационными признаками звукового сигнала, воздействие на значения и частотное расположение которых открывает широкие возможности для обработки звукового сигнала: сжатие спектра, изменение тембра, преобразование динамического диапазона и шумопонижение, транспонирование сигналов и т.д.

Технические задачи обработки звуковых сигналов путем воздействия на их модулирующие функции состоят в следующем:

● создать многоступенный демодулятор (преобразователь), при подаче на вход которого напряжения u(t) = s(t) на выходах обеспечивались бы напряжения, пропорциональные модуляционным функциям первого, второго и т.д. порядков;

● воздействовать на значения и спектры этих напряжений;

● восстановить звуковой сигнал по обработанным модуляционным функциям, т.е. осуществить амплитудную и частотную модуляцию колебаний генераторов.

Например, использование нелинейного корректирующего воздействия на параметры амплитудно-модулирующей функции позволит провести компрессирование и шумопонижение восстановленного звукового сигнала [6]. Воздействием на сигнал канала частотно-модулирующей функции с помощью нелинейной цепи, обладающей уменьшением дифференциального коэффициента передачи с увеличением мгновенных значений выходного напряжения, можно достичь сжатия частотного диапазона обрабатываемого звукового сигнала [6]. Делением частоты ωm(t) и устранением высокочастотной части ее спектра можно существенно сжать спектр звукового сигнала с сохранением высокой помехоустойчивости [10].

Перспективы применения деления-умножения мгновенной частоты сигнала без выделения модулирующих функций в целях шумопонижения

Постановка задачи

При передаче звуковых сигналов по узкополосным каналам связи частотное компрессирование приводит к заметному ограничению ширины спектра мгновенной частоты. Исследуем возможность подмены в спектре фонем таких сигналов компонент, обусловленных высокими частотами частотной модуляции, на другие компоненты – расположенные на близких частотах, но обусловленные увеличением девиации мгновенной частоты фонемы при восстановлении частотно-компрессированных сигналов. Такая замена должна обеспечить повышение качества звукопередачи за счет более полного субъективного восприятия.

Предпосылками к такой постановке задачи может служить следующее:

1. Гласные звуки на большей части их длительности можно рассматривать как периодический сигнал. При увеличении девиации частоты число гармоник основного тона будет увеличиваться. Следовательно, есть возможность при передаче сигнала уменьшить количество гармоник основного тона, а на приемной стороне канала восстановить их количество путем увеличения девиации частоты.

2. Спектры глухих согласных звуков являются сплошными. Спектры их мгновенных частот [4, 15] также сплошные, в полосе примерно равной половине полосы частот спектра сигнала. Поэтому при увеличении девиации частоты спектр мгновенной частоты останется сплошным, но спектр фонемы расширится.

3. Известно [7, 3] влияние спектрального состава сложных сигналов на восприятие высоты их тона. Звуки, богатые высокочастотными спектральными составляющими, воспринимаются на слух как более высокие по сравнению со звуками, имеющими ту же частоту основного тона, но со слабыми гармониками высокого порядка или с меньшим их количеством.

4. Поскольку подмена спектральных составляющих будет происходить на высоких частотах, то можно предположить, что для слуха такая подмена будет незаметной или почти незаметной. В основе этого лежит пониженная чувствительность слуха к изменению высоты тона в области высоких частот [16].

Разработка методики проведения исследования

Следящее частотное шумопонижение

Возможность использования операции деления мгновенной частоты с целью шумопонижения будет количественно обоснована после предварительных исследований допустимых пределов сокращения спектров модулирующих функций звуковых сигналов для разных каналов передачи.

При использовании деления мгновенной частоты для целей передачи звуковых сигналов в частотно-компрессированном виде, очевидно, что передаваемый сигнал концентрируется в низкочастотной области. Причем ширина полосы частот, которая необходима для неискаженной передачи сигнала, будет постоянно меняться, вместе с изменением звукового сигнала. Поэтому в качестве одной из основных задач этого исследования можно назвать определение возможности создания следящего фильтра низких частот (СФНЧ), верхняя граничная частота которого изменялась бы во времени, принимая значения в соответствии с определенными допустимыми ограничениями полосы частот мгновенной частоты и огибающей, которые будут известны после проведения предварительных исследований. Представляется, что сокращение полосы для узкополосных сигналов, которые практически не маскируют шумы канала передачи, будет очень значительным. Поэтому для таких сигналов будет значительным и выигрыш в отношении «сигнал/шум».

Второй задачей этого исследования следует назвать определение сигнала управления для СФНЧ. В качестве первых претендентов на роль сигнала управления можно предложить сигналы, пропорциональные или ωн(t), или производной мгновенной частоты сигнала в соответствии с [2]. Поскольку шумопонижение при этом достигается за счет различения частотных диапазонов сигнала и шума, то такое шумопонижение можно называть частотным.

При использовании огибающей для порогового амплитудного шумопонижения или для динамической фильтрации, получим комбинированный шумоподавитель для частотно-компрессированных сигналов.

Динамическая фильтрация

Как известно [12], в существующих вариантах динамических фильтров весь частотный диапазон звуковых сигналов делится на полосы, в каждой из которых шумопонижение осуществляется с помощью порогового шумоподавителя (обычно – это инерционные устройства). К недостаткам динамических фильтров обычно относят аппаратурную сложность, так как динамический фильтр представляет собой совокупность нескольких пороговых шумоподавителей (обычно четыре и более). Кроме этого, возникают трудности с обеспечением линейных частотных характеристик.

Теперь появилась возможность исследовать вариант динамической фильтрации в одной низкочастотной полосе при передаче частотно-компрессированных сигналов, управляя шириной полосы сигналом огибающей. Как известно, при уменьшении уровня звукового сигнала вначале в шумах канала звукопередачи тонут верхние гармоники звука, а в последнюю очередь – колебание основного тона. Это позволяет предположить, что возможно, уменьшая полосу фильтра пропорционально уменьшению огибающей, обеспечить эффект шумопонижения без обычных для динамических фильтров недостатков.

Заключение

В модуляционной теории сигнал описывается как сложно модулированный (одновременно по амплитуде и частоте) процесс в виде произведения огибающей (амплитудно-модулирующей функции сигнала) и косинуса фазы (частотно-модулированной функции сигнала). Характерной особенностью данной теории является выделение информационных параметров сигнала, число которых возрастает после каждой последующей ступени его разложения по модулирующим функциям (многоступенное разложение). Это открывает возможность воздействовать на выделенные информационные параметры разного уровня и добиваться желаемого вида обработки сигнала.

Применение модуляционной теории с осуществлением многоступенного разложения позволит провести новые исследования по изучению природных модуляций звуковых сигналов с целью совершенствования технических средств радиосвязи, использующих речевые сигналы как основную передаваемую информацию.

Проведенный обзор позволил сделать вывод об актуальности перспективы применения модулирующих функций для обработки звуковых сигналов. Раскрыты перспективы применения в целях шумопонижения операции деления-умножения мгновенной частоты сигнала без выделения модулирующих функций. Даны предпосылки ее использования, разработаны методики проведения исследования возможности применения операции деления мгновенной частоты для шумопонижения при передаче частотно-компрессированных сигналов в двух вариантах: следящее частотное шумопонижение и динамическая фильтрация.

Рецензенты:

Смирнов Н.В., д.ф.-м.н., доцент, профессор кафедры моделирования экономических систем прикладной математики процессов управления Санкт-Петербургского государственного университета, г. Санкт-Петербург;

Стариченков А.Л., д.т.н., доцент института проблем транспорта им. Н.С. Соломенко Российской Академии Наук, г. Санкт-Петербург.


Библиографическая ссылка

Уваров В.К., Редько А.Ю. МОДУЛЯЦИОННЫЙ АНАЛИЗ-СИНТЕЗ ЗВУКОВЫХ СИГНАЛОВ И ПЕРСПЕКТИВЫ ЕГО ИСПОЛЬЗОВАНИЯ В ЦЕЛЯХ ШУМОПОНИЖЕНИЯ // Фундаментальные исследования. – 2015. – № 6-3. – С. 518-522;
URL: https://fundamental-research.ru/ru/article/view?id=38652 (дата обращения: 20.04.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674