Scientific journal
Fundamental research
ISSN 1812-7339
"Перечень" ВАК
ИФ РИНЦ = 1,674

ACOUSTIC SIGNALS MODULATING ANALYSIS AND SYNTHESIS AND ASPECTS OF ITS USE FOR NOISE REDUCTION PURPOSES

Uvarov V.K. 1 Redko A.Y. 1
1 Saint Petersburg State Institute of Cinema and Television
2136 KB
Modulation theory has a wide range of use, based on the signal processing in time domain, particularly it can be as a basis for solving the problem of broadband signal processing while signal transmission via narrowband radio channel, also via telephone channel. In modulation theory signal is described as modulated in a complex way (both by amplitude and frequency) in the form of multiplication of enveloping curve (amplitude-modulated signal function) and phase cosine (frequency-modulated signal function) process. Special feature of this theory is signal information properties extraction, their number is increasing after each next step of its decomposition by modulating functions (multi-level decomposition). It offers the opportunity to affect the designated information properties of different levels and achieve the desired form of signal processing. The use of modulation theory with multi-level decomposition application affords to undertake new studies on naturally occurring acoustical signal modulations with the goal to those radio communication technical solutions that use vocal signals as the basic transmitted information. The performed review made it possible to make a conclusion about relevance of modulating functions use for acoustical signals processing. The aspects of use in terms of instant frequency division-multiplication operations noise reduction without modulating functions distraction are covered. The conditions for its application are given, methods of studying the possibility of instant frequency division operation application for noise reduction while transmitting frequency-compressive signals in two options – follow-up frequency noise reduction and dynamic filtration – are developed.
modulating analysis and synthesis
instantaneous frequency
noise reduction
1. Ablazov V.I., Gupal V.I., Zgurskij A.I. Preobrazovanie, zapis i vosproizvedenie rechevyh signalov. Kiev: Lybid, 1991. 207 р.
2. Ageev D.V. Aktivnaja polosa chastotnogo spektra funkcii vremeni // Trudy GPI. 1955. T. 11. no. 1.
3. Gippernrejter Ju.B. Vosprijatie vysoty zvuka: Avtoref. dis. kand. psihol.nauk. M.: 1960. 22 р.
4. Ishutkin Ju.M. Razrabotka teorii moduljacionnogo analiza-sinteza zvukovyh signalov i ejo prakticheskoe primenenie v tehnike zapisi zvuka kinofilmov: Avtoref. dis.na soiskanie uch. st. d. t. n. M.: NIKFI, 1985. 48 р.
5. Ishutkin Ju.M., Uvarov V.K. Osnovy moduljacionnyh preobrazovanij zvukovyh signalov / Pod red. Uvarova V.K. SPb.: SPbGUKiT, 2004. 102 р.
6. Ishutkin V.M. Perspektivy obrabotki zvukovyh signalov po ih modulirujushhim funkcijam / V sb.: Problemy zvukotehniki // Trudy LIKI, Vyp. XXXI. L.: LIKI, 1977. рр.102–115.
7. Korsunskij S.G. Vlijanie spektra vosprinimaemogo zvuka na ego vysotu // Probl.fiziol.akust. 1950. T. 2. рр. 161–165.
8. Markel Dzh.D., Grjej A.H. Linejnoe predskazanie rechi: Per. s angl. / Pod red. Ju.N. Prohorova, V.S. 3vezdina. M.: Svjaz, 1980. 308 р.
9. Markin D.N., Uvarov V.K. Rezultaty prakticheskih issledovanij sootnoshenij mezhdu spektrami signala, ego ogibajushhej, kosinusa fazy i mgnovennoj chastoty. Dep. ruk. no. 181kt-D07, ONTI NIKFI, 2007. 32 р.
10. Markin D.N. Razrabotka metoda i tehnicheskih sredstv kompandirovanija spektrov rechevyh signalov. Avtoref. dis. na soiskanie uch. st. k.t. n. SPb.: SPbGUKiT, 2008. 40 р.
11. Muravev V.E. O sovremennom sostojanii i problemah vokodernoj tehniki // Sovremennye rechevye tehnologii sbornik trudov IX sessii Rossijskogo akusticheskogo obshhestva, posvjashhjonnoj 90-letito M.A. Sapozhkova. M.: GEOS,1999. 166 р.
12. Orlov Ju.M. Dinamicheskij filtr-shumopodavitel // TKiT. 1974. no. 10. рр. 13–15.
13. Sapozhkov M.A. Rechevoj signal v kibernetike i svjazi. Preobrazovanie rechi primenitelno k zadacham tehniki svjazi i kibernetiki. M.: Svjazizdat, 1963. 452 р.
14. Uvarov V.K., Pljushhjov V.M., Chesnokov M.A. Primenenie moduljacionnyh preobrazovanij zvukovyh signalov / Pod red. V.K. Uvarova. SPb.: SPbGUKiT, 2004. 131 р.
15. Uvarov V.K. Szhatie chastotnogo diapazona zvukovyh signalov dlja uluchshenija kachestva zvuka pri kinopokaze: Avtoref.dis. kand.teh. nauk. L.: LIKI,1985. 22 р.
16. Cviker Je., Feldkeller R. Uho kak priemnik informacii: Per. s nem. M.: Svjaz, 1971. 255 р.
17. Gabor D. Theory of communications. The Journal of the institute of Electrical Engineers, Part III (Radio and Communication Engineering), Vol. 93, no. 26, November 1946. рр. 429–457.
18. Ville J.A. Theorie et application de la notion de signal analytique. Cables a Transmissions, 2A, no. 1, January, 1948.pp. 61–74; translated from the French in I. Selin, «Theory and applications of the notion of complex signal». Tech. Rept. T-92, The RAND Corporation, Santa Monica, CA, August 1958.

Модуляционная теория имеет широкий спектр применения, основанный на обработке сигналов во временной области, в частности, ее можно применить как основу для решения проблем обработки широкополосных звуковых сигналов при передаче их по узкополосному радиоканалу, в т.ч. по каналу телефонной связи.

Проведенный обзор методов обработки звуковых сигналов [1, 4, 5, 8, 11, 13] выявил перспективность модуляционного анализа-синтеза, разработанного Ю.М. Ишуткиным в 70-х годах прошлого столетия для обработки и измерения искажений [4]. В дальнейшем модуляционная теория получила свое развитие в работах его учеников и последователей [9, 14].

Модулирующие функции колебания сложной формы

В середине ХХ века независимо двумя учеными Д. Габором и Дж. Вие [17, 18] была создана теория аналитического сигнала, дающая возможность описывать в виде явной функции времени любой случайный процесс. Именно эта теория стала математической основой, на базе которой впоследствии была сформирована модуляционная теория звуковых сигналов.

При некоторых нежестких ограничениях любые колебания сложной формы могут быть представлены в виде произведения двух явных функций времени

uvar01.wmf, (1)

где s(t) – исходный звуковой сигнал,

S(t) – неотрицательная огибающая сигнала, амплитудно-модулирующая функция;

cos φ(t) – косинус фазы сигнала, частотно-модулированная функция;

φ(t) – текущая фаза сигнала, фазо-модулирующая функция сигнала.

uvar02.wmf – мгновенная частота сигнала, частотно-модулирующая функция сигнала.

Модулирующие функции S(t), φ(t) и ω(t) сигналов являются действительными функциями действительного аргумента t. В общих случаях модулирующие функции нельзя определить, исходя из самого исходного сигнала s(t): его необходимо дополнить вторым сигналом, называемым опорным s1(t) и уже для пары этих сигналов {uvar03.wmf, uvar04.wmf} можно определить модулирующие функции. Вид этих функций в равной степени зависит от обоих сигналов.

Дж. Габор впервые в 1946 году показал необходимость опорного сигнала при определении модулирующих функций и применил для этого прямое преобразование Гильберта к исходному сигналу s(t) [17]. В теоретической радиотехнике это привело к понятию аналитического сигнала. Однако теория аналитического сигнала была разработана для узкополосных колебаний.

Модулирующие функции широкополосного сигнала

Впоследствии строгие математические представления о модулирующих функциях были распространены и на широкополосные звуковые сигналы. Однако выбор опорного сигнала предполагается произвольным, и выдвигаются лишь требования к ортогональности основного и опорного сигналов [4]. Тем не менее на сегодняшний момент именно преобразование Гильберта рассматривается как удобный в техническом отношении способ построения пары ортогональных сигналов.

Так как в общем случае звуковые сигналы являются непериодическими и их можно считать квазипериодическими лишь на отдельных достаточно коротких интервалах времени, в модуляционной теории для определения опорного сигнала используется прямое преобразование Гильберта с ядром Коши

uvar05.wmf, (2)

где Н – оператор преобразования Гильберта, интеграл (2) является сингулярным, т.е. не существует в обычном смысле в точке t = τ, его следует понимать как интеграл Лебега, а его значение в точке t = τ как главное значение по Коши.

Две функции, связанные между собой преобразованием (2), называются сопряженными по Гильберту. Из теории преобразования Гильберта известно, что эти функции удовлетворяют условию ортогональности, то есть их скалярное произведение равно нулю на всей области определения

uvar06.wmf. (3)

Выражение (3) представляет собой определенный интеграл, понимаемый в смысле Лебега. Т – означает область значений переменной t, по которой ведется интегрирование.

В геометрическом представлении амплитудно-модулирующая функция S(t) это сигнальный вектор, вращающийся вокруг начала координат с угловой частотой ω(t), при этом сигнал может развиваться быстро или медленно, но только в прямом, а не в обратном направлении. Это означает, что обе модулирующие функции могут принимать любые положительные и отрицательные значения (причем ничем не ограниченные) и каждая имеет в общем случае постоянную и переменную составляющие:

uvar07.wmf

и

uvar08.wmf, (4)

где S0 – постоянная составляющая (среднее значение) огибающей сигнала;

SS(t) – огибающая переменной составляющей огибающей сигнала;

cos ωS(t) – косинус фазы переменной составляющей огибающей сигнала;

ω0 – среднее значение мгновенной частоты сигнала (несущая частота);

ωd(t) – девиация мгновенной частоты сигнала;

ωm(t) – модулирующая частота сигнала.

Многоступенное модуляционное преобразование

Из изложенного выше следует, что процесс разложения сигнала по его модулирующим функциям можно продолжить – провести многоступенное модуляционное разложение [6] .

Первая ступень разложения дает пару модулирующих функций первого порядка (см. формулу 4)

uvar09.wmfuvar11.wmf и uvar12.wmf.

Вторая ступень разложения дает дополнительно две пары модулирующих функций второго порядка. При этом огибающая первого порядка S1(t) дает огибающую огибающей и мгновенную частоту огибающей: S21(t) и ω21(t).

Вторая ступень разложения мгновенной частоты первого порядка ω1(t) дает огибающую мгновенной частоты и частоту мгновенной частоты: S22(t) и ω22(t).

После третьего разложения получаются еще четыре пары модулирующих функций третьего порядка и т.д.

Перечисленные после формулы (4) параметры модулирующих функций различных порядков являются важными информационными признаками звукового сигнала, воздействие на значения и частотное расположение которых открывает широкие возможности для обработки звукового сигнала: сжатие спектра, изменение тембра, преобразование динамического диапазона и шумопонижение, транспонирование сигналов и т.д.

Технические задачи обработки звуковых сигналов путем воздействия на их модулирующие функции состоят в следующем:

● создать многоступенный демодулятор (преобразователь), при подаче на вход которого напряжения u(t) = s(t) на выходах обеспечивались бы напряжения, пропорциональные модуляционным функциям первого, второго и т.д. порядков;

● воздействовать на значения и спектры этих напряжений;

● восстановить звуковой сигнал по обработанным модуляционным функциям, т.е. осуществить амплитудную и частотную модуляцию колебаний генераторов.

Например, использование нелинейного корректирующего воздействия на параметры амплитудно-модулирующей функции позволит провести компрессирование и шумопонижение восстановленного звукового сигнала [6]. Воздействием на сигнал канала частотно-модулирующей функции с помощью нелинейной цепи, обладающей уменьшением дифференциального коэффициента передачи с увеличением мгновенных значений выходного напряжения, можно достичь сжатия частотного диапазона обрабатываемого звукового сигнала [6]. Делением частоты ωm(t) и устранением высокочастотной части ее спектра можно существенно сжать спектр звукового сигнала с сохранением высокой помехоустойчивости [10].

Перспективы применения деления-умножения мгновенной частоты сигнала без выделения модулирующих функций в целях шумопонижения

Постановка задачи

При передаче звуковых сигналов по узкополосным каналам связи частотное компрессирование приводит к заметному ограничению ширины спектра мгновенной частоты. Исследуем возможность подмены в спектре фонем таких сигналов компонент, обусловленных высокими частотами частотной модуляции, на другие компоненты – расположенные на близких частотах, но обусловленные увеличением девиации мгновенной частоты фонемы при восстановлении частотно-компрессированных сигналов. Такая замена должна обеспечить повышение качества звукопередачи за счет более полного субъективного восприятия.

Предпосылками к такой постановке задачи может служить следующее:

1. Гласные звуки на большей части их длительности можно рассматривать как периодический сигнал. При увеличении девиации частоты число гармоник основного тона будет увеличиваться. Следовательно, есть возможность при передаче сигнала уменьшить количество гармоник основного тона, а на приемной стороне канала восстановить их количество путем увеличения девиации частоты.

2. Спектры глухих согласных звуков являются сплошными. Спектры их мгновенных частот [4, 15] также сплошные, в полосе примерно равной половине полосы частот спектра сигнала. Поэтому при увеличении девиации частоты спектр мгновенной частоты останется сплошным, но спектр фонемы расширится.

3. Известно [7, 3] влияние спектрального состава сложных сигналов на восприятие высоты их тона. Звуки, богатые высокочастотными спектральными составляющими, воспринимаются на слух как более высокие по сравнению со звуками, имеющими ту же частоту основного тона, но со слабыми гармониками высокого порядка или с меньшим их количеством.

4. Поскольку подмена спектральных составляющих будет происходить на высоких частотах, то можно предположить, что для слуха такая подмена будет незаметной или почти незаметной. В основе этого лежит пониженная чувствительность слуха к изменению высоты тона в области высоких частот [16].

Разработка методики проведения исследования

Следящее частотное шумопонижение

Возможность использования операции деления мгновенной частоты с целью шумопонижения будет количественно обоснована после предварительных исследований допустимых пределов сокращения спектров модулирующих функций звуковых сигналов для разных каналов передачи.

При использовании деления мгновенной частоты для целей передачи звуковых сигналов в частотно-компрессированном виде, очевидно, что передаваемый сигнал концентрируется в низкочастотной области. Причем ширина полосы частот, которая необходима для неискаженной передачи сигнала, будет постоянно меняться, вместе с изменением звукового сигнала. Поэтому в качестве одной из основных задач этого исследования можно назвать определение возможности создания следящего фильтра низких частот (СФНЧ), верхняя граничная частота которого изменялась бы во времени, принимая значения в соответствии с определенными допустимыми ограничениями полосы частот мгновенной частоты и огибающей, которые будут известны после проведения предварительных исследований. Представляется, что сокращение полосы для узкополосных сигналов, которые практически не маскируют шумы канала передачи, будет очень значительным. Поэтому для таких сигналов будет значительным и выигрыш в отношении «сигнал/шум».

Второй задачей этого исследования следует назвать определение сигнала управления для СФНЧ. В качестве первых претендентов на роль сигнала управления можно предложить сигналы, пропорциональные или ωн(t), или производной мгновенной частоты сигнала в соответствии с [2]. Поскольку шумопонижение при этом достигается за счет различения частотных диапазонов сигнала и шума, то такое шумопонижение можно называть частотным.

При использовании огибающей для порогового амплитудного шумопонижения или для динамической фильтрации, получим комбинированный шумоподавитель для частотно-компрессированных сигналов.

Динамическая фильтрация

Как известно [12], в существующих вариантах динамических фильтров весь частотный диапазон звуковых сигналов делится на полосы, в каждой из которых шумопонижение осуществляется с помощью порогового шумоподавителя (обычно – это инерционные устройства). К недостаткам динамических фильтров обычно относят аппаратурную сложность, так как динамический фильтр представляет собой совокупность нескольких пороговых шумоподавителей (обычно четыре и более). Кроме этого, возникают трудности с обеспечением линейных частотных характеристик.

Теперь появилась возможность исследовать вариант динамической фильтрации в одной низкочастотной полосе при передаче частотно-компрессированных сигналов, управляя шириной полосы сигналом огибающей. Как известно, при уменьшении уровня звукового сигнала вначале в шумах канала звукопередачи тонут верхние гармоники звука, а в последнюю очередь – колебание основного тона. Это позволяет предположить, что возможно, уменьшая полосу фильтра пропорционально уменьшению огибающей, обеспечить эффект шумопонижения без обычных для динамических фильтров недостатков.

Заключение

В модуляционной теории сигнал описывается как сложно модулированный (одновременно по амплитуде и частоте) процесс в виде произведения огибающей (амплитудно-модулирующей функции сигнала) и косинуса фазы (частотно-модулированной функции сигнала). Характерной особенностью данной теории является выделение информационных параметров сигнала, число которых возрастает после каждой последующей ступени его разложения по модулирующим функциям (многоступенное разложение). Это открывает возможность воздействовать на выделенные информационные параметры разного уровня и добиваться желаемого вида обработки сигнала.

Применение модуляционной теории с осуществлением многоступенного разложения позволит провести новые исследования по изучению природных модуляций звуковых сигналов с целью совершенствования технических средств радиосвязи, использующих речевые сигналы как основную передаваемую информацию.

Проведенный обзор позволил сделать вывод об актуальности перспективы применения модулирующих функций для обработки звуковых сигналов. Раскрыты перспективы применения в целях шумопонижения операции деления-умножения мгновенной частоты сигнала без выделения модулирующих функций. Даны предпосылки ее использования, разработаны методики проведения исследования возможности применения операции деления мгновенной частоты для шумопонижения при передаче частотно-компрессированных сигналов в двух вариантах: следящее частотное шумопонижение и динамическая фильтрация.

Рецензенты:

Смирнов Н.В., д.ф.-м.н., доцент, профессор кафедры моделирования экономических систем прикладной математики процессов управления Санкт-Петербургского государственного университета, г. Санкт-Петербург;

Стариченков А.Л., д.т.н., доцент института проблем транспорта им. Н.С. Соломенко Российской Академии Наук, г. Санкт-Петербург.