Адаптивная фильтрация цифровых данных

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 23:48, 17 ноября 2016.

Содержание

Введение

В традиционных методах обработки сигналов принято, что сообщение обнаруживается и идентифицируется линейными подсистемами с постоянными параметрами алгоритмов преобразования данных. Подсистемы КПС могут иметь как конечную, так и бесконечную импульсную характеристику, но передаточная функция систем не зависит от параметров входных сигналов и их изменения во времени.

Адаптивные устройства обработки данных отличаются наличием определенной связи параметров передаточной функции с параметрами входных, выходных, ожидаемых, прогнозируемых и прочих дополнительных сигналов или с параметрами их статистических соотношений, что позволяет самонастраиваться на оптимальную обработку сигналов. Такие устройства чаще всего применяются при внедрении в канал и организации атаки. В простейшем случае, адаптивное устройство содержит программируемый фильтр обработки данных и блок (алгоритм) адаптации, который на основании определенной программы анализа входных, выходных и прочих дополнительных данных вырабатывает сигнал управления параметрами программируемого фильтра. Импульсная характеристика адаптивных систем также может иметь как конечный, так и бесконечный характер.

Как правило, адаптивные устройства выполняются узкоцелевого функционального назначения под определенные типы сигналов. Внутренняя структура адаптивных систем и алгоритм адаптации практически полностью регламентируются функциональным назначением и определенным минимальным объемом исходной априорной информации о характере входных данных и их статистических и информационных параметрах. Это порождает многообразие подходов при разработке систем, существенно затрудняет их классификацию и разработку общих теоретических положений /л38/. Но можно отметить, что наибольшее применение при разработке систем для адаптивной об-работки сигналов находят два подхода: на основе схемы наименьших квадратов (СНК) и рекурсивной схемы наименьших квадратов (РСНК).

Общие сведения об адаптивной цифровой фильтрации

Основные области применения

Основные области применения адаптивной фильтрации – очистка данных от нестабильных мешающих сигналов и шумов, перекрывающихся по спектру со спектром полезных сигналов, или когда полоса мешающих частот неизвестна, переменна и не может быть задана априорно для расчета параметрических фильтров. Так, например, в цифровой связи сильная активная помеха может интерферировать с полезным сигналом, а при передаче цифровой информации по каналам с плохими частотными характеристиками может наблюдаться межсимвольная интерференция цифровых кодов. Эффективное решение этих проблем возможно только адаптивными фильтрами.

Частотная характеристика адаптивных фильтров автоматически регулируется или модифицируется в соответствии с определенным критерием, позволяющем фильтру адаптироваться к изменениям характеристик входного сигнала. Они достаточно широко используются в радио- и гидролокации, в системах навигации, в выделении биомедицинских сигналов, и многих других отраслях техники. В качестве примера рассмотрим наиболее распространенные схемы адаптивной фильтрации сигналов.

Адаптивный шумоподавитель

Блок-схема фильтра приведена на рис. 1.1. Фильтр состоит из блока цифрового фильтра с регулируемыми коэффициентами и адаптивного алгоритма для настройки и изменения коэффициентов фильтра.

Рис. 1.1.

На фильтр одновременно подаются входные сигналы и . Сигнал содержит полезный сигнал и некоррелированный с ним загрязняющий сигнал . Сигнал какого-либо источника шума, коррелированный с , который используется для формирования оценки сигнала . Полезный сигнал оценивается по разности:

Возводим уравнение в квадрат и получаем:

Вычислим математическое ожидание левой и правой части этого уравнения:

Последнее слагаемое в выражении равно нулю, поскольку сигнал не коррелирует с сигналами и

В этом выражении – мощность сигнала , – оценка мощности сигнала и общая выходная мощность, - остаточная мощность шума, который может содержаться в выходном сигнале. При настройке адаптивного фильтра к оптимальному положению минимизируется мощность остаточного шума, а, следовательно, и мощность выходного сигнала:

На мощность полезного сигнала настройка не влияет, поскольку сигнал не коррелирован с шумом. Эффект минимизации общей выходной мощности будет выражаться в максимизации выходного отношения сигнал/шум. Если настройка фильтра обеспечивает равенство , то при этом . Если сигнал не содержит шума, адаптивный алгоритм должен устанавливать нулевые значения всем коэффициентам цифрового фильтра.

Адаптивный фильтр Винера

Входной сигнал фильтра, приведенного на рис. 1.2, включает компоненту, коррелированную с со вторым сигналом , и полезную компоненту, некоррелированную с .

Рис. 1.2.

Фильтр формирует из сигнал - оптимальную оценку той части , которая коррелированна с , и вычитает ее из сигнала . Выходной сигнал:

где и – векторы весовых коэффициентов фильтра и его входного сигнала.

Аналогично предыдущему методу, возводим в квадрат левую и правую части уравнения, находим математические ожидания обеих частей и получаем уравнение оптимизации e выходного сигнала:

где – дисперсия ,
– вектор взаимной корреляции,
– автокорреляционная матрица.
Рис. 1.3.

В стационарной среде график зависимости от коэффициентов H представляет собой чашеобразную поверхность адаптации (рис. 1.3). Градиент поверхности:

Каждому набору коэффициентов на этой поверхности соответствует определенная точка. В точке минимума градиент равен нулю и вектор весовых коэффициентов фильтра является оптимальным:

Эта формула называется уравнением Винера-Хопфа. Задачей алгоритма автоматической настройки является подбор таких весовых коэффициентов фильтра, которые обеспечивают работу в оптимальной точке поверхности адаптации.

Однако практическое применение фильтра затрудняется использованием корреляционных матриц R и P, априори неизвестных, и которые могут изменяться со временем для нестационарных сигналов.

Адаптивный алгоритм наименьших квадратов Уидроу-Хопфа

По существу, это модификация фильтра Винера, в которой вместо вычисления коэффициентов за один шаг используется алгоритм последовательного спуска в оптимальную точку при обработке каждой выборки:

Условие сходимости к оптимуму:

где - параметр скорости спуска,
– максимальное собственное значение ковариационной матрицы данных.

Блок-схема алгоритма приведена на рис. 1.4.

Рис. 1.4. Алгоритм адаптации методом наименьших квадратов.

На практике точка максимальной оптимальности флюктуирует около теоретически возможной. Если входной сигнал нестационарный, то изменение статистик сигнала должно происходить достаточно медленно, чтобы коэффициенты фильтра успевали следить за этими изменениями.

Рекурсивные схемы наименьших квадратов

Рекурсивные схемы наименьших квадратов отличаются тем, что вычисление каждой последующей выборки коэффициентов производится не только по коэффициентам только одной предыдущей выборки, но и с определенной длиной постепенно затухающей памяти по предшест-вующим выборкам, что позволяет снижать флюктуации оценок при обработке стационарных сигналов.

Основы статистической группировки информации

При построении систем адаптивной фильтрации сигналов большое значение имеют статистические характеристики обрабатываемых сигналов и шумов, их стационарность, и наличие каких-либо априорных данных, зачастую определяемых такими факторами, как вероятный способ кодирования, ожидаемы й способ модуляции сигнала и т.п. Типичными представителями адаптивных подсистем внедрения и противодействия являются комплексы противодействия РЛС и системам наведения летательных аппаратов, а также комплексы противодействия коммуникационным системам.

Примеры. Базовыми величинами, определяемыми в процессе внедрения в КПС, использующий псевдослучайную модуляцию со «скачком» частоты, обычно является частота несущей и ее девиация. Значения измеряемой величины, как статистически распределенной по своей природе, могут быть определены только путем усреднения числа актов регистрации , т.е объемом выборки. Зарегистрированное число импульсов определяет статистическую погрешность единичного измерения, а временной интервал усреднения, обеспечивающий нормативную погрешность – их производительность. Для методов с непрерывной регистрацией информации во времени (или в пространстве) временное окно измерений определяет также временную (или пространственную, если речь идет о РЛС или ОЭС) разрешающую способность интерпретации результатов измерений, при этом эффективность регистрации выборки обычно ограничена условиями измерений и/или техническими средствами их исполнения. Типичный пример – организация противодействия комплексам противовоздушной либо противоракетной обороны требует принятия решения за секунды, или доли секунд.

Ниже рассматривается пример решения такой задачи. Предполагается, что регистрация данных производится в цифровой форме с накоплением отсчета по постоянным интервалам дискретизации данных (по времени и по пространству).

Предполагается общем случае полезное сообщение может присутствовать в нескольких поддиапазонах спектра передаваемого сигнала. Противодействующая сторона на основе априорных данных выбирает участки спектра, где ожидается, что полезное сообщение присутствует в виде масскированного детерминированного сигнала, либо в смеси с помехами (фоном), значение которых может быть учтено при обработке перехваченного сигнала.

Задача статистической группировки

Задача статистической группировки информации в потоках сигналов в общей и наиболее простой форме может быть сформулирована следующим образом. Полезное сообщение присутствует в двух статистически независимых потоках сигналов. В первом потоке сигналов, условно-основном, полезное сообщение присутствует в маскированном виде. Во втором потоке, условно-дополнительном, на полезный сигнал наложено влияние дестабилизирующих факторов, значение которых неизвестно. Для снижения статистической погрешности измерений требуется осуществить извлечение полезного сообщение из дополнительного потока сигналов и ее суммирование с основным потоком.

Обозначим потоки, а равно и частоты основного и дополнительного потоков импульсных сигналов индексами и (импульсов в секунду), связь потоков по частотам индексом . Определению подлежит частота потока . Значение может изменяться за счет влияния дестабилизирующих факторов на поток и в общем случае представляет собой случайную величину, распределенную по определенному закону с плотностью вероятностей , математическим ожиданием , и дисперсией .

На основе теоремы Байеса, плотность вероятностей распределения частоты по измеренному за единичный интервал числу отсчетов сигнала определяется выражением:

где - априорная плотность вероятностей частоты
, - апостериорное распределение вероятностей числовых отсчетов (закон Пуассона).

Принимая в дальнейшем в качестве искомой величины значения отсчетов по интервалам (экспозиция цифровых отсчетов или скользящее временное окно аналоговых данных) и подставляя в , получаем:

При неизвестном распределении значений априорная плотность распределения принимается равномерной от до , при этом из выражения следуют общеизвестные выражения:

Значениями единиц в выражениях пренебрегаем, что не только корректно в условиях "хорошей" статистики, но и необходимо в режиме последовательных непрерывных измерений для исключения смещения средних значений.

Простейшим способом подготовки цифровых данных для интерпретации является их низкочастотная фильтрация методом наименьших квадратов (МНК) или весовыми функциями (Лапласа-Гаусса, Кайзера-Бесселя и др.). Однако любые методы низкочастотной фильтрации данных снижают пространственную разрешающую способность интерпретации, так как кроме снижения статистических флюктуаций приводят к определенной деформации частотных составляющих полезной части сигнала, спектр которого по условиям деконволюции должен иметь вещественные значения вплоть до частоты Найквиста. В определенной мере ликвидировать этот негативный фактор позволяет метод адаптивной регуляризации данных (АРД).

Выражения получены в предположении полной неизвестности априорного распределения для отсчетов в каждой текущей экспозиции . Между тем, при обработке данных непрерывных измерений, и тем более каротажных данных, которые обычно являются многопараметровыми, для каждого текущего отсчета при обработке данных может проводиться определенная оценка распределения . Как минимум, можно выделить два способа оценки распределения .

Способ 1. По массивам данных параллельных измерений каких-либо других информационных параметров, значения которых достаточно четко коррелированны с обрабатываемым массивом данных либо в целом по пространству измерений, либо в определенном скользящем интервале сравнения данных. К таким массивам относятся, например, предварительные каротажные измерения в процессе бурения скважин, измерения другим прибором, с другой скоростью каротажа, в другом спектральном интервале излучения, и даже другим методом каротажа. При гамма-опробовании оценка распределения может производиться по параллельным измерениям интенсивности потока m в низкочастотном интервале спектра горных пород.

Способ 2. При единичной диаграмме ГК оценка распределения в каждой текущей точке обработки данных может выполняться по ближайшим окрестностям данной точки, захватывающим более широкий пространственный интервал по сравнению с интервалом отсчетов.

Использование априорных данных

Допустим, что кроме основного массива данных , подлежащего обработке (подготовке к интерпретации), мы располагаем дополнительным массивом данных , значения которого в определенной степени коррелированы с массивом . При отсутствии дополнительных массивов способ 2 позволяет получить массив обработкой массива цифровым фильтром МНК (или любым другим весовым фильтром) со скользящим временным окном ( сглаженного сигнала , где – оператор симметричного цифрового фильтра). Отметим также, что 2-ой способ всегда может использоваться для регуляризации данных независимо от наличия данных для 1-го метода.

Массив позволяют дать оценку статистических характеристик распределения . Так, если для тех же интервалов времени в массиве имеются отсчеты (или приведенные к ним отсчеты какого-либо другого параметра), то можно записать:

где – априорная плотность распределения значений , которые в общем случае также могут быть случайными.

При равномерном распределении от до для отсчета равновероятно любое значение , т.е. эффект от измерений в потоке отсутствует. Однако по исходным условиям задачи в потоке обязательно присутствие полезной информации, а, следовательно, и существование, как минимум, определенных границ распределения от до , и среднего значения по пространству измерений. При этом из выражения следует, что наиболее вероятное значение , "априорное" для отсчетов в потоке по измерениям в потоке (отсчетам ), должно быть равно:

При статистической независимости величин и относительная средняя квадратическая погрешность определения значений по отсчетам в массиве :

Отсюда дисперсия распределения значений :

где значение дисперсии определяется статистикой отсчетов в массиве при ,
значение представляет собой дисперсию значений за счет флюктуаций величины ,
а сумма 'определяет полную дисперсию отсчетов .

Влияние на форму распределения сказывается в его "растягивании" по координате z относительно модального значения, при этом решение интеграла в первом приближении может быть представлено в следующем виде:

Для данного распределения:

С учетом выражений и :

Значение в выражении принимается целочисленным. Выражение может быть принято для распределения в качестве априорного распределения вероятностей , при этом:

Отсюда, математическое ожидание и дисперсия z:

C использованием выражений :

где и – весовые коэффициенты доверия отсчетам и :

Дисперсия и относительная средняя квадратическая погрешность отсчетов z:

Эффективность метода

Сравнение выражений и позволяет дать оценку эффекта использования дополнительной информации из статистически независимого от потока (произвольная дополнительная информация).

1. При имеет место , и дисперсия отсчетов в массиве определяется только статистикой потока:

что соответствует определению по двум независимым измерениям и эффект использования дополнительной информации максимален. Так, при и погрешность измерений уменьшается в раза.

2. В общем случае , при этом и положительный эффект снижается. В пределе: и положительный эффект полностью вырождается. Во всех остальных случаях и . Отсюда следует, что при наличии коррелированной информации в массиве положительный эффект, в той или иной мере, всегда имеет место.

3. Положительный эффект тем больше, чем больше значение , меньше флюктуации (величина ), и меньше значения отсчетов . Положительный эффект увеличивается именно в тех случаях, когда особенно остро ощущается недостаток информации: при малых значениях плотности потока излучения и/или экспозиции измерений.

Аналогичный эффект будет иметь место и при формировании отсчетов M по окрестностям текущих точек обработки данных путем определения их среднего значения (низкочастотное сглаживание массива n). Предварительное низкочастотное сглаживание может применяться и для статистически независимого дополнительного массива m, что будет повышать достоверность прогнозных отсчетов и увеличивать глубину регуляризации, если это сглаживание при регуляризации по формулам не сказывается на изменении формы основного сигнала. Последнее определяется соотношением частотных спектров основного сигнала и оператора сглаживания.

Возможны два способа реализации уравнения : непосредственно в процессе измерений методом статистической группировки полезной информации (СГПИ) в реальном масштабе времени, или методом статистической регуляризации данных (СРД), зарегистрированных в виде временного (пространственного) распределения в параллельных массивах отсчетов.

Статистическая регуляризация данных

Как следует из выражения , для практического использования информации из дополнительных потоков данных необходимо установить значения и дисперсию , причем, исходя из задания последней по выражению , должно быть известно значение - относительной средней квадратической флюктуации величины .

Применительно к СРД определение значений и по зарегистрированным массивам данных не представляет затруднений как в целом по пространству измерений, так и в виде распределений в скользящем окне усреднения данных. Последнее эквивалентно приведению для текущей точки обработки данных по информации ее ближайших окрестностей и позволяет производить максимальное извлечение полезной информации из дополнительных потоков сигналов, если частотный спектр распределения величины х по пространству измерений много меньше частотного спектра полезного сигнала. Отметим, что информация о распределении х также может иметь практическое значение (в частности, при гамма-опробовании с дополнительным потоком сигналов в низкоэнергетическом диапазоне спектра излучения - для оценки эффективного атомного номера горных пород).

Проверка теоретических положений метода

Проверка теоретических положений метода АРД проводилась путем статистического моделирования соответствующих массивов данных и их обработки цифровыми фильтрами.

В таблице 1 приведены 4 группы результатов обработки по формулам двух статистически независимых и постоянных по средним значениям массивов данных и (модели постоянных полей) при различных установках СРД по скользящему окну Кс счета текущих значений и по массиву . Текущая точка обработки данных – по центру окна. Количество отсчетов в каждом массиве – 1000, распределение значений отсчетов соответствует закону Пуассона. Определение прогнозных отсчетов по массиву для использования в уравнении проводилось со сглаживанием отсчетов в скользящем окне низкочастотного цифрового фильтра (вариант без сглаживания при ).

В качестве низкочастотного фильтра в алгоритме СРД используется (здесь и в дальнейшем) весовое окно Лапласа-Гаусса. Теоретическое значение дисперсии результатов определялось по выражению с расчетом дисперсии по выражению . При сглаживании прогнозных отсчетов значение в выражении принималось равным , где – коэффициент усиления сглаживающим фильтром дисперсии шумов (сумма квадратов коэффициентов цифрового фильтра). Дополнительно в таблице приводятся зарегистрированные средние значения коэффициента снижения статистических флюктуаций .

Таблица 1. Статистика результатов моделирования СРД. (Основной массив , , дополнительный массив , , отсчетов.)
3 1 9,7 5,7 6,19 1,7 11 3 9,6 3,6 3,80 2,8
5 1 9,7 5,4 5,78 1,8 11 5 9,6 3,3 3,55 3,0
11 1 9,6 5,1 5,36 1,9 11 11 9,6 3,1 3,22 3,2
21 1 9,6 5,0 5,18 2,0 11 21 9,6 3,0 3,11 3,3
51 1 9,6 5,0 5,05 2,0 11 11 9,6 3,0 2,99 3,3
3 3 9,7 4,1 4,71 2,4 3 11 9,8 4,5 4,26 2,2
5 5 9,7 3,6 4,01 2,8 5 11 9,7 3,5 3,78 2,8
11 11 9,6 3,1 3,22 3,2 11 11 9,6 3,1 3,22 3,2
21 21 9,6 2,9 2,91 3,4 21 11 9,6 3,1 3,12 3,2
51 51 9,6 2,7 2,66 3,7 51 11 9,6 3,1 2,99 3,2

Как видно из данных таблицы, практические результаты фильтрации достаточно хорошо совпадают с ожидаемыми по данным теоретических расчетов. Некоторое уменьшение среднего значения по отношению к исходному среднему значению определяется асимметричностью пуассоновского типа модели. При малых средних значениях модельных отсчетов в массиве это приводит к определенной статистической асимметрии в работе СРД, т.к. при среднестатистическое доверие к дополнительной информации с отсчетами Mi+s меньше, чем с отсчетами . Этим же фактором, по-видимому, вызвано и большее расхождение между теоретическими и фактическими значениями при малых значениях окна . Можно также заметить, что по значению коэффициента фильтрация выходит на теоретические значения только при достаточно точном определении значений и , что требует увеличения окна счета этих параметров для полного использования дополнительной информации.

Эффект использования дополнительной информации, в полном соответствии с выражением , усиливается при предварительном сглаживании статистических вариаций отсчетов и при увеличении значений отсчетов дополнительного массива (материалы по последнему случаю не приводятся, т.к. не имеют какой-либо дополнительной информации). В спокойных по динамике полях еще большая глубина регуляризации может быть достигнута при счете значений и по сглаженному массиву , что позволяет повысить вес прогнозных отсчетов . Результаты моделирования данного варианта в тех же условиях, что и для таблицы 1, приведены в таблице 2. Такой же эффект, в принципе, может достигаться и непосредственным введением дополнительного коэффициента веса в выражение в качестве множителя для значения , что позволяет осуществлять внешнее управление глубиной регуляризации.

Таблица 2.
Окно Окно Результаты МАРД
9,80|10,12 9,76|9,19 5 1 9,62 5,63 0,981 1,80
5 9,71 2,61 0,990 3,88
15 9,78 2,05 0,997 4,93
55 9,80 2,01 1,0 5,03
205 9,80 2,01 1,0 5,03
15 1 9,56 5,23 0,975 1,94
5 9,56 3,47 0,985 4,35
15 9,56 3,12 0,992 8,36
55 9,56 2,98 0,999 14,2
205 9,57 2,95 1,0 14,8

Оценка сохранения разрешающей способности

Оценка сохранения разрешающей способности полезной информации была проведена на фильтрации детерминированных сигналов и предельной формы – в виде прямоугольных импульсов. Оценивались два фактора: сохранение формы полезного сигнала и подавление статистических шумов, наложенных на полезный сигнал.

При установке СРД без усреднения данных по массиву (, прогноз по текущим значениям массива ) при любых значениях окна выходной массив без всяких изменений повторяет массив , т.е. не изменяет полезный сигнал и полностью сохраняет его частотные характеристики. Естественно, при условии, что массив пропорционален массиву .

При форма выходных кривых несколько изменяется и приведена на рис. 3.1. В индексах выходных кривых z приведена информация по установкам окон СРД: первая цифра - окно счета дисперсии и текущего значения (в количестве точек отсчетов), вторая цифра (через флеш) - окно сглаживания отсчетов весовой функцией Лапласа-Гаусса и определения прогнозных отсчетов . Для сравнения с результатами типовой низкочастотной фильтрации на рисунке приведена кривая отсчетов , сглаженных весовой функцией Лапласа-Гаусса с окном 25 точек.

Рис. 3.1. СРД прямоугольного импульса. Счет по несглаженному массиву .

На рис. 3.1а приведен результат СРД прямоугольного импульса с амплитудным значением 10 на фоне 5 при отношении (равные значения отсчетов и ). Дисперсия в выражении принималась равной значению отсчетов (статистика Пуассона). Как видно на рисунке, при сохранении фронтов сигнальной функции сглаживание прогнозных значений приводит к появлению искажения формы сигнала по обеим сторонам скачка, интервал которого тем больше, чем больше значение . Амплитудное значение искажений, как это и следует из выражения , в первую очередь зависит от соотношения текущих значений и и в меньшей степени от глубины сглаживания прогнозных отсчетов.

Максимальную величину искажения для точек скачка в первом приближении можно оценить из следующих соображений. Значения между точками скачка равны , где - амплитуда скачка, при этом значения коэффициента для нижней и верхней точек скачка определяются выражениями , где точки скачка (для статистики Пуассона). Отсюда, при прогнозном значении для нижней точки скачка и для верхней точки относительная величина изменений определится выражением , т.е. будет тем меньше, чем больше значения и и больше отношение , что можно наглядно видеть на рис. 3.1в. Из этого выражения также следует, что максимальные искажения скачков, вносимые системой СРД, будут всегда в несколько раз меньше, чем статистические флюктуации непосредственных отсчетов на краях скачков.

При увеличении глубины регуляризации введением счета дисперсии по сглаженному массиву картина искажений несколько изменяется и приведена на рис. 3.2. Реакция СРД на сглаживание дисперсии проявляется в своеобразной компенсации абсолютных отклонений отсчетов непосредственно по сторонам скачка отклонениями противоположного знака в более дальней зоне от скачка. Максимальные значения искажений остаются примерно на таком же уровне, как и для работы по несглаженной дисперсии , с несколько меньшей зависимостью от увеличения значений и .

Рис. 3.2. СРД прямоугольного импульса. Счет по сглаженному массиву .

В приведенных примерах значение окна счета принималось равным значению окна сглаживания дополнительного массива . При картина процесса практически не изменяется. При обратном соотношении размеров окон вступает в действие второй фактор - отклонение от фактических значений счета текущих значений в малом окне по массиву отсчетов, сглаженных с большим окном . На расстояниях от скачка функции, больших , СРД переходит в режим предпочтения сглаженных значений массива , т.к. , что при может приводить к появлению существенной погрешности – выбросов на расстояниях от скачков. Естественно, что при практических измерениях таких условий наблюдаться не будет и эффект резко уменьшится, но для полного его исключения вариант можно считать предпочтительным.

На рис. 3.3 приведен пример регистрации рандомизированного модельного сигнала в виде прямоугольного импульса амплитудой 40 на фоне 10, на котором виден принцип работы СРД. Как и следовало ожидать, СРД производит сглаживание статистических флюктуаций фона и сигнала за пределами зоны от скачка, отдавая предпочтение сглаженным прогнозным значениям , и не изменяет значения фона и сигнала в пределах этой зоны в связи с резким возрастанием текущих значений в выражении . Изменение коэффициента в зоне скачка, управляющего формированием выходных отсчетов, приведено на рис. 3.4 (среднестатистическое по 50-ти циклам рандомизации для модельного импульса на рис. 3.3) и наглядно показывает принцип адаптации СРД к динамике изменения значений обрабатываемых сигналов.

Статистическая оценка регуляризации данных

Статистическая оценка регуляризации данных по прямоугольным импульсам проводилась по 50-ти циклам рандомизации исходных массивов и . В качестве примера на рисунках 3.5 и 6 приведены результаты обработки статистики массивов и . Кроме статистики циклов рандомизации проводилась суммарная обработка всех циклов по общей статистике фона и вершины импульсов. Результаты обработки для тех же установок фильтров приведены в таблице 3.

Таблица 3. Статистика значений фона и вершины импульсов (50 циклов).
Массивы и условия обработки Фон Сигнал
Сред. отсчет Дисперсия Сред. отсчет Дисперсия
Основной входной массив 9,96 9,97 50,1 52,0
Дополнительный входной массив 9,89 9,49 50,2 47,4
Массив , счет по несглаженному 9,87 5,47 49,7 22,3
Массив , счет по сглаженному 9,84 4,76 49,9 18,6
Массив , сглаженный весовым окном 11,5 17,9 48,5 29,2

Результаты моделирования

Результаты моделирования подтверждают преимущество СРД перед простыми методами сглаживания. В числовой форме это наглядно проявляется в снижении дисперсии отсчетов выходного массива при практическом сохранении средних значений массива и для фоновых отсчетов, и для амплитудных значений сигнала. При простом сглаживании "развал" фронтов сигнала (подавление высокочастотных составляющих спектра сигнала), как и должно быть при использовании низкочастотных фильтров, вызывает снижение по отношению к исходному массиву средних значений в максимумах и повышение фоновых значений сигнала, которое тем больше, чем больше окно весовой функции. Этот эффект особенно отчетливо проявляется в интервале окна фильтра по обе стороны от резких изменений сигнала.

При отсутствии дополнительных массивов , коррелированных с регуляризируемым массивом , формирование прогнозных значений может производиться по ближайшим окрестностям текущих значений в скользящем окне . При строго корректном подходе текущая точка не должна включаться в число счета прогнозных значений , но, как показало моделирование, это практически не влияет на результаты регуляризации. При прогнозировании по всем точкам окна массив формируется любым методом сглаживания из массива , и все особенности работы СРД по сглаженным массивам , рассмотренные выше, остаются без изменений при условии счета значений в окне по массиву . Для исключения выбросов по обе стороны от скачков полезного сигнала счет как дисперсии прогнозных значений необходимо выполнять непосредственно по массиву .

Фундаментальной особенностью СРД является возможность последовательной многократной фильтрации данных, при которой может осуществляться преимущественное повышение степени регуляризации данных с минимальными искажениями формы полезного сигнала. Для выполнения последнего размер окна счета и устанавливается минимальным (3-5 точек), а глубина регуляризации данных (степень подавления шумов) устанавливается количеством последо-вательных операций фильтрации (до 3-5 проходов). Пример регуляризации модельного массива в три прохода приведен на рис. 3.7.

Рис. 3.7. СРД одиночного массива N. (3 прохода. Счет по массиву ).

Для сравнения пунктиром на рисунке приведено сглаживание массива 5-ти точечным фильтром Лапласа-Гаусса, который имеет коэффициент подавления шумов, эквивалентный 3-х проходному СРД (см. рис. 3.9).

На рисунках 3.8 и 3.9 приведены результаты статистической обработки 3-х проходной СРД для 25 циклов моделирования в сравнении с 1-м проходом и с 5-ти точечным фильтром Лапласа-Гаусса (кривая n5).

Количество проходов может ограничиваться в автоматическом режиме, например, по среднеквадратическому значению корректирующих отсчетов в каждом проходе по сравнению с предыдущим проходом, которое сначала резко уменьшается за счет сглаживания флюктуаций, а затем, в зависимости от динамики сигнальной функции, стабилизируется или даже начинает увеличиваться за счет искажения самого сигнала.

Частотное представление

Частотное представление работы СРД хорошо видно на рис. 3.10, где приведены моду-ли спектров рандомизированного сигнала в виде меандра (средние значения в минимуме - 20, в максимуме - 100, 25 периодов по 40 отсчетов, всего 1000 отсчетов) и результатов его обработки СРД (окно , окно ).

Модуль спектра основного полезного сигнала (в данном случае чистого меандра) представляет собой последовательность отдельных частотных гармоник по всему диапазону спектра. В спектре рандомизированного меандра эти частотные гармоники суммируются со спектром шума, статистически равномерно распределенным по всему частотному диапазону (спектр шума на рисунке для наглядности сглажен). СРД осуществляет подавление шумовых составляющих сигнала, практически не затрагивая частотных гармоник меандра и не изменяя их по амплитуде. Последнее можно видеть на рис. 3.11, где представлен отрезок спектра сигналов в высокочастотной части главного диапазона в области одной гармоники меандра (частотные составляющие шума не сглажены). При 3-х цикловом СРД высокочастотные составляющие шумов подавляются практически на порядок.

Пример практического использования

Пример практического использования СРД приведен на рис. 3.12 при опробовании участка скважины, пересекающей пласты каменной соли, на содержание сильвинита по гамма-излучению Калия-40. По данным геологического опробования пласты сильвинита в толще вмещающих пород (галита) имеют достаточно резкие границы и однородны по содержанию сильвинита в пределах пластов. Исходная диаграмма ГК (детектор CsJ(Tl) со свинцовым фильтром толщиной 2 мм) и результаты фильтрации исходного массива данных ГК с использованием СРД и низкочастотного фильтра с весовым окном Лапласа-Гаусса приведены на рис. 3.12.

Рис. 3.12. Диаграммы ГК.

Результаты интерпретации диаграмм ГК симметричным деконволюционным цифровым фильтром (окно 13 точек) приведены на рис. 3.13. Как видно на рисунке, деконволюция по несглаженной диаграмме ГК дает существенные вариации содержания сильвинита в пределах пластов. Применение низкочастотной фильтрации диаграммы ГК снимает флюктуации содержания в пределах пластов, но существенно сглаживает границы пластов. Использование СРД позволяет устранить этот недостаток.

Рис. 3.13. Результаты интерпретации диаграмм ГК.

В заключение отметим, что СРД может использоваться для регуляризации не только ядер-нофизических данных, но и любых других числовых массивов непрерывных измерений, если радиус их корреляции не менее 3-5 отсчетов. В качестве примера на рис. 3.14 приведена диаграмма акустического каротажа, зарегистрированная с шагом дискретизации данных 20 см, сглаживание которой проведено СРД без потери пространственного разрешения.

Рис. 3.14. Диаграмма акустического каротажа и результат ее обработки СРД. (5 циклов, , физическое окно 0.6 м)

Статистическая группировка полезной информации

Что касается аппаратных способов реализации СГПИ, то он может быть выполнен в реальном масштабе времени, если информация представлена потоком импульсов и основным информативным параметром является скорость следования импульсов.

Сущность аппаратной реализации

Сущность аппаратной реализации заключается в статистической (близкой к статистической) нормированной выборке импульсов из дополнительного потока и их суммировании с основным потоком n с заданием условий выборки по отношению частоты следования импульсов в потоках. Полагая для непрерывного режима измерений , перепишем выражение с подстановкой значения в следующем виде:

Умножим левую и правую части выражения на нормировочный коэффициент размножения выходного потока :

Заменим отсчеты выборкой сигналов из потока :

где - вероятность выборки сигналов из потока .

Если вероятность выборки сигналов поддерживать равной значению

то при этом будет иметь место

и соответственно для выражения имеем:

При статистической независимости величины от частоты потоков и приведенные выражения действительны при определении значения как в целом по пространству измерений, так и для скользящих окон текущих значений по определенным интервалам предшествующих измерений. Действительно и обратное заключение: если по определенному интервалу измерений выражение обращается в нуль, то установленная вероятность выборки соответствует условию . На этом принципе может проводиться аппаратная реализация СГПИ с автоматической адаптацией к условиям измерений: управление процессом выборки импульсов из потока и направление их на суммирование с потоком по сигналам обратной связи с устройства, следящего за обращением в нуль выражения .

Особенности аппаратной реализации

Особенности аппаратной реализации СГПИ с автоматической адаптацией под условия измерений заключаются в следующем.

Значение вероятности выборки Рв не может быть больше 1. Отсюда из следует, что для любых интервалов измерений должно выполняться условие , а соответственно по всему пространству измерений должно выполняться условие , чем и обуславливается выбор коэффициента . Значение коэффициента принципиально ограничивает степень положительного эффекта СГПИ (), в отличие от СРД, где такого ограничения не имеется.

Относительная статистическая погрешность измерений выходного потока отсчетов соответствует выражению (2.23) при условии постоянного значения величины , т.е. при установке значения по среднему значению величины в целом по пространству измерений. При автоматической адаптации под условия измерений значение вероятности по текущему среднему значению отношения определенного предшествующего интервала измерений также является статистически флюктуирующей величиной с дисперсией распределения (без учета изменений действительного значения ):

где - интервал усреднения информации при определении текущего значения .

Соответственно, дисперсия и средняя квадратическая погрешность текущих отсчетов :

При постоянной экспозиции измерений положительный эффект возрастает с увеличением значения :

при

В общем случае, с учетом средней квадратической ошибки прогнозирования значений для текущих точек измерений по значениям в предшествующих интервалах при :

Формирование значения на основе информации по средним значениям интервалов измерений, предшествующих текущим, определяет СГПИ как динамическую систему с соответствующей постоянной времени реакции на изменение условий измерений. Учитывая, что, во-первых, для любой точки пространства измерений должно выполняться условие , и, во-вторых, увеличение интервала приводит к возрастанию времени реакции на изменение условий измерений, значение целесообразно ограничивать величиной порядка (5-10) значений текущих экспозиций. Чем меньше пространственная частота распределения по отношению к распределению , тем большее значение допустимо.

Реализация систем СГПИ

Реализация систем СГПИ значительно облегчается при чисто практическом ограничении целевой задачи: получение максимального положительного эффекта в экстремально неблагоприятных условиях производства измерений (при низких значениях регистрируемой плотности потока излучения, при высокой скорости измерений) с вырождением положительного эффекта по мере снижения статистической погрешности измерений в основном потоке. Так, например, если при скважинном гамма-опробовании статистическая погрешность измерений основного потока сигналов в зонах с повышенной интенсивностью излучения снижается до 2-3%, то ее дальнейшее уменьшение не имеет практического смысла, т.к. основная погрешность каротажной радиометрической аппаратуры обычно не превышает 5%.

Использование данного целевого ограничения позволяет применить формирование параметра не в скользящем окне временного или пространственного усреднения информации, а по определенному зарегистрированному объему предшествующей информации, т.е. с автоматической вариацией интервала усреднения информации и постоянной регулирования в зависимости от частоты потоков сигналов, при этом объем информации формирования может задаваться с учетом характера вариаций величины и допустимого значения динамической погрешности измерений.

Для реализации такой возможности преобразуем выражение по интервалу усреднения к виду:

при
где - средний уровень смещения числового эквивалента сигнала обратной связи системы АРВ - автоматического регулирования вероятности выборки , при котором обеспечивается выполнение равенства , - коэффициент пропорциональности преобразования цифрового сигнала АРВ в сигнал .

Дифференциальное уравнение для системы АРВ:

Решение дифференциального уравнения при начальных условиях и (переходная функция АРВ):

Как видно из этих выражений, значение сигнала обратной связи АРВ пропорционально отношению частот потоков, а постоянная времени АРВ прямо пропорциональна значению коэффициента преобразования при обратной пропорциональности от значения частоты дополнительного потока , равно как и, с учетом , прямо пропорциональна текущему значе-нию сигнала обратной связи при обратной пропорциональности от значения частоты основного потока . Первое полностью эквивалентно второму при и . В первом приближении, с использованием выражения и эквивалентности значения статистических флюктуаций при для скользящего прямоугольного временного окна и окна интенсиметра с экспоненциальной переходной функцией, для относительных флюктуации значения получаем:

Выражение действительно для прямого измерения - интенсиметром отношения и является максимальной оценкой. Для более точной оценки следует учитывать, что в данном случае интенсиметр является устройством с отрицательной обратной связью по цепи АРВ, что несколько уменьшает значение флюктуации. Точная оценка может быть проведена с использованием формулы Кэмпбелла для дисперсии случайной величины , образованной сложением импульсов пуассоновского потока [5], раздельно для потока при и потока при , с последующим сложением квадратов относительного среднего квадратического значения флюктуации. Так, для схемы, приведенной ниже, получено значение .

При выбранном для пространства измерений значении коэффициента с использованием выражения параметры системы АРВ (коэффициент и среднее значение для средней по пространству величины отношения ) могут устанавливаться под заданное значение допустимых флюктуаций вероятности выборки импульсов :

В процессе измерений АРВ осуществляет непрерывную адаптацию под текущие условия измерений () с регулированием текущего значения по объему информации предшествующего интервала измерений путем соответствующего изменения постоянной времени интегрирования этой информации в зависимости от изменения частот потоков сигналов. При последнее имеет абсолютный характер: .

Следует отметить, что во многих методах геофизики существуют достаточно благоприятные условия использования как СГПИ, так и СРД. Так, например, применительно к скважинному гамма-опробованию с извлечением дополнительной информации из низкоэнергетической части спектра излучения условия достаточно точной реакции на изменения параметра по стволу скважины являются весьма хорошими, т.к. основной фактор вариации значений - эффективный атомный номер среды, изменяется в небольшом диапазоне с низкой пространственной частотой вариаций, причем в зонах расположения активных пород, где требуется наиболее высокая точность интерпретации результатов измерений и возможны значительные изменения атомного номера пород, за счет увеличения плотностей потоков излучения постоянная времени АРВ будет существенно уменьшаться, а пространственная разрешающая способность измерений соответственно увеличиваться. Аналогичные условия характерны, как правило, и для других методов ядерной геофизики.

Пример исполнения системы СГПИ

Пример исполнения системы СГПИ для двух импульсных потоков сигналов приведен на рис. 3.1. Функциональная схема СГПИ содержит реверсивный счетчик импульсов 1, на вход суммирования которого подаются импульсы основного потока n, а на вход вычитания - импульсы дополнительного потока , предварительно проходящие через схему выборки импульсов 3 и счет-чик-делитель частоты следования импульсов 4 с коэффициентом пересчета .

Рис. 4.1. Базовая функциональная схема СГПИ.1- реверсивный счетчик импульсов, 2- блок формирования сигнала выборки импульсов, 3- схема выборки импульсов, 4- счетчик-делитель частоты на R, 5- блок суммирования потоков импульсов.

Информация о состоянии счетчика 1 (сигнал ) с выходов счетчика подается на блок формирования сигнала выборки импульсов 3. В простейшем случае этот блок может представлять собой пороговое устройство (по коду числа ), открывающее схему 3, однако выборка в этом случае имеет характер, близкий к статистическому, только при достаточно малых различиях частоты потоков и (порядка ). По мере роста отношения независимость выборки от импульсов потока в такой схеме вырождается, и требуются дополнительные устройства адаптации под текущие условия измерений. В общем случае блок 3 выполняется в виде пересчетной схемы с регулируемым коэффициентом пересчета импульсов потока в интервале по значению кода с выхода счетчика 1 (например, с использованием статистических пересчетных схем, выполненных в виде генератора случайных кодов со схемой формирования сигнала выборки очередного импульса из потока путем сравнения на большеменьше текущих кодов с выхода счетчика 1 и с выхода генератора кодов).

Импульсы основного потока и импульсы выборки из потока , частота которых равна , поступают на вход блока 5 суммирования потоков сигналов. Интенсивность потока импульсов на выходе блока 5 равна . Блок 5 может содержать пересчетную схему с коэффициентом , при этом выходной поток будет приводиться к масштабу основного потока и появляется возможность синхронного переключения коэффициентов пересчета схем 4 и 5 под различные условия измерений, при этом установка оптимального значения коэффициента может быть переведена в режим автоматической с управлением по текущему значению (в определенном интервале) информационного кода схемы 1. Альтернативное решение - подача на вход суммирования схемы 5 потока импульсов с выхода схемы 4, при этом частота потока будет всегда в 2 раза больше потока .

Попутно отметим, что при выводе информации в цифровом коде со счетчика 1 данная схема может выполнять функции универсального цифрового интенсиметра: средней частоты импульсов ( от генератора тактовой частоты), среднего временного интервала между импульсами и отношения частот двух статистически распределенных потоков импульсов.

Литература

  1. Адаптивные фильтры. /Под ред. К.Ф.Н.Коуэна и П.М.Гранта. – Москва: Мир, 1988, 392 с.
  2. Айфичер Э., Джервис Б. Цифровая обработка сигналов. Практический подход. - Москва: Вильямс, 2004, 992 с.

См. также