Функция потерь

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 13:58, 15 марта 2017.

Функция потерь как характеристика погрешностей измеренного параметра

Из-за действия случайных помех любая оценка параметра сигнала производится неточно. В зависимости от используемого правила оценки одни и те же погрешности будут возникать с различной вероятностью, так что используемое правило оценки во многом характеризует точность работы измерительной системы.

В основе организации системы оценок качества различных правил оценки лежит так называемая функция потерь , которая каждому сочетанию истинного значения параметра и его оценке (измеренному значению) приписывает определенный неотрицательный коэффициент потерь. Выбор вида этой функции зависит от специфики конкретной задачи измерения. К сожалению, общего формального правила выбора функции потерь не существует и его осуществляют так же, как выбор коэффициентов потерь и выигрышей при решении задачи обнаружения, опираясь на накопленный опыт, здравый смысл и интуицию. Наиболее часто используются следующие функции потерь:

Рис. 1. -равномерная функция потерь

-равномерная (квазиравномерная, простая) функция потерь (рис. 1)

где

Выбор простой функции потерь означает, что все погрешности, вне зависимости от их величины и знака, одинаково нежелательны и каждой из них приписывается одинаковый «вес», характеризуемый коэффициентом потерь .

Рис. 2. Функция потерь, линейная по модулю

Функция потерь, линейная по модулю (рис. 2)

В этом случае нежелательность погрешности (её «вес») увеличивается линейно с ростом её абсолютного значения.

Рис. 3. Квадратичная функция потерь

Квадратичная функция потерь (рис. 3), при которой «вес» погрешности увеличивается пропорционально квадрату её величины:

Рис. 4. Прямоугольная функция потерь

Прямоугольная функция потерь (рис. 4)

В этом случае все погрешности, абсолютные значения которых меньше , неопасны. Погрешности, абсолютные значения которых больше , одинаково нежелательны, вне зависимости от их величины. Все рассмотренные функции потерь являются четными функциями аргумента . Это означает, что одинаковые отклонении от истинного значения параметра как в большую, так и в меньшую сторону имеют одинаковую «стоимость». Однако существуют задачи, где необходимо по-разному оценивать знак погрешности. В этих случаях функции потерь будут асимметричными.

Байесовская оценка измеряемых параметровБайесовская оценка α o c b c {\displaystyle \alpha {oc}^{bc} \,\!} измеряемых параметров

Поскольку сам измеряемый параметр и его оценка являются случайными величинами, то случайными будут и потери . Поэтому для характеристики качества измерения (качества алгоритма оценки) применяется некоторый усредненный статистический параметр. Наиболее часто в качестве такого параметра принимают среднее значение функции потерь – средний риск.

Условный средний риск получается усреднением функции потерь по всем возможным реализациям S, так что:

где – область пространства реализаций.

Как следует из , зависит от значения измеряемого параметра в реализации S. Поэтому оценивать качество правила по условному среднему риску неудобно, так как при разных значениях наиболее предпочтительными могут оказаться разные правила. Отсюда целесообразно усреднение условного среднего риска по всем возможным значениям , т.е. получение безусловного среднего риска:

При этом

Поскольку плотность вероятности есть неотрицательная функция, то минимизация безусловного среднего риска сводится к минимизации внутреннего интеграла, т.е. к минимизации функции

которая называется апостериорным условным средним риском, соответствующим условию получения реализации . Если функция дифференцируема по , то оценка параметра по критерию минимума безусловного среднего риска (байесовская оценка ) является корнем уравнения

при котором функция имеет глобальный минимум (нижнюю грань).

Из и следует, что

т.е. безусловный средний риск можно рассматривать как усреднение апостериорного условного среднего риска по всем реализациям s. Минимальное значение безусловного среднего риска , называемое байесовским риском и соответствующее байесовской оценке измеряемого параметра , равно с учетом :

Эффективность байесовской оценки Эффективность байесовской оценки α o c b s {\displaystyle \alpha {oc}^{bs} \,\!}

Теперь рассмотрим, какова же практическая эффективность (ценность) байесовской оценки при различных функциях потерь.

Случай квазиравномерной функции потерь

Подставляя в , получим апостериорный условный риск при квазиравномерной (-равномерной) функции потерь:

Рис. 3.1. Апостериорная условная плотность распределения вероятности измеряемого параметра

Учитывая фильтрующее свойство -функции, получим окончательно:

Из следует, что соответствует максимуму функции . Таким образом, при выбранном постоянном апостериорный условный средний риск меньше, чем больше , т.е. байесовская оценка квазиравномерной функции потерь соответствует такому значению параметра, при котором апостериорная плотность вероятности имеет резко выраженную верхнюю грань (рис. 3.1, б).

Другими словами, байесовское правило оценки квазиравномерной функции потерь есть не что иное, как правило оценки по критерию максимума апостериорной вероятности (Кр. 1º), максимизирующее вероятность правильного измерения неизвестного параметра. При использовании этого правила оценки вероятность появления ошибки любой величины минимальна по сравнению с использованием любого другого правила. Если априорное распределение измеряемого параметра при определённой плотности вероятности неизвестно и нет данных, обеспечивающих возможность его приближенного описания, то необходимо задаться наименее предпочтительным распределением, т.е. прийти к минимаксному критерию (Кр. 3º максимума правдоподобия). Известно, что при решении задачи оценки параметров сигналов наименее предпочтительным распределением является равномерное распределение. При отношение правдоподобия с точностью до постоянного коэффициента совпадает с априорной плотностью вероятности .

Рис. 3.2. Априорная и апостериорная плотности распределения измеряемого параметра при большом отношении "сигнал/помеха"

При этом правило оценки по критерию максимума апостериорной вероятности переходит в правило оценки по критерию максимума правдоподобия. Оценка по этому критерию является минимаксной и оптимальна (обеспечивает минимальную вероятность ошибки) только при равномерном априорном распределении измеряемого параметра. При других распределениях вероятность ошибки увеличивается; в этом случае минимаксная оценка определяет верхнюю границу вероятности ее возникновения (верхнюю границу байесовского риска). Правило оценки по критерию максимума правдоподобия (Кр. 3º) широко применяется на практике, особенно при проведении точных измерений, когда ОСП достаточно велико. В этом случае апостериорное распределение , а следовательно, и функция имеют четко выраженный единственный максимум и по форме значительно «острее» априорного распределения (рис. 3.2).

Тогда, если априорное распределение и не равномерно, на небольшом участке в окрестности оценки можно с достаточной степенью приближения считать его равномерным. И вместо правила оценки по критерию максимума апостериорной вероятности применять более простое для практической реализации правило максимума правдоподобия.

Случай линейной по модулю функции потерь

Подставляя в при линейной по модулю функции потерь для апостериорного условного риска имеем:

и уравнение для отыскания байесовской оценки принимает вид

Рис. 3.3. Апостериорная плотность распределения вероятности для байесовской оценки значения параметра при линейной функции потерь

Откуда

и, следовательно, байесовская оценка соответствует тому значению измеряемого параметра , при котором площади и областей и под кривой апостериорной плотности вероятности слева и справа равны (рис. 3.3).

Иначе говоря, оценка есть медиана апостериорного распределения измеряемого параметра. Подставляя при в , получим безусловный средний риск:

т.е. байесовский риск при линейной по модулю функции потерь равен минимальному среднему отклонению байесовской оценки от истинного значения параметра.

Случай квадратичной функции потерь

Для квадратичной функции потерь из и следует

так что условие для нахождения оценки имеет вид:

Откуда с учетом получим

Таким образом, байесовская оценка при квадратичной функции потерь равна среднему значению апостериорной плотности распределения измеряемого параметра. Из и получим соответствующий байесовский риск (безусловный средний риск, который минимизирует )

Он равен минимальному среднему значению квадрата отклонения оценки от истинного значения измеряемого параметра, т.е. дисперсии байесовской погрешности.

Случай прямоугольной функции потерь

При прямоугольной функции потерь из и имеем:

Рис. 3.4. Апостериорная плотность распределения вероятности для байесовской оценки значения параметра при прямоугольной функции потерь

В итоге получаем уравнение для нахождения оценки

или

Откуда следует (рис. 3.4), что байесовская оценка при прямоугольной функции потерь равна такому значению параметра , при котором апостериорные плотности вероятности, соответствующие значениям и , равны между собой.

Второй член в формуле определяет вероятность появления, заключающего в том, что истинное значение параметра в данной реализации находится в диапазоне от до . Следовательно, в соответствии с этой же формулой апостериорный условный риск при прямоугольной функции потерь равен вероятности того, что истинное значение параметра не находится в этом диапазоне, т.е.

Байесовский риск:

т.е. определяет минимальную вероятность того, что погрешность выйдет за пределы диапазона .

Выводы

На основании изложенного для нахождения оценки значения неизвестного параметра сигнала необходимо:

1. В зависимости от характера решаемой задачи, определяющей связь между погрешностью измерения и вызываемыми ею последствиями (т.е. её «стоимостью»), выбрать соответствующую функцию потерь .
2. Подвергнуть принятую реализацию S такой обработке, при которой можно получить:
2.1. отношение правдоподобия , если функция потерь -равномерная и априорное распределение измеряемого параметра можно считать равномерным;
2.2. апостериорную условную плотность вероятности измеряемого параметра при всех остальных функциях потерь, а также при -равномерной функции потерь, если известно, что априорное распределение отличается от равномерного.
3. В соответствии с выбранной функцией потерь провести анализ функций или , на базе которого найти оценку неизвестного параметра, являющуюся наилучшей (оптимальной в некотором смысле) оценкой. Критерий оптимальности оценки также зависит от выбранной функции потерь .
3.1. При -равномерной функции потерь работает критерий максимума апостериорной вероятности (Кр. 1); или (если априорное распределение измеряемого параметра равномерное) критерий максимума правдоподобия (Кр. 3). В обоих случаях измерительная ОЭС, реализующая эти критерии, обеспечивает максимальную вероятность правильной оценки, т.е. максимальную вероятность того, что оценка совпадает с истинным значением параметра.
3.2. При линейной по модулю функции потерь байесовская оценка дает возможность получить минимум математического ожидания (среднего значения) погрешности .
3.3. При квадратичной функции потерь байесовская оценка идентифицирует минимум среднеквадратического отклонения оценки от истинного значения измеряемого параметра, т.е. минимизирует дисперсию погрешности .
3.4. При прямоугольной функции потерь байесовская оценка идентифицирует минимальную вероятность выхода погрешности измерения за границы поля допуска .
4. В общем случае байесовские оценки при линейной, квадратичной и прямоугольной функции потерь не совпадают друг с другом, а также с оценкой при -равномерной функции потерь, т.е. с оценкой по максимуму апостериорной вероятности (см. например рис. 3.3 и рис. 3.4).

Совпадение всех оценок возможно, но имеет место лишь тогда, когда апостериорное распределение унимодально и симметрично (рис. 3.2). Очевидно, что при линейной обработке входной реализации (при получении так называемых линейных оценок) для этого достаточно, чтобы помеха имела нормальное распределение. При других видах распределения помехи или при нелинейной обработке входной реализации требуется проверка характера апостериорного распределения измеряемого параметра при заданной измерительной системы в любом тракте КПС.

См. также