Оценка параметров методом максимального правдоподобия в COMSOL

13/05/2022

Методы оценки параметров и аппроксимации данных редко сопровождаются увлекательными иллюстрациями, но без них зачастую невозможно получить достоверные данные о свойствах материалов, а значит и невозможно построить точные расчётные модели. Суть этих методов сводится к минимизации разности между экспериментальными данными и соответствующими результатами моделирования. Иногда при оценке параметров требуется объединить данные нескольких экспериментов с учётом соответствующих весовых коэффициентов для измеренных значений. Оценка параметров методом максимального правдоподобия позволяет автоматически задать весовые коэффициенты на основе объективных критериев, чтобы извлечь из экспериментальных данных максимальное количество полезной информации.

Отказ от ручной настройки весов с помощью метода наименьших квадратов

Метод наименьших квадратов — частный случай реализации метода максимального правдоподобия для оценки параметров, который является хорошей отправной точкой для базовой оценки параметров, благодаря чему он находит широкое применение. В среде численного моделирования COMSOL Multiphysics® представлены встроенные инструменты, реализующие метод наименьших квадратов.

В этой статье мы покажем на конкретном примере, как оценка параметров методом максимального правдоподобия поможет избежать ручной настройки весовых коэффициентов.

Линия синего цвета на графике показывает относительную погрешность определения модуля Юнга, которая снижается, а линия зеленого цвета — относительную погрешность определения коэффициента Пуассона, которая увеличивается.
В этом примере относительная погрешность оценки двух параметров зависит от весовых коэффициентов, которые используются для двух массивов экспериментальных данных. Таким образом, для точного определения обоих параметров необходимо найти компромиссное значение весовых коэффициентов.

Вероятность и статистика при выборке данных

Вероятность P измеренной величины в заданном диапазоне значений [a, b] определяется интегралом

P=\int_a^bf(x)dx,

где f — функция распределения вероятности.

В данном случае мы рассматриваем дифференциально малый интервал dx вблизи измеренного значения x, поэтому вероятность равна

P=f(x)dx.

Таким образом, существует прямо пропорциональная зависимость между функцией распределения вероятности и самой вероятностью с коэффициентом пропорциональности dx. (dx можно опустить для удобства обозначений.)

Колоколообразная кривая со стандартным отклонением ошибки измерения, бесконечно малым диапазоном и вероятностью, обозначенной красным цветом.
Вероятность некоторого значения может быть вычислена путем интегрирования функции плотности вероятности.

Метод наименьших квадратов и оценка параметров методом максимального правдоподобия

Существует множество факторов, влияющих на расхождение результатов моделирования и эксперимента. В следующем примере мы рассмотрим измерения, точность которых описывается нормальным распределением, поэтому вероятность получить экспериментальное значение x^e равна

g(x-x^e,\sigma)=\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x-x^e)^2}{2\sigma^2}},

где \sigma — это стандартное отклонение погрешности измерения, а x — математическое ожидание. Для n измерений можно рассчитать общую вероятность как произведение

P=\prod_i^n g(x_i,x_i^e,\sigma) = \prod_i^n \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x_i-x_i^e)^2}{2\sigma^2}}.

Возьмём логарифм вероятности, чтобы уйти от вычисления произведений и избежать любых связанных с ним численных трудностей. Так мы получим сумму, которая напоминает уравнение метода наименьших квадратов:

\log(P) &=& \sum_i^n \log\left(\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(x_i-x_i^e)^2}{2\sigma^2}}\right) \\
&=& \sum_i^n\left( -\frac{(x_i-x_i^e)^2}{2\sigma^2}-\log\left(\sigma\sqrt{2\pi}\right)\right)\Leftrightarrow \\
-\log(P) &=& n\log\left(\sigma\sqrt{2\pi}\right) + \frac{_1}{^2}\sum_i^n\frac{(x_i-x_i^e)^2}{\sigma^2}.

Здесь \sigma в некотором смысле играет роль весового коэффициента метода наименьших квадратов. Поэтому, чтобы найти максимальную вероятность, нам нужно минимизировать правую часть уравнения. Независимо от значения \sigma минимум будет достигнут тогда, когда сумма квадратов отклонений примет минимальное значение. Если мы используем разные массивы данных с разными \sigma, то мы не сможем прийти к тому же заключению. Давайте рассмотрим такой пример.

Максимальное правдоподобие при испытании на растяжение

Обычно коэффициент Пуассона материалов оценивают с помощью испытания на сжатие, но для наглядности мы рассмотрим пример, в котором коэффициент Пуассона, а также модуль Юнга оцениваются с помощью испытания на растяжение. Мы измерим приложенную силу и радиальную деформацию образца в процессе испытаний, как показано на рисунке ниже.

Модель, показывающая напряжение при испытании на растяжение, где концы фиолетовые и имеют стрелки, направленные наружу, а центр красный.
На рисунке показано распределение эквивалентного напряжения при испытании на растяжение. Сила и радиальное перемещение измеряются как функции от перемещения в осевом направлении.

Измеренные значения силы и перемещений (в единицах СИ) отличаются примерно на десять порядков величины, поэтому при использовании метода наименьших квадратов нам пришлось бы подстраивать весовые коэффициенты, чтобы получить точные оценки для обоих параметров материала. Однако мы можем вычислить оптимальные веса с помощью метода максимального правдоподобия автоматически, используя стандартное отклонение погрешности двух измерений \sigma_F и \sigma_r в качестве управляющих параметров; то есть,

P_F &=& \prod_i^ng(F_i-F_i^e,\sigma_F) \quad \mathrm{and} \quad P_r = \prod_i^n g(r_i-r_i^e,\sigma_r) \\
P &=& P_F P_r \Leftrightarrow -\log(P)=-\log(P_f)-\log(P_r).

Инструменты, реализующие метод наименьших квадратов в COMSOL Multiphysics, позволяют довольно просто настраивать пользовательские модели для решения задач оценки параметров методом максимального правдоподобия. В галерее приложений представлена модель Parameter Estimation Using Maximum Likelihood model, в которой экспериментальные данные генерируются искусственно за счёт добавления нормально распределенного шума. Затем в этой модели выполняется расчёт параметров материала и стандартных отклонений на основе этих сгенерированных данных. Результирующая сила и радиальное перемещение показаны на рисунке ниже.

На графике показаны две пересекающиеся линии: синими точками обозначено изменение радиуса, синей линией — рассчитанное изменение радиуса, зелёными точками — приложенная сила, зелёной линией — рассчитанная сила.
Зашумленные данные и их аппроксимация построены в функции от растяжения. Для каждого из двух измерений имеется 37 экспериментальных точек.

Модель способна рассчитать параметры материала с точностью 0,1–0,5%, а стандартные отклонения составляют около 6%, при этом точность будет повышаться при увеличении числа экспериментальных точек.

В этой статье мы обсудили случай нормально распределённого шума с фиксированным стандартным отклонением, но рамки оценки параметров методом максимального правдоподобия могут быть расширены для соответствия реалиям конкретных экспериментов, чтобы информация извлекалась оптимальным и последовательным образом.

Попробуйте сами

Попробуйте самостоятельно поработать с моделью Parameter Estimation Using Maximum Likelihood model. Кликните по кнопке ниже, чтобы открыть описание модели в галерее приложений:

Дополнительные ресурсы

Изучите больше примеров оценки параметров с помощью этих моделей:

Узнайте больше об оценке параметров с помощью этих ресурсов:


Комментарии (0)

Оставить комментарий
Войти | Регистрация
Загрузка...
РУБРИКАТОР БЛОГА COMSOL
РУБРИКИ
ТЕГИ