Билет аппроксимация определение коэффициентов линейной зависимости. Методы аппроксимации функций

Аппроксимация , или приближение - научный метод, состоящий в замене одних объектов другими, в том или ином смысле близкими к исходным, но более простыми. В задачах, рассматриваемых в данном разделе и в следующем, используются исходные данные, полученные в результате табуляции заданной функции. Следует помнить, что в реальных задачах исходными данными являются результаты наблюдений (проведение опытов, научных экспериментов, наблюдение реальных событий и т.п.), которые подвержены ошибкам измерения и другим случайным факторам. Задача исследователя - подобрать по исходным точкам (которые на первый взгляд расположены хаотично) функциональную зависимость (если это вообще возможно), которая наилучшим образом описывает распределение исходных данных и в некоторых случаях попытаться сделать прогноз дальнейшего развития (например исследование временно́го ряда изменения котировок акций).

Задание . Построить таблицу значений функции F(x)=ax²+bx+c для 11 значений аргумента x в диапазоне –1 ≤ x ≤ +1 . Построить график этой функции, затем выполнить аппроксимацию линиями тренда двух типов. С помощью линий тренда построить прогноз на два периода вперёд.

Как и в предыдущих задачах вводим исходные данные: начальное значение аргумента функции Xn , конечное значение аргумента функции Xk , количество точек разбиения функции (количество строк таблицы) N , формулу для шага аргумента функции dX , коэффициенты a , b , c , затем создаем основную таблицу и строим диаграмму (все эти действия были подробно описаны в разделе ) :


Линии тренда на диаграмме

Линии тренда позволяют графически отображать тенденции изменения данных и прогнозировать их дальнейшие изменения . Подобный анализ называется также регрессионным анализом. Используя регрессионный анализ, можно продлить линию тренда в диаграмме за пределы реальных данных для предсказания будущих значений.

Линии тренда могут быть построены на всех двухмерных диаграммах (линию тренда нельзя добавить на объемных, лепестковых, круговых, кольцевых и пузырьковых диаграммах).

Существует шесть различных видов линий тренда:

  • Линейная
  • Полиномиальная
  • Логарифмическая
  • Экспоненциальная
  • Степенная

Линии тренда, добавленные к графику функции, на сами данные и исходную диаграмму никак не влияют.

Формулы для вычисления линий тренда

Линейная . Используется для линейной аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:

где: m - угол наклона, b - координата пересечения оси абсцисс.

Полиномиальная . Используется для полиномиальной или криволинейной аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:

где: b , c 1 , c 2 , … c 6 - константы.

Можно задать степень полинома от 2 до 6.

Логарифмическая . Используется для логарифмической аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:

где: c и b - константы, ln - функция натурального логарифма.

Экспоненциальная . Используется для экспоненциальной аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:

где: c и b - константы, e - основание натурального логарифма.

Степенная . Используется для степенной аппроксимации данных по методу наименьших квадратов в соответствии с уравнением:

где: c и b - константы.

Примечание . Экспоненциальная и степенная виды аппроксимации недоступны, если значения функции F(x) содержат отрицательные или нулевые значения. Кроме того, логарифмическая и степенная виды аппроксимации недоступны, если значения аргумента функции x содержат отрицательные или нулевые значения. Поскольку в заданиях к лабораторным работам используется отрицательное значение нижней границы аргумента Xn (x0 ), не выбирайте логарифмическую и степенную виды аппроксимации!

Скользящее среднее - это среднее значение за определенный период:

На диаграмме линия, построенная по точкам скользящего среднего, позволяет построить сглаженную кривую, более ясно показывающую закономерность в развитии данных.

Добавление линии тренда к рядам данных

Выделяем диаграмму (щелкаем в любом пустом месте диаграммы), после чего на ленте меню появятся три дополнительные вкладки: Конструктор , Макет и Формат . На вкладке Макет в группе Анализ щелкаем по кнопке .

линейный алгебраический численный метод

Часто при анализе экспериментальных данных возникает необходимость найти функциональную зависимость между величинами x и y, которые получены в результате измерений. При аналитическом исследовании взаимосвязи между двумя величинами x и y получается таблица значений, которую также можно представить в графическом виде.

Если же заведомо известен вид аппроксимирующей функции, то задача аппроксимации сводится только к отысканию коэффициентов (a, b, c,...), входящих в функцию. Для нахождения этих коэффициентов используется метод наименьших квадратов, заключающийся в том, что сумма квадратов расстояний по вертикали от точек до графика функции y=f(x, a, b, c,...) наименьшая: S = i 2 = min, где S i = y i - f(x i , a, b, c,...). Для этого используем необходимое условие экстремума функции нескольких переменных i - f(x i , a, b, c,...)) 2: равенство нулю частных производных. В результате получим систему. Таким образом, нахождение коэффициентов сводится только к решению системы:

Линейная регрессия

Линейная функция имеет вид y = ax + b, следовательно, требуется найти два параметра: a и b, с условием, что даны координаты n точек, найденных экспериментально со случайными ошибками («шумом»). Для этого составим функцию i - (ax i +b)) 2 , раскроем скобки i - ax i - b) 2 и составим систему:

Пусть А = i , В = i , С = i x i , D = i 2 , тогда система примет вид:

Решим эту систему линейных алгебраических уравнений методом Крамера и, таким образом, найдем искомые значения параметров a и b:

Таблица. Имеются точки:

Используя способ вычисления параметров линейной функции, получаем:

a = 0,1215455 , b = - 0,2140002

Аппроксимация опытных данных – это метод, основанный на замене экспериментально полученных данных аналитической функцией наиболее близко проходящей или совпадающей в узловых точках с исходными значениями (данными полученными в ходе опыта или эксперимента). В настоящее время существует два способа определения аналитической функции:

С помощью построения интерполяционного многочлена n-степени, который проходит непосредственно через все точки заданного массива данных. В данном случае аппроксимирующая функция представляется в виде: интерполяционного многочлена в форме Лагранжа или интерполяционного многочлена в форме Ньютона.

С помощью построения аппроксимирующего многочлена n-степени, который проходит в ближайшей близости от точек из заданного массива данных. Таким образом, аппроксимирующая функция сглаживает все случайные помехи (или погрешности), которые могут возникать при выполнении эксперимента: измеряемые значения в ходе опыта зависят от случайных факторов, которые колеблются по своим собственным случайным законам (погрешности измерений или приборов, неточность или ошибки опыта). В данном случае аппроксимирующая функция определяется по методу наименьших квадратов.

Метод наименьших квадратов (в англоязычной литературе Ordinary Least Squares, OLS) - математический метод, основанный на определении аппроксимирующей функции, которая строится в ближайшей близости от точек из заданного массива экспериментальных данных. Близость исходной и аппроксимирующей функции F(x) определяется числовой мерой, а именно: сумма квадратов отклонений экспериментальных данных от аппроксимирующей кривой F(x) должна быть наименьшей.

Аппроксимирующая кривая, построенная по методу наименьших квадратов

Метод наименьших квадратов используется:

Для решения переопределенных систем уравнений, когда количество уравнений превышает количество неизвестных;

Для поиска решения в случае обычных (не переопределенных) нелинейных систем уравнений;

Для аппроксимации точечных значений некоторой аппроксимирующей функцией.

Аппроксимирующая функция по методу наименьших квадратов определяется из условия минимума суммы квадратов отклонений расчетной аппроксимирующей функции от заданного массива экспериментальных данных. Данный критерий метода наименьших квадратов записывается в виде следующего выражения:

Значения расчетной аппроксимирующей функции в узловых точках ,

Заданный массив экспериментальных данных в узловых точках .

Квадратичный критерий обладает рядом "хороших" свойств, таких, как дифференцируемость, обеспечение единственного решения задачи аппроксимации при полиномиальных аппроксимирующих функциях.

В зависимости от условий задачи аппроксимирующая функция представляет собой многочлен степени m

Степень аппроксимирующей функции не зависит от числа узловых точек, но ее размерность должна быть всегда меньше размерности (количества точек) заданного массива экспериментальных данных.

∙ В случае если степень аппроксимирующей функции m=1, то мы аппроксимируем табличную функцию прямой линией (линейная регрессия).

∙ В случае если степень аппроксимирующей функции m=2, то мы аппроксимируем табличную функцию квадратичной параболой (квадратичная аппроксимация).

∙ В случае если степень аппроксимирующей функции m=3, то мы аппроксимируем табличную функцию кубической параболой (кубическая аппроксимация).

В общем случае, когда требуется построить аппроксимирующий многочлен степени m для заданных табличных значений, условие минимума суммы квадратов отклонений по всем узловым точкам переписывается в следующем виде:

- неизвестные коэффициенты аппроксимирующего многочлена степени m;

Количество заданных табличных значений.

Необходимым условием существования минимума функции является равенству нулю ее частных производных по неизвестным переменным . В результате получим следующую систему уравнений:

Преобразуем полученную линейную систему уравнений: раскроем скобки и перенесем свободные слагаемые в правую часть выражения. В результате полученная система линейных алгебраических выражений будет записываться в следующем виде:

Данная система линейных алгебраических выражений может быть переписана в матричном виде:

В результате была получена система линейных уравнений размерностью m+1, которая состоит из m+1 неизвестных. Данная система может быть решена с помощью любого метода решения линейных алгебраических уравнений (например, методом Гаусса). В результате решения будут найдены неизвестные параметры аппроксимирующей функции, обеспечивающие минимальную сумму квадратов отклонений аппроксимирующей функции от исходных данных, т.е. наилучшее возможное квадратичное приближение. Следует помнить, что при изменении даже одного значения исходных данных все коэффициенты изменят свои значения, так как они полностью определяются исходными данными.

Аппроксимация исходных данных линейной зависимостью

(линейная регрессия)

В качестве примера, рассмотрим методику определения аппроксимирующей функции, которая задана в виде линейной зависимости. В соответствии с методом наименьших квадратов условие минимума суммы квадратов отклонений записывается в следующем виде:

Координаты узловых точек таблицы;

Неизвестные коэффициенты аппроксимирующей функции, которая задана в виде линейной зависимости.

Необходимым условием существования минимума функции является равенству нулю ее частных производных по неизвестным переменным. В результате получаем следующую систему уравнений:

Преобразуем полученную линейную систему уравнений.

Решаем полученную систему линейных уравнений. Коэффициенты аппроксимирующей функции в аналитическом виде определяются следующим образом (метод Крамера):

Данные коэффициенты обеспечивают построение линейной аппроксимирующей функции в соответствии с критерием минимизации суммы квадратов аппроксимирующей функции от заданных табличных значений (экспериментальные данные).

Алгоритм реализации метода наименьших квадратов

1. Начальные данные:

Задан массив экспериментальных данных с количеством измерений N

Задана степень аппроксимирующего многочлена (m)

2. Алгоритм вычисления:

2.1. Определяются коэффициенты для построения системы уравнений размерностью

Коэффициенты системы уравнений (левая часть уравнения)

- индекс номера столбца квадратной матрицы системы уравнений

Свободные члены системы линейных уравнений (правая часть уравнения)

- индекс номера строки квадратной матрицы системы уравнений

2.2. Формирование системы линейных уравнений размерностью .

2.3. Решение системы линейных уравнений с целью определения неизвестных коэффициентов аппроксимирующего многочлена степени m.

2.4.Определение суммы квадратов отклонений аппроксимирующего многочлена от исходных значений по всем узловым точкам

Найденное значение суммы квадратов отклонений является минимально-возможным.

Аппроксимация с помощью других функций

Следует отметить, что при аппроксимации исходных данных в соответствии с методом наименьших квадратов в качестве аппроксимирующей функции иногда используют логарифмическую функцию, экспоненциальную функцию и степенную функцию.

Логарифмическая аппроксимация

Рассмотрим случай, когда аппроксимирующая функция задана логарифмической функцией вида:

Введение

Основным инструментом для решения сложных математических задач в настоящее время являются численные методы, позволяющие свести решение задачи к выполнению конечного числа арифметических действий над числами; при этом результаты получаются в виде числовых значений. Численные методы позволяют получить лишь решение задачи с конкретными значениями параметров и исходных данных.

Многие численные методы разработаны давно, однако при вычислениях вручную они могли использоваться лишь для решения не слишком трудоемких задач. С появлением компьютеров начался период бурного развития численных методов и их внедрения в практику. Только вычислительной машине под силу выполнить за короткое время объем вычислений в миллиарды, триллионы и более операций, необходимых для решения многих современных задач.

Численный метод наряду с возможностью получения результата за приемлемое время должен обладать и ещё одним важным качеством - не вносить в вычислительный процесс значительных погрешностей.

Аппроксимация

При эмпирическом (экспериментальном) изучении функциональной зависимости одной величины от другой производят ряд измерений функции у от каждого конкретного значения аргумента х. Результаты измерений могут быть представлены графически либо в виде таблицы.

Задача заключается в аналитическом представлении функциональной зависимости y от x, описывающей результат этих экспериментов. Особенность задачи - погрешность, ошибки. В ходе эксперимента измеренные значения у i содержат случайные ошибки и ошибки измерений. Задача сводится к тому, что бы получить такую функциональную зависимость, которая складывала все ошибки - сглаживала.

Аппроксимирующую функцию y(x) выбирают из ряда стандартных и простых. Обозначим функциональную зависимость f (x i ; a 1 ; …a n). (1)

Здесь параметры a и n невозможно определить точно, они содержат в себе ошибки. Чтобы получить несмещённые и состоятельные оценки параметров a 1 ; …a n - можно воспользоваться методом наименьших квадратов.

Метод наименьших квадратов позволяет получить несмещенные несостоятельные оценки параметра a 1 ; …a n . При этом предполагается, что измерения смещения функции произведены независимо друг от друга и ошибки подчиняются закону нормального распределения вероятности.

Суть метода. Если все измерения уi ... yn произведены с одинаковой точностью, то оценки параметров a 1 ; …a n определяются из условия, чтобы сумма квадратов отклонения у i была наименьшей.

у i = у i - f (x i ; a 1 ; …a n)

S=(у i - f (x i ; a 1 ; …a n)) 2

Если параметры a 1 ; …a n входят в аппроксимирующую функцию (1) линейно, то система уравнений будет тоже линейной; в тех случаях, когда они не линейны, необходимо преобразовать функциональную зависимость.

Аппроксимация линейной функции

Задача сводится к следующему. Получен ряд значений функции y 1 , y 2 , …,y n при соответствующих значениях аргумента x 1 , x 2 , …,x n . Необходимо найти значения a и b выражения y=ax+b.

S=? (yi-f (a*xi+b)) ^2

dS/da=2*?(yi-a*xi-b)*xi

dS/db=2*?(yi-a*xi-bi)

Раскроем знак суммы:

Yi*xi-a*?xi^2-b*?xi=0

Переобозначим суммы,

где значения A, B, C, D известны из таблицы.

Определив значения a и b, мы решим поставленную задачу определения параметров выражения y=ax+b.

y: -10.29, -6.64, -6.70, -4.31, -3.26, -2.20, -0.08, 1.50, 3.81, 3.62

График полученной функции:

Аппроксимация степенной функции

Задача: Задача сводится к следующему. Получен ряд значений функции y 1 , y 2 , …,y n при соответствующих значениях аргумента x 1 , x 2 , …,x n . Необходимо найти значения a и b выражения y=ax b . Для этого прологарифмируем это выражение:

ln y = b ln x + ln a

и произведем замены:

Тогда получим знакомое выражение для прямой линии:

Выражение минимизируемой функции для этого случая примет вид:

S=? (yi-f(a*xi+b))^2

Решаем систему методом Крамера и находим параметры a и b

Данные: х: 2,4,6,8,10,12,14,16,18,20

у: 0.41, 0.19, 0.10, 0.07, 0.05, 0.04, 0.03, 0.02, 0.02, 0.02

График полученной функции:

Аппроксимация параболической функции

Задача: Задача сводится к следующему. Получен ряд значений функции y 1 , y 2 , …,y n при соответствующих значениях аргумента x 1 , x 2 , …,x n . Необходимо найти значения a и b и с выражения y=ax 2 +bx+c.

Выражение минимизируемой функции для этого случая примет вид:

S=? (yi-f(a*xi^2+b*xi+c))^2

Отыскание a и b сводится к решению системы уравнений:

Дифференцируем, чтобы найти минимумы:

dS/da=?(yi-a*xi^2-b*xi+c)*xi^2=0

dS/db=?(yi-a*xi^2-b*xi+c)*xi=0

dS/dc=?(yi-a*xi^2-b*xi+c)=0

Раскроем знак суммы:

Yi*xi^2-a*?xi^4-b*?xi^3-c*?xi^2=0

Yi-a*?xi^2-b*?xi*yi-c*N=0

Переобозначим суммы:

G - aE - bD - cC = 0

F - aD - bC - cA = 0

B - aC - bA - cN = 0

где A, B, C, D, E, F, G известны из таблицы.

Решаем систему методом Крамера и находим параметры a и b

Определив значения a и b и c, мы решим поставленную задачу определения параметров выражения y=ax 2 +bx+c.

Данные: х: 1,2,3,4,5,6,7,8,9,10

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

НАЦИОНАЛЬНЫЙ МИНЕРАЛЬНО-СЫРЬЕВОЙ УНИВЕРСИТЕТ

«ГОРНЫЙ»

Кафедра АТПП

Математические методы обработки данных

Лабораторная работа № 2

ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ ПО МЕТОДУ ГАИМЕНЬШИХ КВАДРАТОВ

Выполнил: студент гр.АПМ-13 ____ __________ / Озеров Б.А. /

(подпись) (Ф.И.О.)

Проверил: доцент ­­­­­___________ / Иванов П.В. /

(подпись) (Ф.И.О.)

Санкт-Петербург

Цель работы: изучение практических приемов нахождения коэффициентов линейных и нелинейных регрессионных зависимостей и оценки точности аппроксимации с использованием программной среды MathCad.

Линейная аппроксимация.

Дано:

Способы аппроксимации:

line ;

2) решение системы линейных уравнений с помощью конструкции Given – Find .

Выполнение задания:

1) решение системы линейных уравнений, используя функцию line.

Делаем матрицу данных нам величин, а именно x и y. Функция line просто вычисляет быстрым способом, находит не известные коэффициенты. Получаем искомые коэффициенты. Запись в программе MathCad представлена на рис.1

рис.1 решение системы линейных уравнений, используя функцию line

в программе MathCad

2) Конструкция Given – Find использует расчетную методичку, основанную на поиске корня вблизи точки начального приближения.

В блоке Given записывается система уравнений (неравенств), подлежащих решению. Система уравнений должна быть записана после или правее Given. Перед словом Given необходимо указывать начальные приближения для всех переменных. Признаком окончания системы служит Find.

Сначала задаем матрицу данных нам величин, а именно x и y. И задаем начальное приближение А и В, от которых будем начинать искать значения линейного уравнения Ах+В=y. Затем вводим служебное слово Given и после него записываем уравнение, используя знак жирное равно. И в конце написать функцию Find с неизвестными переменными в качестве параметра. Получаем искомые коэффициенты. Запись в программе MathCad представлена на рис.2

Используя метод наименьших квадратов, мы составляем уравнения, которые записываем после слова Given:

рис.2 решение системы линейных уравнений с помощью конструкции Given – Find

в программе MathCad

Вычислили коэффициенты аппроксимирующего полинома линейного уравнения двумя разными способами. Они совпали: (а=А, b=B)