Метод сопряжённых градиентов (Метод Флетчера — Ривcа) — метод нахождения локального экстремума функции на основе информации о её значениях и её градиенте. В случае квадратичной функции в минимум находится не более чем за шагов.
Теорема (о существовании). Существует хотя бы одна система сопряжённых направлений для матрицы , т.к. сама матрица (её собственные вектора) представляет собой такую систему.
Обоснование метода
Нулевая итерация
Иллюстрация последовательных приближений метода наискорейшего спуска (зелёная ломаная) и метода сопряжённых градиентов (красная ломаная) к точке экстремума.
Пусть
Тогда .
Определим направление
так, чтобы оно было сопряжено с :
Разложим в окрестности и подставим :
Транспонируем полученное выражение и домножаем на справа:
Приняв во внимание последнее, получим из выражения (4) окончательную формулу для вычисления :
К-я итерация
На k-й итерации имеем набор .
Тогда следующее направление вычисляется по формуле:
Это выражение может быть переписано в более удобном итеративном виде:
где непосредственно рассчитывается на k-й итерации.
Алгоритм
Пусть — начальная точка, — направление антиградиента и мы пытаемся найти минимум функции . Положим и найдём минимум вдоль направления . Обозначим точку минимума .
Пусть на некотором шаге мы находимся в точке , и — направление антиградиента. Положим , где выбирают либо (стандартный алгоритм — Флетчера-Ривса, для квадратичных функций с ), либо (алгоритм Полака–Рибьера). После чего найдём минимум в направлении и обозначим точку минимума . Если в вычисленном направлении функция не уменьшается, то нужно забыть предыдущее направление, положив и повторив шаг.
Формализация
Задаются начальным приближением и погрешностью:
Рассчитывают начальное направление:
Если или , то и остановка.
Иначе
если , то и переход к 3;
иначе и переход к 2.
Случай квадратичной функции
Теорема. Если сопряжённые направления используются для поиска минимума квадратичной функции, то эта функция может быть минимизирована за шагов, по одному в каждом направлении, причём порядок несущественен.
Литература
Акулич И. Л. Математическое программирование в примерах и задачах: Учеб. пособие для студентов эконом. спец. вузов. — М.: Высш. шк., 1986.
Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. Пер. с англ. — М.: Мир, 1985.
Коршунов Ю. М., Коршунов Ю. М. Математические основы кибернетики. — М.: Энергоатомиздат, 1972.
Максимов Ю. А.,Филлиповская Е. А. Алгоритмы решения задач нелинейного программирования. — М.: МИФИ, 1982.
Максимов Ю. А. Алгоритмы линейного и дискретного программирования. — М.: МИФИ, 1980.
Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. — М.: Наука, 1970. — С. 575—576.
Уравне́ние Шрёдингера — линейное дифференциальное уравнение в частных производных, описывающее изменение в пространстве и во времени чистого состояния, задаваемого волновой функцией, в гамильтоновых квантовых системах.
Однородная функция степени — числовая функция такая, что для любого из области определения функции и любого выполняется равенство:
Усло́вный экстре́мум — максимальное или минимальное значение, которое функция, определённая на множестве и принимающая вещественные значения, достигает в предположении, что значения некоторых других функций с той же областью определения подчинены определённым ограничительным условиям.
Дискретное преобразование Фурье — это одно из преобразований Фурье, широко применяемых в алгоритмах цифровой обработки сигналов, а также в других областях, связанных с анализом частот в дискретном сигнале.
Тензорный анализ — обобщение векторного анализа, раздел тензорного исчисления, изучающий дифференциальные операторы, действующие на алгебре тензорных полей дифференцируемого многообразия . Рассматриваются также операторы, действующие на более общие, чем тензорные поля, геометрические объекты: тензорные плотности, дифференциальные формы со значениями в векторном расслоении.
Градиентный спуск, метод градиентного спуска — численный метод нахождения локального минимума или максимума функции с помощью движения вдоль градиента, один из основных численных методов современной оптимизации.
Волновое уравнение в физике — линейное гиперболическое дифференциальное уравнение в частных производных, задающее малые поперечные колебания тонкой мембраны или струны, а также другие колебательные процессы в сплошных средах и электромагнетизме (электродинамике). Находит применение и в других областях теоретической физики, например при описании гравитационных волн. Является одним из основных уравнений математической физики.
Вселе́нная Фри́дмана — одна из космологических моделей, удовлетворяющих полевым уравнениям общей теории относительности (ОТО), первая из нестационарных моделей Вселенной. Получена Александром Фридманом в 1922. Модель Фридмана описывает однородную изотропную в общем случае нестационарную Вселенную с веществом, обладающую положительной, нулевой или отрицательной постоянной кривизной. Эта работа учёного стала первым основным теоретическим развитием ОТО после работ Эйнштейна 1915—1917 гг.
Фо́рмула Пла́нка — формула, описывающая спектральную плотность излучения, которое создаётся абсолютно чёрным телом определённой температуры. Формула была открыта Максом Планком в 1900 году и названа по его фамилии. Её открытие сопровождалось появлением гипотезы о том, что энергия может принимать только дискретные значения. Эта гипотеза некоторое время после открытия не считалась значимой, но, как принято считать, дала рождение квантовой физике.
Задача Шту́рма — Лиуви́лля, названная в честь Жака Шарля Франсуа Штурма и Жозефа Лиувилля, состоит в отыскании нетривиальных решений на промежутке уравнения Штурма — Лиувилля
Градие́нтные ме́тоды — численные методы решения с помощью градиента задач, сводящихся к нахождению экстремумов функции.
Уравне́ние Гельмго́льца — это эллиптическое дифференциальное уравнение в частных производных:
Звезда́ Хо́джа — важный линейный оператор из пространства q-векторов в пространство (n − q)-форм. Метрический тензор задаёт канонический изоморфизм между пространствами q-форм и q-векторов, поэтому обычно звездой Ходжа называют оператор из пространства дифференциальных форм размерности q в пространство форм размерности n − q.
В математике последовательностью ортогональных многочленов называют бесконечную последовательность действительных многочленов
,
Уравне́ние Ланда́у — Ли́фшица — уравнение, описывающее движение намагниченности в приближении континуальной модели в твердых телах. Впервые введено Л. Д. Ландау и Е. М. Лифшицем в 1935 году.
Пло́ская волна́ — волна, фронт которой плоский.
Координатное пространство — это плоское пространство, которое устанавливает позицию двухмерных объектов при использовании двух опорных осей, которые являются перпендикулярными друг к другу.
Ряд Пеано — бесконечная сумма, в которой слагаемые получены последовательным применением операторов интегрирования и перемножения матриц.
Коприсоединённое представление группы Ли — это представление, сопряжённое к присоединённому. Если — алгебра Ли группы , соответствующее действие на пространстве , сопряжённом к , называется коприсоединённым действием. С геометрической точки зрения оно представляет собой действие левыми сдвигами на пространстве правоинвариантных 1-форм на .
Тождество Похожаева — это интегральное соотношение, которому удовлетворяют стационарные локализованные решения нелинейного уравнения Шредингера или нелинейного уравнения Клейна-Гордона. Оно было получено С.И. Похожаевым и аналогично теореме о вириале. Это соотношение также известно как теорема Д.Г. Деррика. Аналогичные тождества могут быть получены и для других уравнений математической физики.
Эта страница основана на статье Википедии. Текст доступен на условиях лицензии CC BY-SA 4.0; могут применяться дополнительные условия. Изображения, видео и звуки доступны по их собственным лицензиям.