Выпуклое сопряжение функции — это обобщение преобразования Лежандра, которое применяется к невыпуклым функциям. Оно известно также как преобразование Лежандра — Фенхеля или преобразование Фенхеля (по именам Адриена Мари Лежандра и Вернера Фенхеля). Сопряжение используется для преобразования задачи оптимизации в соответствующую двойственную задачу, которую, возможно, проще решить.
Определение
Пусть будет вещественным топологическим векторным пространством и пусть будет двойственным пространством для . Обозначим двойственную пару[англ.] через
Для функции
- ,
принимающей значения на расширенной числовой прямой, выпуклое сопряжение
определено в терминах супремума по формуле
или, эквивалентно, в терминах инфимума по формуле
Это определение можно интерпретировать как кодирование выпуклой оболочки надграфика функции в терминах её опорных гиперплоскостей[1][2].
Примеры
Выпуклое сопряжение аффинной функции
равно
Выпуклое сопряжение степенной функции
равно
где
Выпуклое сопряжение функции абсолютной величины
равно
Выпуклое сопряжение показательной функции равно
Выпуклое сопряжение и преобразование Лежандра показательной функции совпадают за исключением того, что область определения выпуклого сопряжения строго шире, поскольку преобразование Лежандра определено лишь для положительных вещественных чисел.
Связь с ожидаемыми потерями (средняя цена риска)
Пусть F означает интегральную функцию распределения случайной величины X. Тогда (интегрируя по частям),
имеет выпуклое сопряжение
Упорядочение
Конкретная интерпретация имеет преобразование
как неубывающую перегруппировку начальной функции f. В частности, для не убывает.
Свойства
Выпуклое сопряжение замкнутой выпуклой функции[англ.] снова является замкнутой выпуклой функцией. Выпуклое сопряжение полиэдральной выпуклой функции (выпуклой функции с многогранным надграфиком) снова является полиэдральной выпуклой функцией.
Обращение порядка
Выпуклое сопряжение обращает порядок — если , то . Здесь
Для семейства функций это следует из факта, что супремумы могут быть переставлены местами
и из max–min неравенства[англ.]
Двойное сопряжение
Выпуклое сопряжение функции всегда полунепрерывно снизу. Двойное сопряжение (выпуклое сопряжение выпуклого сопряжения) является также замкнутой выпуклой оболочкой, то есть наибольшей полунепрерывной снизу выпуклой функцией с . Для выпуклых собственных функций[англ.] тогда и только тогда, когда f выпукла и полунепрерывна снизу по теореме Фенхеля — Моро.
Неравенство Фенхеля
Для любой функции f и её выпуклого сопряжения неравенство Фенхеля (известное также как неравенство Фенхеля — Моро) выполняется для любого и :
Доказательство следует немедленно из определения выпуклого сопряжения: .
Выпуклость
Для двух функций и и числа выполняется
- .
Здесь операция — это выпуклое отображение в себя.
Инфимальная конволюция
Инфимальная конволюция двух функций f и g определяется как
Пусть f1, …, fm будут правильными выпуклыми полунепрерывными снизу функциями на . Тогда инфимальная конволюция выпукла и полунепрерывна снизу (но не обязательно будет правильной функцией)[3] и удовлетворяет равенству
Инфимальная конволюция двух функций имеет геометрическую интерпретацию — (строгий) надграфик инфимальной конволюции двух функций равен сумме Минковского (строгих) надграфиков этих функций[4].
Максимизирующий аргумент
Если функция дифференцируема, то её производная является максимизирующим аргументом при вычислении выпуклого сопряжения:
- и
откуда
и, более того,
Масштабирующие свойства
Если для некоторого , то
В случае дополнительного параметра (скажем, ), более того,
где где выбирается максимизирующим аргументом.
Поведение при линейных преобразованиях
Пусть A будет ограниченным линейным оператором из X в Y. Для любой выпуклой функции f на X, имеем
где
является прообразом f для A, а A* является сопряжённым оператором для A[5].
Замкнутая выпуклая функция f симметрична для заданного множества G ортогональных линейных преобразований
тогда и только тогда, когда выпуклое сопряжение f* симметрично для G.
Таблица некоторых выпуклых сопряжений
Следующая таблица даёт преобразования Лежандра для многих часто употребимых функций, а также для нескольких полезных свойств[6].
| | | |
---|
(где ) | | | |
| | | |
(где ) | | | |
| | | |
(где ) | | (где ) | |
(где ) | | (где ) | |
| | | |
| | | |
| | | |
| | | |
| | | |
См. также
Примечания
- ↑ Legendre Transform (неопр.). Дата обращения: 14 апреля 2019. Архивировано 28 июля 2020 года.
- ↑ Frank Nielsen. Legendre transformation and information geometry (неопр.). Дата обращения: 19 апреля 2019. Архивировано 11 ноября 2013 года.
- ↑ Phelps, 1991, с. 42.
- ↑ Bauschke, Goebel, Lucet, Wang, 2008, с. 766.
- ↑ Иоффе, Тихомиров, 1974, с. утверждение 3.4.3.
- ↑ Borwein, Lewis, 2006, с. 50–51.
Литература
- Robert R. Phelps. Convex Functions, Monotone Operators and Differentiability. — Springer, 1991. — ISBN 0-387-56715-1.
- Heinz H. Bauschke, Rafal Goebel, Yves Lucet, Xianfu Wang. The Proximal Average: Basic Theory // SIAM Journal on Optimization. — 2008. — Т. 19, вып. 2. — doi:10.1137/070687542.
- Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. — М.: «Наука», 1974.
- Jonathan Borwein, Adrian Lewis. Convex Analysis and Nonlinear Optimization: Theory and Examples. — Springer, 2006. — ISBN 978-0-387-29570-1.
- Владимир Игоревич Арнольд. Математические методы классической механики. — М.: «Наука», 1989.
- R. Tyrrell Rockafellar. Convex Analysis. — Princeton: Princeton University Press, 1970. — ISBN 0-691-01586-4.
Ссылки