Отношение Рэлея

Перейти к навигацииПерейти к поиску

В математике для данной комплексной эрмитовой матрицы и ненулевого вектора отношение Рэлея[1] определяется следующим образом[2][3]:

Для действительных матриц условие эрмитовости матрицы сводится к её симметричности, а эрмитово сопряжение векторов превращается в обычное транспонирование . Заметьте, что для любой вещественной константы . Напомним, что эрмитова (как и симметричная вещественная) матрица имеет вещественные собственные значения. Можно показать, что для матрицы отношение Рэлея достигает минимального значения (наименьшее собственное число матрицы ) когда равен (соответствующий собственный вектор). Подобным образом можно показать, что и . Отношение Рэлея используется в теореме Куранта-Фишера о минимаксе для получения всех значений собственных чисел[4]. Используется оно и в алгоритмах нахождения собственных значений матрицы для получения приближения собственного значения из приближения собственного вектора. А именно, отношение является базой для итераций с отношением Рэлея[англ.][5][6].

Множество значений отношения Рэлея называется числовым образом матрицы[англ.][7][8].

Специальный случай ковариационных матриц

Ковариационная матрица M для многомерной статистической выборки A (матрицы наблюдений) может быть представлена в виде произведения A' A[9][10]. Будучи симметричной вещественной матрицей, M имеет неотрицательные собственные значения и ортогональные (или приводимые к ортогональным) собственные вектора.

Во-первых, то, что собственные значения не отрицательны:

И, во-вторых, что собственные вектора ортогональны друг другу:

(если собственные значения различны — в случае одинаковых значений можно найти ортогональный базис).

Теперь покажем, что отношение Рэлея принимает максимальное значение на векторе, соответствующем наибольшее собственное значение. Разложим произвольный вектор по базису собственных нормированных векторов vi:

, где является проекцией x на

Таким образом, равенство

можно переписать в следующем виде:

Поскольку собственные вектора ортогональны, последнее равенство превращается в

Последнее равенство показывает, что отношение Рэлея является суммой квадратов косинусов углов между вектором и каждым из собственных векторов , умноженных на соответствующее собственное значение.

Если вектор максимизирует , то все вектора, полученные из умножением на скаляр ( для ) также максимизируют R. Таким образом, задачу можно свести к нахождению максимума при условии .

Поскольку все собственные числа не отрицательны, задача сводится к нахождению максимума выпуклой функции и можно показать, что он достигается при и (собственные значения упорядочены по убыванию).

Таким образом, отношение Рэлея достигает максимума на собственном векторе, соответствующему максимальному собственному значению.

Тот же результат с использованием множителей Лагранжа

Тот же результат может быть получен с помощью множителей Лагранжа. Задача состоит в нахождении критических точек функции

,

при постоянной величине То есть, нужно найти критические точки функции

где — множитель Лагранжа. Для стационарных точек функции выполняется равенство

и

Таким образом, собственные вектора матрицы M являются критическими точками отношения Рэлея и их собственные значения — соответствующими стационарными значениями.

Это свойство является базисом метода главных компонент и канонической корреляции.

Использование в теории Штурма — Лиувилля

Теория Штурма — Лиувилля заключается в исследовании линейного оператора

со скалярным произведением

,

где функции удовлетворяют некоторым специфичным граничным условиям в точках a и b. Отношение Рэлея здесь принимает вид

Иногда это отношение представляют в эквивалентном виде используя интегрирование по частям[11]:

Обобщение

Для любой пары вещественных симметричных положительно определённых матриц и ненулевого вектора , обобщенное отношение Рэлея определяется как

Обобщённое отношение Рэлея можно свести к отношению Рэлея путём преобразования , где разложение Холецкого матрицы .

См. также

Примечания

  1. также известно под именем отношение Рэлея-Рица, названного в честь Вальтера Рица и Лорда Рэлея.
  2. Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176–180.
  3. Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998
  4. Беккенбах, 1965, §26 Минимакс-теорема Фишера.
  5. Парлетт, 1983, §4.6 Итерации с отношением Релея, p. 87).
  6. Вербицкий, 2000, §4.3 Обратные итерации, p. 115.
  7. Геворгян.
  8. Прасолов, 2008, 2.2 Ядро и образ оператора. Факторпространство., p. 114.
  9. Коршунов, 2008, Введение.
  10. ACTA, 2005.
  11. Haberman, 1987.

Литература

  • Б. Парлетт. Симметричная проблема собственных значений. Численные методы. — 1983.
  • Э. Беккенббах, Р. Беллман. Неравенства. — Москва «Мир», 1965.
  • Richard Haberman. Elementary applied partial differential equations. — Prentice Hall, Englewood, New Jersey, 1987.
  • В. М. Вержбицкий. Численные методы (Линейная алгебра и нелинейные уравнения). — Москва «Высшая школа», 2000.
  • В. В. Прасолов. Задачи и теоремы линейной алгебры. — Москва, 2008.
  • Геворгян Л. З. Некоторые геометрические характеристики числового образа оператора. — Государственный Инженерный Университет Армении. Архивировано 31 августа 2006 года.
  • Zdzisław Burda, Jerzy Jurkiewicz, Bartłomiej Wacław. Eigenvalue density of empirical covariance matrix for correlated samples // Acta physica polonica B. — 2005. — Т. 36, вып. 9. — С. 2642.
  • Коршунов Ю. М. Получение многомерной статистической выборки с заданными корреляционными свойствами // Вестник РГРТУ. — 2008. — Вып. 23.
  • Shi Yu, Léon-Charles Tranchevent, Bart Moor, Yves Moreau. Ch. 2 // Kernel-based Data Fusion for Machine Learning: Methods and Applications in Bioinformatics and Text Mining. — Springer, 2011.