Отношение Рэлея
В математике для данной комплексной эрмитовой матрицы и ненулевого вектора отношение Рэлея[1] определяется следующим образом[2][3]:
Для действительных матриц условие эрмитовости матрицы сводится к её симметричности, а эрмитово сопряжение векторов превращается в обычное транспонирование . Заметьте, что для любой вещественной константы . Напомним, что эрмитова (как и симметричная вещественная) матрица имеет вещественные собственные значения. Можно показать, что для матрицы отношение Рэлея достигает минимального значения (наименьшее собственное число матрицы ) когда равен (соответствующий собственный вектор). Подобным образом можно показать, что и . Отношение Рэлея используется в теореме Куранта-Фишера о минимаксе для получения всех значений собственных чисел[4]. Используется оно и в алгоритмах нахождения собственных значений матрицы для получения приближения собственного значения из приближения собственного вектора. А именно, отношение является базой для итераций с отношением Рэлея[англ.][5][6].
Множество значений отношения Рэлея называется числовым образом матрицы[англ.][7][8].
Специальный случай ковариационных матриц
Ковариационная матрица M для многомерной статистической выборки A (матрицы наблюдений) может быть представлена в виде произведения A' A[9][10]. Будучи симметричной вещественной матрицей, M имеет неотрицательные собственные значения и ортогональные (или приводимые к ортогональным) собственные вектора.
Во-первых, то, что собственные значения не отрицательны:
И, во-вторых, что собственные вектора ортогональны друг другу:
- (если собственные значения различны — в случае одинаковых значений можно найти ортогональный базис).
Теперь покажем, что отношение Рэлея принимает максимальное значение на векторе, соответствующем наибольшее собственное значение. Разложим произвольный вектор по базису собственных нормированных векторов vi:
- , где является проекцией x на
Таким образом, равенство
можно переписать в следующем виде:
Поскольку собственные вектора ортогональны, последнее равенство превращается в
Последнее равенство показывает, что отношение Рэлея является суммой квадратов косинусов углов между вектором и каждым из собственных векторов , умноженных на соответствующее собственное значение.
Если вектор максимизирует , то все вектора, полученные из умножением на скаляр ( для ) также максимизируют R. Таким образом, задачу можно свести к нахождению максимума при условии .
Поскольку все собственные числа не отрицательны, задача сводится к нахождению максимума выпуклой функции и можно показать, что он достигается при и (собственные значения упорядочены по убыванию).
Таким образом, отношение Рэлея достигает максимума на собственном векторе, соответствующему максимальному собственному значению.
Тот же результат с использованием множителей Лагранжа
Тот же результат может быть получен с помощью множителей Лагранжа. Задача состоит в нахождении критических точек функции
- ,
при постоянной величине То есть, нужно найти критические точки функции
где — множитель Лагранжа. Для стационарных точек функции выполняется равенство
и
Таким образом, собственные вектора матрицы M являются критическими точками отношения Рэлея и их собственные значения — соответствующими стационарными значениями.
Это свойство является базисом метода главных компонент и канонической корреляции.
Использование в теории Штурма — Лиувилля
Теория Штурма — Лиувилля заключается в исследовании линейного оператора
- ,
где функции удовлетворяют некоторым специфичным граничным условиям в точках a и b. Отношение Рэлея здесь принимает вид
Иногда это отношение представляют в эквивалентном виде используя интегрирование по частям[11]:
Обобщение
Для любой пары вещественных симметричных положительно определённых матриц и ненулевого вектора , обобщенное отношение Рэлея определяется как
Обобщённое отношение Рэлея можно свести к отношению Рэлея путём преобразования , где — разложение Холецкого матрицы .
См. также
- Числовой образ матрицы[англ.]
Примечания
- ↑ также известно под именем отношение Рэлея-Рица, названного в честь Вальтера Рица и Лорда Рэлея.
- ↑ Horn, R. A. and C. A. Johnson. 1985. Matrix Analysis. Cambridge University Press. pp. 176–180.
- ↑ Parlet B. N. The symmetric eigenvalue problem, SIAM, Classics in Applied Mathematics,1998
- ↑ Беккенбах, 1965, §26 Минимакс-теорема Фишера.
- ↑ Парлетт, 1983, §4.6 Итерации с отношением Релея, p. 87).
- ↑ Вербицкий, 2000, §4.3 Обратные итерации, p. 115.
- ↑ Геворгян.
- ↑ Прасолов, 2008, 2.2 Ядро и образ оператора. Факторпространство., p. 114.
- ↑ Коршунов, 2008, Введение.
- ↑ ACTA, 2005.
- ↑ Haberman, 1987.
Литература
- Б. Парлетт. Симметричная проблема собственных значений. Численные методы. — 1983.
- Э. Беккенббах, Р. Беллман. Неравенства. — Москва «Мир», 1965.
- Richard Haberman. Elementary applied partial differential equations. — Prentice Hall, Englewood, New Jersey, 1987.
- В. М. Вержбицкий. Численные методы (Линейная алгебра и нелинейные уравнения). — Москва «Высшая школа», 2000.
- В. В. Прасолов. Задачи и теоремы линейной алгебры. — Москва, 2008.
- Геворгян Л. З. Некоторые геометрические характеристики числового образа оператора. — Государственный Инженерный Университет Армении. Архивировано 31 августа 2006 года.
- Zdzisław Burda, Jerzy Jurkiewicz, Bartłomiej Wacław. Eigenvalue density of empirical covariance matrix for correlated samples // Acta physica polonica B. — 2005. — Т. 36, вып. 9. — С. 2642.
- Коршунов Ю. М. Получение многомерной статистической выборки с заданными корреляционными свойствами // Вестник РГРТУ. — 2008. — Вып. 23.
- Shi Yu, Léon-Charles Tranchevent, Bart Moor, Yves Moreau. Ch. 2 // Kernel-based Data Fusion for Machine Learning: Methods and Applications in Bioinformatics and Text Mining. — Springer, 2011.