Ядерная регрессия

Перейти к навигацииПерейти к поиску

Ядерная регрессия (англ. kernel regression) — непараметрический статистический метод, позволяющий оценить условное математическое ожидание случайной величины. Его смысл заключается в поиске нелинейного отношения между парой случайных величин X и Y.

В любой непараметрической регрессии условное матожидание величины относительно величины можно записать так:

где — некая неизвестная функция.

Ядерная регрессия Надарая — Уотсона

Надарая и Уотсон одновременно (в 1964 году) предложили оценивать как локально взвешенное среднее, где веса определялись бы ядром[1][2][3]. Оценка Надарая — Уотсона:

где — ядро с шириной окна . Знаменатель представляет собой весовой член с единичной суммой.

Получение

Находя ядерную оценку плотности для совместного распределения f(x,y) и распределения f(x) с ядром K,

,
,

получаем

это и есть оценка Надарая — Уотсона.

Ядерная оценка Пристли — Чжао

Ядерная оценка Гассера — Мюллера

где

В статистических пакетах

  • MATLAB: свободно распространяемый инструментарий для ядерных регрессий, оценок плотности и проч. доступны по ссылке (является приложением к книге[4]).
  • Stata: kernreg2
  • R: функция npreg в пакете np способна построить ядерную регрессию[5][6].
  • Python: пакет kernel_regression (расширение sklearn).
  • GNU Octave: математический программный пакет.

Примечания

  1. Nadaraya, E. A. On Estimating Regression (англ.) // Theory of Probability and its Applications[англ.] : journal. — 1964. — Vol. 9, no. 1. — P. 141—142. — doi:10.1137/1109020.
  2. Watson, G. S. Smooth regression analysis (неопр.) // Sankhyā: The Indian Journal of Statistics, Series A. — 1964. — Т. 26, № 4. — С. 359—372. — JSTOR 25049340.
  3. Bierens, Herman J. The Nadaraya–Watson kernel regression function estimator // Topics in Advanced Econometrics (неопр.). — New York: Cambridge University Press, 1994. — С. 212—247. — ISBN 0-521-41900-X.
  4. Horová, I.; Koláček, J.; Zelinka, J. Kernel Smoothing in MATLAB: Theory and Practice of Kernel Smoothing (англ.). — Singapore: World Scientific Publishing, 2012. — ISBN 978-981-4405-48-5.
  5. np: Nonparametric kernel smoothing methods for mixed data types. Дата обращения: 31 августа 2017. Архивировано 17 августа 2020 года.
  6. Kloke, John; McKean, Joseph W. Nonparametric Statistical Methods Using R (англ.). — CRC Press, 2014. — P. 98—106. — ISBN 978-1-4398-7343-4.

Литература

Ссылки