Последовательный статистический критерий — последовательная статистическая процедура, используемая для проверки статистических гипотез в последовательном анализе.
Пусть наблюдению в статистическом эксперименте доступна случайная величина
с неизвестным (полностью или частично) распределением
(формально, в математической нотации,
, где вероятностное пространство
снабжено
-алгеброй событий
, и
измерима относительно Борелевской
-алгебры).
Пусть проверяется нулевая гипотеза
против альтернативы
.
На каждом этапе
статистического эксперимента, независимо от других этапов, наблюдается случайная величина
— копия
, до тех пор пока
, где
— некоторый (случайный) момент остановки. Последовательный статистический критерий — это пара
, где
— любая функция от
, принимающая значение 0 или 1 (решение, соответственно, в пользу нулевой
или альтернативной
гипотезы).
Этому определению может быть придан формальный смысл с помощью понятия момента остановки относительно последовательности
-алгебр
, порожденных случайными величинами
,
. Тогда решающая функция
должна быть измеримой относительно
-алгебры
событий, предшествующих моменту
:
.
Функция мощности критерия
в "точке"
определяется как
. Если
, то
называется вероятностью ошибки первого рода (вероятность отвергнуть нулевую гипотезу, когда она верна). Если
, то
называется вероятностью ошибки второго рода (вероятность принять нулевую гипотезу, когда она неверна).
Рандомизированные последовательные критерии
Рандомизированный последовательный критерий проверки гипотез может быть определен как пара
, где
,
, и
,
- (измеримые) функции, принимающие значения между 0 и 1,
. На каждом этапе
(если эксперимент до него дошел)
интерпретируется как вероятность остановится на этом этапе, без проведения дальнейших наблюдений, а
- как вероятность отвергнуть нулевую гипотезу, если остановка на этом этапе произошла.
называется рандомизированным правилом остановки, а
- рандомизированным правилом принятия решения.
Если все
принимают только значения 0 (продолжение наблюдений) и 1 (остановка), то правило остановки
определяет нерандомизированный момент остановки
. Аналогично, если все
принимают только значения 0 (принятие нулевой гипотезы) и 1 (отвержение нулевой гипотезы), то правило принятия решения
определяет нерандомизированную решающую функцию:
, если
.
Функция мощности критерия
в "точке"
определяется как
, где
- математическое ожидание относительно
. Если
, то
- вероятность ошибки первого рода. Если
, то вероятность ошибки второго рода равна
, где
. Соответственно, средний объем выборки при использовании правила остановки
определяется как
, если
(в противном случае
).
Пример
Последовательный критерий отношения вероятностей (критерий Вальда)
Ссылки
- Ширяев А. Н. Статистический последовательный анализ. Оптимальные правила остановки — М.: Наука, 1976.
- Ghosh, M., Mukhopadhyay, N., and Sen, P.K. Sequential Estimation, New York: Wiley, 1997.