Квартет Энскомба

Перейти к навигацииПерейти к поиску

Квартет Энскомба — четыре набора числовых данных, у которых простые статистические свойства идентичны, но их графики существенно отличаются. Каждый набор состоит из 11 пар чисел. Квартет был составлен в 1973 году английским математиком Ф. Дж. Энскомбом[англ.] для иллюстрации важности применения графиков для статистического анализа и влияния выбросов значений на свойства всего набора данных.

Все наборы обладают такими свойствами:

Характеристика Значение
Среднее значение переменной 9.0
Дисперсия переменной 10,0
Среднее значение переменной 7,5
Дисперсия переменной 3,75
Корреляция между переменными и 0,816
Прямая линейной регрессии
Коэффициент детерминации линейной регрессии 0,67

Сами последовательности приведены ниже. Значение одинаковы для первых трёх последовательностей.

Четыре набора данных имеют идентичные статистические характеристики, но их графики существенно различаются.
Квартет Энскомба
I II III IV
x y x y x y x y
10,08,0410,09,1410,07,468,06,58
8,06,958,08,148,06,778,05,76
13,07,5813,08,7413,012,748,07,71
9,08,819,08,779,07,118,08,84
11,08,3311,09,2611,07,818,08,47
14,09,9614,08,1014,08,848,07,04
6,07,246,06,136,06,088,05,25
4,04,264,03,104,05,3919,012,50
12,010,8412,09,1312,08,158,05,56
7,04,827,07,267,06,428,07,91
5,05,685,04,745,05,738,06,89

См. также

Ссылки

  • F.J. Anscombe, "Graphs in Statistical Analysis", American Statistician, 27 (February 1973), 17-21.
  • Tufte, Edward R. (2001). The Visual Display of Quantitative Information, 2nd Edition, Cheshire, CT: Graphics Press. ISBN 0961392142
  • Sangit Chatterjee and Aykut Firat (2007). «Generating Data with Identical Statistics but Dissimilar Graphics: A Follow up to the Anscombe Dataset», American Statistician, 61(3), 248—254. doi:10.1198/000313007X220057