Гипотеза Спирмена

Перейти к навигацииПерейти к поиску

Гипотеза Спирмена — вариант объяснения различий результатов в тестах интеллекта среди представителей разных рас. Изначальная формулировка была высказана Ч. Спирменом[1] и гласила, что величина различий результатов темнокожих и белых в тестах на когнитивные способности положительно связана с тем, какие факторные нагрузки имеют эти тесты по общему фактору интеллекта (фактору g). Более поздняя формулировка утверждает, что величина различий в средних оценках по тестам когнитивных способностей между выборками темнокожих и белых полностью или в основном зависит от степени, в которой данные тесты измеряют общие умственные способности, или фактор g. Её предложил в своих работах А. Дженсен[2], разделив также сильный и слабый варианты этого утверждения.

Источник расовых различий в интеллекте и, соответственно, в оценках по тестам интеллекта Спирмен и Дженсен видели в биологических предпосылках. Их идеи была с интересом воспринята многими исследователями расовых различий. Например, Дж. Ф. Раштон[англ.] часто обращался к данным Спирмена и Дженсена в своих исследованиях, утверждая, что в основе интеллектуального разрыва между расами лежит генетика[3]. Его работы, однако, неоднократно критиковали за расизм[4] и неточности изложения привлекаемых данных. В 2020 году факультет психологии университета Западного Онтарио официально заявил о признании большей части идей Раштона расистскими[5].

Хотя изначально гипотеза была призвана объяснить лишь различия между представителями популяций белых и темнокожих, в более поздних исследованиях начались попытки перенести её на результаты сравнения разных этнических и национальных групп.

Краткая история

С самого начала исследований интеллекта была замечена разница между средними тестовыми оценками, получаемыми на темнокожих и белых выборках. Однако величина этой разницы варьировалась в зависимости от выполняемого когнитивного теста. Различия в результатах представителей данных групп, а также нестабильность величины этих различий в разных тестах теоретически могут быть связаны:

  1. с характеристиками самого теста (культурной нагруженностью, языковыми особенностями и т. д.);
  2. с различиями в развитии отдельных когнитивных способностей у представителей разных выборок;
  3. с тем, как данный тест измеряет общие умственные способности (фактор g).

Последнее объяснение было развито из наблюдения, сделанного Ч. Спирменом в работе 1927 года[1]. Комментируя исследование, в котором 10 тестов применялись для измерения когнитивных способностей у белых и темнокожих американских детей, он отметил, что, хотя темнокожие дети в среднем получают более низкие баллы по всем тестам, разница с результатами белых детей сильнее выражена в тех из них, которые имеют бо֜льшие факторные нагрузки по фактору g. В логике факторного анализа это означает, что результаты решения таких тестов в большей степени зависят от уровня общих умственных способностей испытуемых.

В 1985 году А. Дженсен с опорой на идеи Спирмена явно сформулировал гипотезу, которой и присвоил имя последнего. Дженсен описал её в двух вариантах: сильном и слабом.

  • Сильный вариант утверждает, что различия результатов в тестах интеллекта между популяциями темнокожих и белых обусловлены исключительно вариативностью общего интеллекта.
  • Слабый вариант утверждает, что различия результатов в тестах интеллекта между популяциями темнокожих и белых обусловлены в большей степени вариативностью общего интеллекта.

Пытаясь найти эмпирическое подтверждение выдвигаемой гипотезе Дженсен использовал слабый вариант формулировки. Им в основном пользовались и другие исследователи.

В 1998 году Дж. Ф. Раштон[англ.] ввёл в научный обиход понятие «эффект Дженсена»[6] для обозначения случаев значимой положительной связи факторных нагрузок по фактору g в субтестах интеллекта с некоторой переменной Х. Он обобщил явления такой связи с рядом биологических характеристик в контексте своей наследственной теории расовых различий.

Через некоторое время стали появляться работы, в которых проверялась применимость гипотезы Спирмена не только в отношении различия темнокожих и белых, но и в отношении разных национальностей[7], этносов, а также их локальных популяций[8]. Так исследователи пытались определить степень универсальности гипотезы. Некоторое влияние на смену фокуса исследований оказала активно развернувшаяся в научных кругах дискуссия о критериях выделения рас, а также социальные движения против расизма.

В XXI веке, несмотря на неоднократное подтверждение связи различий оценок с факторными нагрузками по фактору g, появляются данные, не согласующиеся с предложенной Дженсеном гипотезой. Вопрос интерпретации этой связи остаётся открытым в связи с неутихающими дискуссиями о научном расизме и этических аспектах расовых исследований. Основное внимание позднейших работ, посвящённых гипотезе Спирмена, направлено на выявление широты области популяционных различий, к которой она может быть применена, а также на усовершенствование метода её проверки.

Метод проверки гипотезы

Спирмен выдвинул свою идею, не имея прямого эмпирического её подтверждения. Процедура оценки данной гипотезы описана Дженсеном как метод коррелированных векторов (MCV)[2].

Порядок проведения

В общем виде классическая процедура выглядит следующим образом. Целевые выборки проходят одни и те же тесты интеллекта. Далее для каждой группы в отдельности проводится процедура эксплораторного факторного анализа или анализа главных компонент (PCA). В качестве фактора g выделяется первая главная компонента, первый главный фактор или фактор второго порядка (как утверждает Дженсен, принципиальной вычислительной разницы между тремя этими вариантами нет). Далее вычисляется степень схожести паттернов факторный нагрузок в двух выборках, для этого используется коэффициент конгруэнтности, высокие значения которого указывают на близкие показатели факторный нагрузок тестов в двух выборках.

Среднее значение различий между группами берётся в стандартизированном виде — его показателем выступает величина эффекта (d Коэна).

Основным для непосредственной проверки гипотезы Спирмена является вычисление корреляции между значениями величины эффекта и факторными нагрузками тестов по первому главному фактору. При этом берутся факторные веса большей по объёму выборки (при условии конгруэнтности их значений с меньшей). Дженсен использовал в своих исследованиях метод ранговой корреляции Спирмена, указывая на то, что он не требует допущений относительно дисперсии используемых данных.

Респонденты

Отдельно Дженсен подчёркивал, что сравниваемые группы не должны отбираться специальным образом по критерию высоких показателей интеллекта, в противном случае репрезентативность данных утрачивается, что играет не в пользу гипотезы.

Используемые тесты

Исследования, проводимые в рамках когнитивной подхода к изучению интеллекта, неоднократно показывали, что простые тесты, построенные на времени реакции, имеют меньшие факторные веса по фактору g, чем комплексные психометрические тесты. Поэтому чаще в подобных исследованиях применяются именно психометрические тесты интеллекта, хотя в литературе приводятся и показательные случаи различий результатов в исполнении простых заданий (таких как прямое и обратное воспроизведение чисел) с разным вкладом в фактор общего интеллекта.

В последних исследованиях наряду с тестами способностей для проверки гипотезы Спирмена стали использовать также тесты академических достижений, составленные на основе образовательного материала[7]. Такое изменение связано с критикой идеи гипотезы, которая будет обсуждаться ниже.

Связь с другими эффектами

Эффект Флинна и анти-эффект Флинна[9]

В 1980-е годы Дж. Флинн обобщил данные о повышении среднего балла по тестам интеллекта приблизительно на 3 единицы в 10 лет. Такой поколенческий рост интеллектуальной способности и был назван эффектом Флинна. Позже в скандинавских странах было зафиксировано обратное явление — спад среднего балла в более поздних когортах. Подобное изменение тенденции позже зарегистрировали и в других странах и назвали его анти-эффектом Флинна, или обратным эффектом Флинна.

Научным сообществом обсуждаются четыре варианта объяснения двух этих явлений: социокультурный, статистический, биологический и гибридный. В рамках биологического и гибридного объяснения рассматривается возможность отнесения эффекта и анти-эффекта Флинна к «эффектам Дженсена». В этом случае предполагается, что рост баллов по тестам и, соответственно, интеллектуальных способностей происходит за счёт увеличения уровня общего интеллекта, имеющего биологический источник. Свидетельством в пользу этого предположения было бы большее изменение баллов по субтестам с более высокими факторными нагрузками по фактору g.

В исследовании[10] 2012 года авторы предприняли попытку проверить данное предположение. Они получили значимую положительную связь величины анти-эффекта Флинна для разных субтестов с факторными нагрузками на g. Это говорит о возможности рассмотрения анти-эффекта Флинна как «эффекта Дженсена» и хотя бы частичного объяснения снижения интеллекта через биологические факторы. Важно отметить, однако, что значимой корреляции с величиной классического эффекта Флинна не было обнаружено, что с одной стороны играет против биологического объяснения, а с другой может сигнализировать о различной природе наблюдаемых явлений. Последнее объясняется в рамках гибридного варианта через компенсацию биологического снижения интеллектуальных способностей экономическими и социокультурными улучшениями.

Закон «убывающей отдачи» (SLODR — Spearman’s Law of Deminishing Returns)

Другое известное наблюдение Спирмена заключается в том, что у людей с высокими баллами интеллекта фактор g объясняет меньшую часть индивидуальных различий в результатах по тестам когнитивных способностей. Хотя такая дифференциация способностей у групп с высоким интеллектом не связана напрямую с гипотезой Спирмена, в основе её могут лежать схожие механизмы.

Обсуждение и критика

Критика метода

Некоторые спорные моменты в процедуре обсуждались уже самим Дженсеном[2].

Прежде всего, уже упоминавшаяся неопределённость показателя, который следует принимать за g. Всё же логика факторного анализа и метода главных компонент приводит к несколько различающейся психологической интерпретации результатов даже при численном сходстве. Более того, описанная процедура требует принять допущение, что в каждом тесте первый главный фактор выражает один и тот же концепт g, что далеко не всегда так. В конечном счёте, в зависимости от специфики тестов, они могут оказаться выражением таких широких факторов как флюидный и кристаллизованный интеллект, что уводит от изначальной гипотезы.

Второй проблемный аспект — это применяемый метод корреляции. Коэффициент корреляции Пирсона считается более точным показателем линейной зависимости переменных, однако он находится под сильным влиянием характеристик распределения данных. В случае же факторных весов и значений величины эффекта трудно говорить о статистической независимости данных, а также их нормальном распределении.

Уже в 1985 году Дж. Шёнеман[11] предположил, что корреляция между величиной различий в выборках темнокожих и белых с нагрузкой тестов по первому компоненту (фактору g) может быть статистическим артефактом. Свои соображения он аргументировал тем, что межгрупповые различия вносят свой вклад в дисперсию результатов по интеллектуальным тестам и в условиях, когда первый главный фактор объясняет наибольшую дисперсию, корреляция различий с факторными нагрузками неизбежна.

Тем не менее, данные некоторых исследований опровергают подобное объяснение. Так, корреляция для групп глухих и хорошо слышащих оказалась, во-первых, незначительной, во-вторых, отрицательной, что выражает совершенно другие паттерны, нежели при рассмотрении расовых различий[12]. Хотя неоспоримо, что при сравнении глухих и хорошо слышащих имеют место групповые различия.

В попытках улучшить процедуру проверки исследователи предложили использовать вместо классического метода коррелированных векторов мультигрупповой конфирматорный факторный анализ (MGCFA), который принимает во внимание также и получаемую факторную модель. Применение этого метода снимает также вопрос о выборе параметрического или непараметрического коэффициента корреляции. Стоит заметить, что одна из работ[13], проведённых с использованием MGCFA, не подтвердила данные двух более ранних исследований о соответствии их результатов гипотезе Спирмена. Хотя этот факт не отменяет все подтверждающие гипотезу результаты, он заставляет с большей осторожностью относится к быстрым и однозначным выводам.

Критика идеи

Помимо метода проверки критике подвергаются спирменовская и дженсеновская интерпретации получаемых результатов. Как уже упоминалось, факт положительной корреляции различий по тестам интеллекта с нагрузкой по g Спирмен объяснял наличием различий в группах темнокожих и белых общего уровня интеллекта, что напрямую вытекало из его теоретических представлений об общем факторе интеллекта как генетически обусловленном энергетическом потенциале. Дженсен в свою очередь при анализе эмпирических данных делал упор на различия в скорости протекания элементарных психических процессов, также отражающей биологические свойства индивидов.

Ещё до этого, однако, высказывались предположения о том, что наблюдаемый эффект является производным исключительно тестовых характеристик, таких как культурная нагруженность и языковые особенности. Хотя Дженсен в своих трудах[2] обращается к работам, специально исследовавшим вопрос культурных различий и различий в выполнении вербальных и невербальных тестов, их результаты не подтверждают влияния таких тестовых особенностей на групповые различия в выполнении. Тем не менее продолжают появляться статьи, которые в той или иной степени критикуют объяснение феномена исключительно через фактор g.

Так, в нидерландском исследовании[14] делается предположение о том, что выделяемый факторно g совокупно отражает не только сложность теста в аспекте когнитивной нагрузки и скорости обработки информации, но также агрегирует некоторые культурные характеристики теста. На выборках нидерландских детей и детей-мигрантов второго поколения авторы попытались проверить связь полученных различий в оценках с разложенным на культурно-вербальный аспект и аспект когнитивной сложности общим выделяемым фактором g. Исследователи получили результат, подтверждающий положительную корреляцию между культурно-вербальной нагруженностью (названной агрегированным с — от обозначения кристаллизованного интеллекта) и различиями выполнения. Связь же с общим g (как выражением когнитивной сложности) оказалась отрицательной. Это исследование мало согласуется с уже накопленным массивом подтверждающих гипотезу данных и требует внимательного осмысления причин такого рассогласования — лежат они в неверной классической трактовке явления или в методических ошибках исследования.

Ссылки

  1. 1 2 Spearman C. The Abilities of Man. — New York: MacMillan, 1927.
  2. 1 2 3 4 Arthur R. Jensen. The nature of the black–white difference on various psychometric tests: Spearman's hypothesis (англ.) // Behavioral and Brain Sciences. — 1985-07. — Vol. 8, iss. 2. — P. 193–219. — ISSN 0140-525X 1469-1825, 0140-525X. — doi:10.1017/S0140525X00020392. Архивировано 28 октября 2022 года.
  3. J. Philippe Rushton. Race differences and r/K theory: A reply to Silverman (англ.) // Ethology and Sociobiology. — 1990-03-01. — Vol. 11, iss. 2. — P. 131–140. — ISSN 0162-3095. — doi:10.1016/0162-3095(90)90033-3. Архивировано 28 января 2012 года.
  4. Halford H. Fairchild. Scientific Racism: The Cloak of Objectivity (англ.) // Journal of Social Issues. — 1991-10. — Vol. 47, iss. 3. — P. 101–115. — doi:10.1111/j.1540-4560.1991.tb01825.x.
  5. Dr. Philippe Rushton (англ.). www.psychology.uwo.ca. Дата обращения: 28 октября 2022. Архивировано 28 октября 2022 года.
  6. Roberto Colom, Manuel Juan-Espinosa, Luı́s F. Garcı́a. The secular increase in test scores is a “Jensen effect” (англ.) // Personality and Individual Differences. — 2001-03-01. — Vol. 30, iss. 4. — P. 553–559. — ISSN 0191-8869. — doi:10.1016/S0191-8869(00)00054-4.
  7. 1 2 Russell T. Warne. Testing Spearman's hypothesis with advanced placement examination data (англ.) // Intelligence. — 2016-07-01. — Vol. 57. — P. 87–95. — ISSN 0160-2896. — doi:10.1016/j.intell.2016.05.002.
  8. Jan te Nijenhuis, Hanna David, Daniel Metzen, Elijah L. Armstrong. Spearman's hypothesis tested on European Jews vs non-Jewish Whites and vs Oriental Jews: Two meta-analyses (англ.) // Intelligence. — 2014-05-01. — Vol. 44. — P. 15–18. — ISSN 0160-2896. — doi:10.1016/j.intell.2014.02.002. Архивировано 11 мая 2019 года.
  9. Валуева Е. А., Белова С. С. Эффект Флинна: обзор современных данных // Психология. Журнал Высшей школы экономики. — 2015. — Т. 12, № 4. — С. 165—183. Архивировано 28 октября 2022 года.
  10. Michael A. Woodley, Gerhard Meisenberg. In the Netherlands the anti-Flynn effect is a Jensen effect (англ.) // Personality and Individual Differences. — 2013-06-01. — Vol. 54, iss. 8. — P. 871–876. — ISSN 0191-8869. — doi:10.1016/j.paid.2012.12.022. Архивировано 25 февраля 2022 года.
  11. Jeffery P. Braden. Fact or artifact? An empirical test of Spearman's Hypothesis (англ.) // Intelligence. — 1989-04-01. — Vol. 13, iss. 2. — P. 149–155. — ISSN 0160-2896. — doi:10.1016/0160-2896(89)90013-5.
  12. Jeffery P. Braden. The factorial similarity of the WISC-R performance Scale in deaf and hearing samples (англ.) // Personality and Individual Differences. — 1984-01-01. — Vol. 5, iss. 4. — P. 403–409. — ISSN 0191-8869. — doi:10.1016/0191-8869(84)90005-9.
  13. Conor V. Dolan, Willemijn Roorda, Jelte M. Wicherts. Two failures of Spearman's hypothesis: The GATB in Holland and the JAT in South Africa (англ.) // Intelligence. — 2004-03-01. — Vol. 32, iss. 2. — P. 155–173. — ISSN 0160-2896. — doi:10.1016/j.intell.2003.09.001. Архивировано 9 января 2013 года.
  14. Michelle Helms-Lorenz, Fons J. R Van de Vijver, Ype H Poortinga. Cross-cultural differences in cognitive performance and Spearman's hypothesis: g or c? (англ.) // Intelligence. — 2003-01-01. — Vol. 31, iss. 1. — P. 9–29. — ISSN 0160-2896. — doi:10.1016/S0160-2896(02)00111-3. Архивировано 14 июля 2012 года.

См. также