Скрытые переменные
Скрытые переменные внушают нам ложную мысль о том, что причины либо нет, либо ее слишком сложно найти. Громадные размеры мира также играют определенную роль, как и все невидимые струны, соединяющие его части. Мы мыслим в локальных терминах, не рассматривая множество взаимодействий между составными частями нашего мира – от субатомных частиц до галактик.
Иногда кажется, что у двух абсолютно независимых переменных появляется статистическая связь через третью переменную. Когда такое происходит, мы обнаруживаем иллюзорную корреляцию, вызванную тем, как мы видим данные или как эти данные организованы. Если бы мы простодушно собрали данные об оценках и о длине волос учеников в математическом классе, возможно, мы обнаружили бы корреляцию между длиной волос и оценками. У длинноволосых, скорее всего, будут хорошие оценки. Если мы не посмотрим на третью переменную, то можем заключить из этой корреляции, что ученикам, чтобы получать хорошие оценки, следует отрастить волосы. Мы не настолько наивны, чтобы не замечать третью переменную – скажем, возраст или пол. Длина волос как показатель может искажаться среди более старших учеников или среди женщин, у которых волосы были длиннее, чем у мужчин{100}. Другим примером будет корреляция между доходами во взрослой жизни и отметками в колледже. Мы можем сделать ошибочный вывод, что доход во взрослой жизни зависит от оценок, которые человек получал в школе, тогда как в действительности скрытой переменной был объем работы, который ученик был готов усердно выполнять{101}.
Скрытые переменные встречаются в корреляциях, статистических данных повсеместно. Если не замечать эти скрытые переменные, то придется верить во всевозможный вздор: например, в то, что для хорошей успеваемости в колледже ученику следует начать курить, потому что «у курильщиков оценки в колледже лучше, чем у некурящих». Или возьмем более серьезный пример. До последнего времени на Новых Гебридах – группе островов на юге Тихого океана – было распространено убеждение, что вши полезны для здоровья. В течение веков старейшины случайно замечали, что у здоровых местных жителей были вши, а у больных их не было. Они пришли к выводу, что вши положительно влияли на здоровье. В условиях более тщательного и контролируемого исследования было замечено, что вши были почти у всех туземцев большую часть времени. Вши также могли вызывать лихорадку, что, в свою очередь, вызывало гибель вшей. Путаница возникала из-за того, что у нездоровых людей случалась лихорадка и поэтому у них не было вшей. «Вот где причина и следствие искажены до неузнаваемости, перевернуты и перемешаны», – написал Даррелл Хафф в своей книге «Как лгать при помощи статистики»{102}, которой сейчас уже больше 60 лет, но она все еще остается бестселлером. В СМИ полно всевозможных странных сюжетов, пытающихся нас в чем-то убедить, основанных только на данных опросов: использование пестицидов в сельском хозяйстве вызывает аутизм; линии электропередач вызывают опухоли мозга; чай из корня васаби – миорелаксант; 9 из 10 докторов считают, что употребление каши на завтрак способствует оздоровлению; дети с длинными руками лучше строят логические рассуждения, чем их сверстники с более короткими руками; и прогулки в сосновом лесу раз в неделю снижают уровень гормона стресса кортизола, артериальное давление и частоту сердечных сокращений. Женщинам следует принимать эстроген, чтобы уменьшить шанс сердечного приступа. Эстрогенная терапия увеличивает шанс сердечного приступа у женщин, уже переживших сердечный приступ. Эстрогенная терапия может защитить женщин от остеопороза и, возможно, рака толстого кишечника, но также может увеличить шанс сердечных заболеваний, инсульта, тромбоза, рака груди и слабоумия{103}.
Известен классический случай ошибки сэра Рональда Элмера Фишера. Для многих биологов и статистиков Фишер – отец современной статистики и теории планирования экспериментов. Он родился в 1890 г. в пригороде Лондона, а умер в 1962 г. в Аделаиде, Австралия, от рака прямой кишки. Ричард Докинз назвал Фишера величайшим биологом со времен Дарвина.
Фишер был человеком огромного обаяния и доброты, пытливым мыслителем с широким кругом интересов, человеком, страстно приверженным научным исследованиям, первоклассным собеседником, но он также время от времени демонстрировал суровый нрав в отношении любого, кого уличал в совершении ошибок, создании условий для их возникновения или же распространении ошибочных сведений. Его работы были сложны для понимания, равно как и его лекции: «Фишер был слишком сложен для среднего студента; его классы быстро разваливались, оставались только два-три студента, которые могли выдерживать его темп, и становились преданными адептами»{104}.
В начале своей карьеры статистика Фишер работал на экспериментальной сельскохозяйственной станции, ставшей впоследствии всемирно известной благодаря разработке теории планирования экспериментов. Он разработал то, что сегодня называется дисперсионным анализом, установил принцип рандомизации и развил идею о важности воспроизводимости{105}. Он разработал эксперименты для проверки совпадений с помощью количественных методов, куда входили, например, сопоставление карт из обычной колоды в 52 карты, системное исследование экстрасенсорного восприятия{106}. Это практический метод, предполагающий использование системы оценки, основанной на перестановках в колоде, следующих нормальному распределению.
Сложно поверить, что такой гений биологии, как Фишер, мог поощрять работы в области евгеники, ошибочные суждения, популярные до 1930-х гг., согласно которым, если правительства не будут поддерживать рост рождаемости в семьях с «благоприятными» генетическими чертами и препятствовать такому росту в семьях с «неблагоприятными» чертами, полученный генетический фонд приведет к упадку цивилизации.
В августе 1958 г. Фишер написал в журнале Nature: «Любопытная связь между привычкой к курению и раком легких в умах некоторых из нас не вызывает простого умозаключения о том, что продукты горения, достигающие поверхности бронхов, вызывают, пусть и через определенный продолжительный период времени, развитие рака. Если, например, можно было бы предположить, что курение сигарет – причина этого заболевания, то можно было бы также предположить, причем ровно на тех же основаниях, что вдыхание сигаретного дыма является действием, обладающим значительным профилактическим эффектом против возникновения болезни, поскольку практика вдыхания среди пациентов с раком легких встречается реже, чем у пациентов с другими видами рака»{107}. Фишер рассматривал доводы, связывающие рак легких с курением, как неподтвержденные предположения{108}:
Вопрос довольно сложный, и я упоминал, что на ранней стадии логическое разграничение проходило между: A вызывает B, B вызывает A, что-то еще вызывает оба из них. Тогда возможно, что рак легких – точнее, предраковое состояние, которое должно существовать, и, собственно, известно, что оно существует в течение нескольких лет у тех лиц, у кого позже будет диагностирован явный рак легких – является одной из причин курения? Не думаю, что это можно исключить. Не думаю, что мы знаем достаточно, чтобы сказать, что это и есть причина{109}.
Работа Фишера ошибочна. Учитывая его крутой нрав в отношении любого, кто, по его мнению, допустил ошибку в анализе данных или их оценке, можно только догадываться, в какую ярость его мог привести кто-то, допустивший ту же ошибку, что и он, преждевременно сделав выводы, не изучив предварительно все доступные данные. Он не осознавал собственный конфликт личного и профессионального: он был курильщиком на службе у табачной компании.
К сожалению, результаты многих медицинских исследований, которые слишком быстро оказываются в СМИ, рождают спекуляции по поводу причин и профилактики тех или иных недугов. Нам рекомендуют есть больше рыбы и меньше ненасыщенных жиров, а также не жить рядом с электромагнитными полями. Такие медицинские рекомендации могут приводить к иным опасностям. Когда-то нам говорили, что для снижения вероятности сердечных заболеваний надо принимать витамины C и E, а также бета-каротин в качестве антиоксидантов. Для предотвращения рака прямой кишки надо есть больше клетчатки. Когда-то нам говорили, что надо употреблять меньше грубой пищи, а потом, несколько десятилетий спустя, что нужно употреблять больше грубой пищи. Масштабные исследования по данным наблюдений не смогли подтвердить эти теории. Нельзя сказать, что одно событие является причиной другого просто потому, что клиническое исследование с десятками сотен испытуемых в общей и контрольной группах подтверждает гипотезу. Все, что оно может, так это сказать, что гипотеза, возможно, верна. В лучшем случае дать косвенное свидетельство того, что одно событие вызывает другое. Не будучи совершенно уверенными в причине, мы очень мало знаем о том, как давать конкретные рекомендации. На самом деле, если причина неверна, то рекомендации могут принести больше вреда, чем пользы{110}.
Не то чтобы клинические исследования вообще ничего нам не дают. Они говорят многое. Например, мы точно знаем, что курение сигарет имеет некую связь с раком легких и сердечно-сосудистыми заболеваниями, хотя нам и неизвестны точные причины. Курение – это одна из сопутствующих причин. Мы знаем это потому, что, когда после Второй мировой войны американки массово пошли работать на заводы и предприятия и начали курить, был отмечен случайный скачок заболеваемости раком. У нас есть свидетельства того, что американская диета и образ жизни как-то связаны с раком груди, основанные на данных наблюдения над японками и американками, а потом – над двумя поколениями американок японского происхождения, у которых уровень заболеваемости раком груди оказался таким же, как у коренных американок. Проблема причины и следствия не так проста. Часто существуют обстоятельства, искажающие наше восприятие и заставляющие думать, что одно является причиной другого: когда A вызывает B опосредованно, так как A на самом деле вызывает C, что, в свою очередь, вызывает B.
Проблема с клиническими испытаниями в том, что выбор испытуемых не настолько случаен, насколько должен бы быть. Меня никто никогда не просил стать испытуемым в клиническом испытании. Итак, мы должны спросить: кто эти испытуемые? Это люди, у которых есть мотивация для того, чтобы быть добровольцами. Многим платят, а платят из источников, которые могут быть связаны с интересами тех, кто эти источники финансирует. Следовательно, испытуемые приходят из особой, а не из случайной группы. Люди, участвующие в клинических испытаниях, скорее, будут придерживаться выгодных для себя рекомендаций. Они, скорее всего, довольно стройные и имеют меньше опасных для здоровья факторов. Мы можем статистически урегулировать эффект социально-экономического статуса, но это не всегда работает должным образом{111}. Кроме того, результаты таких исследований временные – пройдет 10 или 20 лет, прежде чем будет проведено новое исследование, которое поставит под сомнение предыдущее. Другими словами, избежать искажений при проведении клинических исследований очень сложно.
С другой стороны, если общественность прислушивается к медицинским рекомендациям – результатам клинических исследований, мы кое-что узнаем. Если бы мы ошибались, называя курение причиной рака легких и сердечно-сосудистых заболеваний, мы не должны были бы увидеть резкого уменьшения уровней заболеваемости раком легких и сердечно-сосудистыми заболеваниями, которые увидели за последние пять десятилетий, в ходе которых доля курящего населения в США сократилась на 57 %.
История говорит нам: то, во что мы верим сейчас, может оказаться неправдоподобным век спустя. В мире есть нечто большее, чем то, что мы видим, что можем измерить, что, как мы думаем, нам известно. Наши научные представления – сиюминутная достоверность. Сэмюэль Арбесман в своей книге «Полураспад фактов» пишет: «Мы собираем научное знание, как часовой механизм, в результате чего в ходе наших поисков лучшего понимания мира постоянно ниспровергаются факты»{112}. Убеждения, какими бы сильными они ни были сегодня, – не истина в последней инстанции. Они являются просто рабочими гипотезами. В оригинальном рецепте Вселенной есть щепотка случайности, а доступные нам средства наблюдения ограничены; потому мы не можем знать всего.
Да, мы ограничены. Явления природы зависят от такого числа переменных, что точное измерение, как правило, невозможно; а это означает пренебрежение принципом неопределенности. Если простое явление, например бросок монеты, зависит от бессчетных необнаруживаемых событий в умеренно хаотическом мире случайно сталкивающихся электронов, то только попробуйте представить мириады событий, отвечающих за такой сложный феномен, как рак. Но открыть причину рака – это не то же самое, что выдвинуть довольно удачное предположение о возможных «подозреваемых». Некоторые ученые относили рост заболеваемости раком легких после Второй мировой войны на счет производственных факторов и новых промышленных товаров. Среди «подозреваемых» был асфальт ввиду быстрого роста дорожного строительства в Америке и Европе. Однако к концу 1950 г. так много исследований связывали курение с раком легких, что стало ясно: курение – значительный фактор. Задача статистики – не найти причины, а скорее, определить «круг подозреваемых». Многие естественные отношения нельзя объяснить законами или измерить в ходе наблюдений, но можно связать со статистическими показателями.
Еще в V в. до н. э. Гиппократ писал о порошке, сделанном из экстракта хинного дерева, облегчавшем головные боли и жар. Это был аспирин. Немецкая фармацевтическая компания Bayer производит его в форме таблеток с XIX в. Но никто не знал, почему он действует, до 1971 г., когда британский фармаколог Джон Роберт Вейн продемонстрировал, что аспирин подавляет выработку определенных молекулярных соединений, регулирующих сокращение и релаксацию мышечных тканей. Морфин использовался в качестве обезболивающего с XVI в., но до 2003 г. никто не знал, что он естественным образом вырабатывается в организме человека. Стоит подумать о некоторых традициях, которым мы следуем, даже не зная почему. Задолго до того, как стало известно о существовании бактерий, люди мыли руки перед едой. Сегодня мы, возможно, моемся слишком часто, даже используем антибактериальное мыло, которое убивает и полезные бактерии. Но откуда нам знать, какие бактерии для нас полезны?
Наука любит прямые связи между причинами и следствиями, но не обязывает нас знать о существовании таких связей. Ученые могут допускать корреляцию между двумя сложными феноменами. Настоящая проблема в том, что люди склонны видеть связь там, где ее нет, а также игнорировать имеющиеся связи, которые слишком сложны для того, чтобы можно было их прогнозировать. Мы видим в совпадениях события, таинственным образом предусмотренные неким глубокомысленным замыслом. Может, и так, а может, и нет. В этом сложном мире взаимосвязанных феноменов некоторые связи сцеплены столь искусными и длинными цепочками опосредованных взаимоотношений, что мы даже представить не можем влияние одного на другое.
Больше книг — больше знаний!
Заберите 20% скидку на все книги Литрес с нашим промокодом
ПОЛУЧИТЬ СКИДКУ