fact_checkers | Парадокс "парадокса Симпсона"

Вынесу из комментов, а тот тут пропагандонам подвезли новую методичку про парадокс Симпсона, и не все понимают, в чём подвох.

В двух словах, парадокс Симпсона заключается в том, что "кажущаяся" эффективность той же вакцины в целом по популяции может получиться ниже, чем в каждой из отдельных групп, из-за их сильной разнородности.

Ну, типа, если считать на 100к населения, доверившись цифрам Минздрава Израиля, то эффективность вакцины в целом выходит 67%, однако для возрастной группы младше 50 лет получается 92%, а для возрастной группы 50+ лет 85% -- оба показателя больше, чем общий.

А если разбивать по ещё более узким возрастным группам по 10 лет, то внутри каждой группы эффективность и вовсе зашкалит за 90%, а в некоторых станет абсолютной (100%).

Проблема в том, что чем сильнее мы дробим общую выборку, тем меньше статистическая значимость получаемых результатов, тем менее репрезентативными получаются "осколки", а главное -- тем существеннее искажения, вносимые сопутствующими факторами, которые мы не учитываем, считая их идентичными для обоих сравниваемых групп, а делать это совершенно неправомерно.

Между тем, иногда оказывается, что именно разница (между группами) в частоте таких неучтённых факторов и отвечает за все найденные закономерности, а вовсе не тот параметр, который мы проверяли. И чем меньше сравниваемая выборка, тем существеннее это может искажать результат. Это называется confounding bias.

Хрестоматийный пример -- нашумевшие научные исследования "кофе вызывает рак лёгких", якобы на 14% за каждые 2 выпиваемые чашки в день.

Но оказалось, что среди пьющих много кофе большая доля курящих. И эти результаты на самом деле обусловлены именно влиянием курения, а вовсе не кофе.

Когда курильщиков учли правильно, то оказалось, что никакого риска рака лёгких от самого кофе нет (да и если подумать, какая может быть связь между кофе и лёгкими?): https://cebp.aacrjournals.org/content/25/6/951

Поэтому для оценки эффективности вакцин в клинических испытаниях обе группы, и прuвuтую, и нет, максимально рандомизируют, т.е. добиваются, чтобы по всем важным параметрам (возраст, факторы риска, особенно хронические заболевания и т.п.) были распределены максимально равномерно между обеими группами.

Понятно, что в реальной жизни такого добиться невозможно, но когда у нас по несколько миллионов человек в каждой из групп, можно считать, что с каким-то допуском это соблюдается.

В Израиле непрuвuтых 60+ лет всего около 90 000 человек, а прuвuтых (двумя и более дозами) 1,5 миллиона.

Легко догадаться, что среднее состояние здоровья в группе прuвuтых заметно лучше, т.к. в группе непрuвuтых находятся все те, кому прививка противопоказана по состоянию здоровья, терминальные больные, которые при прочих равных будут чаще умирать от каждого чиха.

И для выборки 90 000 человек такое смещение тем более критично. Тем более, что как сказал директор одного из израильских к0вuдариев, у них в статистику тяжелых ковидных пациентов попадают все, кто госпитализирован по любой причине, а в больнице сдал ПЦР+

Как это влияет -- можно показать на простом и наглядном примере. Допустим, у нас есть два лекарства, реальная эффективность первого равна 40%, реальная эффективность второго равна 60%, т.е. второе лекарство на треть эффективнее первого. Но мы об этом не знаем, и у нас есть 1 600 000 человек, на которых мы будем это проверять.

1) Разобьём их на две равные группы - по 800 000, и дадим каждой своё лекарство. Обе группы идеально рандомизированы, за исключением одного фактора - так получилось, что во второй оказалось 40 000 человек, которым это лекарство противопоказано, и они не стали его пить. Но исследователям об этом неизвестно.

Тогда в первой группе заболеет 480 000, а во второй 344 000 (40% из 760 000 принявших лекарство плюс все 40 000, кто его не стал пить).

По методика оценки эффективности вakцuн, эффективность второго лекарства по сравнению со первым из-за этого составит

Ef = 1 - 344k/800k / 480k/800k = 28% вместо реальных 33%.

Из-за достаточно большого объёма обеих выборок искажение получилось невелико, но оно всё равно есть.

2) А теперь сделаем как в Израиле. Первое лекарство дадим 1 500 000 человекам. Второе - 100 000, из них все те же 40 000 с противопоказанием не стали его пить. В первой группе заболело 900 000, во второй 64 000. Считаем эффективность:

Ef = 1 - 64k/100k / 900k/1500k = -6,7% вместо 33%!

Из-за того, что выборки несопоставимы по объёму, а малая выборка к тому же вышла максимально нерепрезентативной, у нас получился недостоверный результат, будто второе лекарство хуже первого, хотя на самом деле оно на треть более эффективно.

А как надо было сделать правильно? Надо выявить и удалить из второй выборки всех, кому лекарство противопоказано. Тогда выборка станет репрезентативной, там останется 60 000 человек, заболеет из них 24 000 и эффективность получится:

Ef = 1 - 24k/60k / 900k/1500k = 33% как и положено.

Точно так же и с непривитыми 60+летними в Израиле. Мы не знаем, скольким из них вакцина противопоказана по состоянию здоровья, и какое искажение они тем самым вносят в результат. И если не очистить от них столь малую выборку, результат не может считаться достоверным. Особенно если учесть, что противопоказания к ковидным вакцинам чаще всего это тяжелые коморбидитеты, которые и сами по себе, при прочих равных условиях, увеличивают риски тяжелого течения и смерти.

Flat | Top-Level Comments Only

From:

galina_v

Мало того, чтобы не быть ежиком, надо бы еще и большую группу разбить на много маленьких медвежат размером с малую группу, и исследовать их по отдельности. Тк в малой группе отдельная человекотушка будет иметь больший вес, чем в большой. То есть малый вес отдельного голубчика в большой группе может замазывать эффекты - как позитивные, так и негативные - при сравнении с малой. А в малой - наоборот их выпячивать при сравнении с большой.

Но, кстати, само нежелание выделять группу "непривитые в силу противопоказаний" - в идеале с выделением подгруппы "непривитые из-за возникновения побочных эффектов" - это просто роспись в том, что негативные эффекты чудо-процедуры видеть не желают.

S	M	T	W	T	F	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Фактчекинг Фактчекеров

Парадокс "парадокса Симпсона"

Парадокс "парадокса Симпсона"

no subject

Profile

August 2025

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags