Качество статистического анализа в исследованиях, которые ныне успешно проходят рецензирование в "Ланцете", падает уже до анекдотического уровня. Я не берусь судить медицинские и сопутствующие им аспекты, я только про то, что могу и умею оценивать с профессиональной точки зрения: работу над данными и то, что в её результате получается.
А в результате используются методы, которыми результаты подгоняются под заранее заданную повестку, что ли. И такое, конечно, в пропагандистском листке проходит все рецензии на "ура".
https://www.thelancet.com/journals/laninf/article/PIIS1473-3099(21)00475-8/fulltextЗдесь нас хотят убедить, что страшная "дельта" чаще приводит к госпитализациям, чем предшествовавшая ей "альфа". Что уже звучит странно, читая регулярные отчёты британского Минздрава. Да и статистика Черногории, хоть и куцая, но однозначно показывает, что в нынешнюю волну заметно меньше госпитализаций по сравнению с прошлым годом при сопоставимом количестве случаев.
Вкратце: 43 338 пациентов (8682 с "дельтой", 34 656 с "альфой", медианный возраст 31 год). В течение 14 дней после сдачи позитивного теста в больницы попали 2,3% заболевших "дельтой" против 2,2% заболевших "альфой" - разница в рамках погрешности на таком объёме данных.
А регрессионная модель авторов исследования на этих данных дала вывод, что в 2,26 раза больше госпитализаций с "дельтой", нежели с "альфой"! И это становится официальным результатом.
Конечно, ковидобесы, как обычно, водрузят на свои знамёна внушаемые им выводы из краткой аннотации и не полезут разбираться, как оно так могло получиться.
А я как бы уже научен, что всё, что нужно скрыть от большей части публики, в таких исследованиях размещается отдельным документом в разделе "Supplementary appendix". Ну и иду сразу туда. И там оно, конечно, есть (PDF):
https://www.thelancet.com/cms/10.1016/S1473-3099(21)00475-8/attachment/477c3e5c-e408-4231-814c-4d9385234eb4/mmc1.pdfЧто мы там видим?
Самыми сильными сопутствующими факторами, оказавшими влияние (confounder contribution) на вероятности госпитализации, почему-то оказались номер недели и этническое происхождение, а вовсе даже не возраст!
Как можно было настроить модель, чтобы так получилось?
Напомню, речь идёт о вероятности госпитализации в случае заболевания, которая в принципе более-менее устоявшаяся величина для одного штамма, на которую не должна влиять динамика заболеваемости.
Как может вероятность попасть в больницу иметь самую сильную зависимость от номера недели, на которой ты заболел?! А не от реальных факторов риска (возраст, сопутствующие заболевания). Модель подгоняли под заранее заданные результаты, и это вылезло побочным эффектом?
Ну или случайно где-то перемудрили, просто само так вышло, они не специально, товарищ Цукерберг.