«Официальные цифры можно выбросить в мусорное ведро». Аналитики сомневаются в статистике по COVID-19
С сенсационным заявлением накануне выступил один из основателей исследовательского агентства Data Insight, аналитик Борис Овчинников. В своём фейсбуке он выложил подробный разбор данных о заболевших коронавирусом в России, который, по мнению автора, объясняет, почему коронавирусная статистика в стране фальсифицируется на федеральном и региональном уровнях.
Овчинников проанализировал количество заболевших за 25 дней — с 30 апреля до 24 мая. Он заметил, что в этот отрезок число выявленных случаев COVID-19 четыре раза заканчивалось на 99. Вероятность подобного случайного совпадения крайне мала, хоть и не исключена, написал аналитик, — 0,011%, или один случай на 9350 попыток. Овчинников высчитал её через биноминальное распределение.
Увеличив отрезок на 10 дней и начав отсчёт с 20 апреля, он увидел, что в статистике по 85 регионам часто фигурировали цифры, заканчивающиеся на 98 или 99, а кратные 5 или 10 — почти никогда. Аналитик оценил вероятность подобной аномалии в десятые доли процента, а вероятность одновременного их появления ещё меньше. Размышляя над этим, он предположил два объяснения. Согласно первому, произошедшее — невероятная случайность.
Второе объяснение — фальсификация. «Или число выявленных за сутки больных, которое потом озвучивается гражданам, не считается через суммирование данных из регионов, а определяется сверху — в формате указания типа „покажите прирост около 8600“. Дальше, перед публикацией, эта цифра „дезокругляется“ — часто просто вычитанием единицы или двойки, что, кстати, требует дальше корректировки цифр по регионам или даже их рисования с нуля», — уточнил Овчинников.
Аналитик отметил, что фальсификация данных на региональном уровне не вызывала у него сомнений. Он привел в пример ситуации, когда в восьми регионах сразу число выявленных зараженных равнялось 97–98, а в Краснодарском крае 12 дней подряд количество новых случаев составляло от 96 до 99.
«Похоже, что фальсификация статистики по количеству выявленных больных — это не отдельные локальные инициативы, а единая многоуровневая система, где первична придуманная общероссийская цифра, а региональные цифры уже подгоняются под нее. Официальные цифры по количеству заболевших можно выбросить в мусорное ведро: нет никаких оснований считать, что они адекватно показывают динамику эпидемии. Может быть, показывают, может быть, нет — неизвестно. Качество рисованных цифр невозможно и абсурдно оценивать», — уточнил Овчинников.
Фальсификация федеральной статистики означает, что вероятность того, что в каждом отдельном регионе показываются честные цифры, снижается, считает аналитик.
«Цифры, например, по Москве и Новосибирску можно было рассматривать без связки с рисованием в Краснодаре — но можно ли их рассматривать без связки с рисованием федеральных цифр?» — написал он.
Сомнения в связанной с заболеваниями COVID-19 статистике высказывали зарубежные СМИ. Две недели назад газета The New York Times (NYT) опубликовала материал о том, что число смертей от коронавируса в Москве и других регионах России может быть выше, чем сообщает официальная статистика. Аналогичную статью выпустила газета Financial Times (FT). В ее материале также утверждалось, что число смертей от коронавируса в Москве и Санкт-Петербурге может быть выше, чем сообщает официальная статистика. По версии издания, в этих городах общий показатель смертности за апрель 2020-го возрос на 2073 случая по сравнению со средним числом за этот же месяц за предыдущие пять лет.
Обе публикации вызвали резкую реакцию в отечественном истеблишменте. В Госдуме, например, призвали Министерство иностранных дел принять меры в отношении журналистов NYT и FT вплоть до лишения аккредитаций. То есть российские политики фактически сразу же отмахнулись от новых представленных им чисел, которые указывают на имеющуюся проблему, заявив просто, что «у нас в стране статистикой не манипулируют». Никто из них, похоже, не желает вдаваться в подробности, то ли опасаясь, что глубокое изучение ситуации покажет просчёты в организации борьбы с коронавирусом, то ли опасаясь, что вскроются фальсификации, существующие на самом деле.
Такая позиция не убеждает никого — ни западных наблюдателей, ни собственных аналитиков и население, а, вероятно, лишь усиливают подозрительность и недоверие.
Между тем цифры инфекционной статистики могут быть совсем не безобидными, когда речь идёт о назревшей нормализации жизни региона. Так, к примеру, происходит в Вологодской области. Регион со сравнительно мизерным числом заболевших находится в восьмом десятке регионов по этому показателю, обеспечен большим запасом коек для приёма новых больных. И, тем не менее, не может снять ограничения, наложенные на работу практически всей сферы услуг и значительной части торгового бизнеса. Это чревато дестабилизацией ситуации, поскольку большое число людей два месяца живут без зарплаты и доходов.
Причина — во всё той же статистике. Малое число заболевших превратилось в настоящую ловушку для области: даже небольшой прирост заболевших значительно увеличивает пресловутый коэффициент распространения вируса, который упорно не желает опускаться ниже единицы. Парадоксальным образом Москва с её сравнительно огромным числом заболевших и умерших сейчас имеет больше шансов снять ограничения раньше Вологодчины.
Не эта ли абсурдная ситуация в том числе заставила губернатора Олега Кувшинникова в понедельник заявить, что более 50% вологжан являются носителями коронавируса, но болеют бессимптомно?
Марина Мельникова
СамолётЪ