Коронавирус. Коронавирус. Коронавирус

Ситуация в мире сейчас такая, что больше вопросов, чем ответов. Хочется понимать что на самом деле происходит, но очевидно, что даже при желании внимательно проанализировать ситуацию и причинно-следственные связи, у нас не будет достаточно достоверной информации, чтоб сделать выводы. И что же мы можем делать в этом случае? Мы можем оценить текущую ситуацию и сформировать для себя некие ожидания, прогнозы, чтоб понять как спланировать свою личную жизнь и в каком направлении двигаться дальше. 

Что будет в этой статье? 

  • Краткое описание доступных источников данных.
  • Примечания по использованию данных.
  • Визуализация доступных данных по коронавирусу. (+демографические и экономические показатели) в powerBI (InsightWhale).
  • Примечания по работе с файлом powerBI. 
  • Краткая инфо по слайдам (картинки и немного текста).
  • Что можно извлечь из графиков и как их воспринимать.

Что доступно для обзора? 

Примеры источников данных: 

Всегда обращайте внимание какой источник данных используется в отчетах/графиках/визуализации! 

Встречаются данные, которые никак не подтверждены официальными ресурсами страны (например, СМИ пишет, что чаще умирают женщины 65+, но страна не выдавала инфо о соотношении пола/возраста по смертности от коронавируса). 

Неофициальные ресурсы могут просто выдвигать гипотезы, а не анализировать подтвержденные данные. Более того, даже если это был анализ, не факт, что методы были применены правильно (иногда при анализе можно получить парадоксальные результаты, например “чем больше плотность населения — тем ниже темпы заражения”). 

Важно понимать: 

  • Не все страны отдают точную статистику. Например, в Италии можно найти разбивку данных по демографическим показателям и городам, а в Казахстане есть только общая цифра на всю страну. 
  • Не во всех странах есть необходимое количество тестов на коронавирус, соответственно реальные количественные показатели могут отличаться от того, что есть в интернете/СМИ. 
  • Данные по общим демографическим (соотношение полов, смертность и пр.) и экономическим (долг страны, импорт/экспорт и пр.) показателям в открытом доступе можно найти в ограниченном количестве и чаще это данные за 2015-2017 годы. 
  • Для сбора и размещения статистики также требуется время, так что в целом те данные, которые мы видим на сайтах, как минимум запаздывают на день. 

Таким образом, даже если мы используем официальные данные, мы не сможем увидеть настоящую картину в целом по миру, поэтому в любом случае всегда держим в голове допущение, что всё может быть несколько лучше/хуже. 

Визуализация данных по коронавирусу в powerBI

Мы, команда InsightWhale немного побрейнштормили на тему коронавируса, посмотрели доступную информацию и сделали визуализацию данных. Визуализация не дает того или иного окраса происходящим событиям, а просто описывает текущую ситуацию. Используя эти графики и таблицы вы можете сделать свои личные выводы, я лишь опишу возможные варианты использования и примечания. 

Общие примечания

  1. Отчетику нужно прогрузиться, дайте ему немного времени (он сразу после этого блока в iframe). 
  2. Отчет powerBI обновляется ежедневно и даже если скриншоты в статье устареют, то он — нет.
  3. В правом верхнем углу вы можете посмотреть последнюю дату обновления данных и используемые источники. 
  4. В правом нижнем углу есть иконка, при нажатии на которую, можно развернуть отчет на весь экран. 
  5. Вторая справа иконка в правом нижнем углу -> поделиться URL, можете скопировать ссылку, чтоб отправить друзьям или пошарить в соц. сетях. 
  6. Внизу посередине переключаются страницы отчета. 
  7. Отчет обновляется, поэтому могут добавляться новые листы или в текущие могут вноситься небольшие правки. 
  8. Чтоб выбрать несколько стран одновременно, используйте Ctrl + левая кнопка мыши (Windows) или cmd + левая кнопка мыши (Mac)

Общие данные

Можно применить фильтр справа (выбрать одну или несколько стран) и узнать цифры по конкретной стране. 

  • Confirmed: количество подтвержденных заражений, включает и recovered, и deaths, и тех, кто еще заражен. 
  • Recovered: количество выздоровевших. 
  • Deaths: количество умерших. 
  • Increased today on: на сколько увеличилось количество случаев сегодня (в день обновления данных).  
  • Confirmed vs Population: коэффициент значимости заражения относительно населения, количество подтвержденные случаи разделить на население.  
  • Recovered vs Confirmed: коэффициент выздоровления, кол-во выздоровевших разделить на кол-во подтвержденных случаев. 
  • Deaths vs Confirmed: коэффициент смертности, кол-во смертей разделить на кол-во подтвержденных случаев. 
  • Карта отвечает на вопрос: в каких странах больше всего людей выздоравливает относительно заразившихся? 

Статистика по странам со 100+ зараженными

Слайды ниже показывают только те страны, где более 100 зараженных. Можно выбрать одну или несколько стран для отображения на графике и отфильтровать по дате или количеству дней. Статистика для стран с 30M+ населения.

Чем полезен? 
Здесь всё сводится к единой точке — когда в стране появилось более 100 зараженных. Если в случае с использованием календарных дней мы можем посмотреть текущую ситуацию, то здесь мы можем посмотреть относительное течение заболеваемости по странам. 
Например, мы видим, что на 20й день в США показатели уже значительно превышают Китайские и сам темп заболеваемости в целом более резкий, чем был в Китае. 

Над чем подумать и куда копать? 
Вы, конечно же, можете задаться своими вопросами (пишите в комментариях, я с радостью подумаю вместе с вами), но вот пара вариантов: 

  • Какие действия были предприняты Китаем на 20-21 день (в то время как у Китая будет дальше скачок, а после стабильная ситуация, у США выглядит так, будто ситуация не быстро стабилизируется)? 
  • Что делали США на 14-15 день или чего НЕ делали в сравнении с Китаем (примерно после этого рост пошел более резко вверх)? 

Тот же график, что выше, но по календарным дням. 

Чем полезен? 

  • Здесь можно посмотреть конкретные даты и более точечно искать информацию по действиям государств в те или иные изменения количественных показателей. 
  • Можно увидеть корреляцию между графиками разных стран, например, Италия и Испания имеют одинаковую просадку 12 марта, а далее графики движутся параллельно. Найдя такие интересные моменты, мы можем лезть глубже и анализировать действия стран попарно. 

Над чем подумать и куда копать? 

  • Что делал Китай 12 февраля? 
  • Что происходило в Италии и Испании 12 марта?
  • Что происходило в Штатах 18 марта? 
  • Выдержит ли система здравоохранения Штатов такую ситуацию? 

Этот график похож на те, что выше, но показывает влияние количества заражений коронавирусом на население страны, графики сведены к единой точке (когда стало 100+ зараженных). Статистика для стран с 30M+ населения. 

Чем полезен? 

  • Понять для каких стран ситуация несет наибольший удар по населению и системе здравоохранения. 
  • Понять относительное влияние зараженности населения коронавирусом. Цифры могут быть огромные, но это будет малая доля населения, либо же наоборот, количественные показатели будут низкие в сравнении с другими странами, но это будет нести огромный урон государству.  

Над чем подумать и куда копать? 

  • По количественным показателям Китай лидировал, но фактически урон населению с 5+ дней у других стран намного выше. Это те страны, которые в первую очередь нуждаются в помощи и в принятии оперативных мер на уровне управления государством.

Коэффициент смертности и выздоровления по календарным дням

Отношение коэффициента смертности и выздоровления с количеством зараженных. 

Чем полезен? 

Можно понять как меняется ситуация в какой-либо конкретной стране по выздоровлению или смертности в дни, начиная с 100+ заражений. 

Над чем подумать и куда копать? 

На первом графике видно, что в США смертность превышает выздоровления, а в Италии наоборот. Конечно, здравая ситуация когда больше людей выздоравливают и меньше людей умирают. Соответственно, в США явно происходит что-то нехорошее и неправильное. 
Если в какой-то момент графики меняются местами, можно проанализировать какие действия выполнялись и какие меры были предприняты страной, либо же попробовать поискать более подробную разбивку по демографическим показателям (например, гипотетически возможно, чтоб в какой-то стране был высокий процент пожилых людей среди зараженных, у которых больше риск). К сожалению, такие данные по каждой стране найти сложно.

Общие данные по странам. Таблица. 

Можно посмотреть ТОП стран по разным показателям и выбрать какие-либо группы для более глубокого анализа. Учтены все страны, в т.ч. с количеством заражений менее 100 и с населением менее 30 миллионов. 

Чем полезен? 

Сортировка по влиянию зараженности на население. И казалось бы, в топе сначала должны быть страны с малым населением, но как мы видим, Италия и Испания находятся в первой пятерке. 

Чем полезен? 

Сортировка по коэффициенту выздоровления. 

Гипотезы: 

  • Страны с низкими количественными показателями и высоким коэффициентом выздоровления: 
    а) не дают всемирным организациям данные по реальному количеству зараженных
    б) выполняют правильные действия (изоляция, закрытие границ и пр.) 
  • Страны с высокими количественными показателями и высоким рейтом выздоровления делают всё правильно и можно проанализировать что именно они делали/делают. 

Чем полезен? 

Где больше всего умирают от коронавируса относительно количества заболевших? Вероятно, если из 2-3 заболевших один умер, то страна не отдает всю статистику.  

Чем полезен? 

Влияние смертности от коронавируса на население страны. Малые числа, но всё же если мы говорим о пандемии и многие паникуют, думаю стоит знать эти показатели. Стоит дополнительно изучить общие показатели по смертности от других заболеваний в прошлые годы. 

Общие демографические показатели по странам

Фильтр выбора страны в шапке отчета посередине. 

Чем полезен?  

Есть разные гипотезы в интернете, что быстрее/больше заражаются те страны где высокий процент 65+ или больше мужчин и т.п. Демографические данные по странам в открытых источниках присутствуют только за 2016 год, на этом графике можно выбрать несколько стран и сравнить их по демографическим показателям. 
К сожалению, на таком уровне нельзя сделать никакого точного вывода. Чтоб определить влияние демографии на смертность/выздоровления от коронавируса, нужно иметь данные конкретно по заболевшим, а такую информацию выдают всего лишь несколько стран. 

Общие экономические показатели по странам

Чем полезен? 

Такой же график как выше, но с экономическими показателями, а не демографическими. Есть гипотезы, что вирус — это третья мировая война и одни страны умышленно заражают другие по каким-то политически-экономическим соображениям. Показатели приведены за три года, чтоб можно было посмотреть динамику. Можно выбрать группу стран и проанализировать их показатели и, вероятно, найти какие-то инсайты.  GDP = ВВП
Думаю, что эти данные также можно использовать для понимания насколько ситуация с коронавирусом будет критична для экономики той или иной страны. 

Итого

InsightWhale продолжает собирать и анализировать данные, если у нас будут какие-то полезные инсайты или выводы, мы обязательно поделимся, а пока давайте будем делать так: 

  • не паниковать, 
  • думать, 
  • беречь себя и своих близких, 
  • следовать рекомендуемым действиям (от правительства), например, насчет самоизоляции. 

В России сейчас неплохая ситуация, поэтому стоит сохранить её на этом уровне и не допустить таких графиков, которые можем наблюдать у США и Италии. 

Здоровья вам и добра! 

Пишите в комментах была ли вам интересна и полезна статья 🙂

Наверх