FORESIGHT COVID-19

ФОРСАЙТ COVID-19: ЧЕТВЕРТИЙ ЕТАП ПОСЛАБЛЕННЯ КАРАНТИНУ

Дата публікації 12.07.2020

Зміст

1. Особливості поширення пандемії COVID-19 в Україні протягом четвертого етапу послаблення карантинних заходів (10.07.2020 – 12.07.2020)

1.1. Вплив загальної мобільності населення України на поширення пандемії COVID-19

1.2. Залежність між кількістю щоденно виявлених інфікованих осіб та хворих на COVID-19 і кількістю проведених тестів

2. Вплив послаблення карантинних заходів на територіальний розподіл пандемії COVID-19 в Україні

2.1. Загальні тенденції

2.2. Детальний аналіз в розрізі регіонів України

3. Прогнозне моделювання поширення пандемії COVID-19 в Україні на липень 2020 року

3.1. Застосування методу подібності в математичному моделюванні

3.2. Застосування рекурентної нейронної мережі із довгою короткостроковою пам’яттю типу LSTM

3.3. Короткостроковий прогноз поширення COVID-19 (13.07.20 - 17.07.20) на основі нейронної мережі Back Propagation

3.4. Порівняння результатів прогнозування поширення COVID-19 в Україні, отриманих різними методами

Висновки

Посилання

Команда проєкту

 

1. Особливості поширення пандемії COVID-19 в Україні протягом четвертого етапу послаблення карантинних заходів (10.06.2020-12.07.2020)

Наведене дослідження команди проєкту «ФОРСАЙТ COVID-19» присвячено вивченню особливостей поширення хвороби коронавірусу протягом четвертого етапу послаблення карантинних заходів (10.06.2020 р. – 12.07.2020 р.). Результатом перших трьох етапів послаблення карантинних заходів (з 11.05.20 р. по 10.06.20 р.) стало суттеве зниження соціальної дисципліни громадян, значне підвищення їх безпечності, зростання пішої і автомобільної мобільності та інше, що вплинуло на різке зростання нових випадків захворювання та повернення до експоненціального характеру поширення пандемії в червні 2020 року. Перша декада липня характеризувалася стабілізацією цього процесу на рівні 600 – 900 нових інфікованих за день. Суттєве зростання кількості зареєстрованих хворих протягом останнього місяця пояснюється також більш ніж півтора-разовим збільшенням кількості проведених нових тестів (з 8496 – 10.06.20 до 13134 – 10.07.20 (табл. 1, рис.1-3).

Таблиця 1. Зміна характеру поширення пандемії COVID-19
в Україні в процесі послаблення карантинних заходів

Дати Cases New tests Режим протиепідемічних заходів
12.03.20-11.05.20     Жорсткий карантин
01.05.2020   6686  
02.05.2020 550 4207  
03.05.2020 502 6971  
04.05.2020 418 4869  
05.05.2020 366 5167  
06.05.2020 487 4524  
07.05.2020 507 7286  
08.05.2020 504 7586  
09.05.2020 515 7952  
10.05.2020 522 9296  
11.05.2020 416 5149 Перший етап послаблення карантину – дозволена робота стоматологічних кабінетів, салонів краси та перукарень, закладів побутового обслуговування, відвідування парків, відвідування дитячих та спортивних майданчиків на вулиці; діяльність закладів громадського харчування на винос; діяльність літніх майданчиків просто неба в закладах громадського харчування; торгівля непродовольчими товарами в магазинах (зокрема, тих, що розташовані в ТРЦ) тощо
12.05.2020 375 5755  
13.05.2020 402 4940  
14.05.2020 422 10248  
15.05.2020 483 9119  
16.05.2020 528 9024  
17.05.2020 433 7163  
18.05.2020 325 5098  
19.05.2020 260 7062  
20.05.2020 354 8568  
21.05.2020 476    
22.05.2020 442   Другий етап виходу з карантину – дозволено роботу промислових ринків, великих торгових мереж, наземного громадського транспорту, проведення спортивних заходів до 50 осіб без глядачів, проведення релігійних заходів з обмеженням 1 людина на 10 кв.м, відновлення роботи міського та приміського наземного транспорту у звичайному режимі, відновлення роботи готелів (хостели лишаються зачиненими).
23.05.2020 432 10527 Відновлено рух міського транспорту у більшості міст України.
24.05.2020 406 7914  
25.05.2020 259 6242 Дозволено роботу метрополітену без спецперепусток та закладів дошкільної освіти
26.05.2020 339 9868  
27.05.2020 321 10796  
28.05.2020 477 10214  
29.05.2020 429 14572 Лише у 4 областях показники не дозволяли послаблювати карантин. До них відносяться: Чернівецька, Львівська, Рівненська та Донецька
30.05.2020 393 10961  
31.05.2020 468 8286  
01.06.2020 340 6622 Третій етап послаблення карантину – частково відновлено міжобласне та приміське залізничне та автотранспортне сполучення. Відновлено роботу фітнес-центрів, спортивних залів, басейнів, закладів освіти (для проведення ЗНО та атестацій). Також обов'язкову самоізоляцію було скасовано для осіб старше 60 років, що є представниками клубів та тренерського персоналу.
02.06.2020 328 8481  
03.06.2020 483 9884  
04.06.2020 588 10764  
05.06.2020 553 11235 Відновлення роботи ресторанів та кафе у повному режимі, відновлення богослужінь біля та у храмах з обмеженням 1 людина на 5 кв. м, припинення дії обов'язкової самоізоляції для осіб, що досягли 60 років, проведення акредитацій освітніх програм у віддаленому режимі. Сім областей (Львівська, Чернівецька, Луганська, Донецька, Житомирська, Рівненська та Волинська), а також Київ виявились неготовими до послаблення обмежень
06.06.2020 550 10991  
07.06.2020 485 9504  
08.06.2020 463 7039  
09.06.2020 394 6359  
10.06.2020 525 8496 Четвертий етап послаблення карантину – дозволено відкривати заклади культури та проводити культурні заходи. Робота кінотеатрів та функціонування фан-зон на концертах наразі залишається під забороною. Також відновлено роботу закладів з оздоровлення та відпочинку (крім дитячих таборів)
11.06.2020 689 10569  
12.06.2020 683 11663  
13.06.2020 753 10939  
14.06.2020 648 10223  
15.06.2020 656 7950 Частково відновлено міжнародне авіасполучення, однак до країн ЄС та Шенгену дозволено в'їзд лише на роботу, навчання та лікування
16.06.2020 666 9967  
17.06.2020 758 10744  
18.06.2020 829 12447  
19.06.2020 921 11805  
20.06.2020 841 11490  
21.06.2020 735 9457  
22.06.2020 681 6395  
23.06.2020 833 11225  
24.06.2020 940 13188  
25.06.2020 994 12764  
26.06.2020 1109 13858  
27.06.2020 948 11342  
28.06.2020 917 9945  
29.06.2020 646 7239  
30.06.2020 706 6972  
01.07.2020 664 10025  
02.07.2020 889 11110  
03.07.2020 876 13696  
04.07.2020 914 14883  
05.07.2020 823 9934  
06.07.2020 543 6743  
07.07.2020 564 9345  
08.07.2020 807 13568  
09.07.2020 810 13938  
10.07.2020 819 13134  

 

1.1. Вплив загальної мобільності населення України на поширення пандемії COVID-19

Зокрема, дослідження загальної (пішої і автомобільної) мобільності населення показують, що вона продовжує значно перевищувати первинні показники початку року. Середня автомобільна мобільність за період з 17 червня по теперішній час склала в середньому 160% від початку року, а піша – 130%. При цьому обидва види мобільності мають тенденцію до зростання. (рис.1). 

Рисунок 1. Динаміка мобільності населення в Україні та країнах Європи протягом карантинних заходів

Між кількістю щоденних випадків захворювання на COVID-19 і загальною мобільністю населення в Україні протягом 4-етапного послаблення карантинних заходів виявлена чітка кореляційна залежність (рис. 2). Якщо протягом перших двох етапів послаблення карантинних заходів коефіцієнт кореляції між цими двома статистичними рядами був на рівні 0.55-0.65, то протягом четвертого етапу він зріс до 0.68-0.73 (табл. 1, рис 2).

Рисунок 2. Кореляція між кількістю щоденних випадків захворювання на COVID-19 і загальною мобільністю населення в Україні протягом 4-етапного послаблення карантинних заходів

1.2. Залежність між кількістю щоденно виявлених інфікованих осіб та хворих на COVID-19 і кількістю проведених тестів

Дослідження показали, що зі зростанням кількості тестувань протягом чотирьох етапів послаблення карантинних заходів відбувалося збільшення нових випадків захворювань з певним часовим лагом (рис. 3-9). Бачимо, що зростання захворюваності з початку червня йшло з певним випередженням зростання кількості тестувань. Протягом четвертого етапу послаблення карантинних заходів ця залежність стала носити більш визначений характер зі збільшенням дисперсії значень.

Рисунок 3. Кореляція між кількістю щоденно виявлених інфікованих осіб на COVID-19 і кількістю проведених тестів

 

Рисунок 4. Залежність між кількістю тестувань та кількістю хворих на COVID-19

Графік (рис. 4) демонструє тісну залежність між кількістю тестувань та хворих на COVID-19 в Україні. Коефіцієнт кореляції цими двома статистичними рядами становить 0,995, що вказує на прямий і жорсткий зв’язок між ними.

Рисунок 5. Залежність між кількістю тестувань та щоденною кількістю нових хворих на COVID-19

Залежність на рис. 5. вказує на зв’язок між збільшенням тестування та кількістю нових випадків. Коефіцієнт кореляції між цими даними дорівнює 0,762, що підтверджує залежність між збільшенням тестування та збільшенням нових випадків.

Рисунок 6. Залежність між щоденною кількістю тестувань та щоденною кількістю нових хворих на COVID-19

Залежність між добовими показниками приросту тестування та нових випадків (рис. 6) також вказує на наявність зв’язку між цими статистичними рядами, але ця залежність носить менш виражений характер з коефіцієнтом кореляції 0,592 та описується експоненціальним трендом.

Рисунок 7. Залежність між кількістю тестувань та кількістю госпіталізованих хворих на COVID-19

Залежність між кількістю тестувань та кількістю госпіталізованих хворих на COVID-19 (рис. 7) вказує на подібний розподіл до загальної кількості хворих з коефіцієнтом кореляції 0,978 з тією різницею, що кількість госпіталізованих хворих змінюється під впливом значної кількості зовнішніх факторів, що впливає на характер розподілу на певних проміжках часу.

Рисунок 8. Залежність між кількістю тестувань та щоденною кількістю нових госпіталізованих хворих на COVID-19

Залежність на рис. 8 вказує на два піки зростання кількості госпіталізованих хворих. Перший пік триває з середини квітня до початку травня. Потім у зв’язку з святковими днями цей процес йде на спад, а другий період починається з початку червня. В останні дні також спостерігається зменшення випадків госпіталізації. Залежність має низьке значення коефіцієнта кореляції і описується поліноміальним трендом, що свідчить про вплив організаційних факторів на госпіталізацію хворих.

Рисунок 9. Залежність між щоденною кількістю тестувань та щоденною кількістю госпіталізованих хворих на COVID-19

Великий розкид точок на графіку (рис. 9) вказує на відсутність істотного зв’язку між добовими показниками тестування та госпіталізації.

Таким чином, між збільшенням кількості тестувань та кількістю виявлених хворих існує жорстка статистична залежність (практично лінійна, рис. 7), яка є складовою комплексу факторів розвитку епідеміологічної ситуації. Коефіцієнт кореляції між цими двома статистичними рядами даних протягом четвертого етапу послаблення карантинних обмежень досяг значення 0,978. На певних проміжках часу характер цієї залежності змінювався, що відображено на графіках (рис. 4-9). Відповідно, точка насичення, яка пов’язана з максимальним охопленням потенційних хворих в Україні, ще не досягнута. Зв’язки між показниками госпіталізації та тестування також пов’язані між собою, але в даному випадку на процес госпіталізації впливають інші інституціонально-організаційні фактори.

2. Аналіз територіального розподілу пандемії COVID-19 в Україні протягом четвертого етапу послаблення карантинних заходів

2.1. Загальна ситуація

Епідеміологічна ситуація в регіонах України продовжує залишатися складною. Коефіцієнт виявлення випадків інфікування COVID-19 перевищує 11% в Волинській (19,33%), Закарпатській (15,59%), Рівненській (13,64%), Харківській областях (11,48%). В Тернопільській області перевищено поріг зростання динаміки захворюваності, який обраховується за період два тижні. У порівнянні з пороговим значенням в 10% цей показник в Тернопільській області становить 47,03%. Складною ситуація залишається в інших західних областях: Львівська, Івано-Франківська, Чернівецька. Прогнозоване погіршення ситуації відбувається у Харківській та Одеській областях, а також погіршення ситуації спостерігається у Донецькій області, що може бути пов’язано з відкриттям пропускних пунктів з окупованою частиною Донбасу (рис. 10).

Стабільно складною, але контрольованою залишається епідеміологічна ситуація у м. Києві та Київській області. Вінницька, Хмельницька, Житомирська області залишаються з високим ризиком погіршення ситуації за рахунок збільшення мобільності з сусідніми західними регіонами. Центральні регіони України характеризуються помірним або низьким рівнем захворюваності. В більшості цих регіонів добовий приріст нових випадків не перевищує 10 осіб.

Рисунок 10. Коефіцієнт виявлення випадків інфікування регіонах України

Завантаженість ліжок у закладах охорони здоров’я перевищує 50% у Закарпатській області, де вона становить 63,25%. Понад 25% завантаження ліжок у Львівській, Волинській, Рівненській, Чернівецькій областях та м. Києві. В цілому цей показник тісно корелює з виявленням нових випадків (коефіцієнт кореляції 0,768). Проте такі регіони як Житомирська та Хмельницька області мають досить низькі показники завантаженості ліжок (рис. 11).

Рисунок 11. Завантаженість ліжок у закладах охорони здоров’я, визначених для госпіталізації пацієнтів з підтвердженим випадком COVID-19

Низькою кількістю тестувань методом полімеразної ланцюгової реакції та імуноферментного аналізу вирізняються Донецька (22,07 на 100 000 населення) та Чернігівська (17,54 на 100 000 населення) області, які знаходяться нижче порогового значення в 24 тести на 100 000 населення. Враховуючі, що обидва регіони мають певне погіршення ситуації за останній час, це може призвести до зростання захворюваності. Досить високими показниками тестування характеризуються Львівська, Волинська, Рівненська області та м. Київ. Також порівняно високим цей показник є в певних центральних регіонах України (рис. 12).

Рисунок 12. Середня кількість тестувань методом полімеразної ланцюгової реакції та імуноферментного аналізу

Таким чином, епідеміологічна ситуація продовжує залишатися складною у регіонах Західної України та м. Києві. Погіршується ситуація у Харківській, Донецькій та Одеській областях, що пов’язано зі збільшенням мобільності населення. Напруженою залишається ситуація з госпіталізацією в Закарпатській, Львівській, Волинській, Рівненській області та м. Києві.

2.2. Детальний аналіз в розрізі регіонів

В цьому розділі наведено продовження перших трьох регіональних досліджень, присвячених аналізу особливостей поширення пандемії COVID-19 в регіонах України, враховуючи значну нерівномірністьцього процесу на території країни, відмінності комунікації населення, нерівномірність міграційних потоків, регіональні особливості протидії та боротьби з хворобою тощо (Форсайт COVID-19: регіональний контекст, Форсайт COVID-19: перехід до фази згасання пандемії, Форсайт COVID-19: сплеск після послаблення карантинних заходів). Виходячи з суттєвої неоднорідності та нестаціонарності процесів поширення коронавірусу, їх стохастичної природи та високої волатильності, наявності так званих «важких хвостів» розподілів процесів поширення COVID-19, для виявлення стійких трендів було використано методи технічного аналізу часових рядів на основі базових індикаторів, зокрема, «zigzag», «supertrend», «ivar», «АТР» які застосовуються для відстеження основних тенденцій та виявлення «торгових сигналів» на фондових ринках [1-3].

Ставилося завдання виявлення та аналізу тренду кількості нових інфікованих хворих в областях України, м. Києві та країні в цілому з врахуванням волатильності досліджуваного процесу.

Довідково. Вибір індикатору «supertrend» обумовлено тим, що він є ефективним інструментом технічного аналізу для виявлення тренду на високоволатильних даних. Коли на вихідній кривій має місце зростаюча тенденція, значення індикатора «supertrend» знаходяться нижче за неї, відповідно, під час спадного тренду – значення цього показника знаходяться вище графіка вихідних даних. Перетин кривих індикатора і даних може означати закінчення, злам попередньої тенденції. Частий перетин цих кривих вказує на те, що явна тенденція у даних відсутня. Як і більшість технічних індикаторів, «supertrend» реагує на зміну тренду вданих з певним запізненням, проте на думку команди проєкту, ця властивість індикатора є суттєвою при відповіді на запитання «Чи залишився у минулому пік захворюваності?», і може бути розцінена як “обережність” відповідного висновку.

Індикатор «zigzag» поєднує найбільш значущі локальні екстремуми на графіку даних і не чутливий до дрібних коливань. Цей індикатор зручно використовувати для аналізу попередніх коливань даних.

Починаючи з другого етапу аналізу пандемії коронавірусу в Україні було залучено технічні індикатори «ivar» (індикатор сили тренду) та «АТР» (індикатор волатильності). Перший дозволяє аналізувати силу наявного тренду, або стверджувати про його відсутність в даних. Дія цього показника базується на фрактальних характеристиках часових рядів. Правила його використання дуже прості: якщо значення індикатора знаходяться вище відмітки 0.5, це означає, що тенденція відсутня, причому чим ближче це значення до 1, тим більше впевненості у такому висновку; і, навпаки, значення індикатора нижче рівня 0.5 вказує на наявність тренду (не важливо якого), і чим ближче до 0, тим сильніша відповідна тенденція.

Індикатор АТР – дозволяє вимірювати волатильність, що характеризує рівень мінливості даних у часі. Один з принципів використання ATR формулюється так: чим вище значення даного індикатора – тим вищою є ймовірність зміни існуючої тенденції.

1. Україна загалом (окрім тимчасово окупованих територій).

Рисунок 13. Аналіз динаміки нових виявлених хворих в Україні

Останній пік кількості нових виявлених хворих за день припадає на 26 червня 2020 року. Після 27 червня значення індикатору «supertrend» знаходяться вище графіка вихідних даних, що свідчить про можливий початок спадної тенденції.  Індикатор сили тренду «ivar» наближається до критичної позначки 0.5, що говорить про затухання сили тенденції на зростання, яка мала місце протягом червня. Значення індикатору волатильності (наявності ризиків) з 27 червня також спадають, наближаючись до рівня кінця травня, коли епідемічна ситуація виглядала контрольованою.

Стосовно співвідношення кількості нових хворих та людей, що видужали за добу – тенденція на графіку (рис. 13а) все ще не виглядає надто оптимістичною. Кількість нових хворих за добу з першого червня 2020 року і понині стабільно переважає кількість тих, хто видужав. При цьому, значення синьої кривої з 27 червня спадають, а значення індикатора волатильності з 1 липня знаходяться на рівні травневих позначок, що дозволяє обережно сподіватись на продовження спадного тренду у найближчому майбутньому.

Рисунок 13а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Україні  на першу декаду липня

2. Області України та м. Київ

2.1. м.Київ:

Рисунок 14. Аналіз динаміки нових виявлених хворих по м. Києву станом на першу декаду липня

Останній зафіксований пік кількості нових виявлених хворих за день – 1 липня 2020 року. 21 червня боковий рух графіка змінив тренд на зростання. Показник волатильності також демонструє найвищі з початку червня значення, що може свідчити про дещо загрозливу ситуацію. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, також вказує на певну втрату стабільності ситуації. Починаючи з другої половини червня, кількість нових виявлених хворих стабільно переважає кількість видужалих, а волатильність цього процесу не падає.

Рисунок 14а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали для м. Київ  станом на першу декаду липня

Згідно показників, визначених МОЗ України, а саме: завантаженість ліжок у закладах охорони здоров’я, визначених для госпіталізації пацієнтів з підтвердженими випадками COVID-19, має становити менш ніж 50%; середня кількість тестувань методом полімеразної ланцюгової реакції та імуноферментного аналізу має становити більш, ніж 24 на 100 000 населення протягом останніх семи днів; коефіцієнт виявлення випадків інфікування COVID-19 становить менше 11% (характеризує відношення кількості нових виявлених випадків за тиждень до кількості всіх тестувань), показник динаміки зростання випадків інфікування COVID-19 становить менше 10%. Однак тенденція до зростання кількості нових виявлених хворих та висока волатильність цього процесу є тривожними та свідчать про наявність ризиків втрати контролю над ситуацією.

2.2. Вінницька область

Рисунок 15. Аналіз динаміки нових виявлених хворих по Вінницькій області станом на першу декаду липня

Останній зафіксований пік: 17 червня, після чого відбувся злам тренду. Наразі маємо позитивну тенденцію до спадання кількості нових виявлених хворих за день. Значення показника волатильності також є відносно невисокими.

Крива співвідношення кількості людей, що захворіли та видужали з 26 квітня в цілому осцилює навколо нуля, а з початку липня кількість тих, що видужали переважає, волатильність даного процесу є  відносно низькою.

Рисунок 15а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Вінницькій області  станом на першу декаду липня

За даними МОЗ ситуація в Вінницькій області є цілком задовільною за всіма показниками. Аналіз вищенаведених графіків також вказує на стабілізацію ситуації та позитивну спадну тенденцію. 

2.3. Волинська область

Рисунок 16. Аналіз динаміки нових виявлених хворих по Волинській області станом на першу декаду липня

Останній зафіксований пік: 28 червня, після чого спостерігається боковий рух графіка. Значення індикатора волатильності також стали нижчими з початку липня. Проте, динаміка співвідношення нових виявлених хворих та кількості людей, що видужали, вказує на нестабільність ситуації. Кількість нових виявлених хворих за день стабільно переважає кількість видужалих осіб.

Рисунок 16а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Волинській області  станом на першу декаду липня

Дані МОЗ України підтверджують тривожність ситуації: завантаженість ліжок у закладах охорони здоров’я, визначених для госпіталізації пацієнтів з підтвердженим випадком COVID-19, критично близька до порогового значення 50%; коефіцієнт виявлення випадків інфікування COVID-19 вже перевищує порогове значення 11% та становить майже 20%.

2.4. Дніпропетровська область

Рисунок 17. Аналіз динаміки нових виявлених хворих по Дніпропетровській області станом на першу декаду липня

Починаючи з 5 травня (останній зафіксований пік нових виявлених випадків захворювання) кількість нових виявлених хворих за день коливається у коридорі значень від 0 до 15. Волатильність (мінливість) процесу також низька, що вказує на незначні ризики зміни ситуації.

Рисунок 17а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Дніпропетровській області  станом на першу декаду липня

Динаміка співвідношення нових виявлених хворих та кількості людей, що видужали також вказує на стабілізацію процесу захворюваності у Дніпропетровській області (протягом червня та початку липня значення коливаються навколо 0 з невисоким рівнем мінливості). Дані МОЗ України також підтверджують стабільність ситуації.

2.5. Донецька область

Рисунок 18. Аналіз динаміки нових виявлених хворих по Донецькій області станом на першу декаду липня

             Після 27 червня відбувся злам тренду, після чого спостерігається різке зростання кількості нових виявлених хворих за день, що свідчить про наявність спалаху захворювання. Останній зафіксований пік нових виявлених захворюваностей: 2 липня (81 випадок). Волатильність (мінливість у даних) також стрімко зростає. Графік динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, вказує на нестабільність ситуації. Кількість осіб, що захворіли, переважає кількість тих, хто вилікувавсь.

Рисунок 18а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Донецькій області станом кінець травня

Дані МОЗ України свідчать про критично низьке охоплення області тестуванням (показник кількості тестувань нижчий від порогового значення 24 на 100 тис. населення); показник динаміки зростання випадків інфікування COVID-19 становить більш як 10% (близько 27%), що також свідчить про наявність спалаху захворювання.

2.6. Житомирська область

Рисунок 19. Аналіз динаміки нових виявлених хворих по Житомирській області станом на першу декаду липня

29 червня відбувся злам тенденції на зростання випадків захворювання, наразі спостерігається спадний тренд, волатильність процесу також спадає і на початку липня тримається приблизно на травневих позначках. Аналіз динаміки процесу видужання також вказує на покращення ситуації.

Рисунок 19а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Житомирській області  станом на першу декаду липня

За даними МОЗ України процес захворюваності в Житомирській області є задовільним за всіма показниками.

2.7. Закарпатська область

Рисунок 20. Аналіз динаміки нових виявлених хворих по Закарпатській області станом на першу декаду липня

Після 18 червня, коли було зафіксовано останній пік кількості нових хворих, спостерігається боковий рух графіка. Волатильність (мінливість у даних нових захворювань) поступово спадає. У той же час, аналіз динаміки співвідношення процесів захворюваності та одужання демонструє тривожність ситуації. Кількість вилікуваних осіб не перевищує кількості нових захворювань ще з початку червня, а мінливість даного процесу залишається вищою, ніж протягом травня, що свідчить про наявність ризику загрозливого розвитку подальшого процесу

Рисунок 20а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Закарпатській області  станом на першу декаду липня

За даними МОЗ України, завантаженість ліжок у закладах охорони здоров’я значно перевищує порогове значення 50%; коефіцієнт виявлення випадків інфікування COVID-19 становить більш як 11%.

2.8. Запорізька область

Рисунок. 21. Аналіз динаміки нових виявлених хворих по Запорізькій області станом на першу декаду липня

Спостерігається спадання кількості нових виявлених хворих за день з 15 травня, тільки 2 липня кількість хворих виявилась дещо вищою за травневі показники. Показник волатильності (мінливості процесу щоденної захворюваності) невисокий, що загалом свідчить про контрольовану ситуацію захворюваності в області. Останній пік спостерігався 29 квітня. Також стабільною виглядає крива співвідношення нових виявлених хворих та кількості людей, що видужали. Волатильність (мінливість) цього процесу також є низькою.

Рисунок 21а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Запорізькій області  станом на першу декаду липня

За даними МОЗ України Запорізька область демонструє стабільність ситуації за всіма визначеними МОЗ показниками.

2.9. Івано-Франківська область

Рисунок 22. Аналіз динаміки нових виявлених хворих по Івано-Франківській області станом на першу декаду липня

З другої половини червня, коли червона лінія «supertrend» перетнула графік кількості нових виявлених захворювань, спостерігається боковий рух графіка, проте достатньо високі показники волатильності, чиї значення близькі до квітневих позначок, вказують на наявність високих ризиків ускладнення епідемічної ситуації. Аналіз динаміки співвідношення процесів захворюваності та видужання також вказує на те, що про стабільність ситуації говорити ще зарано, оскільки кількість нових виявлених хворих стабільно перевищує кількість осіб, що подолали хворобу.

Рисунок 22а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Івано-Франківській області  станом на першу декаду липня

За даними МОЗ України коефіцієнт виявлення випадків інфікування COVID-19 критично близький (і навіть перевищує) до порогового значення 11%.

2.10. Київська область

Рисунок 23. Аналіз динаміки нових виявлених хворих по Київській області станом на першу декаду липня

Останній пік пандемії у області мав місце 11 квітня. Волатильність (мінливість даних щоденної захворюваності) наразі нижча, ніж у квітні. Протягом останніх двох місяців кількість нових хворих за добу знаходиться у коридорі від 10 до 60 осіб. Тим не менш, кількість нових виявлених хворих наразі переважає кількість вилікуваних.

Рисунок 23а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Київській області  станом кінець травня

За даними МОЗ України ситуація в Київській області є стабільною за всіма визначеними МОЗ показниками.

2.11. Кіровоградська область

Рисунок 24. Аналіз динаміки нових виявлених хворих по Кіровоградській області станом на першу декаду липня

Останній пік мав місце 14 квітня. Процес вийшов на стабільну динаміку 6 травня, яка триває і понині. Волатильність (мінливість у даних нових виявлених хворих) є низькою. Кількість нових виявлених хворих не перевищує 10 осіб. Графік динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, осцилює навколо нуля з низьким рівнем мінливості.

Рисунок 24а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Кіровоградській області  станом на першу декаду липня

Дані МОЗ України підтверджують стабільність ситуації.

2.12. Луганська область

Рисунок 25. Аналіз динаміки нових виявлених хворих по Луганській області станом на першу декаду липня

             Кількість нових виявлених хворих за день не перевищує 10 осіб з середини квітня. Графік співвідношення нових випадків захворювань та вилікуваних осіб стабільно осцилює навколо нуля.

Рисунок 25а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що одужали, по Луганській області  станом на першу декаду липня

За даними МОЗ України ситуація з поширенням захворювання в Луганській області є задовільною за всіма показниками.

2.13. Львівська область

Рисунок 26. Аналіз динаміки нових виявлених хворих по Львівській області станом на першу декаду липня

Останній зафіксований пік: 22 червня. 27 червня червона лінія трендового індикатора «supertrend» перетнула лінію графіка, що свідчить про злам тенденції на зростання кількості нових хворих. Спостерігається незначна тенденція до спадання, проте показники волатильності наразі залишаються високими, що свідчить про наявність ризиків повернення до зростання захворюваності. Кількість нових хворих за день стабільно переважає кількість тих, хто видужав, отже ситуація ще далека від стабільної.

Рисунок 26а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Львівській області  станом на першу декаду липня

Згідно МОЗ України ситуація в Львівській області є задовільною, хоча слід відзначити, що показник завантаженості ліжок у закладах охорони здоров’я, визначених для госпіталізації пацієнтів з підтвердженим випадком COVID-19, загрозливо близький до порогового значення 50% і становить близько 40%.

2.14. Миколаївська область

Рисунок 27. Аналіз динаміки нових виявлених хворих по Миколаївській області станом на першу декаду липня

Різке збільшення кількості нових захворювань в другій половині червня свідчить про наявність спалаху захворювання. Останній зафіксований пік спостерігався 22 червня. Насьогодні спостерігаємо спадну тенденцію.

             Наступний графік (рис. 27а) підтверджує спалах захворювання напри-кінці червня та подальшу стабалізацію процесу захворюваності.

Рисунок 27а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Миколаївській області  станом на першу декаду липня

МОЗ України підтверджує задовільність ситуації в Миколаївській області.

2.15. Одеська область

Рисунок 28. Аналіз динаміки нових виявлених хворих по Одеській області станом на першу декаду липня

Останній зафіксований пік: 28 червня. Тренд на зростання, що спостерігався з 14 до 28 червня, змінив боковий рух графіка, проте останніми днями кількість нових хворих знову наближається до пікових позначок. Варто відзначити стрімке зростання волатильності даних, що свідчить про нестійкість процесу. Кількість нових виявлених хворих переважає кількість людей, що видужали, що також підтверджує високі ризики несприятливого розвитку подій.

Рисунок 28а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Одеській області  станом на першу декаду липня

МОЗ України визначає Одеську область як регіон з показниками, що відповідають нормі.

2.16. Полтавська область

Рисунок 29. Аналіз динаміки нових виявлених хворих по Полтавській області станом на першу декаду липня

Пік пандемії спостерігався 22 квітня. Мають місце стійкий тренд на спадання кількості нових виявлених хворих за день та спадання волатильності виявлення нових хворих за добу. Наразі кількість нових випадків захворювань близька до нуля (не перевищувала 5 осіб). З 3 травня кількість людей, що одужали, в основному переважає кількість людей, що захворіли, мінливість цього процесу є низькою.

Рисунок 29а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Полтавській області  станом на першу декаду липня

МОЗ України визначає Полтавську область як регіон з показниками, що відповідають нормі.

2.17. Рівненська область

Рисунок 30. Аналіз динаміки нових виявлених хворих по Рівненській області станом на першу декаду липня

Останній пік кількості нових виявлених хворих за день відбувся 30 червня. 5 липня червона лінія тренду «supertrend» перетнула лінію графіка, що може свідчити про злам тенденції на зростання. Наразі не можна стверджувати про наявність стійкої тенденції до зростання або спадання кількості нових випадків захворювання у області. Має місце достатньо висока волатильність (мінливість процесу плину пандемії), що вказує на наявні ризики несприятливої зміни ситуації.

Високу волатильність демонструє також динаміка процесу співвідношення нових виявлених хворих та кількості людей, що видужали.

Рисунок 30а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Рівненській області  станом на першу декаду липня

За даними МОЗ України коефіцієнт виявлення випадків інфікування COVID-19 становить більш як 11% і становить 13, 79%.

2.18. Сумська область

Рисунок 31. Аналіз динаміки нових виявлених хворих по Сумській області станом на першу декаду липня

Останній зафіксовай пік – 13 червня (12 осіб). Наразі спостерігається боковий рух графіка, ситуація стабільна, кількість нових виявлених хворих за день не перевищує 10 – 12 осіб. Динаміка співвідношення нових виявлених хворих та кількості людей, що одужали також є стабільною.

 

Рисунок 31а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Сумській області  станом на першу декаду липня

МОЗ України визначає Сумську область як регіон з показниками, що відповідають нормі. Аналіз вищенаведених графіків це підтверджує.

2.19. Тернопільська область

Рисунок 32. Аналіз динаміки нових виявлених хворих по Тернопільській області станом на першу декаду липня

Пік пандемії відбувся 29 квітня. Потім  мало місце стійке спадання кількості нових виявлениххворих за день. Протягом червня спостерігався тренд на зростання. З 1 липня – злам тренду, боковий рух графіка у коридорі від 5 до 50. Співвідношення кількості нових випадків захворювання та кількості людей, які вилікувались, було доволі тривожним протягом червня, однак в липні процес був стабілізований, хоча є незначні локальні сплески.

Рисунок 32а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Тернопільській області  станом на першу декаду липня

За даними МОЗ України коефіцієнт виявлення випадків інфікування COVID-19 становить 8,26%, що загрозливо близько до порогового значення 11%, водночас показник динаміки зростання випадків інфікування COVID-19 становить значно більше 10%.

2.20. Харківська область

Рисунок 33. Аналіз динаміки нових виявлених хворих по Харківській області станом на першу декаду липня

Спостерігається боковий рух графіка у коридорі від 10 до 60.  З кінця червня має місце достатньо висока волатильність. З 1 червня спостерігається негативна динаміка співвідношення нових виявлених хворих та людей, що одужали (за винятком 30 червня, що може пояснюватись тривалими вихідними перед цим та обмеженою роботою лабораторій на День Конституції).

Рисунок 33а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Харківській області  станом на першу декаду липня

За даними МОЗ України коефіцієнт виявлення випадків інфікування COVID-19 становить більш як 11%.

2.21. Херсонська область

Рисунок 34. Аналіз динаміки нових виявлених хворих по Херсонській області станом на першу декаду липня

Пік пандемії відбувся 28 квітня. Наразі кількість нових виявлених хворих за день близька до нуля. Рисунок 34а також свідчить про позитивну динаміку процесу.

Рисунок 34а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Херсонській області  станом на першу декаду липня

МОЗ України визначає Херсонську область як регіон з показниками, що відповідають нормі. Аналіз вищенаведених графіків підтверджує стабільність ситуації.

2.22. Хмельницька область

Рисунок 35. Аналіз динаміки нових виявлених хворих по Хмельницькій області станом на першу декаду липня

Близько 25 червня відбувся різкий стрибок кількості нових виявлених хворих за день, що свідчить про наявність локального спалаху захворювання. Останній пік відбувся 25 червня, після чого ситуація була стабілізована. Графік співвідношення нових виявлених хворих та кількості людей, що видужали, також вказує на наявність спалаху 25 червня, однак подальша тенденція цілком позитивна.

Рисунок 35а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Хмельницькій області  станом на першу декаду липня

МОЗ України визначає Хмельницьку область як регіон з показниками, що відповідають нормі.

2.23. Черкаська область

Рисунок 36. Аналіз динаміки нових виявлених хворих по Черкаській області станом на першу декаду липня

Пік пандемії спостерігався 28 березня. Спостерігаємо боковий рух графіка, хоча 6 липня червона лінія тренду «supertrend» перетнула лінію графіка, що може свідчити про зміну тенденції на зростаючу. Однак протягом червня - липня жодного разу не було зафіксовано більше 20 хворих за добу, тож даних замало для чіткого висновку. З 16 червня графік співвідношення нових виявлених хворих та кількості людей, що видужали, в цілому не демонструє негативної динаміки (рис. 36а).

Рисунок 36а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Черкаській області  станом на першу декаду липня

МОЗ України визначає Черкаську область як регіон з показниками, що відповідають нормі.

2.24. Чернівецька область

Рисунок 37. Аналіз динаміки нових виявлених хворих по Чернівецькій області станом на першу декаду липня

Пік захворюваності мав місце 22-24 квітня, після чого припинилося зростання кількості нових виявлених хворих за день, волатильність (мінливість даних плину пандемічного процесу) є стабільно невисокою протягом червня. Спостерігається боковий рух графіка у коридорі від 10 до 90 нових випадків.

Кількість нових хворих стабільно переважає кількість людей, що видужали. Більше того, з 25 травня показники волатильності цього процесу падають, а отже є можливість, що така негативна тенденція може зберігатись і надалі.

Рисунок 37а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Чернівецькій області  станом на першу декаду липня

МОЗ України визначає Чернівецьку область як регіон з показниками, що відповідають нормі.

2.25. Чернігівська область

Рис. 38. Аналіз динаміки нових виявлених хворих по Чернігівській області станом на першу декаду липня

Останній зафіксований пік – 3 червня. Наразі спостерігається боковий рух графіка. Після 13 червня (25 виявлених хворих) кількість нових виявлених хворих за день приймає значення близько 10 – 15 осіб.

Рисунок 38а. Аналіз динаміки співвідношення нових виявлених хворих та кількості людей, що видужали, по Чернігівській області  станом на першу декаду липня

МОЗ України визначає Чернігівську область як регіон, недостатньо охоплений тестуванням (менше порогового значення 24 на тис. населення)

3. Прогнозне моделювання поширення пандемії COVID-19 в Україні на липень2020 року

3.1. Застосування методу подібності в математичному моделюванні

На першому кроці застосування цього методу виберемо країну (країни) – прототип, характер розвитку пандемії в якій (яких) є найбільш наближеним до характеру розвитку цього процесу в Україні.  З цією метою застосуємо метод кореляційно-регресійного аналізу для порівняння головних показників України з відповідними показниками країн Європи. Країни для порівняння вибиралися виходячи з наступних показників:

  • Населення, обраної для порівняння країни має бути не меншим 10 млн. людей;
  • Густина населення має бути співмірною з густиною населення України і коливатися в діапазоні (1-2,5) у порівнянні з густиною населення України.

В результаті застосування цих критеріїв для порівняння з Україною було обрано 16 країн Європи (таблиця 2).

Таблиця 2. Застосування кореляційно-регресійного
аналізу для вибору країни (країн) прототипу

Країна Коеф. кореляції за P1 (r1.j) Коеф. кореляції за P2 (r2.j) Коеф. кореляції за P3 (r3.j) Коеф. кореляції за P4 (r4.j) Коеф. для P5 (r5.j) Індекс подібності (Ij) Населення (млн) Щільність населення (осіб/кв.км) Кількість зроблених тестів (% від кількості населення)
Ukraine             42 73,8 1,7697
France 0,948 0,953 0,992 0,908 0,976 0,956 67,1 104 2,1212
Poland 0,989 0,984 0,996 0,906 0,813 0,938 38,4 123 4,5459
Romania 0,974 0,987 0,993 0,9 0,831 0,937 19,4 84,4 4,2859
Hungary 0,914 0,961 0,985 0,804 0,916 0,916 9,8 105,1 3,0232
Sweden 0,999 0,988
0,853 0,719 0,89 10,3 20,3 5,9403
Czechia 0,892 0,926 0,949   0,752 0,88 10,6 134 5,456
Germany 0,951 0,959 0,989 0,871 0,607 0,875 83,1 232 7,6095
Greece 0,866 0,925 0,852 0,834 0,887 0,873 10,8 82 3,4421
Netherlands 0,885 0,908   0,836 0,851 0,87 17,4 421 3,9796
Italy 0,959 0,982 0,994 0,757 0,473 0,833 60,3 201,3 9,6043
Belarus 0,987 0,997 0,987   0,327 0,825 9,5 45,8 11,7641
Austria 0,799 0,91 0,845 0,861 0,608 0,805 9 106 7,5878
Spain 0,925 0,956 0,967 0,706 0,293 0,769 47,1 92 12,2651
Belgium 0,881 0,908 0,857 0,829 0,335 0,762 11,5 376 11,6456
Portugal 0,938 0,951 0,972 0,639 0,25 0,75 10,3 114,5 12,9114
United Kingdom 0,975 0,966 -0,184 0,64 0 0,479 67,9 270,7 16,6241

Було розглянуто наступні набори даних:

  • Кількість зареєстрованих випадків COVID-19 (P1);
  • Кількість зареєстрованих летальних випадків COVID-19 (P2);
  • Кількість зареєстрованих випадків одужання від COVID-19 (P3);
  • Коефіцієнт мобільності (P4);
  • Кількість зроблених тестів на 1000 осіб (P5).

Дослідження спрямовувалось на оцінювання подібності даних для України з даними 16 країн Європи, обраних для порівняння. Для показників  P1 - P4 обраховано відповідні коефіцієнти кореляції ri,jде i=1..4; j=1..16; значення Pнормовано відносно значення показника для України за формулою:

З використанням наявних даних і введених критеріїв P1-P5 було обраховано індекс подібності:  (таблиця 5).

На рис. 39 наведено кількість хворих на COVID-19 для перших 5 країн з табл. 2 та України.

Рисунок 39. Кількість зареєстрованих випадків COVID-19

Як бачимо, що поведінка кількості зареєстрованих випадків у Франції та Угорщини дуже відрізняється від України. Тому на основі використання обрахованого індексу подібності та групи таких показників, як населення країни, густина населення країни, територіальна наближеність країни Європи до України, в якості країн-прототипів для виконання прогнозного моделювання на четвертому етапі послаблення карантинних заходів було обрано Швецію, Польщу та Румунію. На рис. 40-43 зображено графіки поширення хвороби для цих країн.

При цьому для України, на цьому часовому відрізку, характер процесу поширення пандемії COVID-19найбільш наближений до Шведського випадку з коефіцієнтом кореляції за (Р1) К=0,999. (рис 3, табл. 2). На рис. 40 наведені дані для щоденно інфікованих COVID-19 у Швеції за останній місяць.

Рисунок 40. Дані для щоденно інфікованих COVID-19 у Швеції за останній місяць

Враховуючи приблизно 18-денну часову затримку поширення хвороби в Україні по відношенню до країни-прототипу Швеції, можемо передбачити на наступні 18 днів тенденцію повільного затухання поширення COVID-19 в Україні на рівні 700-900 нових інфікованих в день (рис. 41, табл. 3).

Рисунок 41. Кількість зареєстрованих випадків COVID-19 для України та країн-прототипів

Рисунок 42. Кількість щоденних зареєстрованих випадків COVID-19 для України та країн-прототипів

Рисунок 43. Кількість зареєстрованих смертельних випадків від COVID-19для України та країн-прототипів

Рисунок 44. Прогнозні дані для кількості зареєстрованих випадків COVID-19 в Україні (з використанням країни-прототипу – Швеції)

 

Таблиця 3. Прогнозні значення кількості інфікованих в Україні (синій колір)

Дата Кількість інфікованих Добова кількість інфікованих
10.06.2020 28381  
11.06.2020 29070 689
12.06.2020 29753 683
13.06.2020 30506 753
14.06.2020 31154 648
15.06.2020 31810 656
16.06.2020 32476 666
17.06.2020 33234 758
18.06.2020 34063 829
19.06.2020 34984 921
20.06.2020 35825 841
21.06.2020 36560 735
22.06.2020 37241 681
23.06.2020 38074 833
24.06.2020 39014 940
25.06.2020 40008 994
26.06.2020 41117 1109
27.06.2020 42065 948
28.06.2020 42982 917
29.06.2020 43628 646
30.06.2020 44334 706
01.07.2020 44998 664
02.07.2020 45887 889
03.07.2020 46763 876
04.07.2020 47677 914
05.07.2020 48500 823
06.07.2020 49043 543
07.07.2020 49607 564
08.07.2020 50414 807
09.07.2020 51224 810
10.07.2020 52043 819
11.07.2020 52843 800
12.07.2020 53680 837
13.07.2020 54600 921
14.07.2020 55507 907
15.07.2020 56400 893
16.07.2020 57279 879
17.07.2020 58143 865
18.07.2020 58994 851
19.07.2020 59831 837
20.07.2020 60653 823
21.07.2020 61462 809
22.07.2020 62257 795
23.07.2020 63037 781
24.07.2020 63804 767
25.07.2020 64556 753
26.07.2020 65295 739
27.07.2020 66020 725
28.07.2020 66730 711
29.07.2020 67427 697

3.2. Застосування рекурентної нейронної мережі із довгою короткостроковою пам’яттю типу LSTM

Довірчий інтервал для прогнозу нових виявлених хворих на другу половину червня було побудовано робастно за допомогою моделі лінійної регресії, SARIMA, методу градієнтного бустингу (XGB), із залученням рекурентних нейронних мереж із довгою короткостроковою пам’яттю (ДКЧП, англ. long short-term memory, LSTM). Робасність розуміється в такому сенсі: на першому кроці для кожної із моделей на кожен із 10 днів будуються прогнози із відповідними довірчими інтервалами із заданою статистичною точністю, де верхній селектор – це песимістичний прогноз, а нижній – оптимістичний. На другому кроці будуються шукані довірчі інтервали для кожного моменту часу як мінімальні за включенням інтервали, які містять довірчі інтервали із означених вище трьох прогнозних моделей.

Прогноз виконувався на основі даних Національної служби здоров’я України [4,5]. На рисунках 27 та 28 представлено відповідні довірчі інтервали.

Довідково:

У статистиці лінійна регресія – це метод моделювання взаємозв'язку між даними за допомогою лінійних функцій, де невідомі параметри моделі оцінюються за вхідними даними. При розрахунках параметрів моделі лінійної регресії зазвичай застосовується метод найменших квадратів (МНК) [6].

Модель SARIMA (або сезонна модель ARIMA) – модель і методологія аналізу нестаціонарних часових рядів із використанням сезонності (в нашому випадку це пов’язано зі специфікою реєстрації підозр та нових підтверджених хворих, людським фактором, специфікою роботи медичних статистиків тощо). Підхід Бокса-Дженкінса полягає в тому, що в першу чергу оцінюється стаціонарність часового ряду. Якщо ряд не є стаціонарним, то за допомогою низки тестів для нього шукаються одиничні корені та порядок інтегровності (як правило, обмежуються першим або другим порядком). Далі, якщо порядок інтегровності більший за нуль, ряд перетворюється на (слабко) «стаціонарний» [7,8].

Метод градієнтного бустингу використовується в галузі статистики та аналізу даних для прогнозних моделей. Структура дерева містить такі елементи: «листя» і «гілки». На ребрах («гілках») дерева ухвалення рішення записані атрибути, від яких залежить цільова функція, в «листі» записані значення цільової функції, а в інших вузлах — атрибути, за якими розрізняються випадки. Щоб класифікувати новий випадок, треба спуститися по дереву до листа і видати відповідне значення [9]. Для навчання та оптимізації структури використаємовідкриту бібліотеку XGBoost, в який, зокрема, реалізовано методи розумного штрафування дерев, пропорційного скорочування листових вузлів, Ньютонове підсилювання, а також, реалізований додатковий параметр рандомізації [10].

На відміну від решти алгоритмів машинного навчання, рекурентні нейронні мережі з довгою короткостроковою пам’яттю (в англомовній термінології LSTM) здатні автоматично виявляти характерні риси з часових послідовностей, обробляти багатовимірні дані, а також виводити послідовності змінної довжини, завдяки чому їх можна використовувати для інтервального прогнозування [11].

З використанням рекурентної нейронної мережі LSTM побудуємо два сценарії розвитку поширення хвороби до 21 липня 2020 року: оптимістичний і песимістичний.

Оптимістичний сценарій може відбутися за умови відсутності небажаних, непередбачуваних факторів негативного характеру.Розрахуємо прогнозні дані і довірчі інтервали прогнозу нових виявлених хворих до 21 липня 2020 року, з урахуванням осереднених значень за 7 днів (рис. 45, табл. 4).

Рисунок 45. Оптимістичний сценарійпрогнозні дані і довірчі інтервали прогнозу нових виявлених хворих до 21 липня 2020 року

Таблиця 4. Прогнозні дані і довірчі інтервали прогнозу нових виявлених хворих
до 21 липня 2020 року (оптимістичний сценарій)

Дата Прогнозне значення Нижня межа Верхня межа
12.07.2020 763 747 779
13.07.2020 742 723 761
14.07.2020 719 693 745
15.07.2020 689 652 726
16.07.2020 655 607 703
17.07.2020 622 561 683
18.07.2020 595 525 665
19.07.2020 569 491 646
20.07.2020 542 460 624
21.07.2020 519 434 603

Статистична похибка розрахунків становить 0.03%.

Песимістичний сценарій побудовано з врахуванням ймовірних ризиків впливу, зовнішніх, негативних факторів, зокрема, можливої появи нових осередків епідемії в ході розширення охоплення населення України тестами. Прогнозні дані і довірчі інтервали прогнозу нових виявлених хворих до 21 липня 2020 року наведено на рис. 46 і в табл. 5.

Рисунок 46. Песимістичний сценарій: прогнозні дані і довірчі інтервали прогнозу нових виявлених хворих до 21 липня 2020 року

Таблиця 5.Прогнозні дані і довірчі інтервали прогнозу нових виявлених хворих
до 21 липня 2020 року (песимістичний сценарій)

Дата Прогнозне значення Нижня межа Верхня межа
12.07.2020 861 843 879
13.07.2020 833 812 854
14.07.2020 851 820 881
15.07.2020 840 795 885
16.07.2020 810 751 869
17.07.2020 801 722 879
18.07.2020 791 698 884
19.07.2020 778 672 884
20.07.2020 780 662 898
21.07.2020 814 699 929

Статистична похибка розрахунків при побудові песимістичного сценарію також становить 0.03%.

Таким чином, на часовому відрізку (12.07.20 – 21.07.20) кількість нових виявлених хворих може коливатися в діапазоні (500 – 800) осіб на день за оптимістичним сценарієм і (650 – 950) – за песимістичним.

3.3. Короткостроковий прогноз поширення COVID-19 (13.07.20 - 17.07.20) на основі нейронної мережі Back Propagation

Результати короткострокового прогнозного моделювання кількості хворих на COVID-19 в Україні і м. Києві на 13.07.20-17.07.20 (рис. 47-56; табл. 6, 7) отримано з використанням багатошарової нейронної мережі Back Propagation на основі механізму «ковзного вікна» з кількістю точок даних для навчання нейронної мережі – 12.

Бачимо, що для України характер поширення пандемії, за виключенням окремих сплесків, досягає рівня 600 – 800 нових інфікованих на день (рис. 48). Для міста Києва, спостерігаємо аналогічний характер поширення пандемії з 60 – 80 новими інфікованих на день (рис. 51, 52).

Середня абсолютна похибка у відсотках виконаного прогнозу не перевищує MAPE = 1.08% для України і МАРЕ = 1.49% для м. Києва (рис. 55, 56, табл. 8, 9). Зазначимо, що на більших обсягах даних (як це ми маємо для України у порівнянні з м. Києвом) нейронна мережа Back Propagation є менш чутливою до короткотермінових збурень та сплесків і дозволяє отримати меншу похибку прогнозу. 

На рис. 57 та 58 наведено відповідно співвідношення кількості інфікованих і видужалих в Україні та м. Києві від вірусу SARS-CoV-2. 

3.4. Порівняння результатів прогнозування поширення COVID-19 в Україні, отриманих різними методами

Зведемо результати прогнозного моделювання процесу поширення пандемії COVID-19 (нових виявлених хворих), отримані з використанням методу подібності в математичному моделюванні (розділ 3.1), рекурентної нейронної мережі із довгою короткостроковою пам’яттю типу LSTM (розділ 3.2) і нейронної мережі Back Propagation (розділ 3.3), в єдину таблицю 10 і зобразимо графіки цих прогнозів на рис. 59.

Таблиця 10. Порівняння прогнозних значень нових
випадків за добу, отриманих різними методами

Дата Метод подібності в математичному моделюванні Back Propagation Neural Network LSTM, оптимістичний сценарій LSTM, песимістичний сценарій
12.07.2020 837   763 861
13.07.2020 921 701 742 833
14.07.2020 907 740 719 851
15.07.2020 893 760 689 840
16.07.2020 879 710 655 810
17.07.2020 865 680 622 801
18.07.2020 851   595 791
19.07.2020 837   569 778
20.07.2020 823   542 780
21.07.2020 809   519 814
22.07.2020 795      
23.07.2020 781      
24.07.2020 767      
25.07.2020 753      
26.07.2020 739      
27.07.2020 725      
28.07.2020 711      
29.07.2020 697      

Рисунок 59. Порівняння прогнозних значень нових випадків за добу, отриманих з використанням методів подібності в математичному моделюванні, рекурентної нейронної мережі LSTM, нейронної мережі Back Propagation

Порівнюючи отримані з використанням різних методів результати прогнозного моделювання (рис. 59) бачимо, що на відрізку часу 12.07.20 – 29.07.20 вони мають явно виражену збіжність і вказують на тенденцію повільного згасання другої хвилі пандемії COVID-19 до кінця липня 2020 року до рівня 500-700 нових хворих на день.

Висновки

  1. Епідеміологічна ситуація протягом четвертого етапу послаблення карантинних заходів продовжує залишатися складною у регіонах Західної України та м. Києві. Погіршується ситуація у Харківській, Донецькій та Одеській областях, що пов’язано із зростанням мобільності населення, зниженням рівня його безпечності і соціальної дисципліни. Напруженою залишається ситуація з госпіталізацією в Закарпатській, Львівській, Волинській, Рівненській області та м. Києві. Разом з тим, в цілому по Україні результати виконаного прогнозного моделювання свідчать про можливий початок спадної тенденції поширення пандемії.
  2. Дослідження загальної (пішої і автомобільної) мобільності населення показують, що вона продовжує значно перевищувати первинні показники початку року. Середня автомобільна мобільність за період з 17 червня по теперішній час склала в середньому 160% від початку року, а піша – 130%. При цьому обидва види мобільності мають тенденцію до зростання. Між кількістю щоденних випадків захворювання на COVID-19 і загальною мобільністю населення в Україні протягом 4-етапного послаблення карантинних заходів виявлена чітка кореляційна залежність. Якщо протягом перших двох етапів послаблення карантинних заходів коефіцієнт кореляції між цими двома статистичними рядами був на рівні 0.55-0.65, то протягом четвертого етапу він зріс до 0.68-0.73.
  3. Між збільшенням кількості тестувань та кількістю виявлених хворих існує жорстка статистична залежність (практично лінійна), яка визначається комплексом факторів розвитку епідеміологічної ситуації. Коефіцієнт кореляції між цими двома статистичними рядами даних протягом четвертого етапу послаблення карантинних обмежень досяг значення 0,978. Разом з тим, на попередніх етапах послаблення карантину характер цієї залежності час від часу змінювався, що вказує на те, що точка насичення, яка пов’язана з максимальним охопленням потенційних хворих в Україні, ще не досягнута. Зв’язки між показниками тестування та госпіталізації також пов’язані між собою, але в даному випадку на процес госпіталізації впливають інші інституціонально-організаційні фактори.
  4. Останній пік кількості нових виявлених хворих за день в Україні відбувся 26 червня 2020 року (1180 осіб). Кількість хворих і різниця кількості нових хворих та кількості осіб, що видужали після послаблення карантинного режиму до 26 червня стабільно і монотонно зростали. Під час жорсткого карантину кількість нових виявлених хворих на день не була більшою аніж 500 осіб на день, після послаблення – приблизно 700 - 800, а пікове значення 26 червня склало 1180 осіб, що захворіли. Волатильність після першого тижня червня знову почала зростати до кінця місяця, а отже зростали і ризики втрати контролю над епідемічною ситуацією. Значення індикатора сили тренду протягом червня знаходились значно нижче критичної позначки, що свідчило про вихід із стабільного коридору 250-600 хворих та формування тренду на стійке зростання. Це відбулось, значною мірою, за рахунок того, що в травні – червні були введені три перші етапи послаблення карантинних заходів в областях України, де станом на 30.05.2020 спостерігався високий ризик несприятливого розвитку пандемії (Форсайт COVID-19: перехід до фази згасання пандемії коронавірусу). В цих регіонах (Волинська, Донецька, Львівська, Рівненська, Чернівецька області) станом на першу декаду липня все ще продовжується зростання хвороби. За цей час до зазначених областей долучились Вінницька та Закарпатська області, які станом на кінець травня були в групі середнього та низького ризику розвитку епідемії відповідно.
  5. Результати прогнозного моделювання процесу поширення пандемії COVID-19, отримані з використанням методу подібності в математичному моделюванні (розділ 3.1), рекурентної нейронної мережі із довгою короткостроковою пам’яттю типу LSTM (розділ 3.2) і нейронної мережі Back Propagation (розділ 3.3) вказують на тенденцію повільного згасання другої хвилі пандемії COVID-19 на часовому відрізку 12.07.20 – 29.07.20. Зокрема:
    • Після 27 червня дані індикаторів свідчать про можливий початок спадної тенденції. Сила зростаючої тенденції, що мала місце у червні затухає, а показники волатильності (наявності ризиків) з 27 червня спадають, наближаючись до рівня кінця травня, коли епідемічна ситуація виглядала контрольованою. Співвідношення кількості нових хворих за добу стабільно переважає кількість тих, хто видужав, проте швидкість процесу захворюваності явно зменшується, а значення мінливості цього процесу з 1 липня знаходяться на рівні травневих позначок, що дозволяє обережно сподіватись на продовження спадного тренду у найближчі дві декади липня 2020 року.
    • Як показують результати прогнозного моделювання, до областей, з оптимістичною епідеміологічною ситуацією можна віднести Вінницьку, Дніпропетровську, Житомирську, Запорізьку, Кіровоградську, Луганську, Полтавську, Миколаївську, Хмельницьку та Херсонську області, що також підтверджується даними МОЗ.
    • Місто Київ, Івано-Франківська, Одеська, Львівська, Київська та Чернівецька області рекомендовані МОЗ до послаблення карантинних заходів, проте результати виконаного прогнозного моделювання свідчать про наявність достатньо високих ризиків погіршення епідеміологічної ситуації – у більшості з цих областей значення одного або кількох критеріїв, які відслідковує МОЗ для прийняття рішення про зняття частини карантинних обмежень, є близькими до критичних.
    • Волинську, Донецьку, Закарпатську, Рівненську, Тернопільську, Харківську та Чернігівську області за результатами прогнозного моделювання і даними МОЗ не рекомендувало до зняття наявних карантинних обмежень. Зокрема у Донецькій та Чернігівській областях виявлений недостатній рівень охоплення тестуванням, у Закарпатській області перевищено поріг завантаженості ліжок у лікарнях, у Тернопільській області найвища по Україні динаміка захворюваності, а у решті областей перевищено поріг по інцидентності.

Посилання

  1. Peter Navarro, When the Market Moves, Will You Be Ready? McGraw-Hill Education, 2003.
  2. Attilio Meucci, Risk and Asset Allocation. (Springer Finance) 1st ed. 2005. Corr. 3rd printing, 2009.
  3. Marcos Lopez de Prado, Advances in Financial Machine Learning. John Wiley & Sons, Inc, 2018.
  4. Operational monitoring of the COVID-19 situation by the National Health Service of Ukraine (dashboard).
  5. Open data on the incidence of COVID-19 in Ukraine.
  6. Milos Hauskrecht, Linear Regression (Machine Learning). University of Pittsburgh, 2020.
  7. Kissler, Stephen M., Christine Tedijanto, Edward Goldstein, Yonatan H. Grad, and Marc Lipsitch. "Projecting the transmission dynamics of SARS-CoV-2 through the postpandemic period." Science 368, no. 6493 (2020): 860-868.
  8. Tseng, Fang-Mei, and Gwo-Hshiung Tzeng. "A fuzzy seasonal ARIMA model for forecasting." Fuzzy Sets and Systems 126, no. 3 (2002): 367-376.
  9. Breiman, Leo; Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and regression trees. Monterey, CA: Wadsworth & Brooks/Cole Advanced Books & Software. ISBN978-0-412-04841-8.
  10. XGBoost Library Documentation.
  11. Sepp Hochreiter[en]; Jürgen Schmidhuber[en] (1997). Long short-term memory. Neural Computation[en] 9 (8): 1735–1780. PMID 9377276. doi:10.1162/neco.1997.9.8. 1735

Науковий керівник проекту: М.З. Згуровський.

Команда проєкту: Н.В. Горбань, Б.Р. Дудка, К.В. Єфремов, Ю.П. Зайченко, П.О. Касьянов, О.П. Купенко, М.М. Перестюк, І.О. Пишнограєв, В.В. Путренко.

 
© World Data Center
    for Geoinformatics and Sustainable Development
    July 12, 2020