Doverosa premessa: Emergenza24 segue l’evoluzione del coronavirus dal 28.12.2019 e ne ha dato notizia il 31.12.2019. Dal giorno seguente, primo gennaio 2020, ha iniziato la raccolta sistematica di ogni dato a livello mondiale fornendo supporto e aggiornamenti per la parte italiana ad organizzazioni e istituzioni che raccolgono e ripubblicano i dati di COVID19.
Emergenza24 dal 01.01.2020 fornisce tutti i dati in open data in Github e sono disponibili a tutta la comunità scientifica per ogni analisi, osservazione, discussione.
- Gli ultimi dati sono sempre disponibili qui
- Lo storico (da 31.12.2019) con tutti i dati e aggiornamenti è qui
- Il dataset è disponibile aggiornato qui
Partiamo dai dati
I dati che sono raccolti e forniti, lo sappiamo tutti, sono ovviamente parziali e rappresentano una porzione nemmeno definita dei dati totali ma l’andamento aiuta a capire, sui grandi numeri, l’evoluzione del fenomeno. Quindi più che concentrarsi sul singolo numero, a cui ricordiamo corrisponde purtroppo una persona malata o deceduta, va fatta una lettura complessiva. Nemmeno il rapporto tra nuovi casi e tamponi è significativo perché non è omogenea la popolazione a cui viene praticato e nemmeno questo dato è disponibile.
Un altro dato estremamente utile ma non fornito e, pare nemmeno raccolto centralmente, sarebbe quello relativo all’intero percorso di ogni singolo paziente da quando viene fatto il tampone a quando è guarito. Questo permetterebbe di poter fare analisi molto più precise fino a poter valutare modelli di impegno delle strutture sanitarie.
Cosa si intende per nuovi casi
I nuovi casi sono forniti dalle fonti che sono indicate di seguito e quindi possono essere dello stesso giorno, del giorno precedente o ancora prima. È da tenere presente che non tutti i laboratori sono operativi al sabato e alla domenica e quindi ci possono essere degli accumuli. Il dato però ancora più significativo è che i dati possono essere riferiti a tempo effettuati “anche 20 o 30 giorni prima” come più volte ribadito nel Bollettino del DPC. Questo vuol dire che guardare il singolo giorno non è significativo anche se un dataset così esteso riduce sempre più questo errore.
La Protezione Civile fornisce dati più bassi durante il Bollettino
Non sono più bassi. La Protezione Civile fornisce ogni giorno una tabella riassuntiva completa di tutti i valori. Il dato evidenziato, di norma dal Dott. Borrelli, si riferisce ai nuovi casi di malati che vanno a pesare sul Sistema Sanitario Nazionale. Dato importantissimo per definire quanti posti letto servono e quanti posti in terapia intensiva. È quindi corretto evidenziare quel valore che è costituito da:
(Numero totale nuovi casi confermati) – (deceduti nel giorno) – (guariti nel giorno)
Quali fonti
Prendendo in considerazione i soli dati italiani le fonti sono le seguenti:
- Bollettino quotidiano della Protezione Civile
- Comunicati di Aziende ospedaliere
- Comunicati dei presidenti regionali
- Comunicati di Direttori sanitari
Ognuno di questi comunicati contiene un dataset eterogeneo e nemmeno sempre organicamente ordinato.
Prendendo in considerazione il Bollettino della Protezione Civile possiamo definire alcuni punti.
Fino al 17.04.2020 il bollettino era alle ore 18:00 in presenza da Dipartimento della Protezione Civile. Dalla settimana successiva avverrà solo il lunedì e il giovedì.
Il Bollettino è alle 18:00 e fa riferimento a dati raccolti alle ore 16:00 o 17:00 inviati dalle Regioni. I dati regionali hanno un orario di raccolta che varia dalle ore 8:00 alle ore 17:00 e spesso contengono correzioni rispetti ai dati dei giorni precedenti.
Non tutti i dati regionali sono sempre completi di tutte le province. Stesso discorso vale per le province autonome di Trento e Bolzano. Quando questo dato viene fornito lo indichiamo in questo documento e, di norma, nel piedino dei grafici distribuiti.
Dal 18.04.2020 solo on line e con aggiornamenti in presenza il lunedì e giovedì con possibilità di domande da parte dei giornalisti.
Istituti sanitari e strutture di ricovero
Forniscono spesso dei dati puntuali a giornali o a mezzo comunica stampa. Questo dato aiuta la raccolta provinciale del dato e anche puntuale. Questi dati, perlopiù estemporanei, possono essere riferiti a periodi diversi alle 24 ore, talvolta accumulati su più giorni o rappresentativi di poche ore.
Emergenza24 non fornisce i dati puntuali e provinciali per la difficoltà di avere una continuità di dataset.
Come raccogliamo i dati
Tutte le fonti italiane (sono 162 al momento) sono raccolte in un dataset cronologico con l’orario di rilascio e l’orario al quale fanno riferimento. Se questo non è specificato si presuppone, con sufficiente precisione, che sia l’ultimo orario indicato in precedenza dalla stessa struttura. Essendo poche ore di possibile differenza per una singola struttura il dato si mantiene sufficientemente preciso.
Ogni dato viene poi automaticamente confrontato con il dato del giorno successivo ed evidenziate anomalie statistiche che ci aiutano a capire se il modello di raccolta necessita di modificazioni.
Quali dati fornisce Emergenza24
Il dato a cui facciamo riferimento che forniamo alle organizzazioni internazionali e istituti e che pubblichiamo nei social e nella pagina del sito web è il dato fornito dal Dipartimento della Protezione Civile alle ore 18:00 con tutte le limitazioni viste in precedenza.
Il dato però, pur avendo periodicità regolare, non è rappresentativo di taluni fenomeni istantanei e quindi viene spesso fornito anche un dato attualizzato alle ultime 24 ore che, ovviamente, differisce dal dato del DPC e raccoglie tutte le fonti disponibili in quel momento.
Da quanto indicato in precedenza risulta chiaro che il modello non può essere rappresentato per semplice sottrazione o somma su dati diversi perché non sono omogenei nella raccolta.
Un dato importante è che disponendo dell’estesissimo dataset gli errori complessivi sono trascurabili.
Cronologia variazioni
Di seguito in ordine cronologico delle modifiche di periodicità, anomalie nei dati.
- Ci sono anomalie nei dati del 01.03.2020 che ricomprende alcuni casi precedentemente non conteggiati e il 10.03.2020 in cui mancano dei dati della regione Lombardia.
- Il giorno 11.03.2020 accumula, nei soli dati dei contagiati positivi, quindi non decessi, circa 600 casi tutti in Lombardia riferiti al 10.03.2020.
- Il giorno 16.03.2020 non erano pervenuti alle 17:00 i dati di Regione Puglia e Provincia Autonoma di Trento.
- Il giorno 18.03.2020 non sono compresi di dati della Regione Campania perché non li ha forniti.
- Dal 29.03.2020 il Piemonte fornisce i dati alle 19:00 di ogni giorno quindi non sono compresi nel comunicato delle 18:00 della Protezione Civile.
- La Regione Autonoma di Bolzano il 11.04.2020 non aveva fornito i dati dei guariti aggiornato nel giorno 12.04.2020.
- Fino al 17.04.2020 il bollettino era alle ore 18:00 in presenza da Dipartimento della Protezione Civile. Dalla settimana successiva avverrà solo il lunedì e il giovedì.
- Dal giorno 18.04.2020 il bollettino del DPC sarà solo on line il martedì, mercoledì, venerdì, sabato e domenica.
- Dal 18.04.2020 la Regione Veneto farà un solo comunicato intorno alle 12:00 con i dati riferito alle 08:00.
- I dati del 20.04.2020 soffrono di un errore di conteggio:
I dati corretti di oggi sono:
515 nuovi positivi
454 morti
1287 guariti
Totale casi: 2.256Hanno sbagliato i dati lombardi mettendo i nuovi positivi nei guariti (19.463 dichiarati dalla lombardia e 20008 dalla PC) @lorepregliasco @Cartabellotta @Emergenza24 @DPCgov pic.twitter.com/oh2aXHcGML
— Marco M.M. (@meteorologo777) April 20, 2020
- I dati del 30.04.2020 sono complessivi di dati di guariti accumulati in diversi giorni in Emilia Romagna.
- Dal 30.04.2020 La Regione Veneto fornisce di nuovo due bollettini: uno alle 12:00 riferito a dati raccolti fino alle 08:00 ed uno alle 17:00 senza indicazione dell’orario di raccolta dei dati. Nella data del 30.04.2020 il numero dei guariti delle 17:00 appare inferiore rispetto alle ore 12:00 dello stesso giorno.
- I dati del 02.05.2020 hanno una anomalia nel numero dei decessi. Quelli segnalati nelle ultime 24 ore sono 474 (+76% rispetto al giorno precedente) e sono un accumulo di casi non segnalati in precedenza. Il numero dei decessi nelle ultime 24 ore è di 192.
- I dati del 06.05.2020 hanno anomalie. La Protezione Civile precisa “Il numero così alto dei pazienti dimessi e guariti è dovuto ad un aggiornamento dei dati della Regione Lombardia riferiti anche ai giorni precedenti.“
- 12.05.2020 – La Regione Lombardia ha comunicato che dei nuovi casi conteggiati oggi, 419 sono riferiti alle settimane precedenti e non alle ultime 24 ore.
- 20 e 21 maggio 2020. I Dati del Veneto non sono corretti per “un guasto alle macchine per i tamponi”.
- 24.05.2020. la Protezione Civile nazionale afferma che “La Regione Lombardia non ha aggiornato il dato odierno sui decessi.” La Regione Lombardia dice che non ci sono decessi:
ULTERIORI INFORMAZIONI DA PROTEZIONE CIVILE
04/05 – Dati Regione Sardegna ricalcolo nuovi casi e guariti
02/05 – Dati Regione Lombardia ricalcolati 329 decessi (47 di oggi e 282 da riconteggio di aprile)
01/05 – Dati Regione Lazio ricalcolati 41 decessi (8 nelle ultime 48 ore e 33 ad aprile)
26/04 – Dati Regione Valle d’Aosta ricalcolati (casi testati)
24/04 – Dati Regione Sardegna ricalcolati (1.237 tamponi aggiunti)
24/04 – Dati Regione Friuli Venezia Giulia in fase di revisione su dimessi/guariti
23/04 – Dati Regione Lazio parziali (casi testati non completi)
23/04 – Dati Regione Campania parziali (casi testati non aggiornati)
21/04 – Dati Regione Lombardia parziali (casi testati non aggiornati)
20/04 – Dati Regione Lombardia ricalcolati (ricalcolo di casi testati – eliminazione duplicati)
15/04 – Dati Friuli Venezia Giulia corretti (ricalcolo di isolamento domiciliare e dimessi/guariti)
12/04 – Dati P.A. Bolzano corretti (ricalcolo guariti -110 rispetto a ieri)
10/04 – Dati Molise parziali (tamponi non aggiornati)
29/03 – Dati Emilia Romagna parziali (tamponi non aggiornati)
26/03 – Dati Piemonte parziali -50 deceduti (comunicazione tardiva)
18/03 – Dati Campania non aggiornati
18/03 – Dati Parma non aggiornati
17/03 – Dati Rimini non aggiornati
16/03 – Dati P.A. Trento e Puglia non pervenuti
11/03 – Dati Abruzzo non pervenuti
10/03 – Dati Lombardia parziali
07/03 – Dati Brescia +300 esiti positivi
18.06.2020 – Regione Abruzzo ha effettuato un ricalcolo dei casi totali, sottraendo un errato positivo
19.06.2020 – Si comunica che la Regione Abruzzo ha effettuato un ricalcolo dei casi totali, sottraendo due errati positivi e che la regione Sicilia ha sottratto dai casi totali 397 unità.
24.06.2020 – La Provincia Autonoma di Trento ha effettuato un ricalcolo dei dati: togliendo 61 deceduti, aggiungendo 447 guariti e aumentando i casi totali di 387 unità rispetto a quanto precedentemente comunicato.
25.06.2020 – La Regione Marche elimina 3 decessi non riconducibili a COVID.
06.12.2020 – Il Molise comunica che il dato delle persone testate di ieri era 89.725 e non 897.250
07.12.2020 – Anomalia non documentata di +41 casi rispetto al giorno precedente.
18.12.2020 – Il “ricalcolo” effettuato in data odierna senza fornire l’indicazione del periodi di riferimento rende impossibile garantire la continuità del dato. In particolare i rileva, tra gli altri come il Piemonte fornisca come NUMERO TOTALE DI CASI un valore inferiore il 17.12.2020 (189.270) rispetto al 18.12.2020 (187.890) ovvero 1380 CARI TOTALI in meo del giorno prima ma nel contempo indichi un aumento di 883 casi portando quindi la differenza -2263 casi. In totale la differenza rispetto al giorno precedente è di -2591 casi.
Noi continueremo a gestire le diverse fonti in parallelo.
I forniti giornalmente sono corrispondenti a quelli forniti dal Ministero della Salute.
15.06.2021 – Regione Campania corregge un errore e aggiunge 48.078 guariti. Nei nostri grafici sono stati ridistribuiti proporzionalmente nei 30 gg precedenti
30.12.2021 – Regione Veneto comunica che 107 casi sono precedenti al 24.12.2021. Regione Sicilia comunica che 118 casi sono precedenti al 24.12.2021.
04.01.2022 – Regione Liguria. Tra i 30 decessi indicati in data odierna alcuni sono riferibili ai giorni precedenti per un malfunzionamento, ora risolto, del sistema di gestione dei dati.
09.01.2022 – 17:00 – Italia: 155.659 (attenzione leggi UPDATE sotto) nuovi contagi, +157 morti nelle ultime 24 ore. +139.038 morti da inizio pandemia. In questo momento ci sono in Italia +1.943.979 positivi, il valore più alto di sempre.
ATTENZIONE – UPDATE il 10.01.2022 abbiamo appreso che la Regione Friuli Venezia Giulia aveva 181.557 casi e non 166.838. I casi pertanto il 09.01.2022 sono 155.659+14719 = 170.378.
10.01.2022 – 17:00 – Italia: 101.762 nuovi contagi, +227 morti nelle ultime 24 ore. +139.265 morti da inizio pandemia. In questo momento ci sono in Italia +2.004.597 positivi, il valore più alto di sempre.
I dati ufficiali di oggi presentano delle anomalie. In particolare l’incremento del numero dei casi ufficialmente è di 101.762 contro i 117405 ricavato dai calcoli tabellari sempre dello stesso Ministero: In particolare in Abruzzo (+1), in Liguria (-935) e in Friuli Venezia Giulia (-14.716). Prendendo il solo Friuli Venezia Giulia il Comunicato stampa odierno (link e permalink) riporta “Dall’inizio della pandemia in Friuli Venezia Giulia sono risultate positive complessivamente 183.155 persone”. La tabella seguente spiega meglio le differenze.
Abbiamo appreso che in Friuli Venezia Giulia i casi indicati ieri come 166.838 sarebbero in realtà 181.557. In totale erano stati omessi 15.643 casi. Le tabelle di Emergenza24 sono pertanto corrette.
14.01.2022 – 17:00 – Italia: 186.253 nuovi contagi, 360 morti segnalati nelle ultime 24 ore. 140.548 morti da inizio pandemia. In questo momento ci sono in Italia 2.398.828 positivi, il valore più alto di sempre.
ATTENZIONE: il numero reale comunica oggi sarebbe di 200.869 in quanto la Regione Puglia ha aggiunto solo oggi (ma non li ha indicati nel conteggio odierno) +14.647 casi pregressi (dal 01.01.2022 al 13.01.2022). Nelle tabelle da noi elaborate è riportato correttamente il valore di 200.869 casi.
15.01.2022 – 17:00 – Italia: 180.426 nuovi contagi, 308 morti segnalati nelle ultime 24 ore. 140.856 morti da inizio pandemia. In questo momento ci sono in Italia 2.470.847 positivi, il valore più alto di sempre.
ATTENZIONE: il numero reale comunica oggi sarebbe di 192.936 in quanto la Regione Puglia ANCHE OGGI ha aggiunto (ma non li ha indicati nel conteggio odierno) +12.592 casi pregressi (dal 01.01.2022 al 13.01.2022). Nelle tabelle da noi elaborate è riportato correttamente il valore di 192.936 casi.
15.01.2022 – 23:00 – Abbiamo normalizzato i dati della Regione Puglia proporzionando i dati omessi (+14647 comunicato il 14.01.2022 e +12.592 comunicato il 15.01.2022 e riferiti ai giorni compresi tra il 01.01.2022 e 15.01.2022). Il risultato è che i nuovi casi in Puglia nello stesso periodo non sono +81.012 ma 108.251 con un errore del +34%. Il grafico seguente riepiloga la situazione.
16.01.2022 – 17:00 – Italia: 149.512 nuovi contagi, 248 morti segnalati nelle ultime 24 ore. 141.104 morti da inizio pandemia. In questo momento ci sono in Italia 2.548.857 positivi, il valore più alto di sempre.
ATTENZIONE: il numero reale comunica oggi sarebbe di 157.465 in quanto la Regione Puglia ANCHE OGGI (per il terzo giorno consecutivo) ha aggiunto (ma non li ha indicati nel conteggio odierno) +7987 casi pregressi (dal 01.01.2022 al 15.01.2022). Nelle tabelle da noi elaborate è riportato correttamente il valore di 157.465 casi. La Regione Puglia ha omesso quindi 35.226 casi nei primi 15 giorni del 2022.
18.01.2022 – 17:00 – Italia: 228.179 nuovi contagi (peggior dato di sempre), 434 morti (peggior dato dal 14.04.2021) segnalati nelle ultime 24 ore. 141.825 morti da inizio pandemia. In questo momento ci sono in Italia 2.562.156 positivi, il valore più alto di sempre. La Regione Sicilia comunica che 72 decessi sono riferiti ai giorni precedenti.
19.01.2022 – 17:00 – Italia: 192.320 nuovi contagi, 380 morti segnalati nelle ultime 24 ore. 142.205 morti da inizio pandemia. In questo momento ci sono in Italia 2.626.590 positivi, il valore più alto di sempre.
ATTENZIONE: il numero reale comunica oggi sarebbe di 200.966 in quanto la Regione Puglia ANCHE OGGI (per il quarto giorno) ha aggiunto (ma non li ha indicati nel conteggio odierno) +8721 casi pregressi (dal 01.01.2022 al 15.01.2022). Nelle tabelle da noi elaborate è riportato correttamente il valore di 200966 casi. La Regione Puglia ha omesso quindi 43.947 casi nei primi 19 giorni del 2022.
20.01.2022 – 17:00 – Italia: 188.797 nuovi contagi, 385 morti segnalati nelle ultime 24 ore. 142.590 morti da inizio pandemia. In questo momento ci sono in Italia 2.682.041 positivi, il valore più alto di sempre.
ATTENZIONE: il numero reale comunica oggi sarebbe di 198.865 in quanto la Regione Puglia ANCHE OGGI (per il quinto giorno) ha aggiunto (ma non li ha indicati nel conteggio odierno) +10.086 casi pregressi (dal 01.01.2022 al 20.01.2022). Nelle tabelle da noi elaborate è riportato correttamente il valore di 198.865 casi. La Regione Puglia ha omesso quindi 54.033 casi nei primi 20 giorni del 2022.
22.01.2022 – 17:00 – Italia: 171.263 nuovi contagi, 333 morti segnalati nelle ultime 24 ore. 143.296 morti da inizio pandemia. In questo momento ci sono in Italia 2.723.949 positivi, il valore più alto di sempre.
ATTENZIONE: il numero reale comunica oggi sarebbe di 177.335
in quanto la Regione Puglia ANCHE OGGI (per il sesto giorno) ha aggiunto (ma non li ha indicati nel conteggio odierno) +6119 casi pregressi (dal 01.01.2022 al 22.01.2022). Nelle tabelle da noi elaborate è riportato correttamente il valore di 177.335
casi. La Regione Puglia ha omesso quindi 66.680 casi nei primi 20 giorni del 2022.
23.01.2022 – 17:00 – Italia: 138.860 nuovi contagi, 227 morti segnalati nelle ultime 24 ore. 143.523 morti da inizio pandemia. In questo momento ci sono in Italia 2.723.949 positivi, il valore più alto di sempre.
ATTENZIONE: il numero reale comunica oggi sarebbe di 142.487 in quanto la Regione Puglia ANCHE OGGI (per il settimo giorno) ha aggiunto (ma non li ha indicati nel conteggio odierno) +3.650 casi pregressi (dal 01.01.2022 al 23.01.2022). Nelle tabelle da noi elaborate è riportato correttamente il valore di 142.487 casi. La Regione Puglia ha omesso quindi 70.330 casi nei primi 23 giorni del 2022.