I numeri del coronavirus

Doverosa premessa: Emergenza24 segue l’evoluzione del coronavirus dal 28.12.2019 e ne ha dato notizia il 31.12.2019. Dal giorno seguente, primo gennaio 2020, ha iniziato la raccolta sistematica di ogni dato a livello mondiale fornendo supporto e aggiornamenti per la parte italiana ad organizzazioni e istituzioni che raccolgono e ripubblicano i dati di COVID19.

Emergenza24 dal 01.01.2020 fornisce tutti i dati in open data in Github e sono disponibili a tutta la comunità scientifica per ogni analisi, osservazione, discussione.

  • Gli ultimi dati sono sempre disponibili qui
  • Lo storico (da 31.12.2019) con tutti i dati e aggiornamenti è qui
  • Il dataset è disponibile aggiornato qui

Partiamo dai dati

I dati che sono raccolti e forniti, lo sappiamo tutti, sono ovviamente parziali e rappresentano una porzione nemmeno definita dei dati totali ma l’andamento aiuta a capire, sui grandi numeri, l’evoluzione del fenomeno. Quindi più che concentrarsi sul singolo numero, a cui ricordiamo corrisponde purtroppo una persona malata o deceduta, va fatta una lettura complessiva. Nemmeno il rapporto tra nuovi casi e tamponi è significativo perché non è omogenea la popolazione a cui viene praticato e nemmeno questo dato è disponibile.
Un altro dato estremamente utile ma non fornito e, pare nemmeno raccolto centralmente, sarebbe quello relativo all’intero percorso di ogni singolo paziente da quando viene fatto il tampone a quando è guarito. Questo permetterebbe di poter fare analisi molto più precise fino a poter valutare modelli di impegno delle strutture sanitarie.

Cosa si intende per nuovi casi

I nuovi casi sono forniti dalle fonti che sono indicate di seguito e quindi possono essere dello stesso giorno, del giorno precedente o ancora prima. È da tenere presente che non tutti i laboratori sono operativi al sabato e alla domenica e quindi ci possono essere degli accumuli. Il dato però ancora più significativo è che i dati possono essere riferiti a tempo effettuati “anche 20 o 30 giorni prima” come più volte ribadito nel Bollettino del DPC. Questo vuol dire che guardare il singolo giorno non è significativo anche se un dataset così esteso riduce sempre più questo errore.

La Protezione Civile fornisce dati più bassi durante il Bollettino

Non sono più bassi. La Protezione Civile fornisce ogni giorno una tabella riassuntiva completa di tutti i valori. Il dato evidenziato, di norma dal Dott. Borrelli, si riferisce ai nuovi casi di malati che vanno a pesare sul Sistema Sanitario Nazionale. Dato importantissimo per definire quanti posti letto servono e quanti posti in terapia intensiva. È quindi corretto evidenziare quel valore che è costituito da:

(Numero totale nuovi casi confermati) – (deceduti nel giorno) – (guariti nel giorno)

Quali fonti

Prendendo in considerazione i soli dati italiani le fonti sono le seguenti:

  • Bollettino quotidiano della Protezione Civile
  • Comunicati di Aziende ospedaliere
  • Comunicati dei presidenti regionali
  • Comunicati di Direttori sanitari

Ognuno di questi comunicati contiene un dataset eterogeneo e nemmeno sempre organicamente ordinato.

Prendendo in considerazione il Bollettino della Protezione Civile possiamo definire alcuni punti.

Fino al 17.04.2020 il bollettino era alle ore 18:00 in presenza da Dipartimento della Protezione Civile. Dalla settimana successiva avverrà solo il lunedì e il giovedì.

Il Bollettino è alle 18:00 e fa riferimento a dati raccolti alle ore 16:00 o 17:00 inviati dalle Regioni. I dati regionali hanno un orario di raccolta che varia dalle ore 8:00 alle ore 17:00  e spesso contengono correzioni rispetti ai dati dei giorni precedenti.

Non tutti i dati regionali sono sempre completi di tutte le province. Stesso discorso vale per le province autonome di Trento e Bolzano. Quando questo dato viene fornito lo indichiamo in questo documento e, di norma, nel piedino dei grafici distribuiti.

Dal 18.04.2020 solo on line e con aggiornamenti in presenza il lunedì e giovedì con possibilità di domande da parte dei giornalisti.

Istituti sanitari e strutture di ricovero

Forniscono spesso dei dati puntuali a giornali o a mezzo comunica stampa. Questo dato aiuta la raccolta provinciale del dato e anche puntuale. Questi dati, perlopiù estemporanei, possono essere riferiti a periodi diversi alle 24 ore, talvolta accumulati su più giorni o rappresentativi di poche ore.
Emergenza24 non fornisce i dati puntuali e provinciali per la difficoltà di avere una continuità di dataset.

Come raccogliamo i dati

Tutte le fonti italiane (sono 162 al momento) sono raccolte in un dataset cronologico con l’orario di rilascio e l’orario al quale fanno riferimento. Se questo non è specificato si presuppone, con sufficiente precisione, che sia l’ultimo orario indicato in precedenza dalla stessa struttura. Essendo poche ore di possibile differenza per una singola struttura il dato si mantiene sufficientemente preciso.
Ogni dato viene poi automaticamente confrontato con il dato del giorno successivo ed evidenziate anomalie statistiche che ci aiutano a capire se il modello di raccolta necessita di modificazioni.

Quali dati fornisce Emergenza24

Il dato a cui facciamo riferimento che forniamo alle organizzazioni internazionali e istituti e che pubblichiamo nei social e nella pagina del sito web è il dato fornito dal Dipartimento della Protezione Civile alle ore 18:00 con tutte le limitazioni viste in precedenza.

Il dato però, pur avendo periodicità regolare, non è rappresentativo di taluni fenomeni istantanei e quindi viene spesso fornito anche un dato attualizzato alle ultime 24 ore che, ovviamente, differisce dal dato del DPC e raccoglie tutte le fonti disponibili in quel momento.

Da quanto indicato in precedenza risulta chiaro che il modello non può essere rappresentato per semplice sottrazione o somma su dati diversi perché non sono omogenei nella raccolta.

Un dato importante è che disponendo dell’estesissimo dataset gli errori complessivi sono trascurabili.

Cronologia variazioni

Di seguito in ordine cronologico delle modifiche di periodicità, anomalie nei dati.

  • Ci sono anomalie nei dati del 01.03.2020 che ricomprende alcuni casi precedentemente non conteggiati e il 10.03.2020 in cui mancano dei dati della regione Lombardia.
  • Il giorno 11.03.2020 accumula, nei soli dati dei contagiati positivi, quindi non decessi, circa 600 casi tutti in Lombardia riferiti al 10.03.2020.
  • Il giorno 16.03.2020 non erano pervenuti alle 17:00 i dati di Regione Puglia e Provincia Autonoma di Trento.
  • Il giorno 18.03.2020 non sono compresi di dati della Regione Campania perché non li ha forniti.
  • Dal 29.03.2020 il Piemonte fornisce i dati alle 19:00 di ogni giorno quindi non sono compresi nel comunicato delle 18:00 della Protezione Civile.
  • La Regione Autonoma di Bolzano il 11.04.2020 non aveva fornito i dati dei guariti aggiornato nel giorno 12.04.2020.
  • Fino al 17.04.2020 il bollettino era alle ore 18:00 in presenza da Dipartimento della Protezione Civile. Dalla settimana successiva avverrà solo il lunedì e il giovedì.
  • Dal giorno 18.04.2020 il bollettino del DPC sarà solo on line il martedì, mercoledì, venerdì, sabato e domenica.
  • Dal 18.04.2020 la Regione Veneto farà un solo comunicato intorno alle 12:00 con i dati riferito alle 08:00.
  • I dati del 20.04.2020 soffrono di un errore di conteggio:

  • I dati del 30.04.2020 sono complessivi di dati di guariti accumulati in diversi giorni in Emilia Romagna.
  • Dal 30.04.2020 La Regione Veneto fornisce di nuovo due bollettini: uno alle 12:00 riferito a dati raccolti fino alle 08:00 ed uno alle 17:00 senza indicazione dell’orario di raccolta dei dati. Nella data del 30.04.2020 il numero dei guariti delle 17:00 appare inferiore rispetto alle ore 12:00 dello stesso giorno.
  • I dati del 02.05.2020 hanno una anomalia nel numero dei decessi. Quelli segnalati nelle ultime 24 ore sono 474 (+76% rispetto al giorno precedente) e sono un accumulo di casi non segnalati in precedenza. Il numero dei decessi nelle ultime 24 ore è di 192.
  • I dati del 06.05.2020 hanno anomalie. La Protezione Civile precisa “Il numero così alto dei pazienti dimessi e guariti è dovuto ad un aggiornamento dei dati della Regione Lombardia riferiti anche ai giorni precedenti.
  • 12.05.2020 – La Regione Lombardia ha comunicato che dei nuovi casi conteggiati oggi, 419 sono riferiti alle settimane precedenti e non alle ultime 24 ore.
  • 20 e 21 maggio 2020. I Dati del Veneto non sono corretti per “un guasto alle macchine per i tamponi”.
  • 24.05.2020. la Protezione Civile nazionale afferma che “La Regione Lombardia non ha aggiornato il dato odierno sui decessi.” La Regione Lombardia dice che non ci sono decessi:

ULTERIORI INFORMAZIONI DA PROTEZIONE CIVILE

04/05 – Dati Regione Sardegna ricalcolo nuovi casi e guariti

02/05 – Dati Regione Lombardia ricalcolati 329 decessi (47 di oggi e 282 da riconteggio di aprile)

01/05 – Dati Regione Lazio ricalcolati 41 decessi (8 nelle ultime 48 ore e 33 ad aprile)

26/04 – Dati Regione Valle d’Aosta ricalcolati (casi testati)

24/04 – Dati Regione Sardegna ricalcolati (1.237 tamponi aggiunti)

24/04 – Dati Regione Friuli Venezia Giulia in fase di revisione su dimessi/guariti

23/04 – Dati Regione Lazio parziali (casi testati non completi)

23/04 – Dati Regione Campania parziali (casi testati non aggiornati)

21/04 – Dati Regione Lombardia parziali (casi testati non aggiornati)

20/04 – Dati Regione Lombardia ricalcolati (ricalcolo di casi testati – eliminazione duplicati)

15/04 – Dati Friuli Venezia Giulia corretti (ricalcolo di isolamento domiciliare e dimessi/guariti)

12/04 – Dati P.A. Bolzano corretti (ricalcolo guariti -110 rispetto a ieri)

10/04 – Dati Molise parziali (tamponi non aggiornati)

29/03 – Dati Emilia Romagna parziali (tamponi non aggiornati)

26/03 – Dati Piemonte parziali -50 deceduti (comunicazione tardiva)

18/03 – Dati Campania non aggiornati

18/03 – Dati Parma non aggiornati

17/03 – Dati Rimini non aggiornati

16/03 – Dati P.A. Trento e Puglia non pervenuti

11/03 – Dati Abruzzo non pervenuti

10/03 – Dati Lombardia parziali

07/03 – Dati Brescia +300 esiti positivi

 

Questa voce è stata pubblicata in epidemia e contrassegnata con , . Contrassegna il permalink.