CM185

Revisione del dataset degli incendi in USA

Franco Zavatti

Il NIFC (National Interagency Fire Center) gestisce il dataset degli incendi negli Stati Uniti dal 1926, sia per il numero che per l'estensione areale degli stessi. Dopo aver reso disponibili i dati completi per molti decenni, improvvisamente, ma non saprei dire quando esattamente, ha deciso che il suo dataset inizia dal 1983, eliminando dalla disponibilità i dati dal 1926 al 1982 (57 anni). La motivazione è che, negli anni in questione, l'agenzia ha registrato gli incendi in modo non consono alla procedura attuale. Noi abbiamo tutti i giorni a che fare con dati modificati, omogeneizzati, aggiornati, ecc. e, pur essendo pronti a discutere le scelte fatte, mai ci siamo trovati di fronte all'"eliminazione fisica " dei dati che sono la principale dote di ogni ricerca; si può certo decidere di non usare alcuni (anche molti) dati, motivando la scelta, ma questi non si possono cancellare "tout court".
In particolare, se, come sembra, la scelta è stata dettata dal fatto che fino al 1982 (anno di una legge più rigida) gli incendi cosiddetti "controllati" erano pratica comune nell'agricoltura per pulire e concimare il terreno, bisogna notare che:

  1. Questi incendi "agricoli" sono stati senza dubbio registrati come tali e quindi è possibile tenerne conto nel compilare il dataset e,
  2. anche gli incendi dopo il 1982 sono in buona (e forse preponderante) parte causati dall'uomo e, come tali, andrebbero eliminati allo stesso modo, in pratica cancellando quasi del tutto il dataset.

In tempi di revisionismo galoppante, lo abbiamo visto nei vari tentativi di cancellare (o dimenticare)

  • la pausa delle temperature
  • l'optimum olocenico
  • la presenza del forte El Nino 2015-2016, attribuendo il riscaldamento osservato alla cattiva CO2 e al suo profeta, l'altrettanto cattivo uomo,

    è difficile non pensare ad un ulteriore tentativo di presentare all'opinione pubblica quello che si potrebbe definire il "lato catastrofico" dei dati sperimentali. E' pratica comune di chi trama accusare di complottismo chi si fa venire dei dubbi, per cui diamo per certa l'istituzione di questo "tribunale" e ci limitiamo a notare la differenza tra il dataset originale, usato in molte pubblicazioni tra cui un report del Servizio Forestale USA (2015) e in tutti gli articoli di giornale che si sono occupati dell'argomento, e quello rivisto, mostrati nelle figure 1 e 3.
    Fig.1: Dataset originale degli incendi annuali negli Stati Uniti, sia per il numero che per l'estensione degli eventi. Da notare che il "nuovo" dataset inizia nel 1983, il minimo assoluto per entrambe le serie.

    La figura 1 è interessante per vari aspetti: nel caso dell'area interessata agli incendi, la grande estensione (225 mila km2) si riduce a meno di 10 mila km2 nel 1956-57, circa 25 anni prima dell'entrata in funzione della legge più restrittiva e questo dato è in netto contrasto con la scelta del 1983 come anno iniziale della nuova serie; poi, la crescita post-1982 può certamente essere attribuita al cambiamento climatico (in qualunque modo lo si voglia chiamare) ma anche al fatto che, forse, la nuova legge ha dato inizio ad un periodo di incendi dolosi prima che i meccanismi di controllo fossero del tutto rodati e che, a rodaggio completato attorno al 2005, ha portato ad una stabilità (circa 30 mila Km2 l'anno di media) delle aree incendiate.
    Nel caso del numero di incendi, un'importante diminuzione, da circa 230 mila a circa 80 mila l'anno, si è verificata tra il 1938 e il 1956-57; qui però, a differenza di quanto accaduto per l'area, si è registrato un forte aumento (fino a 250 mila) nel numero degli incendi, culminato nel 1980 e seguito da una fortissima diminuzione che nel giro di 2-3 anni ha portato il numero a meno di 10 mila (nel 1983). Da lì al 2005 una sostanziale stabilità attorno a 75 mila incendi l'anno fino al 2005, quando è iniziata una leggera diminuzione che ha ridotto il numero a circa 50 mila. Anche in questo caso è difficile essere d'accordo con la scelta del NIFC di far iniziare la serie nuova nel 1983.
    Fig.2: Spettro LOMB dei dati di figura 1. Molti dei massimi spettrali sono simili e mostrano quindi una struttura analoga, con alcune differenze minori. I valori fra parentesi sono la potenza dei massimi che superano l'intervallo del grafico.
    Lo spettro mostra un'evoluzione temporale simile per entrambi i dataset, con periodi vicini. Tre periodi (18.8 anni per l'area, 2 e 10 anni per il numero di incendi) non si osservano nell'altro dataset, mentre presenze costanti -e potenti- sono i periodi di 6 mesi e 1 anno, tipici degli incendi provocati ad arte in periodi di preparazione del terreno o in quelli, ad es. estivi ed invernali in certe aree geografiche, molto siccitosi.
    Fig.3: Il nuovo dataset dal 1983 al 2020. I fuochi "controllati", in agricultura, e attualmente negli incendi dolosi, andrebbero eliminati (se questa è la scelta di NIFC) anche dai dati post-1982.

    Non possiamo fare a meno di notare che, dal 2005, l'estensione si è stabilizzata o cresce a ritmo inferiore rispetto agli anni precedenti e che il numero di incendi è in diminuzione costante.
    Fig.4: Gli spettri LOMB del "nuovo" dataset. Come in figura 2, i massimi delle due serie sono simili, con differenze specie nei periodi più lunghi.

    Anche in questi spettri si nota una certa somiglianza tra la superficie e il numero degli incendi; ma soprattutto "grida" la presenza dei massimi principali ancora a 1 anno e a 6 mesi, cioè la presenza di eventi annuali e semi-annuali. Se non si tratta degli incendi controllati, utilizzati in agricoltura, visto che il dataset è stato "emendato" proprio per eliminare questi eventi spuri, allora lo spettro evidenzia la presenza di incendi dolosi, appiccati sempre nei periodi più asciutti dell'anno -e quindi con un ritmo regolare- che andrebbero ugualmente eliminati dal dataset.
    Dalla figura è chiaro che la scelta fatta di utilizzare solo una parte del dataset è una scusa per supportare un'idea preconcetta oppure un importante errore di valutazione riguardo le caratteristiche degli incendi "naturali" e "provocati" (dall'uomo).
    Fig.5: Confronto tra gli spettri dei due dataset (vecchio e nuovo) che appaiono piuttosto differenti. Da notare, nel nuovo dataset, la presenza di massimi a 0.5, 1, 1.5 annualità che, seppur di potenza ridotta rispetto al vecchio dataset, identificano ancora la presenza di fuochi provocati dall'uomo.

    Non mi è chiaro quale possa essere il senso delle differenze tra i dataset (vecchio e nuovo), anche perché le due serie hanno in comune più di un terzo del tempo (37 su 95 anni) e non credo che natura e frequenza degli incendi possa essere cambiata molto nei circa 60 anni che li separano.
    Lo spettro dell'area incendiata mostra notevoli differenze tra i due dataset: nasce un massimo attorno a 18 mesi (1.5 anni) e massimi attorno a 2.5-3 anni assumono la massima potenza, paragonabile a quella dei fuochi controllati; i massimi a 5 e 6 anni diventano importanti, a fronte degli stessi picchi, quasi impercettibili, nel vecchio dataset; un massimo a circa 13 anni, in opposizione di fase rispetto a due massimi adiacenti, nel dataset originale, di periodo 12 e 15 anni; la scomparsa dei massimi a circa 18 e 24 anni, sostituiti da una oscillazione di bassa potenza a circa 21 anni.

    Lo spettro del numero degli incendi nel nuovo dataset ha un comportamento simile: la scomparsa dei periodi di 13 e 23-24 anni è sostituita da un periodo di circa 17 anni e due periodi di circa 5 e 7 anni assumono notevole importanza nella nuova serie. I periodi degli incendi controllati (6-12-18 mesi) rimangono, anche qui di potenza ridotta rispetto alla vecchia serie.

    Insomma, il nuovo dataset appare diverso dal vecchio, con un'estensione temporale di meno di un terzo rispetto a quello, ma mantenendo la presenza -chiaramente inferiore ma che si voleva evitare- degli incendi che l'uomo ha provocato e provoca a vario titolo.
    A mio parere, il risultato complessivo dell'operazione "taglio" è di bassa qualità rispetto al dataset completo 1926-2020.

    Per concludere, ribadisco che i dati sperimentali non si eliminano; si possono selezionare per categorie, giustificando la scelta (ad esempio: voglio studiare solo gli incendi naturali, per cui in questa occasione uso solo i dati posteriori al 1983 perché, in base ai documenti, la gran parte degli incendi degli anni precedenti non è naturale), ma è necessario lasciare ad altri la possibilità di controllare e contestare la scelta fatta, fornendo tutti i dati di cui si dispone.
    A me sembra che la scelta del NIFC sia molto più grave del "semplice" taglio di due terzi dei dataset: riflette l'idea oscurantista (direi medievale, ma credo che il Medioevo sia stato meno oscuro di quanto si immagina, anche rispetto al periodo in cui viviamo) di eliminare quanto può dare fastidio alle idee dominanti, nella speranza -vana- che idee diverse possano essere sopite da operazioni burocratiche come questa.

    Tutti i dati e i grafici sono disponibili al sito di supporto


    21.5.21