Dal momento che non esiste il concetto di dato «oggettivo» o dato «neutro», mentire con i numeri è molto facile, così come usarli per fare propaganda. I dati non esistono in natura, sono creati da persone che decidono di misurare o quantificare un certo fenomeno e per imparare a distinguere i dati usati per fare disinformazione bisogna imparare a farsi le domande giuste.
La prima riguarda la fonte. Non tutte le fonti hanno lo stesso valore e la loro affidabilità dipende dal metodo di raccolta, dall’obiettivo dell’ente che li ha raccolti e dalla trasparenza nelle indicazioni della metodologia. Tra le fonti primarie troviamo enti pubblici come gli istituti nazionali di statistica o gli enti privati, come le aziende che producono le app dei nostri telefoni che raccolgono dati a fini commerciali e poi li divulgano. Anche le fonti private possono essere fonti attendibili, ma anche in questo caso deve essere sempre presente la metodologia di raccolta, di solito presente nella «nota metodologica» o nei metadati.
La seconda domanda che dobbiamo farci è se il dato riportato nella notizia sia corretto e soprattutto se basta a descrivere il fenomeno di cui si parla. Di solito quando c’è un solo numero dobbiamo alzare l’asticella del sospetto, soprattutto rispetto alle intenzioni di chi lo cita. Per esempio, se in una notizia troviamo un dato che indica che in Italia 1 bambino su 3 ha la tv in camera, senza altre indicazioni, potremmo trovarlo un numero preoccupante. Ma oltre alla domanda sulla fonte, come abbiamo visto (chi ha raccolto quel dato e come?) dobbiamo chiederci qual è la definizione di «bambino», su quante persone è stata fatta l’indagine, qual è la differenza tra regioni, città, tipologia di famiglie intervistate.
Con i dati poi si può mentire facendo, cherry picking, selezionando dati e informazioni che confermano la nostra tesi, escludendone altri. Il problema di questa pratica, tra le più difficili da individuare, consiste nel fatto che non si tratta di un vero e proprio errore ma di una scelta comunicativa che porta a ingannare il lettore. Vuol dire letteralmente «scegliere le ciliegie più buone»: riuscite a immaginare cosa accade nell’ambito dei dati quando messa in pratica?
Altro pericolo: il valore medio. Negli Stati Uniti, ad esempio, tra il 1997 e il 2019 secondo i dati del Centers for disease and control and prevention (CDP) la percentuale di studenti che fumavano sigarette è calato dal 36% al 6%, in media: sembra un’ottima notizia, ma se prendiamo il dato che riguarda solo una parte della popolazione (le persone native americane e dell’Alaska) quel numero sale al 21%. La media, infatti, non riesce sempre a rappresentare correttamente un fenomeno.
Quando i dati diventano rappresentazioni visuali in forma di grafici, illustrazioni o mappe ci sono altre domande che dobbiamo farci perché anche con la rappresentazione è facile creare disinformazione. Ad esempio, quando in un grafico a barre l’asse delle Y non parte da zero, e la proporzione tra i dati rappresentati è falsata. Oppure quando i grafici a torta non presentano correttamente la proporzione tra le informazioni e la somma degli spicchi è superiore a cento. Un altro errore di rappresentazione che può portarci a mal interpretare un grafico riguarda la scala di graduazione dei valori negli assi che non è coerente e costante, vengono saltati degli anni o i numeri raddoppiano a metà della scala senza nessuna giustificazione: in questo caso la rappresentazione potrebbe darci un’idea del fenomeno non corretta.
Si può mentire molto facilmente con le cosiddette correlazioni spurie, cioè mettendo in uno stesso grafico a confronto due esperienze che hanno lo stesso andamento, e quindi affermare che sono una la conseguenza dell’altra. Per esempio, l’aumento delle persone connesse a Internet e l’aumento degli accessi ai centri di salute mentale. Non è così facile dimostrare che la prima sia la causa, perché ci sono molte altre condizioni di vita e familiari che incidono sulla salute mentale delle persone. Nel libro The Data Detective (New York, Riverhead Books, 2021) l’economista Tim Harford presenta una correlazione spuria che sembra impossibile da smentire, soprattutto perché è entrata nel nostro immaginario fin dall’infanzia: le cicogne portano i bambini! Harford cita Robert Matthews, professore di statistica alla Aston University, che nel giugno del 2000 ha pubblicato uno studio in cui dimostra la correlazione tra la presenza di cicogne e la natalità. Tra i 17 Paesi presi in esame da Matthews, quelli con il tasso di natalità più alto (Germania, Turchia, Polonia) sono anche quelli con più cicogne.
Quando vediamo una notizia che riporta dati e statistiche dobbiamo attivare attenzione e curiosità e leggerla con una lista di domande in testa, ricordandoci che i dati sono stati costruiti e rappresentati per veicolare un messaggio, e sono sempre frutto di scelte.