venerdì 10 maggio 2019

Paradossi della statistica

E’ possibile che la panna acida possa avere un impatto sulle cadute da motocicletta? O che il numero di persone morte per caduta dalla propria sedia a rotelle sia legato al costo delle patatine? O anche che il numero di film interpretati  da Cages sia proporzionale al numero di persone morte per annegamento in piscina? E mai possibile credere alla cosiddetta maledizione di Ramsey, che stabilisce che ogni volta che il centrocampista gallese dell’Arsenal, Aaron Ramsey segna un gol, qualcuno di famoso nel mondo muore?
Ovviamente no anche se sembra essere cosi: grafici divertenti rivelano come la statistica possa creare delle false relazioni (date un occhiata qui). Gli scienziati quotidianamente sono impegnati a cercare possibili correlazioni all’interno di grandi moli di dati per verificare ed eventualmente dimostrare certe teorie. Ma se due insieme di dati sono correlati tra loro da un punto di vista statistico non significa necessariamente che essi realmente siano strettamenti legati tra loro. Trovare una correlazione tra due insiemi non sempre significa causazione. 






Questi grafici sono degli esempi di correlazioni spurie. Queste correlazioni in genere vengono trovate dai computer. Date due qualsiasi variabili essi calcolano velocemente grazie ai loro algoritmi interni un coefficiente statistico chiamato “erre quadro R2” la cui vicinanza ad uno indica la bonta’ della correlazione. Ma la correlazione statistica in se non dice quasi nulla. C’e’ bisogno della conferma da parte dell’analista. Quello che esso deve fare e’ semplice: guardare i grafici che hanno una buona correlazione statistica, formulare un’ipotesi ed eventualmente rigettarla in base alla sua esperienza personale e background culturale. In genere se X e Y mostrano una correlazione quello che si fa e’ far variare la X e vedere cosa succede alla Y anche se cio’ non e’ sempre possibile. In un mondo sempre piu’ dominato dal machine learning e dalla scienza dei dati questo diventa il vero problema: l’incapacita’ di stabilire se una correlazione e’ casuale o causale. Questo non lo puo’ fare un computer ma solo un umano. Tutti gli scienziati del mondo stanno lavorando a questo problema e al momento non esiste alcuna soluzione. Trovare i meccanismi causali e’ il principale scopo di molte ricerche scientifiche in quanto ogni volta che troviamo un meccanismo causale riusciamo a fare un passo avanti nella conoscenza del mondo che ci circonda. A volte capita di vedere delle correlazioni che non riusciamo a spiegare e questo determina uno stimolo per gli scienziati a cercare una potenziale causa. Un buon esempio di correlazione che porta a delle conclusioni importanti e’ quello della connessione tra il tumore ai polmoni e il fumo. Agli inizi del 1990 si osservo’ un aumento di casi di tumore ai polmoni e nessuno sapeva il perche’. Nel 1929 il fisico Fritz Lickint pubblico’ un articolo in cui mostrava che i pazienti con cancro ai polmoni per lo piu’ erano stati dei fumatori. Questo articolo diede inizio a tutta una ricerca grazie alla quale gli scienziati riconobbero la pericolosita’ del fumo. Senza il grafico di correlazione tutto questo non sarebbe potuto accadere. Le correlazioni tra due variabili possono essere delle mere coincidenze, o il risultato di una connessione causale sottostante. Ogni volta che vediamo una correlazione abbiamo l’opportunita’ di capire di cosa si tratti.
A volte le correlazioni tra due enti possono apparire spurie a causa delle cosiddette variabili omesse o lurking variables. Sono proprio le variabili omesse a confondere le acque in quanto si muovono con le due variabili considerate ma non vengono osservate. Per esempio se guardiamo alla correlazione tra anni di istruzione e salario futuro si rischia di sopravvalutare l’effetto causale dell’istruzione sul salario se non si tiene conto per esempio della variabile abilita’. La ragione e’ che l’istruzione assorbe l’effetto dell’abilita’. Individui piu’ abili studiano per piu’ anni e guadagnano di piu’. Questo fa si ch uno pensa che il guadagno sia tutto dovuto all’istruzione senza pensare pero ‘ all’abilita’ della persona.
In generale, quindi un grafico da solo non serve a nulla. Da un punto di vista statistico le variabili omesse sono I serial killer di chi vuole dimostrare qualche cosa con un grafico. Altro esempio famoso di lurking variables e’ quello delle cicogne del paese austriaco di Oldenburg. Riportando sulle ascisse di un grafico XY il numero di nidi di cicogne e in ordinate la popolazione del paese si osserva una correlazione positiva tra queste due variabili, correlazione ovviamente inaspettata. E’ possibile ipotizzare quindi che ci sia in giro qualche variabile omessa come il numero di cacciatori nelle campagne, il numero di comignoli delle nuove case, un migliore habitat nelle zone di riproduzione delle cicogne o chissa’ cos’altro.




Passiamo a un tema connesso che va sotto il nome di paradosso di Simpson, cioe’ l’apparire di contraddizioni tra l’analisi di dati aggregati e dati disaggregati. Vediamo un esempio. Nel 1973 l’universita’ di Berkeley fu uno dei primi atenei ad essere denunciato per discriminazione di genere. Per l'ammissione al semestre autunnale di quell'anno furono esaminate 12.763 domande di iscrizione (8442 di ragazzi e 4321 di ragazze) e le ammissioni, suddivise per genere, furono quelle riportate nella tabella seguente.


Per l'università fu naturale disaggregare i dati per capire quali dipartimenti avevano contribuito a questa discrepanza. Quelli che seguono sono i dati dei sei principali dipartimenti. 


Qui la differenza di genere è ancora più marcata: risultano ammessi circa il 45% dei maschi e il 30% delle femmine. Eppure in 4 dipartimenti la percentuale di ragazze ammesse è maggiore, mentre nei rimanenti due il vantaggio dei maschi è contenuto. In altre parole, il dato complessivo dei sei dipartimenti mostra una discriminazione verso le femmine, mentre nel dato disaggregato non appare alcuna discriminazione o addirittura si può pensare ad una discriminazione contro i maschi. La spiegazione è nel fatto che i dati precedenti non tengono conto delle scelte dei dipartimenti da parte delle candidate/dei candidati. Le ragazze tendevano ad iscriversi ai dipartimenti piu’ selettivi, nei quali la percentuale di ammissioni era inferiore, mentre i maschi si iscrivevano spesso a dipartimenti in cui era più facile essere ammessi. Un altro esempio in cui la presenza di variabili nascoste porta ad una forma di confondimento e’ il seguente. Durante una riunione di facoltà, un gruppo di insegnanti decise di aver bisogno di capire per gli studenti quale poteva essere la durata ottimale dello studio al fine di ottenere risultati sempre piu’ soddisfacenti. Raccolsero cosi le ore di studio dei diversi studenti e li confrontarono  con i punteggi dei loro test. I risultati furono sbalorditivi. Per la confusione di tutti, meno uno studente studiava, più in alto tendeva ad arrivare nei test.


In effetti, il coefficiente associato a questa correlazione e’ di -0.79, una relazione fortemente negativa. Gli insegnanti avrebbero dovuto incoraggiare i loro studenti a studiare di meno? In che modo i dati avrebbero potuto sostenere una simile richiesta? Sicuramente mancava qualcosa.
Dopo aver discusso i risultati, gli insegnanti convennero di consultare lo statistico della scuola che suggerì loro di analizzare i dati di ciascun corso individualmente. Qui la situazione per educazione fisica.


Una correlazione di 0,63! Ecco il paradosso di Simpson. Un fenomeno statistico in cui una relazione apparentemente forte si inverte o scompare quando viene introdotta una terza variabile confondente. Codificando a colori ogni corso separatamente per distinguerli l'uno dall'altro appare questo grafico.


In questo modo gli insegnanti finalmente capirono che più ore uno studente studiava, più il voto tendeva ad essere alto come ci si aspetta. L’Inclusione del corso di studio nell'analisi statistica aveva completamente invertito la relazione iniziale dando un senso cosi a dei dati che inizialmente sembravano segnalare una correlazione spuria. Il paradosso di Simpson e’ molto importante in statistica medica quando si deve indagare l’efficacia di nuovi farmaci o  l’impatto di un fattore esterno tipo il fumo delle sigarette sulla salute.
Volendo quantificare l’impatto del fumo sulla salute delle persone, possiamo prendere 2 gruppi (fumatori e non fumatori) e stabilire il numero di decessi in percentuale. Supponiamo che le persone dei due gruppi vengano divisi per fascie di eta’ come mostrato nella tabella seguente. 



Calcoliamo il numero di decessi percentuale per i fumatori e non fumatori usando la media ponderata. Per i fumatori abbiamo:

% decessi fumatori= (3.6*(55+62)+2.4(124+157)+…..)/(117+281+….+77)=36.63%
% decessi non fumatori=(1.6*(55+62)+3.1(124+157)+…..)/(117+281+….+77)=25.84%

Fumare allunga la vita? E’ mai possibile? No. L’anomalia sta nel non aver considerata una variabile nascosta importante: l’eta delle persone. Se guardiamo, infatti alle singole fasce ci accorgiamo che su 7 gruppi solo una volta la percentuale di decessi per non fumatori e’ maggiore di quella dei fumatori. Per il restante 85% dei casi invece e’ vero il contrario come ci si aspetta.
Un altro esempio dal mondo medico. Due cure (X e Y) per il trattamento dei calcoli renali sono state sperimentate su due gruppi di 350 pazienti, con il risultato che la percentuale di successi è stata del 78% per la cura X e dell’83% per la cura Y. Se però si separano i risultati rispetto alla gravità della malattia, la conclusione cambia: si scopre che per i casi gravi la percentuale di successi è stata del 73% per la cura X e del 69% per la cura Y; mentre per i casi non gravi la percentuale di successi è stata del 93% per la cura X e dell’87% per la cura Y.
In altre parole, i pazienti sono stati suddivisi in due gruppi (calcoli piccoli e calcoli grandi); per ciascuno dei due gruppi sembra migliore la cura X, ma se non suddividiamo i pazienti allora, nel gruppo complessivo, sembra migliore la cura Y. Per capire cosa è successo controlliamo innanzitutto i numeri.



che mostrano un fatto aritmetico non molto intuitivo:


Abbiamo quindi otto numeri positivi a, b, r, s, A, B, R, S tali che


È utile visualizzare questo fatto nel modo seguente. Possiamo, ad esempio, vedere la frazione / come il coefficiente angolare della retta che collega l'origine con il punto (, ) nel piano cartesiano. Analogamente / è il coefficiente angolare della retta che collega l'origine con il punto (, ). Infine ( + )/( + ) è il coefficiente angolare della retta che collega l'origine con il punto ( + , + ), cioè con la somma dei vettori (, ) e (, ), ottenuta attraverso la regola del parallelogrammo.
Ora osserviamo che la diseguaglianza A/B>a/b significa che la semiretta che parte dall’origine e passa per il punto (b,a) sta sotto quella che passa per (B,A) e analogamente per gli altri punti. La seconda figura mostra un esempio in cui le tre diseguaglianze A/B>a/b, R/S>r/s, (A+R)/(B+S)<(a+r)/(b+s) sono soddisfatte. 



Tornando all’esempio delle cure, non è difficile spiegare cosa è successo. Le consistenze dei quattro gruppi rispetto alla gravità della malattia erano molto diverse: inoltre i medici tendevano a somministrare la cura X (migliore) ai casi più gravi (calcoli grandi) e la cura Y (meno efficace) ai casi meno gravi (calcoli piccoli). Il risultato complessivo è quindi sostanzialmente determinato dai gruppi 2 e 3 nella tabella.


Somministrando la cura X prevalentemente a malati gravi (e la cura Y prevalentemente a malati non gravi), come è stato fatto nello studio in considerazione, si ottiene che l'efficacia globale della cura X è inferiore, e questo potrebbe portare alla discutibile conclusione che la cura X è meno efficace. Concludendo, una correlazione non ci dice assolutamente nulla sui rapporti causali sottostanti. Chi in assenza di esperimenti cerca di dimostrare qualche cosa con un grafico non conosce la statistica o e’ in cattiva fede.

venerdì 12 aprile 2019

All’ombra del mastodontico mostro …..



Dopo la scoperta delle onde gravitazionali, un’altra previsione della relativita’ generale di Einstein ha avuto la sua conferma. La notizia ha fatto la sua comparsa sui media di tutto il mondo ieri, 10 Aprile 2019. La notizia si e’ subito sparsa a macchia d’olio lungo la rete del web e i social, spesso con post poco attendibili e informazioni inesatte. Di cosa si tratta? Ancora una volta gli scienziati ci hanno sorpreso e meravigliato. Questa volta abbiamo visto quello che per definizione non e’ possibile vedere. Si e’ proprio cosi. Si tratta della prima prova diretta visiva di una buco nero super-massiccio. L’immagine e’ il risultato di una collaborazione internazionale al lavoro da molti anni (Event Horizon Telescope Collaboration, in breve EHT). L’annuncio e’ arrivato con la pubblicazione di 6 articoli in un special issue del The Astrophysical Journal Letters (Link). Poiche’ ognuno di noi conosce i buchi neri per aver sentito o letto qualche cosa almeno una volta nella vita, si fa fatica a capire la portata della scoperta; diciamo che fino a ieri avevamo solo un’evidenza teorica, qualche immagine simulata al computer o una rappresentazione artistica di un buco nero. Nniente di piu’. Adesso invece non e’ piu’ cosi. Finalmente abbiamo una sua foto anche se alcune precisazioni sono necessarie. Ma procediamo con ordine.




La foto che ha fatto il giro del mondo in pratica e’ la prima immagine radio del buco nero super-massiccio (circa 6.5 miliardi di volte la massa del nostro Sole) al centro della galassia M87 anche conosciuta come Virgo A (una supergigante ellettica – vedi foto sotto) , a 55 milioni di anni luce dalla Terra.





L’immagine catturata dal team di ricercatori internazionali in effetti non e’ esattamente il buco nero; un buco nero e’ nero proprio perche’ la luce non puo’ scappare via essendo attratta dalla sua fortissima forza gravitazionale e quindi di per se un buco nero e’ invisibile. In realta’ l’immagine mostrata e’ quella che gli astronomi chiamano l’ombra proiettata del buco nero, con un anello luminoso formato dalla curvatura della radiazione che passa nelle vicinanze del buco nero dove lo spazio-tempo e’ fortemente deformato. Vediamo meglio cosa succede.
Un osservatore quando vede un oggetto luminoso nel cielo, in pratica sta ricevendo dei treni di fotoni (quanti del campo elettromagnetico) che colpiscono i suoi occhi. Dalla relativita’ di Einstein, sappiamo che qualsiasi massa perturba la tela dello spazio tempo e quindi e’ in grado di deviare anche i fotoni che a un certo punto non seguono piu’ la loro traiettoria rettilinea ma curvano.




Quando un buco nero e’ circondato da materiale luminoso (grazie all’accelerazione del forte campo gravitazionale il materiale nelle sue vicinanze diventa un plasma che emette onde elettromagnetiche) si riesce a vedere la sua sagoma se il materiale circostante a’ abbastanza trasparente da far passare i fotoni (vedi immagine sotto a sinistra dove i raggi in giallo sono i fotoni deviati e quelli neri catturati dal buco nero centrale nel piano equatoriale z=0). Questa ombra del buco nero e’ significativamente piu’ grande della reale dimensione dell’orizzonte degli eventi del buco nero. Questo perche’ l’ombra proiettata che osserviamo e’ l’ombra generata dalla zona di cattura dei fotoni e non l’orizzonte degli eventi stesso. Quest’ultimo e’ sempre interno alla sfera di cattura dei fotoni; confrontare il disco dell’immagine superiore a sinistra, cioe’ l’orizzonte degli eventi, con quello dell’immagine inferiore che invece rappresenta la zona di cattura della sfera di fotoni.



Nell’immagine di sinistra si e’ ipotizzato che il buco nero sia immobile. Nella realta’ esso ruota su stesso e quindi a causa dell’effetto di trascinamento (secondo la relativita’ un oggetto ruotante trascina lo spazio tempo intorno a se) l’ombra proiettata diventa distorta come mostrato nell’immagine sopra a destra. Questo si spiega semplicemente considerando la velocita’ di rotazione del materiale intorno al buco nero che sulla sua destra (la sinistra dell’osservatore) e’ diretta verso di noi e sulla sinistra in allontanamento da noi. L’immagine di seguito e’ la mappa delle velocita’ stellari della parte centrale di M87 rispetto ad un osservatore terrestre. In blu viene rappresentato il moto in direzione della Terra mentre in rosso quello in allontanamento dalla Terra. In giallo e verde le altre direzioni tra queste due estreme. Laddove abbiamo le regioni blu, avremo un anello piu’ luminoso rispetto a quelle rosse. Ecco spiegata l’asimmetria di luminosita’ nell’immagine del buco nero.




Cosa hanno utilizzato gli astronomi per ottenere questa immagine? Un telescopio chiamato Event Horizon. In effetti non si tratta di un singolo telescopio, ma di una matrice di 8 radio-telescopi posizionati in diversi continenti e disegnati proprio per catturare l’immagine diretta di un buco nero. Qui di seguito la posizione degli otto radio-telescopi: Arizona, Hawai, Messico, Cile, Spagna e Polo Sud. La scelta delle onde radio rispetto al visibile ha il vantaggio che la luce del Sole, le nuovole e la pioggia non influenzano le osservazioni degli oggetti celesti.




Come per la scoperta delle onde gravitazionali, anche in questo caso e’ stata usata la tecnica dell’interferometria per migliorare la risoluzione angolare dello strumento. Quest’ultima e’ l’abilita’ di un telescopio nel distinguere due oggetti molto vicini tra loro. In fisica sappiamo che la risoluzione R e’ approssimativamente data dal rapporto tra la lunghezza d’onda lambda e la dimensione del telescopio D. Piu’ e’ grande il diametro di un telescopio e piu’ R e’ piccola (migliore risoluzione angolare). Questa e’ la ragione per cui gli astronomi sono alla continua rincorsa di telescopi sempre piu’ grandi. Semplicemente per avere una vista sempre piu’ fine. Giusto per fare un confronto, la risoluzione di un occhio umano e’ di circa 60 arco-secondi di grado per la luce visibile e quella del telescopio Hubble con i suoi 2,4 metri di diametro e’ di circa 0.05 arcsec di gradi.
Ma cosa e’ un arcsec? Se consideriamo un cerchio esso puo’ essere diviso in gradi. Ogni grado puo’ essere diviso in 60 arcminuti e ogni minuto in 60 arcsecondi, cioe’ un grado corrisponde a 3600 sec di arco (arcsec).
Anche se la risoluzione del telescopio Hubble e’ impressionante, non e’ sufficiente per vedere l’orizzonte degli eventi di un buco nero. Per fotografare il buco nero al centro di M87 e’ stata necessaria una risoluzione di soli 22 micro arcsec di grado cioe 0.000022 arcsec di grado. Questo significa che la luna che ha una dimensione angolare di 0.5 gradi e’ qualche cosa come 82 milioni di volte piu’ grande della dimensione angolare del buco nero di M87. Per arrivare a questa risoluzione da capogiro si e’ pensato di far lavorare all’unisono gli 8 telescopi sparsi nel mondo con un D nella formula di R pari alla massima distanza tra qualsiasi coppia di telescopi nella matrice. E’ come se avessimo costruito un unico telescopio con un diametro enorme. Con questa risoluzione sarebbe possibile leggere un giornale posizionato sulla superficie lunare. Senza la necessaria risoluzione il buco sarebbe apparso come un semplice puntino come accade nel caso di due sorgenti luminose molto vicine in caso di basso potere risolutivo. Vedremmo una sola sorgente.



Ma se si tratta di radio-telescopi come hanno fatto gli scienziati a costruire l’immagine pubblicata all’inizio di questo post? In effetti non si tratta di un immagine nell’intervallo del visibile ma di un’immagine radio. Tra queste due radiazioni non c’e’ molta differenza a parte la lunghezza d’onda. Molto grande per le onde radio rispetto al visibile. Per il resto sono entrambe onde elettromagnetiche che si propagano alla velocita’ della luce grazie alla variazione combinata di campi elettrici e magnetici. Avendo una lunghezza d’onda diversa questi due tipi di onde interagiscono in modo diverso con la materia. Le onde radio per esempio, attraversano i muri mentre quelle della luce visibile no. Se la luce colpisce un certo oggetto, noi lo possiamo vedere grazie alla luce riflessa che arriva ai nostri occhi. Un’alternativa e’ quella di utilizzare una macchina fotografica o una camera e registrare la luce per poi rivedere l’oggetto in qualsiasi momento su un PC o sulla TV. L’immagine del buco nero pero’ come detto e’ un’immagine radio e quindi ogni pixel e’ la rappresentazione di una particolare onda radio. Quando per esempio vediamo il colore arancio, questo e’ un falso colore che sta a rappresentare le onde radio di circa 1 mm. La stessa cosa succede se vogliamo “vedere” un immagine negli infrarossi o ultravioletto. Dobbiamo convertire queste lunghezze d’onda in qualche cosa da poter vedere. In questo senso l’immagine del buco nero non e’ una normale fotografia ne’ qualche cosa che si puo’ vedere con un telescopio ottico. Pur tuttavia rimane inalterato il fascino e la bellezza con cui il buco nero si e’ presentato a noi, puntini infinitesimi sulla superficie di un piccolo pianetino in fuga nell’Universo.

martedì 22 gennaio 2019

Archeocarpologia

Oggi con grande piacere, dopo aver otternuto il permesso, pubblico la tesi di mia figlia Gilda che tratta di  un argomento scientifico ( e quindi in linea con i temi del blog) poco noto alla maggior parte delle persone. Si tratta dell’archeocarpologia e cioè dello studio dei resti di semi, frutti e annessi fiorali. Insieme all’archeopalinologia (studio dei pollini, spore) e all’Archeoxilo-antracologia (studio dei legni e dei carboni) costituisce la disciplina dell’archeobotanica che si occupa dello studio dei reperti vegetali sia microscopici che macroscopici provenienti da siti archeologici a partire dal paleolitico fino all’eta’ moderna. Il suo scopo è quello di trovare le relazioni esistenti fra l’uomo e l’ambiente vegetale e l’evolversi e il modificarsi nel tempo di tale interazione. Negli ultimi anni il contributo delle analisi archeobotaniche si è rivelato di fondamentale importanza in quanto non solo fornisce utili elementi per ricostruire l’evoluzione del paesaggio di un determinato sito, ma contribuisce anche a conoscere le attività dell’uomo nel corso del tempo, scoprendo ad esempio quali piante coltivava e raccoglieva, quali utilizzava e per quale scopo, oppure quali prodotti raccoglieva/trasformava (ceduazione dei boschi, vinificazione, trebbiatura, ecc.), o ancora, se vi erano boschi oppure zone umide o canali, ecc. fino ad acquisire importanti informazioni relative al substrato, al clima, all’orografia e alla topografia del territorio. Dopo questa breve  introduzione ritorniamo alla tesi dal titolo:  “Analisi carpologica del materiale rinvenuto in un pozzo adiacente al Santuario romano di Ercole in Alba Fucens”. Lo studio è stato effettuato sotto la direzione della Professoressa Sadori della Sapienza di Roma e ha avuto come oggetto lo studio dei resti carpologici rinvenuti durante gli scavi del 2011-2013, effettuati dalla Soprintendenza dell’Abruzzo sotto la direzione della dottoressa Ceccaroni, relatrice esterna della Tesi. Le conclusioni dello studio sono state molto interessanti per diversi motivi. Si e’ trattata della prima indagine archeocarpologica effettuata ad Alba Fucens, colonia romana risalente a circa il 300 aC e oggi ubicata a pochi chilometri da Avezzano.  E’ stata stabilita una significativa presenza di sambuco nero rispetto a siti analoghi di epoca romana. Questo sembra essere in linea con quanto stabilito dall’antropologa Nicolai, che in base ai suoi studi glottologici fa risalire il suffisso sabus, dei nomi Sabini, Sanniti e Sabelli (popoli dell’antico Abruzzo), a quello di sambus (sambuco) cioè popoli coltivatori del sambuco. Il ritrovamento di resti di uva, pesche, noci, nocciole, fico, ciliegio e more fa capire che la dieta di questi popoli di circa 2000 anni fa non era poi tanto diversa da quella che ancora sopravvive negli stessi luoghi oggi. Per le noci e le pesche, in particolare, si è stabilito  che già a quell’epoca  venissero coltivate, come anche probabilmente la vite. Un ultimo ritrovamento, degno di nota, è stato quello di una pianta spontanea (lisca natante) ritenuta con molto probabilità oggi assente in Italia e mai esistita in Abruzzo, secondo quanto riportato dal sito Acta Plantarum. A questo punto vi lascio alla lettura dello studio  sperando che vi possa piacere.
Link tesi

martedì 11 dicembre 2018

Se tu sei cosi brillante perche’ non sei anche ricco? Questione di fortuna.


Le persone di maggiore successo non sono sempre quelle piu’ talentuose, ma solo quelle piu’ fortunate. Questo il risultato di un modello di ricchezza sviluppato da 3 fisici italiani dell’Universita’ di Catania e pubblicato su Arxiv (Link1, Link2). La distribuzione della ricchezza come noto, segue un pattern ben definito chiamato la regola 80:20 (o principio di Pareto), l’80% della ricchezza e’ posseduta dal 20% delle persone. In uno studio pubblicato l’anno scorso addirittura e’ riportato che solo 8 persone posseggono la ricchezza totale di quella dei 3.8 miliardi di persone piu’ povere al mondo. Questo sembra accadere in tutte le societa’ e a tutte le scale. Si tratta di un noto pattern chiamato legge di potenza che appare in un ampio intervallo di fenomeni sociali. Ma la distribuzione della ricchezza e’ quella che genera  piu’ controversie a causa dei problemi che solleva sull’equita’ e sul merito. Perche’ mai solo una piccola parte di persone nel mondo dovrebbe possedere tanta ricchezza? La risposta tipica a questa domanda e’ che noi viviamo in una societa’ meritocratica dove le persone vengono premiate in base al loro talento, intelligenza, sforzi, ostinita’. Nel tempo, questo si traduce nella distribuzione di ricchezza che osserviamo nella realta’.  C’e’ un problema pero’ con questa idea: mentre la distribuzione della ricchezza segue una legge di potenza (distribuzione di Pareto), la distribuzione dell’intelligenza e delle abilita’ in genere segue una distribuzione normale che e’ simmetrica rispetto al valore medio. Per esempio, l’intelligenza che viene misurata tramite il test IQ, ha un valore medio di 100 e si distribuisce in modo simmetrico rispetto a questo valore. Nessuno ha mai ottenuto 1000 o 10000. Lo stesso e’ vero per lo sforzo che puo’ essere misurato in ore lavorate. Qualche persona lavora piu’ ore della media e qualche altra di meno, ma nessuno lavora milioni di ore piu’ di altri.

Eppure quando si tratta dei premi che si possono ricevere per il lavoro, alcune persone ottengono ricompense milioni di volte piu’ remunerative di altri. Per di piu’, diversi studi hanno mostrato che in genere le persone piu’ ricche non sono quelle piu’ talentuose. Quali fattori, allora determinano il modo in cui gli individui diventano ricchi? E’ possibile che il caso giochi un ruolo maggiore di quello che ognuno di noi si aspetta? E come possono questi fattori, qualunque essi siano, essere sfruttati per rendere il mondo un posto migliore e più giusto dove vivere?

Una risposta viene proprio grazie al lavoro di A. Pluchino e 2 suoi colleghi dell’Universita’ di Catania. Questo team ha creato un modello al computer utilizzando NetLogo un ambiente di programmazione a multi-agenti. Grazie ad esso hanno potuto analizzare il ruolo del caso in un processo in cui un gruppo di persone con un certo talento esplora le opportunita’ della vita. I risultati sono veramente illuminanti. Le loro simulazioni riproducono accuratamente la distribuzione della ricchezza nel mondo reale. Ma gli individui piu’ ricchi non sono quelli piu’ talentuosi (sebbene essi abbiano comunque un certo livello di talento). Essi sono semplicemente i piu’ fortunati. E questo ha un’implicazione significativa sul modo in cui le societa’ possono ottimizzare i ritorni degli investimenti che si fanno, dal mercato alla scienza. Il modello sviluppato e’ abbastanza semplice. Esso consiste di N persone, ognuna con un certo livello di talento (abilita’, intelligenza, destrezza e cosi via). Questo talento e’ distribuito secondo una Gaussiana intorno ad un valore medio e una certa deviazione standard. Alcune persone, quindi sono piu’ talentuose della media ma nessuna lo e’ per piu’ ordini di grandezza.

clip_image001

Questa e’ la stessa distribuzione che ritroviamo per caratteristiche umane come l’altezza e il peso. Alcune persone sono piu’ alte o piu’ basse della media, ma nessuno ha le dimensioni di un moscerino o di un elefante. Alla fine siamo abbastanza simili tra noi. Il modello costruito, ha seguito ogni individuo per 40 anni di vita lavorativa (dai 20 ai 60 anni). Durante questo tempo, gli individui possono aver sperimentato degli eventi fortuiti che hanno potuto sfruttare per aumentare la loro ricchezza se abbastanza talentuosi. Allo stesso modo, possono anche subire degli eventi sfortunati che possono ridurre la loro ricchezza. Questi eventi sono completamente casuali. Alla fine dei 40 anni, il team ha fatto un ranking degli individui in base alla ricchezza accumulata e studiato le caratteristiche di questa distribuzione. Hanno poi ripetuto la simulazione molte volte per verificare la robustezza dei risultati.

clip_image003

In questa figura un esempio di configurazione iniziale di una simulazione. Ci sono 1000 individui (agenti) con diversi gradi di talento e distribuiti in modo casuale all’interno di un mondo quadrato fatto di 201x201 striscie con condizioni al contorno periodiche. Durante ogni simulazione che copre diverse dozzine di anni queste persone vengono esposte ad un certo numero di eventi fortunati (cerchi di colore verde) e sfortunati (cerchi di colore rosso) che si muovono attraverso il mondo quadrato con traiettorie del tutto casuali.


La distribuzione della ricchezza che emerge dalle simulazioni e’ esattamente quella vista nel mondo reale. La legge 80:20 viene rispettata, in quanto l’80% della popolazione possiede il 20% del capitale totale, mentre il rimanente 20% possiede l’80% di questo capitale. Questo risultato non sarebbe sorprendente o sleale se il 20% delle persone piu’ ricche fosse anche quello piu’ talentuoso. Ma questo non e’ quello che emerge dallo studio.

clip_image005

Gli individui piu’ ricchi, in genere non sono quelli piu’ talentuosi o prossimi a essi. Il massimo successo non coincide con il massimo talento e viceversa.

clip_image007

Quindi se non e’ il talento, quali altri fattori causano questa distribuzione di ricchezza fortemente scodata? La simulazione chiaramente individua nella pura fortuna tale fattore. Facendo una classifica degli individui secondo il numero di eventi favorevoli e sfavorevoli subiti nei 40 anni di lavoro, e’ evidente che gli individui con maggiore successo sono anche i piu’ fortunati. E quelli che hanno avuto meno successo sono proprio quelli piu’ sfortunati (maggiore numero di eventi negativi).

clip_image009

Questo risultato ha delle implicazioni molto profonde per la societa’. Quale e’ la strategia piu’ efficace per esplorare il ruolo della fortuna nel successo di una persona? Il team ha verificato questo aspetto usando il metodo con cui vengono stabiliti i fondi per la ricerca scientifica. Le agenzie di finanziamento di tutto il mondo sono interessate a massimizzare il loro ritorno sull'investimento nel mondo scientifico. Recentemente l’European Reserch Council ha investito 1.7 miliardi di dollari in un programma per studiare la serendipita’, cioe’ il ruolo della fortuna nelle scoperte scientifiche, e come essa puo’ essere sfruttata per migliorare i risultati del finanziamento. E questo studio di Pluchino e il suo team  ben si presta a dare una risposta a questa domanda. In esso vengono esplorati diversi modelli di finanziamento per capire quale di essi produce il miglior ritorno quando si tiene in considerazione la fortuna. In particolare sono stati studiati 3 modelli in cui il fondo e’ distribuito equamente a tutti gli scienziati, distribuito a caso ad un numero limitato di scienziati o dato preferenzialmente a quelli che hanno avuto piu’ successo in passato. Quale e’ la migliore strategia? La risposta e’ controintuitiva ed il primo modello. Si avete capito bene quella che assegna il fondo in modo equo a tutti gli scienziati. E subito dopo la seconda e terza strategia vincente e’ quella che prevede di assegnare a caso il fondo al 10 o 20% degli scienziati. In questi casi, i ricercatori riescono ad ottenere un vantaggio dalle scoperte per serendipita’ che avvengono nel tempo. Col senno di poi e’ ovvio che se uno scienziato ha fatto una scoperta nel passato non significa che ha una probabilita’ maggiore di farne un’altra nel futuro. Un simile approccio potrebbe essere applicato anche negli investimenti di altro tipo di aziende, come una piccola o grande impresa, startup tecnologiche o anche per la creazione casuale di eventi fortunati. E’ chiaro che c’e’ bisogno di ulteriori indagini e studio su questo argomento prima di poter dare un giudizio definitivo. I primi risultati sono di sicuro rivoluzionari e in controtendenza, con una prospettiva di applicazione del tutto nuova e molto interessante. Non ci resta che aspettare ulteriori dettagli….

domenica 2 dicembre 2018

L’Universo dopo la missione Planck


Sono ormai 50 anni da quando abbiamo scoperto un fondo di microonde che arriva sulla terra proveniente da tutte le regioni del cielo. Queste radiazioni non provengono dal sole, da galassie o altre stelle ma sono la luce residua del Big Bang che oggi chiamiamo radiazione cosmica di fondo detta anche semplicemente radiazione di fondo e indicata con l’acronimo inglese CMB. Le missioni satellitari realizzate negli anni passati hanno avute tutte lo scopo di studiare le caratteristiche principali di tale radiazione e verificarne l’accordo con le previsioni teoriche. L’ultima di queste missioni ha visto impegnato il satellite Planck dell’agenzia spaziale europea, lanciato nel 2009. Grazie ad esso la nostra visione dell’Universo e’ cambiata radicalmente. Vediamo perche’. L’immagine seguente mostra come la temperatura associata all’energia di questa radiazione fossile, 380000 anni dopo il Big Bang, non e’ uniforme in tutte le direzioni dello spazio in quanto mostra delle piccole variazioni dell’ordine delle centinaia di microkelvin (il colore blu indica temperature piu’ basse e quello rosso temperature piu’ alte).

clip_image002

Per analizzare l'origine della radiazione cosmica di fondo è necessario tornare al periodo conosciuto come era della ricombinazione. Nell'Universo le condizioni cominciano a permettere la formazione di atomi di idrogeno, fenomeno detto appunto ricombinazione. L'energia di ionizzazione dell'idrogeno vale 13,6 eV, e dunque basta questa energia per staccare l'elettrone dal nucleo, ma a quel tempo la maggior parte dei fotoni possiede ancora un'energia maggiore di quel valore. Quindi ogni volta che un fotone interagisce con un atomo appena formatosi, quest'ultimo perde il proprio elettrone. Il fotone viene deflesso e questa interazione è descritta dal fenomeno chiamato scattering Thomson (figura seguente), responsabile dell'aspetto opaco dell'Universo di allora.

Related image

Per questo motivo il cammino libero percorso dai fotoni tra una collisione e l'altra è estremamente breve e impedisce appunto la formazione di atomi stabili. Con il passare del tempo però l'Universo si espande, la temperatura cala e di conseguenza anche l'energia dei fotoni diminuisce, facendo decrescere sempre più il numero di essi in grado di ionizzare gli atomi di idrogeno. Al termine di questo processo si hanno gli elettroni nel loro stato fondamentale e i fotoni ormai non più in grado di interagire con essi. Cessa dunque il fenomeno di scattering e l'Universo passa da uno stato opaco ad uno trasparente. Si parla quindi di disaccoppiamento tra materia e radiazione, perché da questo momento in poi i fotoni sono liberi di propagarsi in moto perenne nell'Universo, senza essere più deflessi, costituendo ciò che oggi è conosciuta appunto come radiazione cosmica di fondo. Importante notare come ricombinazione e disaccoppiamento sono fenomeni distinti e non avvengono contemporaneamente. A partire dal 1983 sono stati condotti diversi esperimenti per ottenere più informazioni, tra cui soprattutto l'effettiva temperatura dei fotoni della radiazione cosmica di fondo. Sono tre le missioni spaziali più famose a questo riguardo: COBE, acronimo di Cosmic Background Explorer, del 1992, WMAP, ovvero Wilkinson Microwave Anisotropy Probe, del 2001 e Planck, lanciato nel 2009. Quest'ultima nasce con gli obiettivi di misurare con grande precisione il CMB, osservare strutture dell'Universo come alcuni ammassi di galassie, studiare l'effetto chiamato lente gravitazionale e stimare i parametri osservativi. Questi obiettivi, uniti alla tecnologia utilizzata nella realizzazione dell'esperimento, rendono questa missione la più importante delle tre. Grazie ai dati raccolti, soprattutto da Planck, si sono fatti importanti passi avanti in questo campo. Oggi si sa infatti che la radiazione cosmica di fondo corrisponde esattamente alla radiazione emessa da un corpo nero, a una temperatura

T0 = 2.725+/- 0.001 K

a cui corrisponde un’energia media di questi fotoni di solo 1.126*10-22 Joule. Un corpo nero è, fisicamente parlando, un radiatore ideale, ovvero un ggetto che assorbe ogni tipo di radiazione elettromagnetica da cui viene colpito, senza riflettere energia. Il principio di conservazione dell'energia tuttavia non permette di assorbire semplicemente energia e quindi un corpo nero riemette tutta l'energia che ha ricevuto sotto forma di radiazione. Le missioni COBE e WMAP hanno confermato le ipotesi che erano state fatte sul CMB. È stato infatti dimostrato come lo spettro della radiazione cosmica di fondo corrisponda esattamente a quello di un corpo nero.

clip_image004

Il satellite Planck ha misurato le fluttuazioni in temperatura con una risoluzione che nessun altro satellite prima aveva fatto: circa 5 microkelvin rispetto ai 70 di COBE. Quest’alta risoluzione insieme alla capacita’ di misurare la polarizzazione di questa luce ci ha permesso di capire, misurare ed eliminare gli effetti della polvere (vedi immagine seguente) presente nella nostra galassia meglio di quanto fatto prima. Per ottenere le informazioni cosmologiche contenute in questo fondo e’ necessario conoscere tutti gli effetti che possono contaminare tale segnale.

clip_image006

Una volta che il segnale e’ stato ripulito esso puo’ essere analizzato per estrarre tutta l’informazione possibile. Questo significa usare le fluttuazioni in temperatura su larga, intermedia e piccola scala per cercare di capire:

· quanta materia normale, oscura ed energia oscura ci sono nell’universo

· la loro distribuzione iniziale

· la forma e curvatura dell’universo (vedi immagine seguente)

clip_image008

E’ possibile anche analizzare le diverse varieta’ di luce polarizzata di questa radiazione e ottenere altre informazioni molto utili per gli scienziati. Grazie a Planck adesso conosciamo alcuni dei parametri cosmologici con una maggiore precisione, come per esempio la costante di Hubble che oggi sappiamo essere un numero tra 67 e 68 Km/s/Mpc.

clip_image010

L’universo ha piu’ materia e si sta espandendo piu’ lentamente di quanto pensavamo prima. Prima dei risultati del satellite Planck, si pensava che l’universo fosse costituito per il 26% di materia e 74% di energia oscura con un tasso di espansione intorno a 70 Km/s/Mpc. Adesso invece la quantita’ di materia nell’universo corrisponde a circa il 31.5% (il cui 4.9% e’ materia normale e il rimanente materia oscura) mentre il 68.5% e’ energia oscura con una costante di Hubble di circa 67.4 Km/s/Mpc. Quest’ultima e’ in contrasto con altre misure che invece indicano un rate di 73 Km/s/Mpc. Questo punto e’ probabilmente una delle poche controversie ancora oggi rimanenti sul modello di universo. Grazie al satellite Planck sappiamo che ci sono solo 3 tipi di neutrino e la massa di ognuno di essi e’ non piu’ di 0.04 eV/c2, circa 10 milioni di volte meno massiccia di un elettrone. Un’altra indicazione e’ quella che l’universo e’ realmente piatto e la sua curvatura e’ non piu’ di 1 parte su 1000. A partire dall’intensita’ di questa radiazione di fondo e’ possibile utilizzare la trasformata di Fourier per ottenere lo spettro continuo delle fluttuazioni di temperatura. Per descrivere la distribuzione spaziale dell’intensita’ e quindi della temperatura si puo’ sfruttare il fatto che queste sono distribuite su una superficie sferica e quindi e’ possibile utilizzare una decomposizione in armoniche sferiche:

clip_image011

dove Yl,m e’ la funzione armonica sferica di grado l ed ordine m. Di seguito lo spettro ottenuto da Planck.

clip_image013

Esso tra le altre cose ha fornito anche una conferma della teoria dell’inflazione cosmica. Quest’ultima prevede che le fluttuazioni dell’universo al suo inizio dovrebbero essere pio’ o meno le stesse a tutte le scale con una piccolissima maggiore fluttuazione alle scale piu’ grandi. In accordo con i dati forniti da Planck questo significa che una delle quantita’ cosmologiche chiamata indice spettrale ed indicata con ns e’ prossima ad 1 (Planck da’ 0.965+/-0.05%) come ci si aspetta dalla teoria dell’inflazione. C’e’ anche un’altra questione a cui le misure di Planck possono dare un contributo. L’energia oscura che e’ estremamente sensibile alla radiazione di fondo e ai dati provenienti dall’universo ultra-distante (come le supernove di tipo Ia) e’ o no una costante cosmologica? Nel caso in cui lo fosse allora la sua equazione di stato indicata col parametro w dovrebbe essere esattamente pari a -1. Cosa dice Planck? Si e’ trovato un valore di -1.03 con una incertezza di solo 0.03.

clip_image015

Dopo la missione Planck, anche altre quantita’ hanno mostrato delle differenze anche se molto piccole. L’universo e’ diventato leggermente piu’ vecchio. Siamo a 13.8 miliardi di anni verso i precedenti 13.7 miliardi di anni. La distanza del confine osservabile dell’universo e’ un po’ piu’ piccola di quanto pensavamo: 46.1 invece di 46.5 miliardi di anni luce.

In definitiva possiamo dire che in base ai risultati del satellite Planck:

· il modello dell’inflazione e’ confermato

· esistono tre specie di neutrini

· l’universo si sta espandendo piu’ lentamente di quanto pensavamo prima e non c’e’ alcuna evidenza di una sua curvatura

· c’e’ un po’ piu’ materia oscura e materia standard di quanto pensavamo prima a scapito di un po’ meno di energia oscura.

· non c’e’ alcuna evidenza a favore dei modelli Big Rip e Big crunch dell’universo

clip_image017

Grazie alla missione Planck oggi abbiamo uno spettacolare accordo tra la radiazione di fondo (CMB) e le previsioni teoriche dell’universo contenente 5% di materia normale, 27% di materia oscura e 68% di energia oscura. Ci puo’ essere la possibilita’ di variazioni del 1-2% per questi valori, ma un universo senza materia oscura e senza energia oscura con i dati in nostro possesso non e’ pensabile. Entrambe sono reali e necessarie (vedi linea blu del grafico precedente per capire il buon accordo tra i dati teorici che prevedono la materia e l’energia oscura e i dati sperimentali rappresentati dai punti in rosso ottenuti da Planck).

Per approfondire:

https://www.cosmos.esa.int/documents/387566/387653/Planck_2018_results_L01.pdf/19301bb5-d646-f201-f136-d62910bf6a82

http://www.wikio.it