Visualizzazione post con etichetta fisica. Mostra tutti i post
Visualizzazione post con etichetta fisica. Mostra tutti i post

sabato 14 febbraio 2015

Il tempo. Questione di complessita’'?

 

Tutti siamo convinti del fatto che il tempo scorra sempre in avanti senza mai poter tornare indietro. Ma quale meccanismo e’ alla base di un tale comportamento?

Le leggi fondamentali della fisica non dipendono dalla direzione temporale, eppure il futuro e’ cosi significativamente diverso dal passato. Ma perche’? L’origine della freccia del tempo ha interessato fisici e filosofi per piu’ di un secolo. Questi hanno cercato di trovare una soluzione ma senza riuscirci. Ancora oggi questa legge rimane uno dei problemi fondamentali concettuali della fisica. In uno studio recente pubblicato sul giornale Physical Review Letters un gruppo di fisici dell’Universita’ di Oxford ha studiato proprio la “freccia del tempo” evidenziando un modo diverso di guardare a come il tempo si manifesta alle scale universali. Tradizionalmente, il tempo e’ stato descritto con “l’ipotesi del passato”, secondo la quale ogni sistema inizia in uno stato di bassa entropia per poi, guidato dalla termodinamica, portarsi in uno stato con entropia sempre maggiore. In parole semplici: il passato e’ bassa entropia e il futuro alta entropia, un concetto conosciuto come l’asimmetria del tempo termodinamico.

Nella nostra vita di tutti I giorni, possiamo trovare molti esempi di aumento di entropia, come il gas che riempie una camera o un cubetto di ghiaccio che fonde. In questi esempi, si osserva un aumento irreversibile di entropia (e quindi di disordine). Se questo viene applicato su scala universale, si presume che il Big Bang abbia generato l’universo partendo da uno stato di minima entropia. Dopo eoni, mentre l’universo si espandeva e si raffreddava, l’entropia ha iniziato ad aumentare. Per questo motivo il tempo e’ intrinsecamente collegato col grado di entropia, o disordine, del nostro universo. Ma ci sono alcuni problemi.

Subito dopo il Big Bang, il primo universo era un posto molto caldo pieno di particelle primordiali caotiche. Non appena l’universo inizio’ a raffreddarsi, la gravita’ prese il sopravvento rendendo l’universo piu’ ordinato e piu’ complesso: dal raffreddamento delle nuvole di gas, iniziarono a formarsi le prime stelle e poi i pianeti. Questo rese possibile l’inizio della chimica organica, della vita e quindi degli umani che iniziarono a filosofeggiare circa il tempo e lo spazio. Su scala universale, percio’, il disordine effettivamente e’ diminuito e non aumentato come previsto “dall’ipotesi del passato”. Come e’ possibile? Siccome l’entropia e’ una quantita’ fisica dimensionale c’e’ la necessita’ di un riferimento esterno rispetto al quale misurarla. Questo puo’ essere fatto solo per sottosistemi dell’Universo e non per l’intero Universo, in quanto per definizione non c’e’ nulla all’esterno dell’Universo. Quindi se non e’ l’entropia a guidare il tempo in avanti di cosa si tratta? La complessita’ e’ una quantita’ adimensionale che descrive quanto e’ complesso un sistema. Quindi se uno guarda al nostro Universo, la complessita’ e’ direttamente collegata col tempo; come il tempo scorre l’Universo diventa sempre piu’ organizzato e strutturato.

Chi ha posto l’Universo inziale in uno stato di minima entropia? La risposta del team di studiosi e’: la gravita’ e la sua tendenza a creare ordine e complessita’ dal caos. Per provare questa ipotesi il gruppo di fisici ha creato dei modelli al computer per simulare le particelle in un universo virtuale. Essi hanno trovato che indipendentemente dalla simulazione utilizzata, la complessita’ dell’Universo aumenta sempre e non decresce mai col tempo.

Con il Big Bang, l’universo e’ partito da uno stato di minima complessita’ (un brodo di particelle ed energia). Da quel momento in poi col susseguente raffreddamento la gravita’ inizio ‘ a prevalere sulle altre interazioni: i gas cominciarono ad aggregarsi, si formarono le stelle e le galassie cominciarono ad evolversi. L’universo divento’ inesorabilmente piu’ complesso con la gravita’ la forza responsabile dell’aumento della complessita’. Ogni soluzione del modello gravitazionale utilizzato dal gruppo di ricercatori ha la proprieta’ di avere qualche stato passato molto omogeneo caotico (eventualmente proveniente dalla contrazione precedente della materia) e non strutturato che assomiglia molto al plasma che costituiva l’universo al tempo in cui veniva generata la radiazione di fondo cosmica (CMB).

A partire da questo stato col passare del tempo la gravita’ aumenta le inomogeneita’ creando le strutture cosmiche e quindi l’ordine in modo irreversibile. Come l’universo matura, i suoi sotto sistemi diventano abbastanza isolati da far si che altre forze comincino a far sentire I loro effetti e quindi a settare nei sistemi a bassa entropia le condizioni per avere la classica freccia del tempo. In questi sotto sistemi, come la nostra Terra, l’entropia crea una freccia termodinamica del tempo.

L’Universo e’ una struttura la cui complessita’ e’ in crescita. Esso e’ formato da miliardi di galassie separate tra loro da vaste “bolle” vuote. In un passato lontano erano molto piu’ vicine di adesso. Quindi la congettura del team di ricerca e’ che la nostra percezione del tempo risulti da una legge che determina una crescita irreversibile della complessita’.

Il prossimo passo sara’ quello di cercare delle evidenze dalle osservazioni dell’universo. Il team ha stabilito quali tipi di esperimenti mettere in piede per testare la loro idea. Si trattera’ di fare le giuste osservazioni cosmologiche.

Risolto quindi il problema della freccia del tempo? Probabilmente ancora no. Rimane il mistero del perche’ le frecce del tempo di diversi sistemi fisici puntano tutte nella stessa direzione. Le onde elettromagnetiche vengono ritardate non anticipate; I nuclei radioattivi decadono e mai si riassemblano; I sistemi gravitazionali si aggregano e mai si disperdono; noi tutti ricordiamo il passato e non il futuro. Quello che andrebbe dimostrato e’ che effettivamente queste disparate frecce temporali puntano tutte nella stessa direzione indicata dal modello gravitazionale proposto. Comunque i risultati presentati dagli scienziati di Oxford forniscono un nuovo intrigante punto di vista. La loro visione offre l’evidenza che l’ordinaria dinamica gravitazionale (quella Newtoniana per intenderci) puo’ essere sufficiente a produrre un semplice punto iniziale che puo’ dare una direzione al tempo. Non ci resta che aspettare ulteriori sviluppi futuri.

giovedì 6 novembre 2014

Quando il rumore diventa energia elettrica

 
Secondo quanto pubblicato sul web a fine estate, i ricercatori della Nokia insieme a quelli del Queen Mary University di Londra, sono riusciti a realizzare un prototipo delle dimensioni di un Nokia Lumia 925 in grado di ricaricarsi con il rumore. Si avete capito bene. Si tratterebbe della possibilita’ di produrre energia elettrica a partire dall’energia meccanica prodotta dalle onde sonore del traffico, della musica e della voce. Ancora non si sa quando questi telefonini con all’interno nanogeneratori piezoelettrici sensibili alle onde sonore saranno disponibili sul mercato. Potrebbero essere necessari ancora molti mesi ma quando succedera’ di sicuro porteranno non pochi benefici a tutti gli utenti dei telefonini che oggi hanno il terrore di rimanere senza batteria proprio nel momento di maggiore bisogno. Vediamo allora come funzionano.
L’idea, presentata per la prima volta nel 2006 in un articolo pubblicato su Science (Link), e’ basata sullo sfruttamento dell’effetto piezoelettrico e sulle proprieta’ semiconduttive dell’ossido di zinco (ZnO). La piezoelettricità è la proprietà di alcuni materiali cristallini di polarizzarsi generando una differenza di potenziale quando sono soggetti ad una deformazione meccanica. Tale effetto piezoelettrico si manifesta solo lungo una determinata direzione e le deformazioni ad esso associate sono dell'ordine del nanometro. Esso è presente in quasi tutti i materiali cristallini che sono privi di centro di simmetria. La struttura di tali cristalli è costituita da microscopici dipoli elettrici. In condizioni di quiete, tali dipoli elettrici sono disposti in maniera tale che le facce del cristallo hanno tutte lo stesso potenziale elettrico. Quando viene applicata una forza dall'esterno, comprimendo il cristallo, la struttura del cristallo viene deformata e si perde la condizione di neutralità elettrica del materiale, per cui una faccia del cristallo risulta carica negativamente e la faccia opposta risulta carica positivamente. Il cristallo si comporta dunque come un condensatore al quale è applicata una differenza di potenziale. Se le due facce vengono collegate tramite un circuito esterno, viene quindi generata una corrente elettrica, detta corrente piezoelettrica. Nell’immagine A vengono mostrati i nanofili di ossido di zinco come appaiono ad un microscopio elettronico a scansione (SEM) e in quella B come gli stessi appaiono ad un microscopio elettronico a trasmissione (TEM). In C viene schematizzato il sistema a punta utilizzato perf flettere i nanofili per sviluppare un potenziale elettrico
 


Nella figura B sottostante e’ mostrato il potenziale sviluppato da alcuni nanofili individuati dalle coordinate (x,y) e in E il segnale sviluppato da un singolo nanofilo ( circa 10 mV).
 


Dopo la pubblicazione del 2006 c’e’ stato un continuo progresso in termini di potenziale erogabile dal nanogeneratore come mostrato nell’immagine qui sotto.
 


Oggi il record e’ di 57 V con una corrente di 12 uA usando un nanogeneratore di 1 cm2 la cui struttura e’ mostrata nel riquadro qui sopra. Si tratta di una matrice di nanofili di ossido di Zinco (ZnO) inseriti tra due elettrodi di metallo. Il processo per costruire questo nanogeneratore e’ mostrato di seguito.
 


Si parte con un substrato di Silicio su cui si deposita uno strato di ITO (Indium tin oxide, una soluzione solida di In2O3 e SnO2 con una percentuale del 90% e 10% rispettivamente) che a sua volta vedra’ un sottile strato di ZnO che serve a promuovere la crescita successiva dei fili di ZnO. Lo strato di ITO gioca un ruolo non solo come conduttore ma promuove anche l’adesione tra i semi di ZnO e il substrato di silicio ed e’ trasparente alla luce. Prima di realizzare il secondo elettrodo di alluminio viene depositato un film di PMMA (polymethyl methacrylate) che sommerge i nanofili proteggendoli da eventuale rottura per stress meccanico. Inoltre esso funziona come un diodo schocktty. Quando viene applicata una forza compressiva lo stress e’ trasmesso attraverso il PMMA a tutti i nanofili anche se questi hanno una lunghezza diversa. Inoltre questo strato serve come protezione evitando il contatto diretto dei nanofili con l’elettrodo migliorando cosi la durabilita’ e robustezza del nanogeneratore.
La speranza è che i dispositivi alimentati con le vibrazioni sonore possano presto sostituire i caricabatterie tradizionali. Tuttavia, il professore Joe Briscoe della Queen Mary University di Londra, attualmente impegnato nel progetto con la Nokia, ha ammesso che "per il momento il nuovo tipo di caricabatteria non è in grado di sostituire i metodi di ricarica oggi in vigore". "Credo che i telefoni basati su questo tipo ricarica”  - ha spiegato lo scienziato – “possano avere una loro parte nel futuro, ma probabilmente non basteranno per eliminare completamente la necessità del tradizionale metodo di carica". In ogni caso, la possibilità che ogni cellulare possa essere ricaricato con il suono della voce, i rumori di sottofondo, la musica e altro si appresta a diventare realtà. 

lunedì 18 agosto 2014

Skype Translator – Le Deep Neural Networks all’opera

 

E’ di alcuni mesi fa l’annuncio di Microsoft sulla comparsa di Skype Translator per la fine di quest’anno. Si trattera’ di un traduttore automatico che permettera’ di fare telefonate in video con l’aiuto di una traduzione simultanea sia in voce che con i sottotitoli.

La sorpresa e’ arrivata durante la Code Conference di S. Francisco dove il vice presidente di Skype, Gurdeep Pall, ha fatto un esperimento pratico. Parlando in inglese, ha conversato tramite Skype con una dipendente Microsoft di lingua tedesca e la loro discussione e’ stata tradotta in tempo reale. Non e’ ancora chiaro in quante lingue sara’ disponibile Skype Translator e se sara’ un servizio gratuito, ma l’idea di poter parlare, ad esempio, con una persona cinese senza barriere linguistiche, per lavoro o motivi personali e’ davvero una grande novita’. Si tratterebbe del superamento delle barriere linguistiche della Torre di Babele che fino ad ora non era stato possibile con i traduttori disponibili, come per esempio Google Translator, in quanto utili per una traduzione veloce ma non abbastanza precisi. Ma come e’ possibile tutto cio’?

Utilizzando le cosiddette “machine deep learning” sviluppate nell’ambito della ricerca sull’Intelligenza Artificiale. Per capire di cosa si tratta partiamo con l’unita’ piu’ semplice di una rete neurale: il percettrone (perceptron).

Supponiamo di avere 5 immagini di uomini e 5 immagini di qualsiasi altra cosa e di etichettare con 1 le immagini umane e con 0 le altre. L’obiettivo e’ di costruire un algoritmo che sia capace di imparare ad identificare le immagini degli umani una volta che gli vengono presentate nuove immagini mai viste prima (1 per gli umani e 0 per il resto). Questo esempio e’ del tutto generale. I dati potrebbero essere dei sintomi e le etichette le diverse malattie; i dati potrebbero essere le lettere scritte a mano e le etichette le lettere reali corrispondenti. Questo e’ quello che in definitiva fa un algoritmo come il percettrone.

Supponiamo di avere n punti in un piano, etichettati con 0 ed 1. Aggiungiamo un nuovo punto e cerchiamo di prevedere la sua etichetta. Come possiamo fare? Un possibile approccio puo’ essere quello di guardare i primi vicini ed assegnare l’etichetta al punto in base alla quantita’ di 1 e di 0 presenti nelle vicinanze. Per esempio, nell’immagine qui riportata assegneremmo il colore rosso al punto vuoto visto che i primi vicini sono in prevalenza rossi.

Un modo leggermente piu’ intelligente potrebbe essere quello di considerare una linea che meglio separa i dati etichettati e usarla come classificatore (classificatore lineare).

In questo caso, i dati in ingresso verrebbero rappresentati come vettori (x,y) e la funzione in uscita dovrebbe essere qualche cosa come “blu” se il punto cade al di sotto della linea e “rosso” se capita al di sopra. Matematicamente potremmo scrivere la funzione di trasferimento come:

f(x)=w·x+b

dove w e’ un peso opportuno e b un cosiddetto bias (offset verticale). Il risultato di questa funzione potrebbe essere portato in ingresso ad una funzione di attivazione per produrre l’opportuna etichetta. Nel nostro esempio, la funzione di attivazione potrebbe essere:

h(x)=”rosso” se y(x)>f(x)= w·x+b o h(x)=”blu” per gli altri casi.

Per determinare il peso w ottimale, l’algoritmo del percettrone in base ai dati presentati in ingresso sceglie i valori per minimizzare l’errore della risposta in uscita, definito come la differenza tra il valore desiderato e quello reale (oppure utilizzando il cosiddetto mean square error). Ovviamente il percettrone nella sua semplicita’ ha uno svantaggio: esso puo’ solo imparare a separare funzioni lineari. Consideriamo per esempio la funzione XOR, una funzione molto semplice che ritorna 0 se i due valori in ingresso sono uguali altrimenti ritorna 1. In questo caso un classificatore lineare non funzionerebbe correttamente come mostrato sotto.

Per superare questo problema bisogna ricorrere ad un percettrone “multistrato”, anche conosciuto come “feedforward neural network”: in effetti non faremo altro che mettere insieme piu’ percettroni connessi insieme a creare un meccanismo di apprendimento piu’ potente.

La rete neurale ha le seguenti proprieta’:

· Un input, un output e uno o piu’ strati “nascosti” (hidden). Una rete con piu’ strati nascosti viene chiamata Deep Neural Network. Nella figura sopra e’ mostrata una rete con 3 unita’ (anche chiamate neuroni o nodi) in ingresso, uno strato di output con 2 unita’ e due strati nascosti, con 4 unita’ il primo e 3 unita’ il secondo rispettivamente

· Ogni unita’ e’ un singolo percettrone

· Le unita’ dello strato di ingresso servono per trasmettere allo strato nascosto i dati di ingresso, mentre le unita’ nascoste fungono da unita’ di ingresso per lo strato di uscita.

· Ogni connessione tra due neuroni ha un certo peso w simile a quello del percettrone discusso sopra

· Ogni unita’ di uno strato n, in generale e’ connessa ad ogni unita’ dello strato precedente n-1 (anche se e’ possibile disconnettere due neuroni semplicemente settando a zero il proprio peso)

· Lo strato di ingresso serve solo per trasferire i dati di ingresso alla rete che li processera’. Per esempio, se il vettore in ingresso e’ (7,1,2) questo significa che il primo nodo in alto vedra’ il valore 7, quello centrale 1 e quello in basso il valore 2. Questi valori, vengono poi propagati in avanti verso le unita’ nascoste usando una somma pesata come ingresso alla funzione di trasferimento di ogni unita’, che a sua volta calcola il proprio output tramite la funzione di attivazione.

· Lo strato in uscita calcola i valori risultanti allo stesso modo dello strato nascosto. Il risultato e’ l’output finale della rete.

Cosa succede se per i nostri percettroni utilizziamo delle funzioni di attivazione lineari?

L’uscita finale della rete sara’ ancora una qualche funzione lineare degli ingressi, opportunamente aggiustati con tanti pesi diversi collezionati lungo la rete. In altre parole, una composizione lineare di tante funzioni lineari e’ ancora una funzione lineare. Quindi se utilizziamo delle funzioni di attivazione lineari, la rete neurale non sara’ piu’ potente di un singolo percettrone indipendentemente dal numero di strati utilizzati. Per questo motivo la maggior parte delle rete neurali utilizzano funzioni di attivazione non lineari. Le funzioni di attivazione piu’ utilizzate sono: logistica, tangente iperbolica, binaria e rectfier. Nella formula sottostante, k e’ la funzione di attivazione, wi i pesi e gi i vettori in ingresso.

Di seguito la schematizzazione di un singolo neurone con funzione di attivazione a soglia. Il neurone riceve in ingresso uno stimolo dato dalla somma del prodotto dei singoli ingressi per i pesi associati. Nel nostro caso U=1.5·0.5+1·3+2·(-1)=1.75. Se la somma supera una certa soglia (nel nostro esempio il valore theta) il neurone si attiva e in uscita si avra’ il valore U-ɵ=1.75-1=0.75

L’algoritmo piu’ comune per il learning (addestramento) di un percettrone a multistrato e’ conosciuto come backpropagation. La procedura di base e’ la seguente:

· Un campione per il training viene presentato in ingresso alla rete e propagato attraverso di essa.

· In uscita viene calcolato l’errore E=0.5(t-y)2 dove t e’ il valore di riferimento (target) e y e il valore reale calcolato dalla rete.

· L’errore E viene minimizzato usando un metodo chiamato stochastic gradient descent. Il valore ottimale di ogni peso viene determinato in modo da far raggiungere all’errore un minimo globale. Durante la fase di training, i pesi vengono cambiati di poco nella direzione del minimo globale, anche se questa non e’ un’attivita’ semplice visto che spesso i pesi raggiungono dei minimi locali come quelli mostrati di seguito.

L’algoritmo di backpropagation fornisce un metodo per aggiornare ogni peso tra due neuroni rispetto all’errore di uscita. Il peso di un dato nodo (per esempio il nodo i-esimo) viene aggiornato seguendo la semplice relazione:

dove E e’ l’errore di uscita della rete e wi e il peso in input al neurone i-esimo. Il parametro alfa controlla la velocita’ di discesa lungo il gradiente, e nei casi piu’ semplici e’ una costante. Si tratta di muoversi nella direzione del gradiente rispetto al peso wi. Dapprima vengono calcolati gli errori in uscita delle diverse unita’, e quindi propagati all’indietro nella rete in modo efficiente per cercare di raggiungere il minimo globale.

Lo strato nascosto (hidden layer) e’ dove la rete immagazzina la rappresentazione astratta dei dati di training, cosi come il cervello ha una rappresentazione interna del mondo reale. Secondo il teorema dell’approssimazione universale, un singolo strato nascosto con un numero finito di neuroni puo’ essere specializzato ad approssimare qualsiasi funzione. Comunque nella realta’ una rete neurale puo’ avere piu’ di uno strato nascosto per permettere astrazioni maggiori anche se ci sono degli effetti collaterali.

Man mano che si aggiungono strati nascosti, l’algoritmo di backpropagation diventa meno utile nel passare le informazioni agli strati precedenti. Si puo’ presentare inoltre, il cosiddetto problema di overfitting. Esso descrive il fenomeno dell’interpolazione dei dati di training in modo troppo “preciso” (lasciatemi passare il termine), e la rete finisce col perdere in flessibilita’. E’ come se la rete imparasse a memoria perdendo la capacita’ di generalizzare cioe’ la capacita’ di fornire una risposta corretta a nuovi ingressi (non presentati nella fase di addestramento della rete).

Altro problema che affligge tutti i sistemi di apprendimento supervisionato (cioe’ quelli con addestramento) e’ la cosiddetta maledizione della dimensionalita’, un progressivo decadimento delle prestazioni all’aumentare della dimensione dello spazio di ingresso. Questo avviene perche’ il numero di esempi necessari ad ottenere un campionamento sufficiente dello spazio di ingresso aumenta esponenzialmente con il numero delle dimensioni.

Per superare questi problemi sono stati sviluppati degli algoritmi particolari. Il primo e’ quello delle reti auto-associative progettate ed addestrate per trasformare un pattern in ingresso in se stesso, in modo che, in presenza di una versione degradata o incompleta di un pattern di ingresso, sia possibile ottenere il pattern originale. Una rete auto-associativa in generale e’ una rete neurale feedforward con 3 strati: un ingresso, un’uscita e uno strato nascosto. Concettualmente, la rete viene addestrata per ricreare in uscita i dati presentati in ingresso con lo strato nascosto che immagazzina i dati compressi cioe’ una rappresentazione compatta che cattura le caratteristiche fondamentali dei dati in ingresso. Una vera e propria riduzione della dimensione del campione in ingresso.

 

Il secondo algoritmo sviluppato e’ stato quello delle cosiddette Restricted Boltzmann machines (RBM) un tipo di rete neurale stocastica.

Questo tipo di rete e’ composto da uno strato di ingresso/uscita chiamato visibile e uno strato nascosto. Diversamente dalle reti feedforward, le connessioni tra lo strato visibile e quello nascosto sono non direzionali (cioe’ i dati possono viaggiare in entrambi le direzioni visibile-nascosto e nascosto-visibile) e le diverse unita’ neuronali possono essere completamente connesse (in questo caso si parla di macchina di Boltzmann) o parzialmente connesse (in questo caso si parla di macchina di Boltzmann ristretta). In generale una rete RBM ha le unita’ binarie (con stati 0 o 1) assegnate con una certa probabilita’ secondo una distribuzione di Bernoulli.

Queste reti erano note agli scienziati fin dagli anni 80 ma solo di recente hanno visto di nuovo un grosso interesse da parte della comunita’ scientifica in seguito all’introduzione di un nuovo algoritmo di training (addestramento) non supervisionato chiamato “contrastive divergence”.

Questo algoritmo e’ costituito da 3 fasi: quella positiva, quella negativa e quella dell’aggiornamento dei pesi.

Fase positiva

· Un campione v (si tratta di un vettore multidimensionale) e’ presentato in ingresso alla rete

· Il vettore v e’ propagato allo strato nascosto allo stesso modo delle reti feedforward; indichiamo il suo output con il vettore h.

Fase negativa

· Si propaga il vettore h indietro allo strato visibile ottenendo un nuovo vettore v’

· Il vettore v’ viene propagato indietro allo strato nascosto ottenendo un nuovo vettore h’

Aggiornamento dei pesi

w(t+1)=w(t)+a(vhT-v’h’T)

dove a rappresenta la velocita’ di apprendimento della rete e T indica il vettore trasposto (l’operazione di trasposizione trasforma una riga in colonna e viceversa). La fase positiva riflette la rappresentazione interna dei dati reali (h a partire da v). La fase negativa, invece rappresenta il tentativo della rete di ricreare i dati sulla base della rappresentazione interna (v’ a partire da h). Lo scopo principale dell’algoritmo e’ quello di generare dei dati il piu’ vicino possibile ai dati reali e questo e’ riflesso nella formula di aggiornamento dei pesi. In altre parole, la rete ha una qualche percezione di come i dati in ingresso possono essere rappresentati, e quindi prova a riprodurre i dati reali sulla base di questa percezione. Se la riproduzione non e’ abbastanza vicina alla realta’, la rete aggiorna i pesi e prova di nuovo.

Sia le reti auto-associative che le macchine di Boltzmann hanno la proprieta’ interessante di avere le unita’ nascoste che funzionano come dei veri e propri rivelatori di caratteristiche “feature detectors” e questo e’ alla base delle deep neural net come vedremo tra poco. Prima vediamo meglio la proprieta’ delle unita’ nascoste. Supponiamo di voler addestrare una rete neurale a distinguere immagini che rappresentano delle motociclette da quelle che rappresentano dei visi. Abbiamo molti pixels in ingresso e un output pari a 0 per le motociclette e un 1 per un viso. Se usassimo una rete neurale con un singolo strato e un peso per ogni pixel quello che la rete cercherebbe di fare e’ classificare ogni pixel come appartenente ad una moto o ad un viso. Ovviamente questo e’ impossibile in quanto un pixel nero potrebbe essere parte sia dell’immagine della moto che di un viso. Sicuramente sarebbe piu’ utile avere a disposizione un rivelatore di un “manubrio” o di una “ruota”. Sotto la spinta di queste motivazioni sono stati sviluppati dei metodi di “deep lerning” che mirano, tramite l’utilizzo di architetture profonde, all’apprendimento di gerarchie di “features”, con quelle ai livelli piu’ alti formate attraverso la composizione di quelle ai livelli piu’ bassi. Ispirandosi all’architettura profonda del cervello, i ricercatori nel campo delle reti neurali hanno provato ad addestrare reti multistrato sfruttando un algoritmo di apprendimento non supervisionato (le RBM/auto-associative con learning contrastive divergence) e addestrando singolarmente ogni strato nascosto per superare il problema dell’overfitting. Queste strutture stacked (impilate una nell’altra) sono molto potenti e producono risultati veramente impressionanti. Google, per esempio, ha utilizzato una rete profonda costituita da diverse reti auto-associative per imparare a distinguere un viso umano da quello di un gatto (link). Un esempio di rete profonda con blocchi auto-associativi e’ quello mostrato di seguito.

Lo strato nascosto I agisce come strato di ingresso per lo strato nascosto II e cosi via. Il training di una rete del genere procede come segue:

1. Viene effettuato l’addestramento del primo blocco auto-associativo (le connessioni rosse) usando il metodo di backpropagation con tutti i dati di training disponibili.

2. Si effettua l’addestramento del secondo blocco auto-associativo (connessioni verde). Il training inizia presentando i dati in ingresso allo strato rosso e propagato ai neuroni del secondo strato nascosto (quello verde). In seguito vengono aggiornati i pesi (input-hidden e hidden-output) del secondo strato nascosto (quello verde) utilizzando l’algoritmo backpropagation e tutti i dati di training gia’ utilizzati per addestrare il primo strato nascosto. Questa procedura viene ripetuta per tutti gli strati nascosti.

3. Gli steps precedenti vengono chiamati pre-training e servono per inizializzare i pesi della rete. Comunque a questo stadio non esiste ancora un mappatura tra lo strato di ingresso e quello di uscita. Per realizzarla, la rete viene addestrata come una normale feedforward usando l’algoritmo di backpropagation (questo step viene chiamato fine-tuning).

Come con le reti auto-associative, e’ possibile “impilare” anche delle macchine di Boltzmann (RBM) per realizzare delle reti deep conosciute come Deep Belief Netwroks (DBN). In questo caso lo strato nascosto della prima RBM funzionera’ da strato visibile per lo strato nascosto della seconda RBM e cosi via. Lo strato di ingresso della prima RBM e’ lo strato di ingresso dell’intera rete.

L’addestramento della rete procede in questo modo:

1. Viene effettuato il training della prima RBM utilizzando l’algoritmo “contrastive divergence” utilizzando tutti i dati di addestramento.

2. Parte l’addestramento della seconda RBM. Poiche’ lo strato visibile della seconda RBM e’ lo strato nascosto della prima RBM, l’addestramento inizia presentando i dati di training in ingresso alla prima RBM e da qui propagati. La stessa cosa verra’ ripetuta per tutti gli strati nascosti.

3. Allo stesso modo delle reti auto-associative stacked, dopo il pre-training va fatta la mappatura dello strato di ingresso e quello di uscita utilizzando l’algoritmo di backpropagation (fine-tuning).

Le deep neural networks hanno fatto “risorgere” l’interesse per l’intelligenza artificiale da parte degli scienziati del mondo accademico e di quelli di compagnie come Google, Facebook e Microsoft. Gli sforzi di questi teams sono impressionanti: basta ricordare i progressi fatti nell’ambito del riconoscimento vocale, del riconoscimento delle immagini e delle traduzioni automatiche, giusto per citarne alcuni. La mole di dati nonche’ la potenza di calcolo a disposizione oggi e’ di diversi ordini di grandezza superiore a quella di alcuni anni fa. Questo non puo’ che aiutare lo sviluppo di algoritmi di apprendimento sempre piu’ sofisticati. Di sicuro saremo testimoni di una svolta epocale nell’ambito dell’intelligenza artificiale. Non ci resta che attendere.

venerdì 2 maggio 2014

Terremoti nel cervello. Legge di potenza per l’epilessia.

 

Verso la fine degli anni ottanta, il neurologo Ivan Osorio

dopo anni di ricerca, si rese conto che non si poteva  capire a fondo cosa determinasse nel cervello l’aumento improvviso dell’attività elettrica conosciuta come attacco epilettico.

Cominciò così a guardarsi intorno, al di fuori del campo medico per cercare di trovare delle similitudini con altri fenomeni. Fu cosi che scoprì per caso la forte somiglianza tra gli attacchi epilettici e i terremoti e subito iniziò a studiare le leggi che regolano quest’ultimi per cercare di gettare nuova luce su cosa avviene nel cervello durante gli attacchi di epilessia. Questo collegamento fu trovato indirettamente, leggendo un articolo pubblicato da uno psicologo su Nature nel 1967, Graham Goddard, che aveva descritto un particolare fenomeno chiamato “kindling”.

Questo scienziato aveva scoperto che stimolando continuamente il cervello di alcuni ratti con impulsi di basso voltaggio, una volta che si innescava un attacco epilettico, c’era bisogno di una stimolazione elettrica minore rispetto alla precedente, per indurre un secondo attacco epilettico. Goddard chiamò questo fenomeno “kindling” in quanto gli ricordava quello che succede, quando si vuole accendere un gran fuoco e si parte con l’usare gradualmente sempre più ramoscelli. All’inizio c’è bisogno di tanti ramoscelli, ma poi quando il fuoco è andato, basta l’aggiunta di pochi ramoscelli per tenerlo acceso.

Si tratta di un fenomeno dove lentamente c’è un accumulo di energia che poi viene rilasciata istantaneamente. I vari impulsi elettrici creano piccoli attacchi epilettici, che accumulandosi pian piano portano poi ad una violenta scarica. Ricorrendo ad un’altra analogia, e’ come avere un mucchietto di sabbia dove  l’aggiunta di un unico granello, genera delle micro-valanghe (piccoli attacchi epilettici) e porta gradualmente il sistema in uno stato critico. A quel punto l’arrivo di un nuovo granello di sabbia può generare una valanga di grandi dimensioni (scarica epilettica violenta).

Nell’ambito dei sistemi complessi, questo rilascio improvviso di energia si chiama ‘rilassamento’. I tempi che intercorrono tra due eventi di rilassamento, in genere, sono molto lunghi, e la quantità di energia rilasciata è cosi grande che può avere delle conseguenze catastrofiche. In base a queste considerazioni è possibile considerare gli attacchi epilettici come degli eventi di rilassamento del cervello?

I sistemi complessi (come i terremoti, internet, i mercati finanziari ...) sembrano mostrare tutti la stessa legge di rilassamento. Ogni volta che all’interno di un sistema complesso, c’è un turbamento, una scossa, un evento estremo che sposta il sistema dal suo stato tipico, esso si rilassa seguendo una legge ben precisa: la legge di Omori.

Omori trovò la sua legge analizzando gli eventi sismici. Da allora in poi i ricercatori hanno verificato che tutti i sistemi complessi sembrano mostrare la stessa legge indipendentemente dal contesto. La legge è una legge di potenza con un andamento del tipo t, dove t è il tempo trascorso rispetto all’evento catastrofico ed alfa una costante. Nel caso dei terremoti, per esempio, la legge di Omori stabilisce che il numero di eventi sismici dopo la scossa principale per unità di tempo, decresce nel tempo con legge di potenza. Questo significa che subito dopo la scossa principale ci sarà un numero elevato di scosse di minore intensità e che questo numero poi rapidamente decadrà andando a zero ma molto, molto lentamente. Ecco perchè anche dopo mesi da una prima scossa si hanno ancora eventi sismici significativi. Il sistema per ritornare al suo stato iniziale, cioè a quello esistente prima della scossa, impiega un tempo lunghissimo. Nella figura 1, viene mostrato il numero di scosse nel tempo per il terremoto che ha colpito l’Aquila il 6 Aprile del 2009. Si può vedere chiaramente l’andamento previsto da Omori (curva color fucsia) con un esponente pari a circa 0.4.

 

Figura 1 Legge di Omori per il terremoto dell’Aquila dell’Aprile 2009.

 

 

 

Figura 2 Legge analoga a quella di Omori per l’andamento della magnitudine massima giornaliera del terremoto dell’Aquila dell’Aprile 2009.

 

Nella figura 2, è riportata invece l’andamento giornaliero della massima magnitudo registrata. Anche in questo caso si può notare un andamento simile alla legge di Omori con un esponente pari a 0.185.

Ma ritorniamo adesso all’epilessia.

Osorio e il matematico dell’Università del Kansas, Mark Frei, avevano presentato la loro idea a diversi congressi, fino a, quando incontrarono il neurologo John Milton, che gli suggerì di confrontare gli attacchi epilettici ai sistemi complessi incluso i terremoti. L’idea era semplice: usare le leggi di un fenomeno per risolvere i misteri di un altro.

Lo stesso Milton favorì l’incontro di Frei e Osori con il geofisico Didier Sorniette, esperto di teoria delle catastrofi e dei sistemi complessi, per cercare di applicare i concetti fisici sviluppati in ambiti diversi, alle previsioni degli attacchi epilettici. Questo team di ricercatori ha eseguito un’analisi quantitativa, confrontando 16.032 casi di attacchi epilettici e 81.977 eventi sismici con magnitudo maggiore di 2.3. Gli attacchi epilettici sono stati definiti come il rapporto adimensionale dell’attività elettrica del cervello in una particolare banda di frequenze con un valore superiore a 22 ed una durata di almeno 0.84 secondi. Da questi dati, sono poi stati estratti due parametri caratteristici: l’energia E (intesa come il prodotto del picco dell’attacco epilettico per la sua durata) e l’intervallo di tempo tra due attacchi consecutivi. Per i terremoti, invece, è stato considerato il momento sismico definito come:

S~101.5M

dove M è la magnitudo del sisma. Nella figura 3 è riportato il confronto tra un segnale epilettico e quello di un sisma. Notare la forte somiglianza tra i due. Stessa cosa per la figura 4, dove viene riportata la distribuzione di probabilità (PDF) per l’energia nel caso degli attacchi epilettici e il momento sismico S dei terremoti. Per entrambi i sistemi, la probabilità che un evento abbia un’energia o un momento sismico maggiore di x è proporzionale a  x-β  dove β~2/3.

Questa distribuzione si differenzia da quella Gaussiana per la presenza di una lunga coda a destra, che si riflette nella presenza di eventi estremi che accadono con una probabilità non trascurabile. Questi eventi estremi si trovano a diverse deviazioni standard dal valore medio predetto dalla distribuzione di Gauss. Queste proprietà sono anche riflesse nel fatto che distribuzioni di potenza illimitate con beta uguale a 2/3 hanno una media ed una varianza infinita.

Un risultato analogo è stato ottenuto per l’intervallo temporale tra due eventi successivi.

 

Figura 3 Confronto tra il segnale elettrico di un attacco epilettico (A) e quello di un terremoto (B). Notare la forte somiglianza.

 

Figura 4 Densità di probabilità del momento sismico e degli attacchi epilettici. Entrambe le statistiche sono compatibili con la stessa legge di potenza con esponente ̴ 2/3.

 

La figura 5, mostra come entrambe le densità di probabilità approssimativamente seguono una legge di potenza sebbene con una pendenza diversa.

Com’è possibile che questi sistemi operanti su scale spaziali e temporali completamente diverse, con processi alla base decisamente diversi, esibiscano tante somiglianze da un punto di vista statistico?

 

Figura 5 Densità di probabilità degli intervalli temporali tra due attacchi epilettici successivi (curva rossa) e tra due terremoti (curva blu).

 

Una possibile speculazione per tale somiglianza potrebbe venire dal fatto che entrambi questi sistemi sono formati da tanti elementi interagenti in competizione tra loro, e che la maggior parte di tali sistemi esibiscono un comportamento auto-organizzato con una statistica che segue una legge di potenza. In parole semplici, gli attacchi epilettici come i terremoti accadono quando l’attività del cervello o della crosta terrestre, visitano la parte destra della distribuzione dell’energia/magnitudo o allo stesso modo la parte sinistra della distribuzione degli intervalli temporali tra due attacchi epilettici o tra due scosse successive. Sia il cervello che la crosta terrestre possono essere simulati con un sistema di oscillatori non-lineari con dinamica instabile e un numero elevatissimo di interconnessioni con proprietà frattali o auto-somiglianti, che si ripetono attraverso una vasta gerarchia di scale spaziali. L’analisi dinamica di tali sistemi ha mostrato che essi si trovano al confine tra lo stato ordinato e quello caotico, come tanti altri sistemi complessi. Una caratteristica fondamentale dei sistemi complessi è proprio la capacità di visitare sia zone ordinate che quelle caotiche (pensate ad un’autostrada dove all’improvviso si forma un ingorgo senza alcun motivo apparente e senza nessun motivo scompare all’improvviso) facendo tesoro dell’esperienza accumulata (effetto memoria o feed-back). Per questi sistemi la somma è maggiore delle parti nel senso che il sistema come un tutt’uno riesce a mostrare comportamenti decisamente complessi che nessuna delle singole parti riuscirebbe a mostrare. È solo l’azione di gruppo, l’interazione tra la maggior parte degli elementi del sistema a far emergere un tale comportamento. La scienza della complessità contrariamente alla fisica riduzionista non cerca di dividere un sistema in parti più semplici da studiare ma cerca di analizzare il sistema come un unico “corpo” che vive ed interagisce con il mondo che lo circonda (sistema aperto da un punto di vista termodinamico). È molto probabile che tutti i sistemi complessi siano retti da leggi universali la cui comprensione potrebbe definitivamente gettare una nuova luce sul comportamento della natura e dell’Universo. Ancora una volta la matematica sembra essere l’unica chiave per aprire la serratura della Natura, e riuscire, così, a carpire il segreto ultimo delle cose.

 

Per approfondire:

http://arxiv.org/ftp/arxiv/papers/0712/0712.3929.pdf

http://chaos1.la.asu.edu/~yclai/papers/PRE_010_OFSML.pdf

venerdì 28 febbraio 2014

Una nuova stima della massa dei neutrini

 
Oggi parliamo di un argomento che mi sta molto a cuore visto che e’ stato argomento della mia tesi di laurea: la massa dei neutrini. All’epoca della mia tesi si pensava che la materia oscura che pervade l’intero universo potesse essere spiegata con la massa dei neutrini. Ci furono diversi esperimenti in tutto il mondo che cercavano di stabilire la massa di questi oggetti evanescenti e quello a cui partecipai anche io (CHARM II) era uno di questi. Si cercavano le cosiddette oscillazioni di neutrini (cioe’ il passaggio spontaneo dei neutrini da un sapore all’altro) previste teoricamente dal grande fisico italiano Bruno Pontecorvo che ho avuto la fortuna di conoscere di persona durante un convegno al CERN di Ginevra. La sua teoria prevede le oscillazioni dei neutrini solo se essi hanno una massa diversa da zero.
 
 
Nella figura sopra, la curva blu rappresenta la probabilità che il neutrino mantenga il sapore originario, mentre la curva rossa rappresenta la probabilità che cambi sapore. La frequenza di oscillazione dipende da Δm2, la differenza tra le masse al quadrato dei diversi neutrini.
 
 
Purtroppo CHARM II non fu in grado di rilevare tali oscillazioni. Esse furono osservate per la prima volta una decina di anni dopo all’osservatorio Giapponese di Super-Kamiokande. Tali esperimenti hanno permesso di determinare un limite superiore alla massa dei neutrini che pur risultando molto piccola non e’ uguale a zero in contrasto con quanto previsto dal Modello Standard. In questi giorni due ricercatori dell’Universita’ di Manchester e Nottingham sembrano aver stabilito con grande accuratezza la massa dei neutrini utilizzando i risultati del satellite Planck il cui compito e’ quello di mappare la radiazione cosmica di fondo (in inglese Cosmic Microwave Background CMB) e le misure della curvatura dello spazio-tempo tramite le lenti gravitazionali (per maggiori dettagli sulle lenti consultare il precedente post sul mio blog).
 
 
La radiazione cosmica di fondo e’ la luce residua dell’universo neonato partita 380000 anni dopo il Big Bang quando il raffreddamento dell’universo permise la formazione degli atomi neutri e alla luce di cominciare il suo grande viaggio attraverso l’oscurita’ dell’Universo ormai divenuto trasparente. I fotoni si separarono definitivamente dalla materia (vedi immagine sotto). Oggi questi fotoni fossili, infiacchiti dai miliardi di anni trascorsi bombardano in continuazione il nostro pianeta. La loro lunghezza d’onda e’ dell’ordine del millimetro e quindi fanno parte dello spettro delle micro-onde, le stesse di quelle prodotte nei nostri forni a micro-onde. Prima che la luce si disaccoppiasse dalla materia l’universo era completamente opaco in quanto i fotoni venivano continuamente catturati dalla materia. La radiazione cosmica di fondo, quindi e’ il segnale piu’ antico che possiamo captare oggi e la cosa piu’ lontana che possiamo osservare. La “mappatura” di questa radiazione di fondo ha permesso di scoprire che 380000 anni dopo il Big Bang la materia non era distribuita uniformemente (cosa che non avrebbe permesso la creazione di tutte le strutture cosmiche oggi visibili) ma c’erano delle disuniformita’ oggi visibili come piccolissime differenze di temperatura visto che l’energia dei fotoni e’ proporzionale alla densita’ della materia. Lo studio della radiazione fossile ha permesso agli scienziati di misurare accuratamente alcune costanti cosmologiche come la quantita’ di materia presente nel nostro Universo e la sua eta’. Tuttavia emergono alcune discrepanze quando si prendono in considerazione strutture dell’Universo su grande scala come la distribuzione delle galassie.
 
 
Come ha spiegato il professor Richard Battye dell’Universita’ di Manchester, il numero di ammassi di galassie osservato e’ minore di quello che i dati del satellite Planck sembrano suggerire. Inoltre i segnali di questi ammassi misurati grazie all’effetto delle lenti gravitazionali sono piu’ deboli di quanto previsto dalla distribuzione della radiazione cosmica di fondo (CMB). Un modo per risolvere questo dilemma e’ ipotizzare che i neutrini abbiano massa. Il loro effetto sarebbe quello di sopprimere la crescita delle strutture dense che portano alla formazione degli ammassi di galassie. L’interazione tra i neutrini e gli altri costituenti della natura e’ molto debole e quindi sono difficili da osservare. Inizialmente (come gia’ detto all’inizio di questo post) si suppose che essi fossero delle particelle prive di massa ma gli esperimenti successivi come quelli delle oscillazioni dei neutrini dimostrarono il contrario. La somma delle masse dei tre sapori di neutrino (elettronico, muonico e tauonico) era stata determinata essere maggiore di 0.06 eV (molto meno di un  miliardo di volte la massa del protone). Nello studio del Professor Battye e dei suoi collaboratori, combinando i risultati del satellite Planck e delle immagini di galassie lontane rese visibili dall’effetto delle lenti gravitazionali, e’ stato stabilito che la somma della massa dei neutrini e’ pari a 0.320+/-0.081 eV. Il Dottor Adam Moss, uno degli autori della ricerca, in un intervista ai giornalisti ha affermato che “se questo risultato verrà confermato da ulteriori analisi, non solo contribuirà ad accrescere le nostre conoscenze del mondo subatomico, ma sarà anche un’importante passo avanti per un’estensione del modello standard della cosmologia sviluppato negli ultimi dieci anni”.

venerdì 20 dicembre 2013

La Super-simmetria alle corde

 

Il modello standard della fisica delle particelle, nonostante i successi registrati negli ultimi anni, tra cui la previsione del bosone di Higgs, non ancora riesce a spiegare completamente il nostro universo. Per esempio non riesce a spiegare la materia oscura che i cosmologi credono riempire l’interno Universo e il perche’ subito dopo il Big Bang sia sopravvissuta la materia all’antimateria. Alcune estensioni del modello standard come la Super-simmetria, riescono a spiegare questi fenomeni prevedendo l’esistenza di nuove particelle chiamate “sparticle” e nuove interazioni.

Come si puo’ vedere dalla tabella la Super-simmetria associa ad ogni fermione (particella con spin semintero – lo spin e’ una grandezza quantistica che non ha equivalente nella meccanica classica anche se per analogia puo’ essere assimilabile ad una rotazione della particella intorno ad un proprio asse) un bosone (spin intero) e viceversa. Si tratta di una simmetria fra fermioni e bosoni. Quindi ogni fermione ha un superpartner bosonico ed ogni bosone un superpartner fermionico. Le coppie vengono chiamate partner supersimmetrici e le nuove particelle chiamate spartner o sparticelle. Notare che lo spin delle sparticelle e’ equivalente a quello delle particelle meno ½. Fino ad oggi, nessuna di queste particelle e’ stata individuata sperimentalmente. Ma essendo la super-simmetria una teoria molto elegante da un punto di vista matematico si tende a credere che essa sia corretta anche se non c’e’ al momento nessun riscontro sperimentale. Anzi. Una delle ultime notizie apparse su Nature riguardante la misura del dipolo elettrico dell’elettrone eseguita dalla collaborazione ACME guidata dal professore David De Mille della Yale University e da John Doyle e Gerald Gabrielse della Harward University (link articolo) sembra mettere alle corde la supersimmetria. Anche se questi ultimi risultati sembrano indicare una non correttezza della teoria super-simmetrica, esistono delle versioni modificate di tale teoria in cui i risultati ottenuti potrebbero essere ancora spiegati. Ma che tipo di misura ha effettuato il gruppo della collaborazione ACME? Che cosa e’ il dipolo elettrico dell’elettrone? In genere si conosce il momento di dipolo di molecole con una loro struttura interna come mostrato in figura (il dipolo per definizione e’ un sistema composto da due cariche elettriche uguali e di segno opposte e separate da una distanza costante nel tempo).

Ma se l’elettrone e’ puntiforme come fa ad avere una struttura interna? E se non ha una struttura interna come fa ad avere un dipolo elettrico? Per capire il dipolo elettrico dell’elettrone bisogna far ricorso alla meccanica quantistica che prende il posto della fisica classica quando scendiamo a livello atomico. Secondo la meccanica quantistica il vuoto pullula di particelle virtuali ( si parla di mare di particelle virtuali) come coppie di elettrone-positrone (elettrone con carica positiva) che si formano e si annichilano di continuo vivendo per frazioni infinitesime di tempo. In una regione dove c’e’ un elettrone lo spazio e’ riempito con queste coppie e poiche’ l’elettrone e’ carico negativamente esso attirera’ a se i positroni e respingera’ gli elettroni virtuali. Ecco come si forma il dipolo. Una nuvola di cariche positive che scherma la carica negativa dell’elettrone cosiddetto nudo (bare electron) cioe’ l’elettrone reale e non virtuale.

 

Se analizziamo questo effetto inserendo tutte le particelle-antiparticelle cariche previste dal modello standard, la nuvola intorno all’elettrone dovrebbe avere una simmetria quasi sferica e quindi un momento di dipolo elettrico inferiore a 10-36 e.cm (ricordiamo che il momento di dipolo come detto precedentemente e’ dato da u=q.d dove q e’ la carica e d la distanza delle due cariche del dipolo). Se estendiamo il modello standard con la Super-simmetria allora la nuvola elettronica dovra’ contenere anche le nuove particelle cariche ( i partner simmetrici delle particelle ordinarie del modello Standard) e la previsione teorica del momento di dipolo elettronico da’ un valore di 5x10-25 e.cm, superiore a quello del caso Standard. Ma dal momento che il valore ottenuto dalla collaborazione ACME e’ di molto inferiore a quello teorico previsto dalla Super-simmetria (|u| < 8.7×10−29 e.cm al 90% di confidenza) questo sembra indicare l’assenza di particelle Super-simmetriche in Natura. Lo scarto e’ estremamente piccolo anche se significativo. Se l’elettrone avesse le dimensioni del nostro sistema solare, la differenza da una sfera perfetta non supererebbe lo spessore di un capello. La misura del dipolo dell’elettrone e’ stata effettuata utilizzando il concetto di spin degli elettroni. Cosi come un uovo fatto ruotare intorno ad un suo asse barcollera’ a causa della sua forma oblunga mentre una palla di biliardo no (essendo una sfera quasi perfetta) se l’elettrone quantistico non e’ perfettamente sferico oscillera’ intorno al suo asse di spin. I ricercatori dell’ACME con il loro esperimento sono andati alla ricerca di questi barcollamenti degli elettroni utilizzando delle molecole di monossido di Torio molto pesanti.

In base ai risultati ottenuti dal team del professore De Mille possiamo dunque dire che la teoria super-simmetrica e’ morta? Non ancora anche se in molti lo credono visti gli ultimi risultati dell’LHC del CERN. Ad esclusione dell’ultimo tassello mancante del modello standard, il bosone di Higgs, finora non sono stati trovati segnali di nuove particelle. Ed e’ altamente improbabile dopo questo risultato del dipolo elettrico dell’elettrone che possa emergere qualche nuova particella nel dominio dei TeV (teraelettronvolt 1012 eV). Di sicuro i fisici che studiano il dipolo degli elettroni continueranno a fare di tutto per spingere il limite della loro misura sempre piu’ basso, nella speranza che un segnale venga infine trovato. Per questo motivo la comunita’ dei fisici e’ in trepidante attesa dei risultati della prossima sessione di collisioni del LHC, prevista per il 2014 quando l’acceleratore arrivera’ ad energie mai raggiunte prima. Non ci resta che aspettare per capire se davvero la teoria della Super-simmetria anche se matematicamente elegante non e’ quella scelta dalla Natura.

Articolo su arxiv: http://arxiv.org/abs/1310.7534

http://www.wikio.it