giovedì 9 giugno 2016

La bellezza e potenza della Teoria dei Gruppi

 

image_thumb

Circa cento anni fa, i matematici si erano resi conto che molti dei problemi incontrati in fisica, chimica e matematica potevano essere descritti da una nuova struttura algebrica: il Gruppo. E la cosa affascinante  era che un singolo gruppo poteva  descrivere molti problemi anche molto diversi tra loro.

La Teoria dei Gruppi e’ molto complicata e non e’ facile trasmettere le sue nozioni di base con dei semplici esempi ma ci proveremo. Supponiamo di avere l’insieme di tutti i numeri interi (positivi, negativi e lo zero). E’ possibile addizionare due qualsiasi numeri di questo insieme ed ottenere un nuovo elemento dello stesso insieme (per es. 2+3=5, -7+5=-2..) come e’ possibile considerare oltre alla somma che comprende il numero n il suo opposto –n per ritornare al punto di partenza (2+3-3=2). Questo semplice insieme con le due operazioni citate rappresentano un Gruppo. In questo caso abbiamo considerato un insieme con un numero infinito di elementi. Ma e’ possibile avere dei Gruppi anche con un numero finito di elementi. Consideriamo, per esempio, un quadrato e chiediamoci quante rotazioni e riflessioni possiamo applicare ad esso senza alterare il suo aspetto nel piano. In questo caso si parla di simmetrie della figura piana. Per il caso specifico, le rotazioni di 90, 180 e 270 gradi intorno al punto centrale sono delle simmetrie del quadrato. Stessa cosa per le riflessioni orizzontali, verticali, quelle intorno ai due assi diagonali e quella che lascia il quadrato fisso (cioè non lo muove per niente). Ovviamente e’ abbastanza intuitivo provare che qualsiasi simmetria seguita da un altra e’ una nuova simmetria del quadrato in quanto esso appare non cambiato. Nella figura seguente viene mostrato come una riflessione intorno ad una diagonale seguita da una rotazione di 90 gradi equivale ad una riflessione orizzontale per il caso di un quadrato. Esattamente come per i numeri interi dove la combinazione di due di essi ci fa rimanere nel mondo degli interi cosi con le simmetrie una combinazione di esse rimane sempre una simmetria.

image_thumb1

 La riflessione di un quadrato intorno ad una diagonale seguita da una rotazione oraria

di 90 gradi equivale ad una riflessione orizzontale.

Come visto per  l’esempio dei numeri interi e’ possibile tornare indietro una volta applicata un’operazione. Per una simmetria che ha ruotato in senso orario di 360 gradi una figura e’ sempre possibile tornare indietro applicando una rotazione antioraria di 360 gradi. Stessa cosa per la riflessione. In totale ci sono 8 distinte simmetrie per un quadrato e tutte insieme formano un Gruppo. Appare chiaro che abbiamo una stessa struttura alla base di due insiemi completamente diversi tra loro. Questa e’ la potente bellezza dei Gruppi.

Prima di passare alla definizione matematica di Gruppo, dobbiamo introdurre il concetto di operazione binaria. Con essa combiniamo due oggetti per ottenerne un terzo. Sia l’addizione che la moltiplicazione sono due esempi di operazione binaria (nel caso dei numeri interi l’addizione di due qualsiasi numeri interi e’ ancora un numero intero e stessa cosa per la moltiplicazione). Anche la combinazione di due simmetrie per una particolare forma geometrica e’ una operazione binaria (per esempio una riflessione seguita da una rotazione). Siamo pronti quindi per definire un gruppo come un insieme, alle cui coppie di elementi e’ possibile applicare un’operazione binaria. In generale se l’operazione che applichiamo non ha ne’ un nome ne’ un simbolo associato, viene chiamata ‘moltiplicazione’ ed indicata col simbolo x. Gli elementi di un gruppo non devono essere necessariamente dei numeri o delle simmetrie e quindi l’operazione binaria non e’ necessariamente un’addizione o una combinazione di simmetrie. Comunque con l’operazione binaria non e’ permesso fare quello che vogliamo in quanto essa deve soddisfare 4 assiomi:

Assioma 1: Il prodotto di qualsiasi 2 elementi dell’insieme deve essere un altro elemento dell’insieme. In altre parole se a e b sono due elementi di un gruppo G allora anche a x b deve essere un elemento di G.

Assioma 2: Nell’insieme ci deve essere un elemento chiamato identità (generalmente indicato con e). Questo elemento e’ analogo al numero zero per l’addizione o il numero 1 per la moltiplicazione. In altre parole se a e’ un qualsiasi elemento di un gruppo G, allora e x a=a x e=a. Per l’esempio del quadrato fatto prima, la simmetria identità e’ semplicemente la simmetria che non fa nulla cioè quella che lascia il quadrato così come e’.

Assioma 3: L’operazione binaria deve essere associativa. Questo significa che  ((a x b) x c)=(a x (b x c)). Per esempio sia la moltiplicazione che l’addizione sono entrambe associative mentre la sottrazione non lo e’.

Assioma 4: Se a e’ un qualsiasi elemento del gruppo, allora deve esistere un unico elemento del gruppo, chiamato l’inverso di a, tale che:

image_thumb2

Se l’operazione binaria e’ anche commutativa, cioè axb=bxa, allora il gruppo viene chiamato commutativo o abeliano. Fin qui la teoria. Vediamo adesso come la teoria dei gruppi può aiutarci a risolvere problemi veramente complessi in modo molto semplice. Faremo uso di un gruppo particolare chiamato il gruppo-4 di Klein dal nome del matematico Felix Klein. Questo gruppo e’ uno dei più piccoli tra quelli esistenti. Come il nome suggerisce, questo gruppo contiene 4 elementi, e descrive tra le altre cose, le 4 simmetrie di un rettangolo: riflessione rispetto ad un asse orizzontale (che chiameremo o), riflessione rispetto ad un asse verticale (che chiameremo v), rotazione di 180 gradi intorno al punto centrale del rettangolo (che chiameremo r) e l’operazione nulla cioè quella che non fa assolutamente niente (che chiameremo e, cioè l’elemento identità). Nella tabella sottostante viene riportato il risultato della combinazione di due qualsiasi simmetrie.

image_thumb3

Osservare come nella tabella della combinazione delle simmetrie la diagonale principale e’ costituita dall’operazione di identità e come la matrice e’ simmetrica rispetto a questa diagonale. Se applichiamo per esempio  la simmetria o seguita dalla simmetria v il risultato equivale alla simmetria r  e scriveremo che o x v = r.

image12_thumb3

L’applicazione di una riflessione ad un rettangolo rispetto ad un asse orizzontale, seguita da una riflessione rispetto ad un asse verticale, equivale ad una rotazione di 180 gradi rispetto al centro di un rettangolo.

Esistono altri gruppi di Klein costituiti da solo 4 elementi. Supponiamo di andare a dormire con addosso una T-shirt con un disegno sulla parte frontale. Durante la notte fa caldo e siamo costretti a toglierci la T-shirt. Verso il mattino, sentendo freddo rimettiamo la shirt. Come troveremo la maglietta al risveglio del mattino?  A causa dello stato di sonnolenza in cui uno si trova potrebbe aver rimesso la maglietta esattamente nel verso giusto e cioè come era prima di togliersela, oppure potrebbe averla rimessa al contrario (col disegno dietro alle spalle per intenderci), oppure col lato interno della maglietta al di fuori e il disegno davanti o con la maglietta con il di dentro verso il di fuori e il disegno sulle spalle. In totale ci sono 4 differenti azioni: possiamo usare S per indicare che la maglietta e’ stata rimessa come prima (identità), B per indicare che il disegno e’ andato sulle spalle, O per indicare che l’interno della maglietta e’ al di fuori e A per indicare la condizione O con in più il disegno sulle spalle. Come già fatto precedentemente e’ possibile combinare due di queste azioni e vedere cosa succede (operazione binaria). Combinando insieme per esempio le azioni O e A otteniamo B, cioè O x A=B e cosi via come indicato nella tabella sottostante.

  image15_thumb 

L’insieme delle quattro azioni descritte costituisce un Gruppo-4 di Klein. I gruppi con un numero di elementi molto piccolo vengono chiamati “Piccoli Gruppi”. E’ possibile costruire molti gruppi di piccole dimensioni ricorrendo per esempio alla matematica dei resti. Consideriamo, per esempio, l’insieme dei numeri (1, 3, 5, 7) e prendiamo come operazione il resto della divisione per 8 del prodotto di due qualsiasi di questi numeri. In questo caso otteniamo la seguente tabella di moltiplicazione.

  image18_thumb1

Osserviamo come il risultato della nostra operazione binaria produca sempre elementi dell’insieme iniziale, che esiste l’elemento identità come anche l’inverso. Di nuovo abbiamo un gruppo di Klein con 4 elementi e di nuovo abbiamo la stessa struttura del gruppo della T-shirt e delle simmetrie del rettangolo. Questo può essere ancora più facilmente visibile sostituendo i numeri della tabella di moltiplicazione con i simboli di simmetria della T-shirt, cioè rimpiazzando S con 1, B con 3, O con 5 e A con 7. Corrispondenza perfetta. Anche se gli esempi vengono da contesti diversi, il gruppo e la sua struttura e’ sempre lo stesso. Bello no?  Facciamo un altre esempio considerando sempre come operazione binaria quella dei resti dei prodotti. Abbiamo 4 numeri interi 1, 3, 7, e 9 e consideriamo il resto della divisione per 10 del prodotto di due qualsiasi numeri dell’insieme. Qui di seguito la tabella di moltiplicazione. Questa volta si nota subito che c’e’ qualche cosa di diverso rispetto a quelle precedenti.

  image21_thumb2

Ci accorgiamo che in questo caso non abbiamo l’elemento identità lungo la diagonale. In effetti questo e’ un gruppo ma non di Klein-4. Infatti mentre l’operazione binaria da noi definita applicata a 9x9 da’ l’identità questo non e’ vero per il 3 e il 7. Abbiamo trovato qualche cosa che e’ leggermente diverso dai gruppi precedenti. Per capire di cosa si tratta analizziamo un altro esempio più semplice. Supponiamo di avere 4 persone sedute intorno ad un tavolo quadrato  e supponiamo che può essere servito un piatto alla volta da un sistema automatico situato al centro della tavola.

image_thumb10

Esistono 4 possibili azioni per il sistema automatico per porre il piatto di fronte ad ognuno dei clienti in modo che essi possano servirsi da soli. Una rotazione di 90 gradi che possiamo chiamare Q1, una rotazione di 180 gradi Q2, una rotazione di 270 gradi Q3 e una rotazione di 360 gradi Q4 che equivale all’identità’. La tabella per questo gruppo e’ data da:

image_thumb9

Questo gruppo e’ chiamato il gruppo ciclico con 4 elementi. Se confrontiamo la tabella del gruppo ciclico con quella del gruppo degli elementi (1,3,7,9) precedente ci accorgiamo che hanno esattamente la stessa struttura suggerendo che anche esso e’ un gruppo ciclico di 4 elementi. Basta sostituire 1 a I, 3 con Q1, 7 con Q3 e 9 con Q2. Si può dimostrare ma non lo faremo, che con 4 elementi esistono solo due tipi di gruppi: quello di Klein e quello ciclico. C’e’ un solo gruppo costituito da un solo elemento contenente l’identità’. Con due elementi c’e’ bisogno di avere un elemento di identità e un elemento di inversione che già abbiamo visto come sottogruppi di due elementi dei gruppi con 4 elementi. Prendiamo per esempio le azioni S e B della T-shirt, oppure I e Q2 per il distributore di piatti. Ognuno di questi e’ un gruppo di due elementi. Con tre elementi si può dimostrare che c’e’ solo una possibile struttura. Riconsideriamo di nuovo l’esempio del ristorante e supponiamo di avere anziché 4 clienti solo 3 equamente spaziati intorno ad un tavolo rotondo (per esempio a 120, 240 e 360 gradi). Se indichiamo le tre azioni con R1, R2 e R3=I, questo costituisce un gruppo ciclico di 3 elementi indicato C3 con la cui tabella e’:

image_thumb11

I gruppi analizzati fino ad ora possono essere rappresentati anche tramite delle reti (networks). Ogni linea in questo caso rappresenta un azione del gruppo e i vertici il risultato della combinazione dei due elementi (vedi figura nnh)

  image_thumb14

image_thumb15  Rappresentazione tramite rete del gruppo-4 di Klein (sopra) e del gruppo ciclico (sotto)

Prima di poter passare ad una applicazione pratica, dobbiamo introdurre un altro gruppo molto importante, quello simmetrico Sn . Si tratta del gruppo di tutte le permutazioni di un insieme finito di n numeri. Ricordiamo che la permutazione e’ un modo di ordinare in successione n oggetti distinti, come nell’anagrammare una parola. Se abbiamo n oggetti il numero possibile di permutazioni e’ dato dal fattoriale n che si indica con n! . Consideriamo per semplicità il caso n=4, cioè l’insieme (1,2,3,4). Le permutazioni possono essere rappresentate con la notazione matriciale, cioè con una tabella con un certo numeri di righe e colonne. Nella prima riga si inserisce la sequenza di numeri originali e nella seconda riga invece la permutazione di interesse. Nel nostro caso indichiamo con:

image_thumb7

due permutazioni. In questo caso per comporre le due permutazioni basta applicare all’insieme iniziale (1,2,3,4) prima la permutazione tau e poi la sigma.

image_thumb8

Ovviamente in questo esempio l’identita’ e’ data dalla permutazione nulla. L’inverso di una permutazione, invece, si ottiene scambiando le due righe della tabella e poi riordinando le colonne in modo che la prima riga abbia l’ordine naturale.

image_thumb57           image_thumb58

Infatti ,  σ σ-1 = I   cioè la combinazione delle due permutazioni e’ uguale all’identità’. Consideriamo adesso la seguente permutazione:

image_thumb19

Essa manda 1 in 4, 3 in 1 e 4 in 3 lasciando fisso il 2. Questo fatto lo possiamo scrivere come (1,4,3). Una tale permutazione viene detta ciclo di lunghezza 3. Un ciclo di lunghezza 2 viene chiamato trasposizione o scambio. Osservare che ogni permutazione può essere decomposta in prodotti di scambi cioè:

image_thumb20

Si può dimostrare che:

1) Ogni permutazione può essere decomposta nel prodotto di un numero finito

   di cicli disgiunti

2) Il numero di scambi in cui si può decomporre una permutazione o e’

   sempre pari o e’ sempre dispari.

Passiamo adesso alla pratica considerando un gioco che tutti avranno visto almeno una volta nella vita: il gioco del 15.  Si tratta di un rompicapo matematico, inventato da Samuel Loyd nel 1878. Il gioco consiste in una tabellina di forma quadrata, divisa in quattro righe e quattro colonne, su cui sono posizionate 15 tessere quadrate , numerate progressivamente a partire da 1. Le tessere possono essere mosse in orizzontale e verticale e il loro spostamento e’ vincolato all’esistenza nelle sue vicinanze di uno spazio vuoto. Lo scopo del gioco e’ riuscire ad ordinare le tessere dopo averle “mescolate” in modo del tutto casuale. Questo gioco rappresenta un problema matematico che può essere risolto con la teoria dei gruppi, in particolare con il gruppo delle permutazioni S15.

Il problema, infatti, data una configurazione iniziale delle tessere, consiste nel permutare i suoi elementi per posizionarli nell’ordine naturale da 1 a 15. La domanda a cui dobbiamo rispondere e’ la seguente: e’ sempre possibile fare ciò, in altre parole e’ sempre possibile risolvere il gioco del 15 indipendentemente dalla configurazione iniziale? Per rispondere cominciamo con l’osservare che ad ogni mossa c’e’ lo scambio tra un elemento numerato e il blocchetto vuoto. Inoltre all’inizio il blocchetto vuoto si trova in basso a destra della scacchiera e li deve ritrovarsi alla fine del gioco. Se dunque durante il gioco il blocchetto vuoto viene spostato di n mosse, per riportarlo nella posizione originaria ne occorreranno altre n. Dunque le mosse necessarie per risolvere il gioco devono essere in numero pari. Ciò equivale a dire che la permutazione associata al gioco deve essere pari affinché il gioco stesso possa essere risolto. Consideriamo la seguente configurazione iniziale:

image_thumb27

Per tornare alla configurazione originaria la permutazione associata e’:

image_thumb28

che può essere decomposta nel seguente modo:

(13,1,8,2,7,4,3,12)*(14,6,9,10)*(15,11)

che a sua volta si può decomporre nel prodotto dei seguenti scambi:

(13,12)(13,3)(13,4)(13,7)(13,2)(13,8)(13,1)(14,10)(14,9)(14,6)(15,11)

Trattandosi di una permutazione dispari (abbiamo 11 scambi) il gioco non e’ risolvibile.

Vediamo, invece, cosa succede con quest’altra configurazione iniziale:

image_thumb34

La permutazione associata e’:

image_thumb35

Che può essere decomposta in:

(2,1,15,8,4)(6,3,14,7,12)(10,5,13,9,11)==(2,4)(2,8)2,15)(2,1)(6,12)(6,7)(6,14)(6,3)(10,11)(10,9)(10,13)(10,5)

Poiché si tratta di una permutazione pari, in questo caso il gioco e’ risolvibile. Esistono due diverse versioni del gioco del 15: una costituita da una tabella di plastica le cui tessere vengono mescolate manualmente e un’altra più moderna, in versione computerizzata. Nella prima versione, ogni mescolamento delle tessere corrisponde ad una permutazione che deve essere necessariamente pari, poiché per portare la casella vuota in basso a destra, qualsiasi sia la permutazione, il numero di scambi necessari e’ sempre pari. Pertanto il gioco e’ sempre risolvibile. Nella versione computerizzata, invece, poiché le configurazioni iniziali vengono scelte in modo del tutto casuale, non e’ sempre possibile risolvere il gioco.

Gli stessi concetti possono essere applicati ad un altro gioco che sicuramente tutti conoscono: Il cubo di Rubik. Questo e’ stato inventato a metà degli anni 70 dall’architetto ungherese Rubik. Si tratta di un cubo dove ciascuna faccia ha un colore diverso e questa e’ suddivisa in 9 quadratini. E’ possibile ruotare ciascuna faccia e lo scopo del gioco consiste nel ripristinare l’ordine iniziale con tutte le facce colorate allo stesso modo. Chiunque ha giocato con questo cubo sa che bastano poche mosse per trovarsi in una situazione di “panico” senza nessuna speranza di ritorno alla condizione iniziale. Per fortuna non c’e’ nessun motivo per sentirsi persi, in quanto esistono diverse tecniche per risolvere il rompicapo e in cui la teoria dei gruppi gioca un ruolo fondamentale.

 

image_thumb36

 Cubo di Rubik risolto (sinistra) e cubo di Rubik in una delle sue possibili configurazioni iniziali.

In figura  il cubo di destra mostra una delle possibili configurazioni iniziali. Ma quante di queste configurazioni esistono? Si può dimostrare che ce ne sono 43 252 003 274 489 856 000 (si tratta di un numero con ben 20 cifre che a leggerlo suona più o meno così: quarantatremila miliardi di miliardi). Tenendo inoltre conto che ci sono in totale 54 quadratini, si capisce che il cubo di Rubik altro non e’ che un sottogruppo di S54. Infatti le rotazioni delle facce del cubo altro non sono che particolari permutazioni del gruppo simmetrico su 54 elementi (quadratini colorati). Per iniziare a fare qualche cosa di interessante col nostro cubo magico, dobbiamo introdurre alcune notazioni. Prima di tutto dobbiamo trovare un modo per indicare le 6 facce del cubo.

· S sta ad indicare la faccia di “sinistra”

· D sta ad indicare la faccia di “destra”

· F sta ad indicare la faccia di “fronte”

· R sta ad indicare la faccia sul “retro”

· A sta ad indicare la faccia in “alto”

· B sta ad indicare la faccia in “basso”

image_thumb42

Ogni cubetto può essere individuato, invece, usando le lettere minuscole delle   facce  a cui esso appartiene. Cosi ad (o da) sta ad indicare il cubetto dello spigolo sul lato destro in alto (cubetto indicato in celeste) e adf il cubetto all’angolo di fronte ad esso (cubetto grigio). Indichiamo poi una rotazione di 90 gradi in senso orario di una faccia con la lettera che individua la faccia stessa. Ad esempio la rotazione di 90 gradi in senso orario della faccia destra la indicheremo semplicemente con la lettera D. Viceversa per indicare una rotazione antioraria sempre di 90 gradi aggiungeremo un apice D’.  Con questo simbolismo e’ possibile scrivere qualsiasi sequenza di mosse, indipendentemente dalla sua complessità. Un esempio banale è dato da quattro successive D ovvero DDDD. Trattandosi di quattro rotazioni di 90 gradi ognuna, questo corrisponde ad una rotazione di un angolo giro cioè di una identità (di fatto nulla è cambiato).

Torniamo al caso di una semplice rotazione e vediamo che effetto ha sui cubetti della faccia che ruota. La mossa D ha l'effetto di portare il cubetto ad sulla faccia posteriore e occupare il posto del cubetto rd. Allo stesso tempo, il cubetto rd passa sotto ad occupare la posizione bd, il cubetto bd si sposta ad occupare il posto del cubetto fd e il cubetto fd sale in alto in ad. Simbolicamente, tutto ciò si può rappresentare con il seguente 4-ciclo

 image_thumb43

che per noi adesso dovrebbe essere familiare! Chiaramente, non è importante da quale cubetto partiamo. Ma il 4-ciclo appena visto non descrive tutta la rotazione D; infatti non abbiamo ancora descritto gli effetti di D sui cubetti degli angoli. In modo analogo possiamo rappresentare questi effetti con il seguente 4-ciclo

image_thumb44

Ora  possiamo dare una rappresentazione degli effetti di D su tutti i cubetti della faccia destra. Possiamo scrivere infatti

image_thumb45

che è un prodotto di cicli; da notare che manca il quadratino centrale, ma del resto questo rimane fermo. Da questa rappresentazione in cicli disgiunti è possibile calcolare l’ordine di questa mossa. Trattandosi di due 4-cicli disgiunti abbiamo che l’ordine è proprio 4, cioè  D4=1, e questo era proprio ciò che ci aspettavamo; operando quattro volte con D, infatti, torniamo alla configurazione iniziale. Per finire passiamo alla classificazione dei gruppi semplici, detta anche teorema enorme, che come affermato dal matematico Daniel Gorenstein e’ uno dei più importanti risultati della matematica. Per prima cosa vediamo cosa sono i gruppi semplici. Per fare ciò consideriamo un cubo e tutte le sue rotazioni. In totale ce ne sono 24. Le prime 9 sono intorno agli assi passanti per le facce opposte del cubo (ci sono 3 assi e 3 possibili rotazioni [90, 180 e 270 gradi] intorno ad ognuno).

image_thumb46

Poi ci sono le rotazioni intorno agli assi passanti per il centro degli spigoli opposti come mostrato sotto. In totale ci saranno 6 assi di questo tipo e quindi 6 possibili rotazioni (per ogni asse solo la rotazione di 180 gradi lascia inalterato il cubo di partenza).

image_thumb47

L’ultima famiglia di rotazioni e’ quella intorno agli assi passanti per i vertici opposti del cubo. Ce ne sono 4 in totale, ognuna con rotazioni di 120 e 240 gradi.

image_thumb61

Se consideriamo adesso, un asse passante per i punti centrali di due facce opposte del cubo, e ’ possibile ruotare il cubo intorno a questo asse di 90, 180, 270 e 360 gradi senza alterare la configurazione iniziale. Queste 4 rotazioni, ovviamente altro non sono che 4 elementi delle 24 rotazioni del cubo descritte prima. Quindi esse costituiscono un gruppo più piccolo formato da 4 elementi. Il gruppo completo di rotazioni di un cubo ha all’interno di esso dei gruppi più piccoli. Essenzialmente, un gruppo semplice, e’ uno che non può essere diviso in gruppi più piccoli così come succede per i numeri primi e gli atomi delle molecole. L’importanza dei gruppi semplici deriva dal Teorema di Jordan-Holder, dimostrato intorno al 1889. Esso stabilisce che tutti i gruppi finiti possono essere costruiti a partire dai gruppi semplici finiti.

Un gruppo semplice finito o appartiene a una di 4 famiglie particolari (Gruppo ciclico, Gruppo alterno, Gruppo lineare, Gruppo di tipo Lie) oppure a uno dei cosiddetti 26 gruppi individuali chiamati anche gruppi sporadici. Il più grande gruppo individuale e’ il cosiddetto mostro con ben 808017424794512875886459904961710757005754368000000000 elementi.

martedì 31 maggio 2016

Gli adroni come bisturi di precisione

 

E’ di solo pochi giorni fa la notizia di una bimba di 9 anni affetta da un tumore raro (cordoma) che interessa i due estremi della colonna vertebrale curata con i protoni. La terapia che è stata messa in atto si basa sull’utilizzo di fasci di protoni e ioni pesanti. Si tratta di una tecnica all’avanguardia per il trattamento dei tumori più precisa e che provoca meno danni ai pazienti. Nel mondo non sono molti i centri che utilizzano questo tipo di cura: a livello mondiale sono soltanto 48. Vediamo di capire allora come funziona questa nuova e promettente tecnica di bombardamento. Non e’ la prima volta e non sara’ nemmeno l’ultima che la ricerca fondamentale ha ricadute molto importanti nel campo della medicina. Le proprieta’ quantistiche della materia, le radiazioni, l’antimateria, gli acceleratori di particelle e i rivelatori, sono usciti dai laboratori dei fisici per entrare nel mondo degli ospedali per aiutare i medici a guardare dentro i nostri corpi e curare diverse patologie tra cui il cancro. Questo termine indica un processo patologico caratterizzato dall’abnorme accrescimento di un tessuto che determina la comparsa di una tumefazione localizzata con disturbi legati a distruzione del tessuto normale preesistente, a compressione di strutture vicine o a ostruzioni di visceri cavi con ristagno dei secreti in essi contenuti.

In tutti i tumori si riconoscono due componenti di base:

1. il parenchima costituito dalle cellule neoplastiche o trasformate, ovvero quelle cellule che hanno subito un’alterazione genica che causa la crescita anormale del tessuto.

2. lo stroma che funge da sostegno per la massa tumorale ed `e composto da tessutto connettivo e vasi sanguigni.

Sebbene siano le cellule parenchimali a costituire la parte proliferativa della neoplasia, la crescita e l’evoluzione tumorale sono strettamente connesse e influenzate dallo stroma: e’ quest’ultimo infatti che fornisce la struttura di sostegno su cui proliferano le cellule trasformate.

L’evoluzione della maggior parte dei tumori maligni puo’ essere divisa in quattro fasi:

· modificazione maligna delle cellule bersaglio, denominata trasformazione;

· crescita delle cellule trasformate;

· invasione locale

· e, infine, metastasi a distanza (cioe’ localizzazione secondarie a distanza).

clip_image002

La crescita della massa tumorale e la sua velocita’ e’ determinata dalla differenza tra il numero di cellule alterate prodotte e le cellule perse (apoptosi – eliminazione di cellule alterate tramite meccanismo di morte programmata come avviene per esempio nell’embrione umano durante la differenziazione delle dita delle mani e dei piedi generando la morte delle cellule che costituiscono le membrane interdigitali di mani e piedi palmati). In genere, lo squilibrio tra cellule prodotte e cellule perse e’ piu’ alto nei tumori con una frazione di crescita alta. Alcuni linfomi, leucemie e carcinomi polmonari sono caratterizzati da frazioni di crescita elevate e si manifesta un decorso clinico estremamente rapido: il tumore si dice aggressivo. Tumori piu’ largamente diffusi, come il tumore alla mammella e al colon hanno una bassa frazione di crescita e la produzione cellulare supera la perdita di appena il 10 per cento. Il ritmo di accrescimento e’ dunque molto piu’ lento. La frazione di crescita delle cellule tumorali ha un notevole impatto sulla loro suscettibilita’ alla chemioterapia (trattamento terapeutico a base di sostanze chimiche). La maggior parte dei farmaci contro il cancro, infatti, agisce sulle cellule che si trovano nel ciclo replicativo; percio’ i tumori che hanno una frazione di crescita bassa, ad esempio solo del 5 per cento, avranno una crescita lenta, ma saranno refrattari ai trattamenti chemioterapici classici. In questi casi, si ricorre ad altre tecniche di riduzione della massa tumorale di tipo non farmacologico, ad esempio la radioterapia (di cui parleremo a breve) o l’intervento chirurgico. Lo scopo e’ ridurre il numero di cellule tumorali che si trovano nella fase G0 (cellule in una fase di quiescenza temporanea o irreversibile, o in altri termini che hanno interrotto la fase di replicazione) del ciclo cellulare, in modo che le cellule tumorali residue tendano ad entrare nel ciclo replicativo e pertanto diventino sensibili all’azione dei farmaci. Al contrario, tumori aggressivi (come certi linfomi) che contengono un gran numero di cellule nel ciclo replicativo si dissolvono con la chemioterapia e possono anche essere guariti.

Nella crescita di un tumore, inoltre, si distinguono due fasi: una prima fase di evoluzione avascolare e una seconda fase caratterizzata dalla capillarizzazione della massa tumorale. I tumori, infatti, stimolano la crescita dei vasi ematici dell’ospite, processo detto angiogenesi, che e’ essenziale per rifornire di sostanze nutritive le cellule tumorali. Fintanto che la massa tumorale e’ poco estesa (un diametro o uno spessore inferiore ai 2mm), le cellule tumorali riescono a ricevere l’apporto di nutrienti e ossigeno necessari alla loro vita per diffusione dai capillari gia’ esistenti, ma per superare tale soglia e’ necessario un processo di vascolarizzazione. Durante la crescita del tumore, alcune cellule acquisiscono un fenotipo angiogenetico, che gli permette di produrre segnali che inducono la proliferazione delle cellule endoteliali (quelle che rivestono l’interno dei vasi sanguigni e di quelli linfatici), che vanno a costituire i nuovi vasi ematici. Il cambiamento da tumore avascolare a tumore vascolare e’ detto switch angiogenetico. Contrariamente ai vasi normali, i vasi di origine tumorale possono crescere in continuazione, sotto l’azione di fattori di crescita specifici come il VEGF (la proteina piu’ importante di questa categoria e’ il VEFG-A), e costituiscono un sistema ematico irregolare e dalla forma tortuosa. Questo fa si che non tutte le cellule del tumore ricevano il nutrimento necessario, e quindi si creano delle necrosi all’interno della massa tumorale stessa. La vascolarizzazione del tumore e’ una delle condizioni che favorisce maggiormente l’invasivita’ e la metastatizzazione dei tumori maligni. Proprio perche’ l’angiogenesi e’ determinante per la crescita e la diffusione dei tumori, nelle terapie e’ rivolta una grande attenzione ai farmaci che inibiscono questo processo. Rientrano in questa categoria i nuovi farmaci biologici monoclonali come l’avastin (bevacizumab) la cui azione e’ schematizzata nelle immagini sottostanti. In parole semplici l’azione di questi farmaci e’ quella di bloccare i VEGF prodotti dalle cellule tumorali e responsabili della crescita anomala dei vasi sanguigni.

clip_image003

Per quanto riguarda la velocita’ di crescita questa e’ correlata al livello di differenziazione cellulare: meno e’ alto il livello di differenziazione piu’ `e veloce la crescita. Quindi la maggior parte dei tumori maligni cresce piu’ rapidamente rispetto i tumori benigni. Inoltre, la velocita’ di crescita e’ spesso non costante nel tempo perche’ fattori come la stimolazione ormonale, l’adeguatezza dell’apporto ematico e altri fattori ad oggi ancora poco conosciuti possono condizionare la cinetica cellulare. Questo rende la crescita e dimensione di un tumore praticamente impredicibile.

La terza fase, quella dell’invasione locale, avviene in modo differente per tumori benigni e maligni. Quasi tutte le neoplasie benigne crescono formando masse compatte ed espansive che restano localizzate nella loro sede di origine e non hanno la capacita’ di infiltrare gli organi circostanti o invadere a distanza. Poiche’ la loro espansione e’ piuttosto lenta, sviluppano al loro intorno un tessuto connettivo fortemente compresso, detto capsula fibrosa, che li separa dal tessuto d’origine. La crescita dei tumori maligni, invece, e’ accompagnata da una progressiva infiltrazione, invasione e distruzione dei tessuti circostanti. Solitamente le neoplasie maligne sono poco demarcate dal tessuto normale circostante e hanno una crescita irregolare e disomogenea. I tumori maligni a lenta espansione possono sviluppare una capsula fibrosa, ma, generalmente, sviluppano anche delle filiere di cellule che infiltrano le strutture adiacenti.

Queste filiere sembrano al microscopio delle chele di granchio e per questo il tumore maligno e’ anche detto cancro. Nella loro espansione i tumori maligni non rispettano, in genere, i normali confini anatomici e questo rende difficile l’intervento chirurgico di asportazione e, anche qualora il tumore apparisse compatto e ben circoscritto, e’ sempre necessario asportare anche una parte di tessuto sano limitrofo. L’invasivita’ dei tessuti circostanti e’ una delle principali caratteristiche del decorso clinico che permette di distinguere un tumore maligno da uno benigno.

La quarta fase, quella delle metastasi, e’ caratteristica solo delle neoplasie maligne. Le metastasi sono impianti di tumore lontani dal tumore primitivo. L’invasivita’ che caratterizza i tumori maligni permette loro di penetrare nei vasi ematici e linfatici nonche’ nelle cavita’ del corpo. Quelle appena indicate sono le tre principali vie di diffusione per i tumori maligni, che danno l’opportunita’ al cancro di diffondere in altre sedi. Solitamente, tanto piu’ il tumore primitivo e’ aggressivo e di rapido accrescimento, maggiore e’ la possibilita’ che metastatizzi o abbia gia’ metastatizzato.

Piu’ si studiano i tumori e piu’ si capisce quanto essi siano purtroppo intelligenti. Non c’e’ dubbio che come tutte le cellule anche quelle tumorali soddisfano il principio di evoluzione di Darwin e quindi escogitano nuove strategie pur di sopravvivere. Tra queste ricordiamo quelle messe a punto dal tumore del pancreas per ingannare il sistema immunitario o quelle del glioblastoma (tumore del cervello) che e’ in grado di trasformare alcune delle proprie cellule in vasi sanguigni per potersi cosi autoalimentare. Per questo motivo laddove la chirurgia e la chemioterapia non sono d’aiuto e’ possible utilizzare tecniche alternative date in prestito alla medicina dalla fisica nucleare e particellare. L’idea di base e’ di utilizzare le radiazioni per danneggiare il DNA delle cellule tumorali e determinarne cosi la morte.

clip_image004

Tra queste tecniche ricordiamo la radioterapia (generalmente raggi X), i fotoni di alta energia (raggi gamma), generati da sorgenti radioattive, quali il cobalto-60, oppure i fasci di elettroni. Questa radiazione viene indirizzata sull’organismo in corrispondenza del tessuto tumorale e, una volta dentro il corpo, viene assorbita durante il suo percorso da tutti i tessuti e gli organi, non soltanto laddove c’è un tumore, generando i ben noti effetti secondari. Questo, tra l’altro, limita la quantità di radiazione che si può utilizzare, in quanto un utilizzo massiccio mette a rischio la vita stessa del paziente. Una nuova tecnica a disposizione degli oncologi per combattere il cancro e’ quella dell’adroterapia in cui le cellule malate vengono sparate con un acceleratore di particelle.

Fasci di protoni oppure di ioni di carbonio, provenienti da acceleratori dedicati, sono utilizzati con grande successo per il trattamento dei tumori localizzati. L’idea di utilizzare i protoni per il trattamento dei tumori fu proposta nel 1946 da R.R. Wilson ed è stata applicata per la prima volta nel 1954 nel laboratorio di ricerca di fisica nucleare del Lawrence Berkeley National Laboratory, in California, Stati Uniti. In Europa il metodo è stato utilizzato in Svezia, a Uppsala, per la prima volta nel 1957, utilizzando un acceleratore che era stato costruito per ricerche di fisica fondamentale. Da allora, la tecnica si è molto perfezionata ed estesa in tanti paesi del mondo, inclusa l’Italia. Il nome della terapia deriva dal fatto che le particelle che vengono utilizzate, protoni oppure ioni di carbonio, sono adroni – particelle cioe’ composte da quark e che subiscono interazioni forti.

clip_image006

I protoni e gli ioni di carbonio utilizzati nell’adroterapia grazie a delle macchine chiamate acceleratori vengono portati ad una certa energia, che dipende dalla tipologia e localizzazione del tumore, e indirizzati con precisione elevatissima sul paziente.

clip_image008

clip_image010

Entrati nell’organismo, a differenza dei fasci di fotoni o di elettroni, viaggiano sino ai tessuti tumorali danneggiando pochissimo gli altri tessuti, rilasciando invece un’enorme quantità di energia, nel tessuto tumorale. I tessuti sani subiscono pochi danni, mentre quelli malati sono distrutti. Come si puo’ notare dal grafico sottostante la dose massima di energia rilasciata dai protoni e’ piu’ in profondita’ rispetto a quella dei raggi X. Il picco di rilascio dell’energia da parte dei protoni e’ chiamato picco di Bragg.

clip_image012

Controllando l’energia dei fasci si può controllare il posto dove questi rilasciano la loro carica distruttiva nell’organismo. Per tumori superficiali l’energia è più piccola che per un tumore profondo. La terapia con ioni di carbonio ha il vantaggio di avere una maggiore densità di ionizzazione rispetto a quella dei protoni. In questo modo i danni della struttura del DNA all’interno della cellula tumorale si verificano più frequentemente e così diventa più difficile per la cellula cancerosa riparare il danno. L’efficienza biologica della dose è più grande rispetto a quella dei protoni di un fattore tra 1,5 e 3. L’utilizzo degli ioni di carbonio ha però uno svantaggio: la dose, superato il posto dove è localizzato il tumore, non diminuisce a zero, come nel caso dei protoni, in quanto le reazioni nucleari stesse tra gli ioni di carbonio e gli atomi del tessuto portano alla produzione di ioni più leggeri, che possono creare piccoli danni nelle vicinanze del tessuto tumorale (alcuni progetti di ricerca stanno studiando proprio questo aspetto).

Per eseguire l’adroterapia sono necessari:

• un acceleratore di protoni e/o di ioni, che produce più fasci di particelle in modo tale da avere più sale di trattamento;

• un sistema di trasporto dei fasci nelle sale di trattamento;

• un sistema molto preciso di posizionamento del paziente;

• un sistema accuratissimo di controllo dell’energia dei fasci e della dose assorbita dal paziente;

• un sistema tridimensionale di trattamento personalizzato sul paziente ottenuto integrando le immagini diagnostiche ottenute applicando tecniche quali la tomografia a emissione di positroni o la tomografia computerizzata.

Il protocollo di trattamento dipende ovviamente dalla tipologia del tumore. Vengono trattati i tumori localizzati, per esempio i melanomi dell’uvea, occhio, i tumori della base del cranio e della colonna vertebrale e anche alcuni tumori solidi pediatrici. Dopo l’iniziale calibrazione dell’energia, vengono effettuate un numero variabile, 12-16 d’abitudine, di sedute di trattamento.

Alla fine del 2012 esistevano nel mondo circa 40 centri di adroterapia e quasi 100.000 pazienti trattati con fasci adronici. Recentemente è entrato in funzione anche il centro italiano CNAO, vicino a Pavia, per l’adroterapia. L’adroterapia è un metodo molto costoso: l’investimento iniziale è intorno ai 100 milioni di Euro, e i costi per singolo paziente sono a loro volta molto alti – arrivando a decine di migliaia di Euro, un fattore almeno due volte più grande del costo della radioterapia. Oggi i ricercatori di tutto il mondo stanno provando nuovi metodi per costruire acceleratori meno costosi e riuscire a trattare più pazienti con questo metodo molto efficace per i tumori localizzati.

clip_image013

mercoledì 11 maggio 2016

Quando la topologia incontra i big data

 

I big data stanno ricevendo sempre piu’ attenzione da parte dei media,  industrie, laboratori, banche e governi per citarne alcuni. La quantita’ di dati generata ogni giorno, (dalle condizioni meteorologiche ai telefonini, dal web ai satelliti….. ) e’ enorme e molti dei database contengono centinaia e centinaia di variabili (attributi). Si tratta di insiemi cosi grandi e complessi che i metodi tradizionali di analisi  spesso falliscono. Ma allora perche’ cosi tanto interesse? Perche’ i dati contengono informazioni estremamente importanti ed interessanti. Sono delle vere e proprie’ miniere da cui estrarre l’oro (cioe’ l’informazione). Ma questa estrazione non e’ semplice e cio’ non solo a causa del numero di variabili e del numero di istanze ma anche a causa della rumorosita’ e complessita’ dei database. Facciamo un esempio ricorrendo al concetto di correlazione lineare, il cui obiettivo e’ quello di trovare la migliore retta che approssimi un insieme di punti in un piano. Qui di seguito un esempio di correlazione tra l’altezza e peso di un gruppo di persone. L’equazione della retta e’ data da Altezza(Height)=0.6*Peso(Weight)+130.2 il che significa che per esempio una persona che pesa 100 Kg sara’ alta circa 190 cm.

image

Di sicuro una linea retta e’ una forma e questa e’ adatta a rappresentare i punti del grafico. Questo pezzo di informazione e’ molto importante per diverse ragioni. Una e’ che la forma ci da’ un’informazione qualitativa mostrandoci come la variabile altezza varia direttamente con la variabile peso (cioe’ l’altezza aumenta se aumenta il peso). Un’altra e’ che essa permette di prevedere con ragionevole accuratezza una delle due variabili se conosciamo il valore dell’altra. La forma e’ alla base di una nuova metodologia che applica la topologia all’analidsi dei dati (Topology Data Analysis). Per il nostro esempio e’  la forma della linea che risulta un utile principio organizzativo per estrarre delle utili informazioni. Sfortunatamente pero’ i dati non sempre cooperano e si dispongono lungo una retta. Consideriamo, per esempio, l’insieme mostrato di seguito.

image

E’ facile capire che non c’e’ nessuna linea che possa rappresentare tali dati accuratamente. La ragione e’ che questi dati si dispongono in un insieme di tre cluster molto “stretti”. Anche se puo’ sembrare strano un aspetto fondamentale di qualsiasi forma e’ il numero di pezzi connessi in cui l’insieme puo’ essere diviso (In matematica, uno spazio topologico si dice connesso se non può essere rappresentato come l'unione di due o più insiemi aperti non vuoti e disgiunti. In modo poco formale ma abbastanza intuitivo, possiamo dire che la connessione è la proprietà topologica di un insieme di essere formato da un solo "pezzo"). In questo caso quindi la forma non puo’ essere quella di una linea ma quella di 3 pezzi connessi.

image

A questo punto potremmo pensare di procedere assumendo che quasiasi insieme di dati possa essere approssimato da una linea, da una famiglia di clusters o una famiglia di linee. Qui di seguito un altro insieme di dati che dimostra come questo non sia vero.  Chiaramente la regressione lineare (cerchio a destra) in un tale contensto e’ inutile e lo possiamo vedere grazie al fatto che ci rendiamo conto che la forma e’ circolare e cioe’ che possiamo vedere come si dispongono i punti.

image

Un altro esempio in cui la forma rassomiglia a quella di una Y. Questa e’ un’altra forma che spesso capita di incontrare nell’analisi dei big data. Il sistema ha un cuore centrale e 3 filamenti che si estendono a partire da esso. Questo puo’ rappresentare una situazione dove il cuore rappresenta il comportamento tipico e I filamenti invece dei comportamenti estremi dove il sistema sta meno frequentemente. E’ chiaro che questa forma e’ diversa da tutte le altre menzionate.

image

Esistono purtroppo infinite varieta’ di forme possibili nei dati reali e non solo quelle poche riportate fin qui come mostrato nell’immagine qui sotto.

image

E le difficolta’ non finiscono qui. Cosa succede se i punti si trovano in uno spazio a piu’ di 3 dimensioni? Come potremmo renderci conto che si tratta di un cerchio o di una linea?

O meglio: come possiamo insegnare ad un computer a trovare per esempio un cerchio?

Queste sono alcune delle questioni che emergono quando si analizzano i big data. Le risposte vengono dai campi piu’ disparati quali: machine learning, data mining, advanced statistic ecc. Ultimamente comunque come gia’ anticipato un valido contributo sembra venire dalla geometria e in particolare dalla topologia. Quest’ultima chiamata anche la “geometria dei fogli di gomma” e’ lo studio delle proprieta’ delle figure e delle forme che non cambiano quando viene effettuata una deformazione senza strappi, sovrapposizioni o incollature. Per un topologo una sfera e un cubo sono la stessa cosa. Operazioni come questa vengono chiamate deformazioni e due oggetti vengono considerati uguali se e’ possibile deformare uno nell’altro. I topologi studiano gli spazi assegnandogli degli oggetti algebrici chiamati invarianti. Nel caso particolare dell’applicazione della topologia all’analisi dei dati (TDA) l’invariante scelto e’ la cosiddetta “persistenza omologa”. L’omologia ordinaria misura il numero di “buchi” in uno spazio che non possono essere riempiti. Pensiamo ad una sfera. Se disegniamo una curva chiusa sulla sua superficie questa racchiudera’ uno disco di 2 dimensioni e potra’ avere il raggio che vogliamo anche tendente a zero. In questo senso significa che non ci sono buchi sulla superficie di una sfera altrimenti non avremmo potuto ridurre il disco fino ad avere dimensione nulla.

clip_image014

Al contrario questo non e’ vero per la superficie della sfera stessa che racchiude un “vuoto” tridimensionale che non puo’ essere riempito. I numeri di Betti contano quanti buchi non riempibili sono presenti per uno spazio di ogni dimensione.

· β0(X) e’ il numero di componenti connesse (o 0-cicli), in pratica il numero di pezzi separati di cui e’ composto lo spazio

· β1(X) conta i buchi fatti “a circonferenza” dello spazio (1-cicli come quelli di una ciambella)

· β2(X ) conta i vuoti bidimensionali dello spazio (2-cicli come quelli della sfera, del pallone o di una camera d’aria etc).

clip_image016

Qui di seguito il primo numero di Betti per le consonanti coreane.

image

Consideriamo adesso un caso bidimensionale con i dati rappresentati da un insieme discreto di punti come mostrato.

image

L’idea e’ quella di far crescere intorno ad ogni punto un disco di diametro d. Se d inizialmente e’ molto piccolo allora nessuno dei dischi s’interseca. Ma una volta che d cresce (vedi sotto) allora i dischi  iniziano a toccarsi dando origine a dei numeri di Betti diversi da zero. Osserviamo che a partire da d=d1 e fino a che d=d2, avremo un buco tra i 4 dischi cioe’ il buco persistera’ mentre d va da d1 fino a d2. Questo lo possiamo rappresentare con un grafico che prende il nome di barcode come mostrato sotto.

image

Ritorniamo adesso al caso discreto di punti introdotto prima e iniziamo a far crescere i dischi. Fermandoci ad un diametro leggermente superiore a d=1 avremo la seguente situazione. Ci sono due buchi uno in alto a sinistra all’interno del pentagono e uno in basso a destra all’interno del quadrato.

image

Quando il diametro d supera ~1.5 si forma un unico buco grande come mostrato sotto.

image

L’omologia persistente monitora i numeri di Betti utilizzando i barcode al variare del diametro d. Le barre lunghe indicano delle caratteristiche (features) dei dati che possono essere significative. Le barre corte invece spesso nascono dal rumore e possono essere scartate. Quello che si fa quindi e’ passare da una collezione discreta di punti ad una sequenza piu’ complicata di spazi che modellano meglio i dati di quanto possa fare una semplice correlazione lineare.

Gunnar Carlsson della Stanford University e’ uno dei pionieri della TDA. Insieme a dei colleghi ha fondato la compagnia AYASDI, sviluppando un software che si e’ dimostrato un valido strumento nell’analisi dei dati di banche, finanza, governo e industrie. Qui di seguito qualche esempio di applicazione. Dall’analisi di un database di una banca contenente circa 6 milioni di transazioni con circa 300 attributi il software e’ stato capace di isolare quelle fraudolente indicate in rosso.

image

Un altro esempio e’ dato dall’applicazione del software al mondo delle fabbriche di semiconduttori. Sono state analizzate piu’ di 1000 linee di produzione con circa 500 attributi per ogni linea identificando quelle con problemi di bassa qualita’ dei loro prodotti come mostrato nell’mmagine sottostante.

image

In definitiva cosa rende cosi’ potente l’applicazione della topologia nell’analisi dei dati rispetto alle tecniche piu’ tradizionali? La risposta e’ nelle seguenti 3 proprieta’ della topologia.

1. Indipendenza dal sistema di coordinate: la topologia studia le proprieta’ geometriche degli oggetti che non dipendono dal particolare sistema di riferimento utilizzato per rappresentarli

2. Invarianza rispetto alle deformazioni: la topologia studia le proprieta’ delle curve e superfici che non cambiano quando vengono stirate.

image

3. Rappresentazione compressa: la topologia costruisce delle rappresentazioni combinatorie di oggetti continui. Un cerchio (curva continua) puo’ essere rappresentato da una rete esagonale costituita cioe’ da 6 nodi e 6 spigoli (edges).

image

domenica 13 marzo 2016

Matematica e Google

 

image

Molte persone credono che la matematica sia una disciplina fine a se stessa molto astratta e praticamente inutile. I matematici vengono visti come esseri strani che vivono in un universo tutto loro e si occupano di cose che solo loro capiscono e che non servono nella vita di tutti i giorni.

E’ possibile che ci sia qualche cosa di vero in queste affermazioni. Ma di sicuro se non ci fossero stati gli sviluppi matematici fatti negli ultimi anni, molte delle funzionalità che oggi utilizziamo non sarebbero disponibili. La tecnologia avanza con l’avanzare della ricerca matematica e non solo. Anche se molti di noi non se ne accorgono, ogni giorno facciamo uso della matematica. Vogliamo fare un elenco delle applicazioni che vedono coinvolta la ricerca matematica? Proviamoci.

· Fotografia digitale

· Musica digitale

· Film e tv digitali

· Telefonia mobile

· Crittografia

· Navigatore satellitare

· TAC (tomografia assiale computerizzata)

· Previsioni meteo

· Analisi di rischio

· Analisi di economia

· Internet

e tante altre. In questo post, come si intuisce dal titolo ci occuperemo di Internet e in particolare del Page Ranking di Google cioe’ dell’algoritmo utilizzato da Google per assegnare un fattore di importanza alle pagine trovate dal motore di ricerca.

Due studenti dell’Università’ di Stanford, Sergey Brin e Larry Page, hanno fatto la loro fortuna inventando uno dei più potenti motori di ricerca del web “Google”.

Ma cosa deve fare esattamente un motore di ricerca?

Semplicemente ordinare le pagine presenti sul web in base alla loro importanza ogni qualvolta un utente effettua una ricerca. Ma come si può definire l’importanza (page rank) di una pagina?

L’idea dei due studenti e’ stata la seguente.

Ogni pagina web ha una sua propria importanza che deriva dalle connessioni (non direttamente dai contenuti). L’importanza di una pagina viene trasferita in parti uguali alle pagine che essa punta. Quindi l’importanza di una pagina e’ data dalla somma delle frazioni di importanza che gli derivano dalle pagine che ad essa puntano. Facendo ricorso ad una analogia nella vita di tutti i giorni: una persona importante da’ importanza alle persone che frequenta e allo stesso tempo una persona e’ importante se frequenta molte persone importanti.

Passiamo al modello matematico. Supponiamo di numerare le pagine del web da 1 a n. Definiamo la matrice di connettività nel seguente modo:

image

dove i vari elementi sono uguali a 1 se c’e’ un link tra la pagina i e la pagina j altrimenti sono uguali a zero. Facciamo un esempio con 4 pagine, cioè n=4 e supponiamo di avere la seguente matrice di connettività:

image

Schematizziamo le connessioni tra le varie pagine con delle frecce ottenendo il seguente grafo:

image

Sommando i valori della riga i si trova il numero di link che partono dalla pagina i. Indichiamo questo numero con Pi. Sommando, invece, i valori della colonna j si trova il numero di pagine che puntano alla pagina j che indicheremo con Aj. Se adesso indichiamo con xj l’importanza della pagina j risulta che:

image

per j che varia da 1 a n. Considerando il sistema di 4 pagine precedente, possiamo per esempio scrivere:

image

Si tratta, in generale, di un sistema lineare di n equazioni in n incognite. Le soluzioni xj danno il livello di importanza delle singole pagine, cioè il page rank.

Ad oggi, pensate che ci sono circa n=8500000000 pagine attive.

Comunque l’equazione da noi ricavata e’ una versione semplificata. In effetti quella usata da Google e’ data da:

image

dove d e’ un parametro compreso fra 0 e 1, che di solito viene messo a 0.85. I valori di xj sono compresi tra 0 (pagina non importante) e 1 (pagina importantissima.

Ma e’ possibile risolvere un sistema lineare con 8.5 miliardi di incognite? Se utilizzassimo il metodo di eliminazione questo richiederebbe circa 4*109 operazioni matematiche. Sic!

Il calcolatore più veloce esistente al mondo (il Blue Gene dell’IBM) richiederebbe più di 36 milioni di anni per risolvere un tale sistema. Un tempo da ere geologiche....

Eppure Page e Brin calcolano il page rank in continuazione. Come fanno?

Anche se la tecnologia fosse in grado di costruire un computer 1000 volte o anche un milione di volte più veloce sarebbe sempre impossibile risolvere il problema di Google in tempo reale. E allora?

La soluzione la si può ottenere solo sviluppando nuovi metodi matematici. E’ quello che hanno fatto i due sviluppatori di Google che utilizzano il seguente algoritmo.

Prima di tutto assegnano alle pagine dei valori di importanza xj qualsiasi. Inizialmente non importa quale sia il valore. Dopo di che si sostituiscono questi numeri nell’equazione riportata precedentemente ricavando dei nuovi valori di importanza in accordo alla matrice di connettività e ai valori di Pi. A questo punto si inseriscono sempre nella stessa equazione come valori di ingresso xj quelli appena ottenuti. E si ricavano nuovi valori e cosi via. In questo modo viene generata una successione di approssimazioni successive che converge alla soluzione del sistema qualunque siano i valori iniziali utilizzati. Nella figura qui sotto viene riportato l’andamento delle soluzioni del sistema per il caso di 4 pagine riportato sopra come esempio. Notiamo la rapida convergenza delle soluzioni.

image

Andamento delle soluzioni del sistema Page rank per il caso di 4 pagine

Per fare un passo dell’algoritmo qui descritto bisogna eseguire tante moltiplicazioni quanti sono gli elementi non nulli della matrice di connettività C e all’incirca altrettante addizioni. Su ogni riga della matrice C, comunque, mediamente ci sono pochi elementi diversi da zero. Se supponiamo che questo numero sia 50, un passo del metodo iterativo spiegato, su Blue Gene impiegherebbe solo 2 millesimi di secondo. Se anche fossero necessari 1000 passi iterativi basterebbero 2 secondi per approssimare la soluzione di Google.

Fin dalla sua introduzione l’equazione del PageRank  ha ricevuto l’attenzione di moltissimi studiosi che hanno cercato di migliore in tutti i modi il metodo di soluzione del sistema lineare. Qualche anno fa ugruppo di studiosi, tra cui alcuni italiani dell’università’ di Roma e Cagliari, hanno usato un nuovo approccio molto più veloce di quelli esistenti oggi, ricorrendo ad un’analogia con la Fisica Quantistica. In particolare, hanno mostrato che e’ possibile riarrangiare l’equazione Page Rank in modo da ottenere un’equazione simile all’equazione di Schrödinger.

Vi ricordo che l'equazione di Schrödinger rappresenta una delle più importanti conquiste della fisica ed in particolare della meccanica quantistica. Quest'ultima, risalente alla metà degli anni venti e’ stata sviluppata soprattutto da de Broglie e Schrödinger e si basa sul cosiddetto approccio ondulatorio della materia. In questa ottica, si rappresentano le particelle con delle funzioni d'onda in quanto si e’ visto che in certi esperimenti le particelle elementari mostrano comportamenti ondulatori. La funzione d’onda va interpretata in termini probabilistici, cioè il suo modulo al quadrato altro non rappresenta che la probabilità di trovare la particella in un punto x al tempo t. L’equazione di Schrodinger e’ scritta come:

image

dove psi e’ la funzione d’onda, i e’ l’unita immaginaria, h tagliato una costante fisica, m la massa della particella, V(x) il potenziale in cui e’ immersa la particella e i simboli d/dt e d2/dx2 sono la derivata rispetto al tempo e la derivata seconda rispetto alla posizione rispettivamente. Si rimanda il lettore ad un qualsiasi testo di analisi matematica per la definizione di derivata. In parole molto semplici la derivata di una funzione f rispetto al tempo, df/dt , indica quanto rapidamente f cambia al variare del tempo.

Esprimere il PageRank in termini di una funzione d’onda che obbedisce ad un’equazione simil-Schrödinger permette, secondo questo studio, di localizzare velocemente le pagine con un rank più alto senza utilizzare procedure iterative, chiarendo nel contempo il ruolo della topologia nella diffusione delle informazioni nelle reti complesse.

Nell’equazione riarrangiata del PageRank, il potenziale V dell’equazione di Schrödinger corrisponde alla differenza tra il numero di links entranti Pj e il numero di links uscenti Aj da ogni pagina (i nodi della rete mostrata qui di seguito).

 

image

Rappresentazione dell’equazione PageRank e la sua controparte quantistica. Nelle immagini in basso vengono rappresentati il potenziale V e il corrispondente PageRank misurato lungo dei dischi concentrici intorno ad un vertice.

Quando il potenziale V e’ minore di zero (minima energia) la funzione d’onda dell’equazione PageRank e’ localizzata in questa buca di potenziale e il suo valore e’ massimo, indicando che quel nodo, cioè la pagina e’ importante.

Allo stesso modo, quando il potenziale V e’ positivo la funziona d’onda e’ localizzata in questo picco di potenziale e mostra il suo valore più basso, indicando che la pagina non e’ importante.

Questa analogia formale con la fisica quantistica mette a disposizione dello studio del PageRank una serie di strumenti teorici consolidati, sviluppati dai fisici, come la teoria perturbativa.

La differenza di scala tra il mondo delle particelle sub-atomiche ed il Web è enorme ma i ricercatori sono convinti che il loro lavoro potrà portare benefici a tutto quel campo di ricerca che si collega al  PageRank  e che comprende, per esempio, la propagazione della fiducia nei social network od una più efficiente classificazione delle pagine web.

image

Curve di livello del potenziale V e della funzione d’onda. Si può vedere come in prossimità del minimo del potenziale corrisponde il massimo della funzione d’onda e quindi dell’importanza della pagina web. Il calcolo e’ stato effettuato sempre considerando i dischi concentrici dell’immagine precedente

http://www.wikio.it