venerdì 2 settembre 2022

L’Archeometria nella lotta contro i falsi nei beni culturali

 

Il seguente post e’ stato scritto con la collaborazione di Gilda Russo (Conservation Scientist).

La falsificazione di oggetti archeologici e storico-artistici è molto diffusa e va dalla produzione di falsi di mediocre qualità ai falsi prodotti da specialisti. Sono, infatti, noti casi di opere a lungo ritenute autentiche, esposte nei più importanti musei, che sono state identificate come falsi di varia età in tempi successivi e solo attraverso analisi archeometriche. Numerose sono le indagini archeometriche che possono essere utili nella individuazione di falsi. Dalle tecniche di datazione assoluta (come la termoluminescenza o la datazione al radiocarbonio) alle metodologie di indagini che consentono di identificare la composizione chimica dei materiali originali, di degrado e/o di restauro e quindi realizzare studi di autenticazione, sulle tecnologie di produzione e di datazione indiretta. Ancora in questo contesto sono di notevole importanza le tecniche basate sull’imaging diagnostico (Tomografia Computerizzata, radiografia X, fluorescenza UV, riflettografia IR, etc.) che consentono di avere in maniera non invasiva informazioni sulla distribuzione spaziale dei materiali presenti, non direttamente discriminabili ad occhio nudo, e possono dare indicazioni sulla loro natura chimica, differenziando, grazie alle caratteristiche risposte spettrali, le superfici originali da quelle interessate da integrazioni, ritocchi o trattamenti protettivi.

Statuette, gioielli e piccoli oggetti di uso quotidiano sono i falsi più comuni tra gli oggetti metallici. Oltre al caso di prodotti contraffatti nell'antichità, c'è oggi un fiorente mercato dell'arte che coinvolge entrambi i collezionisti privati più o meno ingenui e musei di varia importanza. Nel giugno 2007, il Progetto AUTHENTICO, finanziato dalla Commissione Europea, ha proposto una ricerca multidisciplinare per affrontare questo problema e fornire una strategia per l'autenticazione del patrimonio culturale mobile, in particolare di manufatti metallici (preziosi e non). Una delle tecniche analitiche proposte per verificare l'autenticità e la tracciabilità dei manufatti metallici è l'XRF portatile.

Sebbene nell'analisi quantitativa XRF di metalli antichi sorgono alcune difficoltà nella valutazione di fattori di correzione per la forma irregolare o effetti di rilievo, o come determinare la composizione del metallo (bulk) al di sotto della patina superficiale, il Portable XRF è ancora la più semplice tecnica non distruttiva che consente di determinare in modo quantitativo la lega con sufficiente precisione, fornendo agli storici dell'arte dati scientifici per ciascun campione. La profondità dell'analisi XRF per i metalli è di solito solo pochi decimi di micron, ma in assenza di rivestimenti metallici (come per esempio oro), e di fenomeni di corrosione o croste, la composizione esterna dovrebbe essere rappresentativa del bulk dell’oggetto in esame.

In questo post come esempio di applicazione delle tecniche archeometriche mostreremo come l’XRF possa aiutare l’archeologo nel dichiarare falso o no un oggetto di cui si ignora la provenienza. A tale scopo sono stati utilizzati tre oggetti: una statua egiziana di metallo realizzata in tempi moderni e comprata in un negozio di souvenir di un noto museo italiano, un oggetto metallico di forma cilindrica con alcuni fori (etichettato in questo post come flauto per la sua forma che ricorda appunto questo strumento musicale) proveniente da una collezione privata e supposto essere di epoca romana e infine una fibula di epoca romana acquistata su ebay da un antiquariato inglese.

image

Prima di passare ai risultati delle indagini eseguite vediamo un attimo in cosa consiste l’analisi XRF. La spettroscopia di fluorescenza a raggi X (XRF) è una delle tecniche più utilizzate per l'analisi elementare dei materiali. Gli elementi essenziali della tecnica sono abbastanza semplici: gli elettroni del nucleo degli atomi vengono espulsi dai raggi X primari ad alta energia, l'atomo ionizzato instabile si rilassa quindi allo stato fondamentale e una serie di elettroni saltano negli orbitali inferiori per riempire i posti vacanti, emettendo così fotoni di fluorescenza nella regione dei raggi X, che corrisponde alla struttura quantistica dell’atomo. L'emissione di fluorescenza, riportata spesso anche come raggi X secondari, rappresenta lo spettro "caratteristico" dell'atomo e può essere facilmente utilizzato per identificare e quantificare gli elementi chimici. Le righe di emissione dei raggi X calcolate per tutti gli elementi della tavola periodica sono uno strumento essenziale per l'interpretazione di tutti gli spettri misurati. Sebbene il processo di fluorescenza a raggi X possa essere attivato ionizzando gli atomi con raggi gamma generati da elementi radioattivi (ad esempio 57Co, 109Cd, 125I o 241Am), da elettroni sufficientemente energetici prodotti al microscopio elettronico o da protoni opportunamente accelerati (PIXE), il metodo di gran lunga più diffuso è l’utilizzo di una sonda che genera dei raggi X prodotti da tubi di laboratorio (raggi X primari) azionati ad alta tensione (tipicamente nell'intervallo 20-60 kV). La gamma di elementi che possono essere analizzati in modo efficiente con strumenti da laboratorio dipende dall'energia dei raggi X primari, e quindi le diverse regioni della tavola periodica possono essere sondate utilizzando tubi a raggi X con anodi diversi, come Cu, Mo, Pd, Rh, Ag, Au o W, ognuno dei quali produce una radiazione caratteristica a diversa energia. Ovviamente l'anodo selezionato deve essere quello di un elemento non contenuto nel campione da analizzare, a causa della sovrapposizione con le linee caratteristiche del tubo. Ad esempio, un anodo di W (59,3 keV) può eccitare le righe K di elementi con numeri atomici tra 15–55 e le linee L degli elementi con numeri atomici tra 65–90. Le linee K degli elementi con numero atomico inferiore al Na (Z = 11) sono facilmente assorbiti anche da pochi centimetri d'aria, e da pochi micrometri della massa del campione e quindi non possono essere analizzati di routine.

clip_image008

Rappresentazione grafica dei livelli di energia degli elettroni dei livelli K, L, M, N in un atomo e transizioni elettroniche Ka, Kb, La, Lb, Lg e Ma corrispondenti alle caratteristiche linee di emissione dei raggi X.

Se il fascio di raggi X incidente è prodotto da un anello di sincrotrone, la tecnica XRF è chiamata SRIXE (emissione di raggi X indotta da radiazione di sincrotrone) e offre alcuni vantaggi rispetto agli stessi esperimenti eseguiti con strumentazione di laboratorio, come una maggiore collimazione del fascio primario, uno sfondo intrinseco molto basso e la possibilità di sintonizzare l'energia della sorgente per eccitare selettivamente specifiche linee di fluorescenza. La configurazione sperimentale per la misurazione degli spettri XRF è composta da una sorgente di raggi X o raggi gamma utilizzata per irradiare il campione, una porta campioni e un sistema per rilevare i raggi X fluorescenti. Un tipico spettro XRF mostra l'intensità dei raggi X di fluorescenza emessi dal campione (comunemente in conteggi/unità di tempo) in funzione dell'energia (in eV), come mostrato di seguito. Dopo un'adeguata calibrazione e correzione per tener conto dell'auto assorbimento della matrice e dell’efficienza del rivelatore, l’integrale delle aree dei picchi di fluorescenza viene convertito in concentrazioni relative o assolute degli elementi chimici analizzati.

clip_image010

Spettro XRF ad alta energia ottenuto con una sorgente radioattiva di 109Cd di 22,1 keV.

Esistono due tipi principali di sistemi di rivelazione: quelli basati su rivelatori a stato solido e quelli basati su analizzatori multicanale in grado di misurare direttamente l'energia dei raggi X fluorescenti (il sistema è chiamato EDS: energy dispersive spettrometria) e quelli basati su un reticolo di diffrazione, tipicamente un analizzatore a cristallo singolo, che misura l'energia dei raggi X fluorescenti indirettamente diffrangendo le diverse lunghezze d'onda del segnale fluorescente collimato a diversi angoli (il sistema è chiamato WDS: spettrometria dispersiva di lunghezza d'onda). Gli spettrometri WDS sono inferiori in velocità di conteggio ma hanno una risoluzione energetica più elevata (tipicamente 5–10 eV) e quindi possono discriminare in modo più efficiente le linee di fluorescenza sovrapposte, mentre gli spettrometri EDS hanno tassi di conteggio più elevati ma una risoluzione energetica sensibilmente inferiore (tipicamente 150–200 eV). Di conseguenza, i sistemi ED-XRF sono spesso utilizzati per una bassa risoluzione e veloce misurazione, come ad esempio per gli apparecchi portatili utilizzati per le misurazioni sul campo, mentre i sistemi WD-XRF vengono utilizzati in laboratorio fornendo misurazioni ad alta risoluzione (ordine dei ppm per campioni ideali). Gli spettrometri EDS sono spesso associati ai microscopi elettronici (SEM, TEM) per fornire misurazioni chimiche complementari oltre all'imaging e alla diffrazione, mentre diversi spettrometri WDS sono associati principalmente a fasci di elettroni finemente focalizzati nei cosiddetti micro-analizzatori a sonda elettronica (EPMA). Quest'ultimo tipo di strumento, detto anche microsonda elettronica, offre comunemente un buon compromesso analitico tra gli elementi ai limiti di rilevamento (nell'intervallo 1000 ppm), piccole aree tastate e flessibilità di misura. La sensibilità potenzialmente elevata per la maggior parte degli elementi e la relativa facilità d'uso rendono l'XRF molto diffuso in archeometria. Gli strumenti di nuova generazione basati su EDS sono disponibili in commercio sia per misure di laboratorio che portatili. Tuttavia, dovrebbe essere chiaro che per misurazioni XRF eseguite in condizioni non ideali (es. campione sotto vuoto, superficie piana analizzata, attenuazione del campione ecc.), dove la misurazione viene eseguita direttamente su un materiale senza un'adeguata campionatura e preparazione, è difficile ottenere dei risultati quantitativi affidabili, a causa della geometria della superficie, delle possibili patine superficiali e alterazioni, della possibile forma irregolare del campione sondato, geometria di rilevamento non ottimale, ecc. Esistono strumenti a micro-raggio che eseguono scansioni bidimensionali su aree limitate della superficie del campione utilizzando un raggio focalizzato, ottenendo così informazioni chimiche per ogni punto e producendo dati utili per la chimica imaging e mappatura. La tecnica è chiamata scansione XRF. Un'estensione dell'XRF, denominata XRF a riflessione totale (TRXRF), consente la misurazione degli elementi nel campione in concentrazioni minime (ultra-tracce - mg/g nei solidi e ng/g nei liquidi) utilizzando gli angoli di incidenza sulla superficie del campione al di sotto dell'angolo critico, tipicamente < 0,1°. In queste condizioni il raggio primario è totalmente riflesso, penetra nel substrato solo per pochi nm e c'è quindi un'interazione ottimale tra il fascio primario e il campione. L'assorbimento e gli effetti della matrice sul segnale di fluorescenza possono essere in gran parte trascurati e la sensibilità della misurazione è notevolmente migliorata. Il TRXRF è stato utilizzato con successo nell'analisi chimica di pigmenti pittorici, vernici superficiali e miniature di manoscritti.

L’XRF rappresenta una metodologia di analisi non distruttiva e non invasiva quando eseguita tramite spettrometro portatile o da laboratorio su punti del campione direttamente selezionati sulla superficie dell’oggetto da indagare allo scopo di identificare gli elementi chimici costituenti la lega nel caso di reperti metallici, o pigmenti, nel caso di stesure pittoriche. In tal modo è possibile fornire dati utili per la caratterizzazione e lo studio della tecnologia di produzione e, conseguentemente, individuare elementi marcatori che possano fornire importanti informazioni per l’autenticazione e la datazione indiretta del reperto indagato. L’indagine XRF nel caso di reperti costituiti da materiali di natura metallica permette l’analisi qualitativa e, in determinate condizioni anche una determinazione quantitativa, degli elementi chimici in lega e di eventuali elementi presenti sulla superficie introdotti a seguito di patinature artificiali o da naturali processi di corrosione in corso o pregressi.

Lo strumento utilizzato per l’analisi condotta in questo studio è un XRF analyzer della Thermo-Niton modello XL3t 980 Goldd+ (vedi immagine seguente) di un laboratorio privato. Grazie alla sua interfaccia lo strumento è collegabile ad un PC e grazie al software in dotazione è possibile analizzare gli spettri generati.

clip_image012

clip_image014

clip_image016

Ritorniamo adesso ai metalli. Si tratta di materiali che riflettono la luce, ottimi conduttori di calore e di elettricità, attaccabili dagli acidi (con relativo sviluppo di idrogeno) e dalle basi e in genere hanno delle buone caratteristiche di resistenza meccanica. I metalli danno il nome ai periodi storici come l’età del bronzo, tardo III millennio a.C. e intero II millennio a.C., e quella del ferro, dalla fine del II millennio a tutto il I millennio a.C.

Alla fine del IV millennio a.C. si verificarono importanti progressi nel campo delle tecnologie tra cui:

- la capacità di estrarre i metalli dai minerali in cui essi si trovano chimicamente combinati;

- la comprensione della possibilità di modificarne le caratteristiche con  particolari     aggiunte, ottenendo leghe di tipo diverso;

- lo sviluppo di tecnologie di lavorazione per ottenere particolari forme e prestazioni meccaniche.

I primi elementi metallici ad essere utilizzati dall’uomo preistorico furono:

Au (oro),

Ag (argento),

Cu (rame),

Sn (stagno),

Fe (ferro),

Pb (piombo),

Hg (mercurio),

Spesso As (arsenico) e Ni (Nichel), furono usati consapevolmente al fine di migliorare le caratteristiche del rame. Le prime attività di estrazione dei metalli dai minerali in cui si trovano combinati si riferiscono al rame. Le prime attività di estrazione del rame, infatti, si ebbero probabilmente intorno al 5000-4000 aC. nel nord-est dell’Iran dove si trovavano giacimenti superficiali. Solo più tardi intorno al 3500 a.C. si scoprì che si poteva ottenere un metallo più facilmente colabile in getti, più duro per lavorazione meccanica, aggiungendo stagno al rame durante il processo di fusione. Nacquero così i bronzi allo stagno iniziando così l’età dell’omonimo periodo storico.

Il ferro invece si ipotizza che sia stato prodotto per la prima volta in modo del tutto casuale in Mesopotamia nel 2700 a.C. Questa scoperta fu più accidentale di quella del rame in quanto il ferro si presentava in forma di massa spugnosa ricca di scorie e impurezze. Una differenza importante fra i due metalli è la grande facilità di lavorazione a freddo del rame, mentre il ferro può essere lavorato solo a caldo, poiché una forte deformazione a freddo produce fratture.

Oltre al bronzo e al ferro anche alcune leghe di zinco sono state usate per secoli: l'ottone è senza dubbio quella più antica, e si ritrovano manufatti in tale lega in Palestina a partire dal 1400 a.C. La vera natura metallica di questo elemento comunque non venne riconosciuta dagli antichi. La fabbricazione dell'ottone era nota ai Romani, con una tecnica che prevedeva il riscaldamento di rame e calamina in un crogiolo. Il calore riduceva gli ossidi di zinco della calamina, e lo zinco libero veniva catturato dal rame, formando l'ottone, che veniva poi colato in stampi o forgiato.

La suddivisione dei metalli in nobili e non da’ luogo a quello che si chiama effetto pila. Quando due metalli vengono in contatto, quello meno nobile si corrode (fungendo da anodo) mentre il metallo più nobile rimarrà intatto.

I materiali e l’ambiente in cui si trovano interagiscono continuamente senza che venga raggiunto un effettivo stato di equilibrio. Tale interazione può produrre fenomeni di degrado la cui entità dipende dalla aggressività dell’ambiente e dalla sua variabilità nel tempo. Mantenere costanti le condizioni ambientali all’interfaccia mteriale-ambiente consente di raggiungere uno stato di stabilità in cui gli effetti di danneggiamento vengono minimizzati. Nel caso dei metalli è l’umidità il principale fattore che influenza la velocità dei processi corrosivi in un ambiente naturale non inquinato. I bronzi (rame e stagno), ma anche altre leghe di rame come gli ottoni (rame e zinco), non si ossidano in mancanza di umidità. Altro fattore di degrado è la temperatura (in presenza di fattori chimici di inquinamento come acido solforico e nitrico, solfato ammonico, composti alogenati (cloruri e fluoruri), i cui effetti sono esaltati dalla presenza di energici ossidanti come l’ozono e influenzati dalla piovosità che può apportare sulla superficie esposta depositi salini (es. aerosol) particolarmente pericolosi.

Nel caso di manufatti collocati in interni, come spesso avviene per la statuaria in bronzo, la loro superficie interagisce anch’essa con l’ambiente modificandosi. Perfino i reperti collocati nei musei possono alterarsi soprattutto in conseguenza delle variazioni del microclima in cui sono collocati.

Il prodotto di alterazione della superficie di un manufatto in bronzo esposto per un periodo di tempo relativamente lungo agli agenti chimici presenti nell’ambiente, sia in esterno, che in interno (anche entro una teca in un museo), è genericamente definito patina. Talvolta la patina è il risultato di un processo di finitura intenzionale, generalmente realizzato con finalità artistiche, in quanto possono essere ottenuti effetti cromatici per esaltare ad esempio la drammaticità dei soggetti rappresentati, o anche per nascondere difetti di colata, o saldature di diverse parti di un monumento fuse separatamente. Altre volte però la patina è realizzata per frode (falsi reperti archeologici in cui con essa si cerca di simulare l’effetto del tempo). La composizione chimica delle patine insieme ad altre caratteristiche chimico-fisiche possono però in alcuni casi renderle in grado di esercitare una azione protettiva nei confronti del manufatto, mentre in altri essere un mero prodotto di corrosione che ne deturpa l’aspetto e ne promuove il degrado.

Già nel I secolo d.C. Plinio nella sua “Naturalis Historia” parla di patine nei bronzi definendo Aerugo Nobilis il prodotto di alterazione superficiale di caratteristiche estetiche apprezzabili, mentre Virus Aerugo era il prodotto dannoso. Questa differenza costituisce ancora oggi la linea di confine che guida gli interventi di conservazione sull’opera d’arte in bronzo; nella Carta del Restauro del 1972 si prescrive infatti di “non rimuovere la patina Nobile, stabile chimicamente” anche se soprattutto negli interventi di pulitura dei bronzi collocati in esterni è assai difficile la sua precisa individuazione. Il rame (Cu) puro è inizialmente rosso salmone (nei bronzi il colore diventa più chiaro per aggiunte più o meno grandi di stagno (Sn)). In assenza di anidride carbonica (CO2) e agenti aggressivi nell’atmosfera, l’ossigeno dell’aria ossida il rame a Cu2O (ossido di rame, cuprite) di colore rosso più cupo. La patina che si forma è una miscela di ossido di rame monovalente (Cu2O) con rame metallico. Lo spessore medio di questo strato in media è di 3,5 μm; il colore risultante è il marrone scuro che spesso caratterizza i bronzi conservati in interni (patina nobile).

In presenza di anidride carbonica (CO2) e umidità (H2O), i prodotti che si formano sulle superfici dei bronzi sono di colore verde-azzurro a causa della formazione di due carbonati basici:

· Malachite (CuCO3Cu(OH)2), in strati lisci e compatti di colore verde scuro simile a uno smalto

· Azzurrite (2CuCO3Cu(OH)2), di colore fra l’azzurro e il blu intenso.

Si tratta di patine continue e stabili, di gradevole aspetto, assai apprezzate per il loro carattere non pericoloso per la salute del manufatto.

In ambienti urbani più inquinati contenenti SOx si formano in prevalenza solfati di colore verdastro costituiti da: Brochantite CuSO4.3Cu(OH)2 o Antlerite CuSO4.2Cu(OH)2. Questi composti si trovano associati allo strato di cuprite (Cu2O) sottostante e sono i principali responsabili del colore verde dei monumenti in bronzo esposti all’aperto. In ambienti fortemente acidi questi solfati si trasformano in solfato di rame idrato (CuSO4.5H2O) composto assai solubile e quindi facilmente dilavabile dalle piogge, favorendo in tal modo il progredire dei fenomeni corrosivi.

I composti di rame a base di cloruri sono i più pericolosi a causa dell’elevata solubilità dei cloruri e notevole conducibilità ionica delle soluzioni. I prodotti di corrosione clorurati si trovano nei manufatti rimasti immersi in acqua di mare, interrati in terreni ad alto contenuto salino, contaminati da sostanze organiche in decomposizione o in ambienti vicini al mare in cui il cloruro di sodio (NaCl) è portato dai venti come aerosol. I principali cloruri di sono l’Atacamite CuCl2.3Cu(OH)2 (cristalli ortorombici di colore da smeraldo a verde scuro) e la Paratacamite (Cu,Zn)Cl2.3Cu(OH)2 (cristalli esagonali pulverulenti di colore verde mela).

La paratacamite e la atacamite si ottengono per ossidazione e idratazione della Nantokite, un cloruro rameoso (CuCl), di colore grigio pallido e dall’aspetto ceroso e deliquescente, la cui presenza si riscontra frammista a strati di cuprite (ossido di rame) e di atacamite. La reazione di formazione della paratacamite è accompagnata dalla ossidazione del Cu a cuprite (Cu2O) e a idrossido di rame solubile:

2CuCl + 4Cu + ½ O2 + 3H2O = Cu2(OH)3 Cl + Cu2O

I prodotti di corrosione si manifestano in forma di efflorescenze di aspetto pulverulento che si accompagnano alla distruzione delle patine eventualmente presenti. Il fenomeno, pericolosissimo, è anche chiamato “cancro del bronzo”. Per una efficace conservazione dei bronzi la Nantokite (CuCl) deve essere sempre eliminata. Di seguito un esempio di patina di malachite e cuprite e sulla destra del cosiddetto cancro del bronzo.

clip_image018clip_image020

Qui invece un manufatto di rame romano con chiara presenza in superficie di cuprite e malachite.

clip_image021

Il rapporto tra il volume del rame originario e l’aumento di volume prodotto dai fenomeni di corrosione è espresso dal cosiddetto volume molare relativo (VMR).  Il VMR indica l’accrescimento volumetrico della patina stessa.  Posto 1 il volume iniziale del rame, la cuprite presenta un VMR di 1,67, molto basso (rispetto ad altre patine). Questo significa che la cuprite non altera in modo significativo la superficie dell'oggetto e ne preserva pressoché inalterati i rilievi ed i dettagli.

 

image

 

La corrosione può influenzare significativamente le misure del XRF. Da studi del settore emerge che in generale, è possibile vedere in media un depauperamento del contenuto di rame del 35% per oggetti in lega di stagno corrose. Per oggetti con corrosione in superficie e con alto contenuto di stagno e zinco, il depauperamento medio del rame è di circa il 18%, mentre lo zinco non mostra variazioni significative e lo stagno invece mostra un aumento maggiore del 50%. Per gli oggetti corrosi con alto contenuto di zinco è presente una riduzione dello zinco del 9%. Questo dimostra che la decuprificazione e la dezincificazione sono i processi principali della corrosione. Il depauperamento di rame è stato osservato essere il cambiamento più rilevante dei comuni oggetti di bronzo mentre per gli ottoni si è visto che il processo di corrosione principale è la lisciviazione dello zinco. Questi esperimenti dimostrano chiaramente che bisogna fare molta attenzione alla superficie dell’oggetto che stiamo analizzando con l’XRF per capire il grado di corrosione della sua superficie.

I tre campioni selezionati per l’analisi XRF sia dall’analisi ad occhio nudo che da osservazione con stereo microscopio appaiano essere tutti formati principalmente da Cu e quindi appartenenti alla classe dei bronzi. Inoltre, la loro superficie non sembra presentare alterazioni da corrosione.

Sebbene alcuni esempi isolati di leghe di rame preistoriche contengano diversi per cento di zinco, in particolare da Cipro, solo nel primo millennio aC iniziò la produzione deliberata di ottone, probabilmente in Asia Minore. Dal VII secolo aC i Greci iniziarono a parlare di ottone, ma sempre come un metallo costoso ed esotico non prodotto in Grecia, e questo è confermato dall'assenza di zinco nella grande maggioranza dei bronzi greci. Allo stesso modo, dei tanti bronzi etruschi analizzati, solo due rispettivamente del V e III secolo a.C sono risultati essere di ottone con circa l'11% di zinco e meno del 3% di stagno. Nel I secolo aC i romani iniziarono ad utilizzare il processo di cementazione per la produzione dell’ottone. Dapprima molto probabilmente venne utilizzato per la monetazione, ma poi diventò rapidamente popolare in altri campi, in particolare nella lavorazione dei metalli decorativi dove andò a sostituire ampiamente il bronzo. Durante il II e il III secolo d.C. il contenuto di zinco delle monete diminuì, e gli ottoni con un alto contenuto di zinco non vennero più utilizzati, sebbene l'ottone continuasse ad essere popolare rappresentando circa il 30% delle leghe di rame romane. Dal III secolo in poi una lega di rame con una piccola percentuale di piombo, zinco e stagno (oggi chiamata "bronzo duro al piombo" o “gun metal” in lingua inglese) iniziò ad essere utilizzata regolarmente e da allora è rimasto tale. Le origini di entrambi i termini “Ottone” e “Bronzo” non sono note, ma sembra che in epoca medievale tutte le leghe di rame venissero chiamate bronzi, e solo dal Rinascimento il termine bronzo fu usato in Italia per denotare leghe di rame legate con stagno. Tuttavia, i termini sono stati utilizzati indiscriminatamente in Inghilterra fino al XIX secolo. Ai fini di questo post, per ottone si intende una lega di rame a cui è stato aggiunto deliberatamente dello zinco mentre per bronzo una lega di rame in cui è stato introdotto dello stagno.

clip_image025

Considerando i valori di Cu, Zn e Sn dei tre campioni sotto analisi possiamo subito vedere che la statua egizia falsa non è di bronzo ma di ottone su cui poi sono state create le tipiche patine verdi in modo artificiale. Per l’oggetto invece riportato come ‘flauto’ la sua composizione lo colloca nella regione individuata come bronzo duro visto il suo contenuto medio di Zn e praticamente la quasi assenza di Sn. La fibula acquistata su ebay invece risulta essere un oggetto essenzialmente di rame visto il suo basso contenuto di Zn e di Sn.

image

 

Per poter effettuare un confronto tra gli oggetti in analisi e oggetti simili autentici, si è fatto ricorso ad articoli pubblicati su riviste specializzate dove l’XRF è stata utilizzato per oggetti metallici che vanno dalla preistoria fino al periodo romano (circa 300 dopo Cristo). In giallo sono stati evidenziati i 3 oggetti sotto analisi. Oltre alla statua egizia è presente un’altra statua che rappresenta Minerva dichiaratamente falsa. Entrambe mostrano un elevato contenuto di Cu seguito dallo Zn e una piccola quantità di piombo. Nella tabella seguente il periodo e l’età riportata è quella presente nell’articolo da cui sono stati raccolti i dati XRF. La selezione di campioni di leghe di Cu da un'ampia gamma di tipologie di manufatti e da una vasta gamma di reperti archeologici da diverse aree geografiche fornisce un set di dati il più rappresentativo possibile. Ciò consente la caratterizzazione delle leghe di Cu esenti da distorsioni (bias) dovute alla considerazione di un solo sito o di uno solo tipo di manufatto.

image

Utilizzando i dati raccolti è possibile vedere come si è evoluta la composizione del bronzo in funzione del periodo storico. In tutte le età precedenti a quella romana il bronzo era ottenuto da una lega di Cu e Sn. In epoca romana si aggiunse anche del piombo. Al contrario collezionando i dati dell’ottone si può vedere come la sua composizione dall’età del ferro fino a quella romana è rimasto praticamente lo stesso.

clip_image031

clip_image033

Il piombo (Pb) veniva aggiunto quando la lega metallica doveva essere utilizzata nella fusione di oggetti grandi e complessi come le statue. Nei casi in cui variano contemporaneamente i tre elementi di lega (es. Zn, Sn e Pb), un grafico bidimensionale come gli ultimi due precedenti non va più bene. Questo problema viene superato in una certa misura mediante l'uso di diagrammi ternari. Questi sono in grado di indicare contemporaneamente la differenza tra ottoni e bronzi e tra leghe piombate e senza piombo.

La ricerca effettuata sulle leghe romane di Cu ha permesso di svelare le relazioni tra scelta della lega e i vincoli tecnologici. Questi possono essere visti chiaramente nei livelli di Pb presente nelle leghe romane. A differenza di Zn e Sn, il Pb non è presente nelle leghe di Cu in soluzione solida. Esso forma delle goccioline discrete in tutto il metallo. Questo rende le leghe di piombo più soggette a rompersi quando martellate e forgiate, e così le lamiere e i fili quasi mai hanno più dell'1% di Pb. Il piombo, tuttavia, abbassa il punto di fusione del Cu e produce un fuso di una lega più fluido. Questo lo rende un'utile aggiunta alle leghe che devono essere utilizzati nella fabbricazione di grandi o complesse fusioni, come le statue.

clip_image035

clip_image037

Diversi ricercatori hanno dimostrato che esistevano dei collegamenti complessi tra la forma dei manufatti e le leghe utilizzate per la loro fabbricazione (es. Bayley & Macellaio, 1981; Craddock, 1975, 1996). Uno degli esempi più chiari di questo fenomeno in epoca romana è il gran numero di vasi di bronzo prodotti in Campania e altrove (den Boesterd, 1956). L’analisi di un gran numero di questi vasi ha dimostrato che la maggior parte di loro erano di bronzo piombato. Anche l’archeologo inglese Craddock ha dimostrato che un'ampia gamma di manufatti in leghe di Cu (ad es. statue e strumenti musicali) prodotti nel periodo tardo repubblicano e primo imperiale nell'area mediterranea è stata realizzata con una lega simile al bronzo piombato.

Per quanto riguarda il cambiamento cronologico nelle leghe di Cu di epoca romana sono stati effettuati pochi studi e i risultati non sono molto accurati. Nel grafico di seguito viene riportato il tipo di leghe utilizzate per gli oggetti metallici provenienti da scavi in Gran Bretagna lungo il periodo romano (i secoli sono quelli dopo Cristo). Molti dei tipi di leghe riportate sono presenti a livelli relativamente bassi per tutto il periodo romano (es. ottone piombato e piombo ramato) o mostrano variazioni relativamente piccole nel tempo (es. bronzo duro e bronzo). I cambiamenti significativi nei tipi di lega sono quelli legati al calo dell’ottone senza piombo e il crescente uso del bronzo piombato e bronzo duro al piombo. Nel I secolo d.C. l’ottone rappresentava il 37% delle leghe utilizzate mentre il bronzo al piombo e il bronzo duro al piombo insieme rappresentavano il 27%. Nel IV secolo d.C., l'ottone passa al 4% mentre il bronzo al piombo e il bronzo duro al piombo aumentano al 64%. I cambiamenti cronologici nelle composizioni delle leghe romane analizzate devono, tuttavia, essere considerate con cautela trattandosi di campioni da diversi siti in momenti diversi; i cambiamenti delle leghe analizzate potrebbe riflettere piuttosto i cambiamenti nella documentazione archeologica rispetto ai cambiamenti nell'antica metallurgia del Cu. Inoltre, i diversi tipi di manufatti prodotti e i metodi utilizzati nella fabbricazione potrebbe essere cambiato nel tempo.

clip_image039

Ritorniamo adesso ai nostri tre oggetti. Come anticipato, la statua è chiaramente un falso e quindi ci aspettiamo che il suo spettro sia significativamente diverso dagli oggetti (in particolare proprio una statua) veri. Nel database creato con i dati presi da altri autori e pubblicati su riviste scientifiche specialistiche, abbiamo una statua di Minerva autentica, una statua di Minerva falsa e una statua romana di cui non è riportata l’età e il personaggio che essa rappresenta. Riportando i dati su di un grafico ternario Sn-Zn-Pb si può vedere immediatamente come le 2 statue false si posizionano nel vertice in basso a destra del triangolo che indica un alto contenuto di Zn, un bassissimo contenuto di Sn e un basso contenuto di Pb (in pratica si tratta di ottone). Al contrario le due statue vere si posizionano a metà del lato destro del triangolo che indica un basso contenuto di Zn e un alto contenuto di Pb e Sn (quindi oggetti di bronzo piombato). Questo è un ottimo esempio di come un’analisi XRF possa aiutarci nella individuazione di un falso.

clip_image041

Passiamo adesso al secondo oggetto e cioè la fibula comprata all’asta su ebay dall’Inghilterra. Qui di seguito un esempio di fibule ad arco. Oltre a questa classe esistevano le fibule ad anello e le fibule a piastre.

clip_image043

Una fibula altro non è che un'antica spilla. Tecnicamente il termine latino fibulae si riferisce alle spille romane; tuttavia, il termine è ampiamente utilizzato per riferirsi a spille dell'intero mondo antico e altomedievale. Le fibule erano usate per allacciare i vestiti, i mantelli militari o, in alcuni casi, semplicemente come oggetti decorativi. Furono usate secoli prima della fondazione di Roma e per secoli dopo la sua caduta da greci, persiani, frigi, celti, tedeschi, slavi e molti altri popoli oltre ai romani. Erano usate sia dai soldati che dai civili; da uomini, donne e bambini. Erano usate su abiti, camicie e abiti, nonché sui mantelli. Non venivano utilizzate invece sulla toga, che era semplicemente piegata e drappeggiata. Dopo questa breve descrizione delle fibule ritorniamo alla fibula acquistata su ebay e che abbiamo analizzata con uno strumento XRF.

Ripartendo dalla tabella dove abbiamo raccolto tutti i dati XRF riportata precedentemente salta subito all’occhio il suo basso contenuto di Stagno e una percentuale di Zn al di sotto del 5%. Nel grafico Zn-Sn infatti questo oggetto si posiziona nella zona degli oggetti in rame. Ma quanto erano comuni nel passato le fibule di rame? Non molto come si può osservare dalla tabella sottostante che nel periodo tra il 500 aC e il 100 d.C. riporta solo un 6% di fibule in rame contro un 46% di ottone e circa il 48% di bronzo/bronzo duro.

imageimage

image

 

Anche se i risultati non confermano in modo schiacciante la falsità dell’oggetto sotto studio, c’è qualche lecito sospetto. Come ulteriore approfondimento e’ stata analizzata la percentuale di elementi presenti in tutte le fibule della tabella riportata sopra. La tecnica delle componenti principali è una tecnica statistica utilizzata per ridurre la dimensione del campione andando a trovare le componenti che spiegano la maggior parte della variabilità dei dati. Le nuove variabili (le componenti principali) altro non sono che la sovrapposizione con appositi pesi di tutte le variabili x del nostro database. Per il caso che stiamo studiano possiamo vedere come usando le prime 3 componenti principali riusciamo a spiegare circa l’80% della variabilita’ del nostro campione. Uno dei grossi vantaggi delle componenti principali è quello di poter osservare i dati nel piano o nello spazio cosa impossibile nel caso in cui consideriamo tutti i predittori (le variabili x). Nel piano delle prime due componenti principali notiamo come i dati si dispongono su due cluster che formano una V con vertice in (0,0). La cosa interessante è che il ramo di sinistra della V e’ legato alle fibule create mediamente dopo la nascita di Cristo mentre quelle del ramo di destra prima della venuta di cristo. Sembra indicare un passaggio graduale dal bronzo all’ottone, conosciuto nel passato come oricalco la cui origine viene fatta risalire nel primo secolo prima di Cristo e che tenderà a scomparire nel quarto secolo d.C. (vedi grafico precedente). Guardando i dati come si distribuiscono nel piano della prima e terza componente principale si nota subito un outlier evidenziato con un asterisco verde che guarda caso è proprio la fibula acquistata su ebay. Essa si differenzia dalle rimanenti fibule originarie (clusterizzate intorno all’origine del piano) per l’elevato contenuto di Ag (1%). Questo ci porta a pensare che la fibula sia un falso anche se la confidenza non è molto alta in quanto ci sono delle analisi XRF condotte su delle fibule di epoca romana ritrovate in Kossovo in Polonia che mostrano dei contenuti di Ag molto elevati anche se è anche presente un quantitativo di Sn e Pb considerevole. Cosa che non è vero nel nostro caso. Servirebbero ulteriori analisi, come per esempio quelle delle patine per poter dire con certezza che si tratti di un falso.

 clip_image055clip_image057

Fibule ritrovate in Kossovo (Polonia) di epoca romana.clip_image059

Adesso è la volta dell’oggetto a cui è stato assegnato l’identificativo “flauto” ma il cui scopo è del tutto sconosciuto (vedi prima immagine qui di seguito). Si tratta di un oggetto proveniente da una collezione privata e secondo l’acquirente proviene da uno scavo nel territorio della Marsica (Abruzzo). Potrebbe trattarsi di una parte di una tibiae o di una tuba, entrambe strumenti musicali utilizzate dai romani (nella seconda immagine qui di seguito parte di tibiae proveniente dal Museo degli strumenti musicali di Roma)

La superficie dell’oggetto non mostra segni di corrosione significativi. La patina sembra essere quella tipica degli oggetti in bronzo. L’oggetto all’interno è cavo e rassomiglia ad un tubo. Il lato sinistro ha un diametro leggermente maggiore del lato destro. A circa un terzo a partire dal lato sinistra si apre un foro con un leggero incavo.

image

image

 

Lo spettro XRF di questo oggetto sembra indicare un oggetto di bronzo duro (basso contenuto di Sn e presenza di Zn al di sotto della soglia per essere classificato come ottone) con un alto contenuto di Fe.

Dall’analisi di clustering degli elementi dei diversi oggetti riportati nella tabella ad inizio post si vede chiaramente come questo oggetto sia molto simile agli oggetti identificati dalle righe 45, 46 e 47 che riportano i risultati di analisi XRF eseguita si di una statua di bronzo presso il museo di Salonicco la cui origine non è nota. L’statua mostra un alto contenuto di Cu, stagno e in alcuni punti piombo confermando che si tratta di bronzo. Comunque, va notato che su molti punti della superficie della stata risulta un’elevata concentrazione di Fe (da 1% fino a circa 30%). Gli autori attribuiscono la presenza di tale elemento alla contaminazione di un oggetto di ferro posto nello stesso ambiente di sepoltura. In alcuni punti la statua mostra un basso contenuto di rame (intorno al 50%) a causa dei processi di corrosione. Diversamente da questa statua l’oggetto analizzato risultato simile ad essa per il basso contenuto di Cu e l’alto contenuto di Fe mostra la presenza di zinco e un basso contenuto di stagno che lo fa rientrare nella categoria del bronzo duro. Elementi come il ferro (Fe) possono essere il risultato del processo di fusione, di aggiunte intenzionali, parte di uno strato di corrosione o contaminazione da oggetti di ferro durante la sepoltura.

clip_image065

Come già riportato per la statua del museo di Salonicco, il basso contenuto di Cu potrebbe essere dovuto a qualche fenomeno di corrosione anche se la superficie pur presentando il tipico valore verde della malachite non sembra mostrare un notevole degrado come invece si può notare per la tuba del museo romano di strumenti musicali. Per poter definitivamente stabilire l’autenticità del pezzo servirebbe uno studio delle patine presenti sull’oggetto con analisi tipo FTIR e u-Raman.

clip_image067image

 

clip_image071

domenica 13 marzo 2022

Studio archeometrico di alcune terrecotte dipinte provenienti dal santuario di Ercole di Alba Fucens

In questo post riporto un'interessante studio archeometrico relativo al sito archeologico di Alba Fucens (Abruzzo) nato dalla collaborazione dell'Universita la Sapienza di Roma e la Soprintendenza alle belle arti della Marsica e a cui ha partecipato mia figlia Gilda. Lo pubblico su questo blog perche' si tratta comunque di una lavoro scientifico di rilievo e in un ambito non molto conosciuto dal grande pubblico come quello dell'archeometria o anche Science for archeology. Di seguito un breve riassunto dell'articolo e poi il link alla rivista Minerals su cui e' stato pubblicato. Nel periodo che va dal VII al I secolo aC, le superfici esterne degli edifici civili e sacri in Italia erano prevalentemente decorati con terrecotte. Lo scopo di questo studio archeometrico è stato quello di determinare le caratteristiche e il livello tecnologico raggiunto dagli antichi produttori di ceramiche dipinte provenienti dal santuario di Ercole nel sito archeologico di Alba Fucens (Abruzzo, Italia Centrale). I materiali studiati sono di buona manifattura, e probabilmente provengono da un tempio etrusco-italico, costruito subito dopo l'insediamento della colonia. Per questo lavoro è stato utilizzato un approccio multi-analitico comprendente la diffrazione a raggi X (XRPD), μ-Raman e fluorescenza a raggi (XRF) per determinare la composizione mineralogica della terracotta e per identificare i pigmenti con cui queste erano decorate. Si e’ stabilito che le terrecotte studiate sono state decorate con pigmenti pregiati come il blu egizio e una tavolozza di colori comuni nel periodo romano dal terzo  al primo secolo aC. Il pigmento rosso per esempio e’ stato ottenuto utilizzando ematite, e la sua tonalità modificata attraverso l’uso del bianco lime e forse di bianco piombo. Per il pigmento nero, i risultati analitici purtroppo non hanno consentito di determinare con certezza la sua origine (animale o vegetale). Nonostante i pochi colori utilizzati, si è  notato l’uso di diverse sfumature per ognuno dei colori utilizzatri. Nel caso del blu egizio, ad esempio, si e’ visto come l'artista sia passato da una tonalità brillante ad una opaca, modulando il colore con il bianco (piombo bianco o calcite) o nero (ossido di manganese). La composizione mineralogica della ceramica ha permesso di stimare una temperatura di cottura inferiore agli 800 °C a causa della presenza in essa di illite-calcite e assenza di fasi neoformative come gehlenite e diopside. Infine, la presenza di depositi alluvionali e lacustri affioranti nell'area del Fucino suggerisce una provenienza locale delle materie prime utilizzati. Le analisi μ-Raman e XRF  sembrano indicare la presenza di uno strato bianco di calcite e piombo utilizzato come primer steso sulle terrecotte prima dell'applicazione dei pigmenti, anche se per confermarlo e’ necessario eseguire un’analisi stratigrafica dello strato pittorico della terracotta. I risultati preliminari di questo studio fanno parte di un progetto più ampio e verranno convalidati e ulteriormente integrati in futuro.


Campioni analizzati


Link: 
https://www.mdpi.com/2075-163X/12/3/346


sabato 11 dicembre 2021

Le reti neurali convoluzionali.

Le reti neuronali convoluzionali (CNN) sono un particolare tipo di reti neurali artificali (ANN) utilizzate per lo piu’ per la classificazione delle immagini. Le CNNs si ispirano al principio biologico della riproduzione di una struttura capace di identificare dei patterns in diversi luoghi descritta nell’articolo dei premi Nobel Hubel e Wiesel pubblicato nel 1962 e dal titolo: “Receptive fields, binocular interaction and functional architecture in the cat’s visual cortex”. Queste reti oltre alla classificazione delle immagini hanno mostrato buoni risultati anche con le analisi delle serie temporali e il riconoscimento vocale. Esse sono diventate molto popolari dopo che nel 2012 hanno vinto la competizione  Imagenet Large Scale Visual Recognition Challenge (ILSVRC)  con un margine addirittura del 10%.  Alex Krizhevsky e Ilya Sutskever, sotto la guida di Geoffrey Hinton, proposero l’architettura CNN che presto divento’ famosa con il nome di “AlexNet”. A quel tempo, Geoffrey Hinton era gia’ conosciuto per i suoi contributi scientifici nel campo delle reti neurali artificiali. Egli era stato uno dei contributori dell’algoritmo di Backpropagation nel 1986, e delle macchine di Boltzmann nel 1983. Queste sono alcune delle ragioni per cui Geoffrey Hinton e’ stato riconosciuto come uno dei padri del Deep Learning. Una CNN tipica e’ composta da una serie di strati convoluzionali, che agiscono come estrattori di features, seguiti da un classificatore, in genere un Multilayer Perceptron (MLP), anche conosciuto come una rete a strati completamente connessi (FC) come mostrato in figura 1.

image_thumb1

Figura 1. Gli strati di una CNN

 

Il primo strato riceve in input un’immagine rappresentata nei 3 canali colore RGB. Questo significa avere un array con una certo numero di pixels come per esempio 100x100 ripetuto 3 volte, uno per ogni canale colore. Si tratta quindi di un oggetto con dimensione 100x100x3 che prende il nome di tensore. Infatti l’immagine 100x100 e’ una matrice bidimensionale mentre l’aggiunta dei 3 canali rende questo oggetto non piu’ bidimensionale ma tridimensionale come si puo’ vedere nella prima parte della figura 1. Il primo strato esegue le convoluzione dell’immagine in ingresso con diversi kernel, generando una serie di feature maps del primo strato. Ogni feature map determina l’intensita’ e la localizzazione di una specifica feature. La feature map estratta dallo strato convoluzionale puo’ essere sottomessa ad un’operazione di downsampling conosciuta come Pooling. Questa operazione e’ opzionale cosi e’ possible che essa non segua tutti gli strati convoluzionali. Il risultato di uno strato di Pooling e’ un altro insieme di feature maps ma con ridotta risoluzione. Il successivo strato convoluzionale usa la feature map dello strato precedente per eseguire piu’ convoluzioni e generare nuove feature maps. Le feature maps dell’ultimo strato diventano l’input del classificatore e cioe’ degli strati FC full connected. L’operazione di convoluzione che viene indicata con un asterisco ∗, puo’ essere descritta con la seguente formula:

image7_thumb

essendo x un tipo di input, t un tempo e k il kernel applicato. Il kernel in pratica e’ una matrice di pesi ed esso viene applicato ad una sotto matrice dell’immagine conosciuta come receptive field in biologia (una regione sensoriale che stimola un neurone). La moltiplicazione tra il receptive field e il kernel consiste nella moltiplicazione di ogni pixel e i rispettivi elementi del kernel. Dopo le moltiplicazioni, i risultati vengono aggiunti a formare un elemento della feature map definita dall’equazione con 3 canali RGB:

image14_thumb

 

Le seguenti immagini mostrano l’operazione di convoluzione per un’immagine in grigio 5x5 e un kernel 3x3. Il receptive field e’ stato evidenziato in rosso. L’output della convoluzione e’ una feature map 3x3. Occhio. Le 2 matrici kernel e Recept non vengono moltiplicate con la regola delle matrici ma semplicemente moltiplicando un elemento alla volta. Ogni cella della feature map viene costruita facendo la somma di tutti gli elementi della matrice ottenuta con la moltiplicazione e indicata con sum nella figura.

image18_thumb

image21_thumb

image24_thumb

Figure 2 — Alcuni steps della convoluzione di un’immagine 5x5 con un kernel 3x3.

Le immagini utilizzate in figura 2 possono essere viste nella figura 3. I valori del kernel e della feature map sono stati riscalati tra 0 e 255 per essere rappresentati in una scala di grigi. I pixels bianchi corrispondono a valori prossimi a 255 mentre quelli neri a valori prossimi allo 0.

clip_image014_thumb1

Figure 3 — Convoluzione di una matrice 5x5 con un kernel 3x3

 

Poiche’ la convoluzione della figura 2 usa un kernel 3x3 ci sono 9 possibili receptive fields in input ognuno con una dimensione 3x3. Notare che quando la Receptive field contiene tutti pixels chiari la somma delle celle della matrice ottenuta agendo con il kernel e’ scura e viceversa. Nella figura 2 infatti quando la receptive field ha tutti valori maggiori di 200 la cella corrispondente nella feature map ha come valore 44. Questo e’ dovuto al fatto che il kernel utilizzato evidenzia i contorni passando da un colore brillante sulla sinistra ad un colore scuro sulla destra della matrice. Vediamo adesso cosa accade se applichiamo lo stesso kernel ad un immagine che ha una transizione da una regione scura a sinistra ad una chiara sulla destra. In Figura 4, il receptive field esibisce la transizione dai pixel scuri a quelli chiari e da quelli chiari a quelli scuri. Notare come il kernel identifica gli estremi della stripe segnalandoli con una fascia chiara a sinistra e una scura a destra.

clip_image016_thumb

Figure 4 — Convoluzione di un immagine 17x17 con un kernel per evidenziare gli estremi

 

Passiamo adesso ad un esempio pratico. Qui di seguito la foto a colori di un aereo su cui viene applicato un kernel 3x3 estratto da una piccola regione dell’immagine stessa.

              image_thumb11image_thumb12 

image_thumb13  Figure 5 — Esempi di convoluzione .

 

Nel primo esempio, il kernel comprende la regione della foto con il numero 6 in bianco. L’immagine in grigio sulla destra e’ il risultato della convoluzione tra il kernel e l’immagine stessa. I pixels piu’ scuri rappresentano I valori piu’ bassi ottenuti dall’operazione del kernel sulla receprive field mentre quelli piu’ chiari rappresentano I valori piu’ alti. Nel secondo esempio il kernel e’ costituito da una ruota dell’aereo mentre nel terzo viene riportato il colore giallo dell’aereo. Notare che I pixels piu’ brillanti sono quelli che corrispondono alla parte dell’immagine contenuta nel kernel: numero 6 nel primo caso, la ruota nel secondo e le pareti di colore giallo dell’aereo nel terzo. Osserviamo anche che se la seconda ruota non e’ contenuta nel kernel anch’essa risulta brillante essendo molto simile alla prima ruota. Altra caratteristica importante di una CNN e’ il passo (stride) tra ogni receptive field. Tutti gli esempi mostrati fino ad adesso avevano passo 1. L’adozione di un passo cosi piccolo risulta in una sovrapposizione abbastanza spinta tra i receptive field. Il risultato e’ che molta informazione viene ripetuta tra i receptive field adiacenti come mostrato in figura 6.

 

image36_thumb1

Figure 6 – Receptive field con passo (stride) 1.

In caso di  kernel con dimensioni 3x3, l’utilizzo di un passo (stride) 2 risulta in una colonna o riga di sovrapposizione con il receptive field adiacente. Aumentando lo stride si riduce il costo computazionale del PC. Passando da uno stride di 1 a 2 abbiamo una riduzione del costo di un fattore 4. Questo accade in quanto lo stride 2 impatta la distanza tra i receptive field in entrambe le dimensioni. Allo stesso modo se triplichiamo il passo il costo computazionale si ridurra’ di un fattore 9. Il costo di computazione si riduce in quanto aumentando il passo si riduce il numero di receptive field estratti dall’input e di conseguenza si riduce la dimensione dell’output. La figura 7 mostra 4 esempi di convoluzione con passi (strides) di 2, 4, 8, e 16. La dimensione del kernel e’ di 70x70. Notare che aumentando il passo di un fattore 2 il tempo di esecuzione si riduce di circa un fattore 4.

image_thumb15image_thumb16image_thumb17

Figura 7 — Esempi di stride 2, 4, 8, e 16. La dimensione del kernel e’ di 70x70.

Grafico del tempo di elaborazione verso lo stride

Osserviamo come aumentando il passo riduciamo il tempo di calcolo e il numero di pixels dell’immagine nonostante sia ancora possibile individuare i valori piu’ alti della convoluzione grazie ai pixel piu’ brillanti in alcune zone dell’aereo. Adesso andiamo a vedere come lavora un singolo strato convolutivo e cosa succede quando ne mettiamo insieme un certo numero. La figura 8 mostra cosa succede all’interno dello strato convoluzionale che consiste di 3 stadi: convoluzione, attivazione non lineare, e pooling. L’operazione di convoluzione l’abbiamo discussa nella prima parte. Adesso vediamo le altre 2 operazioni.

 

clip_image032_thumb1

Figura 8 — I 3 stadi di uno strato convolutivo.

 

L’attivazione non lineare e’ conosciuta anche come lo stadio del rivelatore. Qui il risultato della convoluzione e il bias vengono sottomessi ad una funzione di attivazione non lineare come la funzione ReLU. Quest’ ultima non cambia la dimensione della feature map ma modula solo i valori contenuti in essa. Ma che cosa e’ un’attivazione non lineare? Prima di tutto ricordiamo che la non linearita’ in una rete neurale ANN la rende migliore in termini di approssimazione  di funzioni. Una delle funzioni di attivazione non lineare piu’ utilizzata e’ la funzione ReLU, che sta per Rectified Linear Unit. Questa funzione e’ data da:

image48_thumb 

Questa funzione quando applicata con un bias, da’ origine a grafici com quelli illustrati in Figura 9.

 

image51_thumb  Figura 9 — Grafico della funzione ReLU.

 

La figura 10 mostra come la ReLU modula il risultato della convoluzione. L’immagine e il kernel sono gli stessi della figura 2 dove la convolution output e’ quella che prima abbiamo chiamata la feature map.

clip_image038_thumb

Figura 10 — La funzione ReLU applicata all’aoutput della convoluzione.

 

L’immagine equivalente in scala di grigio prima e dopo l’applicazione della funzione ReLU e’ riportata in Figura 11. Notare come alcuni dei valori intermedi sono stati anneriti facendo risaltare ancora di piu’ i 3 pixels con valore diverso da zero.

image_thumb22  Figura 11 — Rappresentazione visuale della funzione ReLU applicata all’output della convoluzione.

 

Nella figura 12, si puo’ vedere come lavora il bias nella funzione ReLU. Il bias si comporta come una soglia che determina cosa mostrare e cosa no.

clip_image042_thumbclip_image044_thumb

Figura 12 — Diversi valori di bias applicati allo stesso risultato della convoluzione dell’immagine contenente le ruote dell’aereo.

Il comportamento a soglia della figura 12 rassomiglia ai neuroni biologici, che non si attivano quado ricevono uno stimolo al di sotto di una certa soglia. Se lo stimolo supera la soglia, il neurone si accende e la frequenza di accensione cresce con l’aumento dello stimolo. In Figura 12, quando il bias e’ 500, esso contribuisce all’attivita’ dei neuroni artificiali. Ma se definiamo il bias a -1000, allora il neurone artificiale si accende solo son stimoli piu’ forti. Per concludere la funzione ReLU lavora come un neurone del nostro cervello. Questo spiega perche’ questa fase e’ chiamata la fase di rivelazione. La funzione ReLU e’ quella che rivela la presenza di una feature estratta dal kernel. Di conseguenza c’e’ un singolo bias per ogni kernel, perche’ ogni feature richiede una differente soglia di attivazione. Alla fine, arriva l’operazione di pooling. Si tratta di un’operazione di sottocampionamento eseguita su ogni feature map. Essa estrae i receptive fields dalla feature map e li rimpiazza con un singolo valore. Questo valore puo’ essere ottenuto attraverso diversi criteri di aggregazione, come il valore massimo, media o media pesata in base alla distanza dal centro del receptive field. Oltre ai criteri di aggregazione ci sono altri 2 ipeparametri nell’operazione di pooling: la dimensione del receptive field e il passo. In modo simile allo stride, l’operazione di pooling genera meno dati di quelli processati dalla convoluzione. Una differenza e’ che invece di saltare dei dati, l’operazione di pooling cerca di riassumere il receptive field in un singolo valore. Un’altra differenza e’ che il passo viene applicato prima della convoluzione, mentre il pooling viene applicato sui risultati della convoluzione, riducendo il volume dei dati al prossimo strato. Inoltre il receptive field dell’operazione di pooling e’ bidimensionale in quanto esso viene applicato ad ogni feature della mappa individualmente mentre il receptive field della convoluzione e’ tri-dimensionale. Un effetto desiderato collaterale del pooling e’ che aumenta l’invarianza delle transazioni degli inputs. Questo effetto a’ amplificato dal numero di strati convoluzionali seguiti dagli strati di pooling. La figura 13 mostra la propagazione dei valori attraverso due strati di pooling con size 3x3 e stride di 2. Per ogni regione di attivazione colorata in blu l’input feature map influenza la regione colorata in blu in uscita dal pooling 1. Allo stesso modo , le attivazioni nella regione coperta di blu in uscita del pooling 1 influenzano la regione ricoperta di blu in uscita del pooling 2. La stessa relazione e’ valida tra le regioni di colore verde.

image59_thumb1

Figura 13–Propagazione di valori attraverso gli strati di pooling con dimensione 3x3 e stride 2. In questo esempio, gli strati convoluzionali sono stati omessi per chiarezza.

 

Considerando che il pooling in Figure 13 e’ il max pooling, indipendentemente da dove capita il valore piu’ alto nella feature map blu in input, esso verra’ propagato nella matrice blu in uscita. Questa e’ la ragione per cui gli strati di pooling amplificano l’invarianza traslazionale (piccole variazioni in ingresso non cambiano i valori in uscita). La figura 14 mostra l’effetto delle diverse combinazioni di strides nella convoluzione, bias nella funzione ReLU,  dimensione del pooling e i passi (strides) di pooling. Sulla sinistra ci sono 3 esempi di strides: 2, 9, e 16. Per ogni opzione di stride ci sono 3 esempi di bias: 500, -250, e -1000. Per ogni bias, ci sono 3 esempi di dimensione del pooling e stride: 3x3 e 2, 5x5 e 3, 7x7 e stride of 4.

clip_image048_thumb

Figura 14– effetti di diversi iperparametri nella convoluzione, ReLU e max pooling.

L’ effetto dello stride nella convoluzione e dello stride nel max-pooling e’ cumulativo. Quando usiamo un passo di 2 sia nella convoluzione che nel max pooling, il risultato finale e’ una riduzione di quasi 4 volte la larghezza e l’altezza della feature map. Il valore 16 come passo nella convoluzione e di 4 nel max pooling sono abbastanza inusuali. In questo caso sono stati intenzionalmente esagerati per illustrare l’impatto che hanno sul risultato finale dello strato di convoluzione. Gli elementi costitutivi di una rete AlexNet vengono rappresentati in figura 14. Le piramidi riportate con linee spezzate rappresentano l’esecuzione delle convoluzioni usando un receptive field dagli inputs o la feature map dagli strati precedenti. Le grosse scatole rappresentano le feature maps mentre le scatole piccole all’interno delle feature maps sono i receptive fields. Questo tipo di CNN riescono a classificare oggetti in 1000 diverse classi.

clip_image050_thumb

Figura 15 — Architettura di AlexNet CNN.

Una peculiarita’ di questa architettura e’ che essa viene addestrata usando 2 GPU (Graphics processing units). Gli elementi al top della figura 15 sono stati allocati in una GPU, mentre gli elementi al bottom sono stati allocati in un’altra GPU. Questa rete CNN gia’ addestrata e’ possibile trovarla in qualche framework come PyTorch. In questi casi c’e’ bisogno di conoscere Python e buttare giu’ linee di codice prima di ottenere i risultati sperati. Un modo alternativo che non richiede nessuna linea di codice e’ quello di costruire una rete personalizzata CNN usando per esempio l’eccellente console per deep neural net messa a disposizione dalla Deep Cognition (o deep learning studio DLS). Si tratta di un sistema user-friendly con molte features, incluso la possibilita’ di disegnare la topologia della rete senza scrivere nessuna linea di codice interagendo con una semplice GUI. Come riportato dai creatori di questa piattaforma, Deep Cognition nasce con lo scopo di democratizzare l’intelligenza artificiale. La loro piattaforma e’ disponibile sia come soluzione Cloud che come Desktop solution nel qual caso il software girera’ sul personal PC . L’interfaccia permette un semplice drag & drop che aiuta a mettere insieme i diversi pezzi di una deep net. C’e’ anche la possibilita’ di utilizzare delle reti pre-trained come Inception, ResNet, MobileNet e cosi via per velocizzare la fase di apprendimento. Questo e’ possibile in quanto nei primi layers di una rete vengono catturate le feature piu’ importanti e molto generiche che possono essere utilizzate per esempio nella classificazione di qualsiasi immagine. La piattaforma salva velocemente qualsiasi modello dopo il training e l’aggiustamento degli iper-parametri (come per esempio learning rate, epochs, batch size etc) della rete.

clip_image052_thumb

 

Di seguito un esempio di utilizzo di una CNN per il riconoscimento delle 9 cifre scritte a mano (il famoso MNIST dataset – fig. 16). In questo caso ogni cifra e’ rappresentata da un’array 28x28 come mostrato nella figura 17 e valori da 0 a 255 (28X28X1).

 

clip_image054_thumb1

Fig 16. Alcune delle cifre del dataset MNIST

 

clip_image056_thumb

Figura 17. La rappresentazione matriciale dell’ 8

 

In figura 18 invece e’ riportata la divisione del database in training set (90%), validation set (5%) e test set (5%). Tutte le righe del database vengono presentate alla rete a batch (insieme di piu’ righe per abbattere il rumore)

clip_image058_thumb

Figura 18. Data pre-processing

Deep Learning Studio permette di disegnare una qualsiasi rete senza scrivere nessuna riga di codice ma semplicemente mettendo insieme i diversi moduli a disposizione, oppure provvedendo esso stesso a costruire l’architettura della rete in modo automatico senza alcun intervento da parte dell’analista grazie ad un’avanzata feature chiamata AutoML (figura 19), che crea per l’utente l’intera pipeline per andare dai dati grezzi fino alla predizione. In figura  20 la rete convoluzionale utilizzata per la classificazione del data set MNIST.

clip_image060_thumb

Figure 19. AutoML

 

clip_image062_thumb4

Figura 20. L’architettura della CNN

 

clip_image064_thumb

Figura 21. Iperparametri

 

Una volta stabiliti i valori degli iper-parametri (figura 21)  si passa alla fase di training della rete CNN. Dopo appena 6 epoche su 10 la rete ha raggiunto un’accuratezza del 89% per il training set e il 91% per il set di validation. Un risultato niente male (figura 22).

clip_image066_thumb1

Figura 22. Training della rete CNN con i risultati di accuracy e loss

 

Qui alcune cifre del test set riconosciute dalla rete con a fianco  la probabilita’ della predizione. Per il 4 nella prima riga, per esempio la rete e’ sicura all’82% che si tratti proprio di un quattro e cosi via per le altre cifre (figura 23).

clip_image068_thumb1

Figura 23. Predizione della rete per le cifre del test set

 

Questo sistema DLS e’ nato con la promessa di rendere facile l’intelligenza artificiale; non c’e’ bisogno di essere un esperto per realizzare modelli molto complessi anche se e’ opportuno avere almeno un’idea di quello che si sta facendo leggendo i documenti di help e i tutorial presenti sul sito della Deep cognition. Non resta che provare. Buon divertimento.

http://www.wikio.it