domenica 25 febbraio 2018

Come torturare i dati per farli parlare

Il post di oggi e’ anomalo. Non si tratta del solito articolo. Ma di due presentazioni fatte alcuni anni fa per introdurre le tecniche di data mining/machine learning e  un ottimo software free (Orange) che ognuno puo’ scaricare ed utilizzare per fare un po’ di pratica. In queste slides vengono descritti i concetti base del machine learning, delle tecniche analitiche e del data mining quali decision tree, clustering, analisi di Bayes, association rules, self organizing maps, supported vector machines, random forest etc . L’idea alla base di queste due presentazioni è stata quella di introdurre i partecipanti (adesso i lettori del blog) nel mondo degli algoritmi sviluppati dalla cosiddetta computer science di cui tanto si sente parlare in ambiti quale l’internet delle cose, automobili senza guidatori, robots, droni  solo per citarni alcuni.

Il machine learning e’ fondamentale nello studio dei sistemi complessi in cui a causa dell’elevato numero di componenti e delle loro interazioni fortemente non lineari non si possono modellizzare facilmente. L’unica possibilita’ e’ quella di mettere al lavoro gli analytics oggi disponibili per cercare nella vasta mole dei dati le relazioni fondamentali, i patterns piu’ importanti, le informazioni nascoste come pepite all’interno delle miniere. Gli algoritmi di machine learning permettono di tirare fuori dai dati le informazioni utili riducendo in modo opportuno il volume dei dati. Pensate ad una piramide. Man mano che si sale verso l’alto, cioe’ man mano che il volume diminuisce emerge l’informazione.  MI fermo qui e vi lascio alle circa 200 slides. Buona lettura.  

Data mining e machine learning

Introduzione ad Orange


image

Nessun commento:

Posta un commento

http://www.wikio.it