A cura di MIUR - Direzione Generale per il coordinamento la promozione e la valorizzazione della ricerca

Il Data Mining “intelligente”: teoria e applicazioni

Il Data Mining “intelligente”: teoria e applicazioni

Che cos’è il Data Mining? Che tipo di informazioni può sviscerare da una quantità di dati estesa e complessa? Quali sono le possibili applicazioni di questo metodo innovativo di analisi matematica? Ce lo spiegano Massimo Buscema e Giulia Massini, rispettivamente direttore e senior researcher del Semeion – Centro Ricerche di Scienze della Comunicazione di Roma in un documento dal titolo Introduzione Teorica al Data Mining intelligente, pubblicato in questi giorni.

Obiettivo principale del Data Mining consiste nell’estrarre da un insieme di dati il maggior numero di informazioni significative, palesi e “nascoste”, in  grado di delineare un profilo utile a chi ha necessità di prendere decisioni o semplicemente comprendere qualcosa di più del materiale in esame, intendendo con informazioni nascoste i “segnali deboli” che potrebbero sfuggire a una analisi statistica tradizionale. È per questo che si parla di Data Mining “intelligente”, realizzabile attraverso una analisi non lineare degli stessi dati a disposizione.

Ma che cosa si intende per analisi non lineare dei dati? I ricercatori del Semeion ce lo spiegano con un esempio alla portata di tutti: “Dal punto di vista dell’interpolazione lineare, la costa frastagliata della Norvegia apparirebbe una successione di linee rette: un buon sistema per approssimare la forma generale della regione, ma davvero pessimo per fornire una mappa a chi deve navigare dentro i fiordi”. Insomma, con questo metodo innovativo capace di “ricalcare” più da vicino un fenomeno – per quanto complesso – si ottengono informazioni più interessanti e utili, specialmente di tipo predittivo dell’evoluzione possibile di un fenomeno nel tempo, cosa impossibile con le tecniche consuete, per quanto sofisticate possano essere.

autocm_700

Nel documento vengono approfonditi con tanto di grafici esemplificativi gli aspetti matematici del metodo, basato su sistemi a reti neurali artificiali, cioè applicativi evoluti che emulano il modo di elaborare le informazioni caratteristico del cervello umano, ma portato alla massima potenza di calcolo grazie a hardware e software di ultima generazione. Inoltre viene mostrata l’efficacia di questi innovativi algoritmi di intelligenza artificiale su un caso reale: l’ottimizzazione della gestione delle prestazioni del Fondo di assistenza sanitaria integrativa del CCNL chimico-farmaceutico (Faschim), progetto di ricerca recentemente presentato in un convegno tenutosi presso il Ministero della Salute a Roma.

Messo alla prova dei fatti, il sistema è stato in grado di individuare i comportamenti tipici e atipici degli assistiti del fondo, nonché le potenziali frodi “nascoste” nei dati, a vantaggio sia degli utenti, sia del sistema economico e sociale che contribuisce al miglioramento della salute pubblica.

Fonte Semeion
Data pubblicazione 01/06/2016
Tag Scienze fisiche e ingegneria