Info docenti

GIUSEPPE MANCO

INF/01 INFORMATICA 

 

Interessi di ricerca:

Data Science, Machine Learning, Social Network Analysis, Recommender Systems

Proposte di tesi di laurea:

Il Laboratorio di Analitica Avanzata su Dati Complessi (Advanced Analytics on Complex Data Laboratory), ADA Lab, è un’inziativa di ricerca che nasce dalla collaborazione di ricercatori dell’Istituto di Calcolo e Reti ad Alte Prestazioni (ICAR) del Consiglio Nazionale delle Ricerche (CNR), nel settore dell’analisi dati. Le proposte di tesi, riportate di seguito, sono tutte collegate ad attività di ricerca d’ultima frontiera portate avanti dall’ADALab. Tali attività sono descritte nel seguito del presente documento.

Il candidato parteciperà alla raccolta di dati da fonti turistiche eterogenee, reali e di grandi dimensioni. I dati dovranno essere filtrati, riconciliati, manipolati ed inseriti all’interno di un’ontologia per il turismo. L’obiettivo della tesi è quello di permettere al candidato di apprendere le metodologie e tecniche nell’ambito dell’Information Retrieval e del Data Exchange.

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Raccolta, Manipolazione ed Analisi di Dati Turistici”.

In un mercato come quello del turismo, dove l’adattatività dei sistemi alle esigenze dei clienti è cruciale, diventa fondamentale comprendere appieno le preferenze e le necessità dei turisti. Per questo lavoro di tesi, il candidato parteciperà alla definizione, alla realizzazione ed alla validazione di metodologie e tecniche per il suggerimento personalizzato di Point of Interest ai vari turisti in mobilità. 

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Raccolta, Manipolazione ed Analisi di Dati Turistici”.

I Social Network sono ormai diventati una costante nella vita della parte più informatizzata del mondo. La loro influenza è presente in moltissimi aspetti sociali, in particolar modo nel turismo. Numerosi sono i turisti che si informano sui vari social (di settore e non), riguardo le diverse possibili destinazioni delle loro vacanze. Nasce, dunque, la necessità della scoperta di veridicità del contenuto informativo presente all’interno dei social network. In questo lavoro di tesi, il candidato verrà coinvolto nella definizione, realizzazione e valutazione di tecniche per la certificazione dei contenuti informativi in relazione alla reputation e trustworthiness di chi diffonde l’informazione in rete.

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Raccolta, Manipolazione ed Analisi di Dati Turistici”.

La maggior parte delle reti sociali più diffuse esibiscono un comportamento tipico: il loro utenti, autonomamente, si aggregano in comunità. La natura di queste comunità può essere varia; solitamente le aggregazioni sono, principalmente, dovute a due fattori:

·       nella vita reale gli utenti si conoscono o comunque sono uniti da qualche legame sociale;

·       gli utenti condividono un interesse o una tematica comune.

La finalità della proposta di tesi è quella di far partecipare il candidato alla definizione, realizzazione e valutazione di modelli matematici per la scoperta di comunità implicite nelle reti sociali.

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Social Network Analysis”.

 Le reti sociali sono dei contesti in continua evoluzione. Numerosi sono i nuovi utenti iscritti ed ancor più numerosi sono i link che si formano tra i vari utenti. La presente proposta di tesi mette il candidato di fronte alla problematica nota in letteratura come link prediction. L’obiettivo è la definizione, realizzazione e validazioni di strumenti per la modellazione dell’evoluzione temporale di una rete sociale.

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Social Network Analysis”.

In una rete sociale si possono definire due categorie di utenti: gli utenti capaci di generare e diffondere contenuti informative, e gli utenti che invece consumano i contenuti informativi generate da altri. I primi sono noti con il termine di influencer, ovvero individui capaci di influenzare chi gli sta attorno, mentre gli altri sono detti susceptible, ovvero coloro che assorbono l’influenza degli altri. Il candidato di questo lavoro di tesi verrà coinvolto nella definizione, realizzazione e valutazione di modelli per l’analisi dell’influenza nelle reti sociali

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Social Network Analysis”.


 

Recommender Systems sono piattaforme in grado capire i gusti di un bacino di utenti e per tal motivo capaci di filtrare e selezionare contenuti / prodotti / servizi di reale interesse per essi. Numerose sono le aziende che adottano i recommender: Google, Yahoo!, Facebook, G+, YouTube, Amazon, eBay, iTunes… In questo lavoro di tesi, il candidato parteciperà alla definizione, realizzazione e valutazione di nuovi algoritmi di recommendation  da comparare con i modelli matematici stato dell’arte presenti in letteratura.


La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Social Network Analysis”.

 

Recommender System sono sistemi ormai consolidati in ambito industriale che hanno lo scopo di suggerire agli utenti di una corporazione una serie di prodotti / servizi / contenuti di gradimento. Gli utenti, però, non sono individui singoli, ma persone immerse in un contesto sociale, e di conseguenze possono subirne l’influenza e adottare alcune mode. Il lavoro di tesi proposto permetterà al candidato di studiare, definire, realizzare e valutare modelli di recommendation nei social network.

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Social Network Analysis”.

Le tecniche per scoprire intrusioni in una rete proteggono i sistemi da utenti ed applicativi non autorizzati e potenzialmente nocivi. Un software che cerca di rilevare le intrusioni viene detto Intrusion Detector: il suo obiettivo è l’analisi dei log d’accesso ai sistemi da parte degli utenti, al fine di distinguere in futuro le azioni lecite da quelle illecite, isolando gli utenti ed gli applicativi dannosi. In questo lavoro di tesi, il candidato dovrà affrontare le problematiche relative a: (ilo storing efficiente dei log di accesso ai sistemi, (iil’analisi esplorativa dei log, e (iiiminingdei log al fine di individuare le categorie di connessione ed attacchi.

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Cyber Security”.


 

Comprendere i comportamenti tipici degli utenti della rete permette di incrementare l’efficacia dei sistemi di protezione, in quanto consente di isolare ed evidenziare comportamenti potenzialmente nocivi per il sistema. La proposta di tesi prevede lo studio, la definizione, la realizzazione e la valutazione di modelli matematici per il profiling degli utenti appartenenti ad una rete: i profili utenti verranno estratti a partire dalle azioni che gli utenti eseguono. 

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Cyber Security”.

Il Problema di Predizione è uno degli argomenti classici nel data mining: data la conoscenza passata del comportamento di un fenomeno, l’obiettivo è quello di predirne il comportamento futuro. Moltissime sono le tecniche di predizione presenti in letteratura, per tal motivo, questo lavoro di tesi chiederà al candidato un confronto ed analisi critica di diversi algoritmi di Classificazione e Regressione

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Data Mining and Knowledge Discovery”.

 Il Deep Learning è una nuovissima area di interesse del Machine Learning, che è stata introdotta con l’obiettivo storico di avvicinare l’apprendimento automatico al concetto di Isaac Asimov riguardo l’Intelligenza Aritificiale. Questa disciplina si concentra sull’apprendimento a più livelli di rappresentazione ed astrazione dei dati. In questo lavoro di tesi, il candidato studierà le tematiche ed alcuni degli algoritmi relativi al deep learning.

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Data Mining and Knowledge Discovery”.


 

I processi di approssimazione di funzioni matematiche richiedono l’utilizzo di tecniche di stima dei parametri. In questo lavoro di tesi, il candidato studierà e confronterà le più efficaci e diffuse metodologie di parameter estimation e le loro applicazioni:

·       Stima ai minimi quadrati – regressione lineare.

·       Gradiente discendente – reti neurali.

·       Massima verosimiglianza – expecation maximization.

·       Massima probabilità a posteriori – latent Dirichlet allocation.

o   Metodi Markov chain Monte Carlo (Gibbs Sampling) – Variational Inference

La tesi proposta rientra nell’attività di ricerca dell’ADA Lab chiamata “Data Mining and Knowledge Discovery”.


 


 

Orario di ricevimento:

Martedì, 12:00-14:00
 

Contatti:

Email:

Questo indirizzo email è protetto dagli spambots. E' necessario abilitare JavaScript per vederlo.

 

Telefono:

 

Ufficio:

Via Bucci 41c - II Piano

 
 

Corsi nell'a.a. 2018/2019

Informazioni aggiuntive