
- Docente: Silvia CASCIANELLI
- Docente: Riccardo LANCELLOTTI
- Docente: Mirco MARCHETTI
- Docente: Vittorio CUCULO
- Docente: Roberto VEZZANI
1. Analisi dei dati e Data Mining (3 CFU)
Tecniche per l’estrazione della conoscenza da grandi volumi di dati, con attenzione alla valutazione dei modelli predittivi, alla messa in produzione di sistemi di Machine Learning (MLOps) e ai metodi di explainability per l’interpretazione dei risultati.
2. Ricerca di elementi simili (0.5 CFU)
Metodi per l’individuazione di similarità in grandi collezioni di documenti, con focus sulle tecniche di Locality-Sensitive Hashing (LSH).
3. Analisi di pattern frequenti (0.5 CFU)
Studio di pattern ricorrenti nei dati transazionali attraverso tecniche di Market Basket Analysis e algoritmi per la scoperta di itemset frequenti.
4. Analisi, mining e retrieval di testi (3 CFU)
Modelli e tecniche per il recupero, la classificazione e l’analisi di testi, con riferimento al text retrieval, ai modelli probabilistici del linguaggio e alle tecniche di NLP supervisionate e non supervisionate.
Il modulo include l’uso di word embeddings, analisi del sentiment, clustering e topic modeling.
È previsto un approfondimento sui modelli Transformer e il loro ruolo nell’elaborazione del linguaggio naturale, con particolare attenzione ai Large Language Models (LLM).
Sono trattati scenari applicativi di classificazione, generazione e interrogazione testuale (semantic search, Retrieval-Augmented Generation - RAG) e l’uso di LLM su dati tabellari.
Ampio spazio è dedicato alle applicazioni della Generative AI (GenAI) in ambito testuale e documentale.
Laboratorio (2 CFU)
- Pandas: rappresentazione e gestione di dati tabellari, preprocessing e feature engineering
- Scikit-learn: tecniche di classificazione e regressione, valutazione dei modelli, feature engineering, costruzione e valutazione di pipeline
- Docente: Francesco GUERRA
- Docente: FEDERICA ROLLO