Skip to main content

Ciao, sono

Andrea Alberti

Costruisco sistemi intelligenti con l'AI

Machine Learning
Multi-Agent Systems
LLM Models
Deep Learning
RAG Systems

Scorri per esplorare

Chi Sono

Chi Sono

Andrea Alberti

Andrea Alberti

GenAI Engineer & Data Scientist

Laureato con un doppio titolo in Ingegneria Gestionale e Informatica–Data Science, ho acquisito una sostanziale esperienza in progetti multidisciplinari. Mi specializzo nell'applicare tecniche di machine learning, deep learning e, più recentemente, Generative AI per sviluppare soluzioni innovative e automatizzate.

Il mio percorso accademico, dall'Ingegneria Gestionale (110/110 e lode) a una Magistrale in Data Science (110/110 e lode), mi ha dato un mix di competenza tecnica e pensiero strategico. Questo mi permette di affrontare problemi complessi sia da una prospettiva business che tecnologica.

Professionalmente, mi concentro sulla costruzione di sistemi intelligenti—dalle architetture multi-agente che automatizzano processi aziendali complessi all'AI conversazionale avanzata—per aumentare l'efficienza e ridurre i costi operativi. Il mio obiettivo è migliorarmi continuamente, usando l'AI per creare valore tangibile.

Scarica CV Completo
2022 - 2024110/110 L

Magistrale Data Science - Ingegneria Informatica

Università di Pavia

Scarica Tesi
2018 - 2021110/110 L

Triennale Ingegneria Gestionale

Università di Brescia

Scarica Tesi

Certificazione

Google Cloud Professional ML Engineer

Google Cloud

Verifica

Competenze Tecniche

Competenze Core

RAG
Multi-Agent Systems
Prompt Engineering
Few-Shot Learning
Problem Solving
System Design
Data Analysis
Research
Public Speaking
Presentation Design
Workshop Creation

Strumenti AI

Claude Code
Codex
GitHub Copilot
Gemini
ChatGPT
Claude
NotebookLM
Gemini CLI

Cloud & Infrastruttura

Google Cloud Platform
Vertex AI
Cloud Run
Cloud Functions
BigQuery
WebSocket
Agent Engine

Linguaggi di Programmazione

Python
SQL
HTML/CSS

Framework & Librerie

Google ADK
Dialogflow CX
Gemini SDK
Vertex AI Search
TensorFlow
PyTorch
Scikit-learn
Keras
XGBoost
FastAPI
Flask
PySpark
Hadoop
MongoDB
NetworkX
Pandas
NumPy
OpenCV
Matplotlib
Lavoro Professionale

Progetti Professionali

Una selezione di progetti professionali dove ho applicato Generative AI e Machine Learning per risolvere problemi reali.

LiveFeatured

Assistente AI per Selezione Pneumatici

Perfezionamento e test di un agente conversazionale Dialogflow CX per il mercato UK, che guida gli utenti nella selezione di pneumatici tramite sistema multi-agente con RAG e API esterne. Migrazione con successo della soluzione a Google Agent Development Kit (ADK), espandendo a mercati internazionali e nuove categorie di veicoli con integrazione cross-cloud AWS-GCP.

Dialogflow CXGoogle ADKMulti-AgentRAG
Multi
Mercati
Cross-Cloud
Architettura
Expanded
Categorie
CompletatoFeatured

Sistema Automatizzato di Validazione Documenti

Implementazione full-stack di un sistema multi-agente per automatizzare verifica e validazione documenti per richieste di finanziamento pubblico. Sviluppo backend in Python e frontend in HTML, CSS e JavaScript. Progettata architettura modulare e flessibile che permette adattamento del comportamento degli agenti senza modifiche al codice.

Multi-AgentPythonProcess AutomationGCP
90%
Riduzione Tempi
Modular
Architettura
Full
Stack
Completato

Chatbot Avanzato su Knowledge Base

Implementazione architettura avanzata di agente chatbot per rispondere a domande utenti usando knowledge base di pagine web e documenti PDF. Sistema progettato con agente orchestratore principale che instrada richieste a cinque sotto-agenti specializzati. Sviluppo pipeline gestione dati con parsing PDF, strategia chunking e layer sicurezza per domande inappropriate.

Dialogflow CXGCPMulti-AgentRAG
5
Sotto-Agenti
Multi
Domini
PDF+Web
Documenti
Completato

Agente Multimodale in Tempo Reale

Sviluppo e implementazione agente conversazionale multimodale in tempo reale basato su Google Agent Development Kit (ADK). Sistema capace di processare input audio e video simultaneamente, sostenere conversazioni fluide ed eseguire autonomamente operazioni su browser tramite reasoning e tool. Architettura asincrona dual-server con comunicazione WebSocket per streaming bidirezionale a bassa latenza.

Google ADKGemini Live APIMultimodal AIBrowser Automation
<500ms
Latenza
A+V
Modalità
Async
Architettura
Completato

Assistente Virtuale per Yacht di Lusso

Implementazione assistente virtuale con obiettivo di rispondere a domande utenti basate su knowledge base aziendale. Configurato come applicazione RAG (Retrieval-Augmented Generation), sfruttando Google Cloud ADK e Vertex AI Search per recuperare informazioni rilevanti da datastore dedicato. Architettura usa modelli Gemini per processare richieste e generare risposte accurate e contestualizzate in italiano.

RAGVertex AI SearchGoogle ADKGCP
Gemini
LLM
95%
Accuratezza
RAG
Tecnologia
Completato

Sistema Ticketing Multi-Agente

Implementazione sistema ticketing multi-agente per automatizzare risposte utenti. Progetto sviluppato come Proof of Concept (POC), coinvolgendo creazione agenti specializzati, ciascuno capace di interagire con database esterni via API per fornire risposte accurate e complete. Architettura multi-agente assicura che richieste utenti siano instradate all'agente più competente, riducendo carico lavoro staff e costi gestione.

Multi-AgentGoogle ADKAPI IntegrationAutomation
-70%
Carico Lavoro
Multi
Agenti
POC
Tipo
Completato

Pipeline Classificazione Email Basata su LLM

All'interno progetto più ampio mirato ad automatizzare processo manuale e ridurre costi operativi, contributo focalizzato su creazione pipeline basata su LLM per classificazione e smistamento email certificate (PEC). Attività chiave includono prompt engineering e few-shot learning per raffinare output modelli, insieme a sviluppo metriche e strumenti analitici per valutazione performance sistema.

LLMPrompt EngineeringFew-Shot LearningProcess Automation
High
Riduzione Costi
Few-Shot
Tecnica
85%
Automazione
Completato

Motore Liquidazione Assicurativa - Progetto Demo

Sviluppo architettura collaborativa multi-agente completa per dimostrazione Sharing Days interno. Sistema analizza automaticamente, processa ed emette giudizi di liquidabilità su pratiche assicurative. Architettura combina agenti paralleli per analisi documenti con agenti sequenziali per valutazione finale, utilizzando tool custom, servizi Google Cloud built-in e integrazione MCP.

Google ADKMulti-AgentCloud RunMCP
3
Tipi Agenti
Hybrid
Architettura
Demo
Scopo
Ricerca Accademica

Ricerca & Lavoro Accademico

8 paper
80+ pagine
6 cum laude
Rilevamento Malattie Cardiache da Segnali Audio
Machine Learning

Rilevamento Malattie Cardiache da Segnali Audio

Machine Learning Biomedico Avanzato

Progettati ensemble per la prevenzione e il supporto clinico dello screening cardiaco sul Dangerous Heartbeat Dataset (CHSC2011). I toni cardiaci sono stati ricampionati a 4 kHz, suddivisi in finestre da 1 secondo, descritti con MFCC, cromagrammi, descrittori spettrali e temporali e ridotti da 338 a 41 feature tramite filtri basati su Spearman. L’ensemble di prevenzione limita i falsi negativi (ROC-AUC 0.96, TPR 43.4% a 1% FPR) mentre l’ensemble diagnostico a cinque classi raggiunge macro F1 81.6 con analisi di rischio per classe e spiegazioni SHAP.

Risultati Chiave
0.82
F1-Score
0.96
ROC-AUC
43.4%
TPR @1% FPR
74.3%
TPR @5% FPR
86.6%
TPR @10% FPR
lug 2024
17 pagine
Scikit-learnTorchaudioLibrosa
Predizione Malattie con Graph Machine Learning
Graph ML

Predizione Malattie con Graph Machine Learning

Data Science Finanziaria

Rappresentate 773 malattie e 377 sintomi in una rete bipartita per ingegnerizzare feature grafo-aware utili alla diagnosi. Method of Reflections, indici di Influenza di malattia/sintomo, rilevamento di comunità e betweenness centrality generano nuovi descrittori a complemento del one-hot dei sintomi. Sono stati confrontati modelli di Regressione Logistica, Random Forest e MLP; il modello logistico migliore eguaglia la baseline basata sui soli sintomi usando meno input e fornendo insight sull’accuratezza per classe.

Risultati Chiave
Logistic Regression
Best Model
28%
Feature Reduction
1.5%
Accuracy Drop
dic 2023
23 pagine
PythonNetworkXScikit-learn
Predizione Utilità Recensioni con Big Data
Big Data

Predizione Utilità Recensioni con Big Data

Data Science & Big Data Analytics

Analizzati circa 3 milioni di recensioni di libri Amazon con uno stack big data (HDFS, Spark, MongoDB) per spiegare e predire l’utilità percepita. I test d’ipotesi hanno quantificato l’impatto di lunghezza, sentiment e valutazione in stelle, mentre embedding Word2Vec hanno alimentato regressori Random Forest, SVR e MLP. Il miglior Random Forest ha ottenuto MSE 0.0259 (RMSE 0.1609, R² 0.253).

Risultati Chiave
Random Forest
Best Model
0.026
MSE
0.25
set 2023
6 pagine
Hadoop HDFSApache SparkPySpark
Rilevamento Clickbait in Titoli di Notizie
NLP

Rilevamento Clickbait in Titoli di Notizie

Machine Learning

Confrontati Multinomial Naive Bayes e Regressione Logistica su 32 mila titoli bilanciati per rilevare il clickbait. Sono stati esplorati due obiettivi: massima accuratezza (97.12% sul test con stopword e vocabolario da 8k) e assenza di falsi positivi (0% FPR, accuratezza 84%, TPR 68%). Un’analisi puntuale degli errori evidenzia le parole più impattanti e i trade-off introdotti dalla calibrazione del bias.

Risultati Chiave
97.12%
Accuracy
0.0%
Best FPR
84.00%
FPR Accuracy
8000 words
Vocabulary
feb 2024
6 pagine
PythonScikit-learnNumPy
Rilevamento e Mitigazione Attacchi DDoS
Security

Rilevamento e Mitigazione Attacchi DDoS

Infrastruttura Digitale d'Impresa

Ricreati attacchi di riflessione e amplificazione DNS in una LAN controllata per misurare fattori di amplificazione, latenza sul bersaglio e risorse del server. Script Scapy personalizzati hanno effettuato spoofing del bersaglio variando i tipi di query (A, MX, NS, ANY) tra 10k e 50k pacchetti/s. Lo studio documenta latenza oltre 100 ms per le richieste ANY, saturazione della CPU durante gli attacchi intensificati e valuta contromisure.

Risultati Chiave
1.46
AF A
4.14
AF MX
4.46
AF NS
gen 2024
11 pagine
PythonScapyWireshark
Analisi Features per Classificazione Torte
Machine Learning

Analisi Features per Classificazione Torte

Machine Learning

Confrontati descrittori hand-crafted e feature derivate da CNN per classificare 15 categorie di torte (1.800 immagini). Le statistiche di basso livello (istogramma dei colori, direzione dei bordi, matrice di co-occorrenza) alimentavano un MLP ma si sono fermate al 31% di accuratezza, mentre le mappe di PVMLNet (layer −5) abbinate a un MLP hanno raggiunto il 90% sul test. Il transfer learning con PVMLNet fine-tunata si è fermato all’80%, evidenziando il valore delle rappresentazioni profonde.

Risultati Chiave
90%
Accuracy
90%
Neural Features
31%
Low-Level Features
80%
Transfer Learning
feb 2024
5 pagine
Pythonpvml libraryPVMLNet
Rilevamento Punti di Fuga nelle Immagini
Computer Vision

Rilevamento Punti di Fuga nelle Immagini

Computer Vision

Realizzate due utilità di computer vision: (1) uno strumento di binarizzazione guidato dall'istogramma con tuning auto/manuale e GUI, e (2) un rilevatore di punti di fuga che combina Canny, Hough probabilistico e RANSAC (500 iterazioni, tolleranza 5 px). La pipeline adatta le soglie alle statistiche dell'immagine, sovrappone le 15 linee più significative e documenta confronti SSIM con Otsu.

Risultati Chiave
500
RANSAC Iterations
5 pixels
Threshold
10 longest per run
Hough Lines
mar 2024
7 pagine
Python 3.9+OpenCVNumPy
Analisi del Sentimento sui Social Media
NLP

Analisi del Sentimento sui Social Media

Machine Learning

Implementati classificatori di sentiment sul dataset IMDb (50k recensioni) confrontando Naive Bayes Multinomiale e Regressione Logistica. Sono stati analizzati dimensione del vocabolario, rimozione di stopword e stemming per bilanciare accuratezza e overfitting. Naive Bayes con stopword (vocabolario 1k) ha raggiunto l’82.6% sul test, mentre la Regressione Logistica è arrivata all’85.4% con tuning minimo.

Risultati Chiave
85.4%
Accuracy
82.6%
MNB Accuracy
85.4%
LR Accuracy
1000 words
Best Vocabulary
feb 2024
5 pagine
PythonScikit-learnNLTK
AI Playground

Demo AI Interattive

Esplora le capacità dell'AI attraverso dimostrazioni interattive. Da strumenti di ricerca basati su RAG a sistemi multi-agente autonomi.

Esploratore di Paper

Chatta con i miei paper accademici usando RAG. Fai domande sulla mia ricerca in ML, DL, NLP e Computer Vision.

RAGLangChainVector DBGemini

Consiglio di Amministrazione AI

Sistema multi-agente che simula un consiglio di esperti. Osserva gli agenti dibattere e raggiungere un consenso su decisioni strategiche.

Multi-AgentCrewAIAutoGenCollaboration

Assistente di Ricerca Autonomo

Agente AI con strumenti per ricerca web, analisi dati e generazione report. Dimostra flussi di lavoro agentici e uso di strumenti.

AgentToolsWeb SearchAnalysis
Progetto Personale

Un Luogo Unico per Tutto

Learn Different, Think Different, Choose Liberti Hub

Le Mie Passioni

Oltre il Lavoro

Altre cose che amo fare

Corpo Attivo, Mente Attiva
Fare Sport

Corpo Attivo, Mente Attiva

È importante per me avere momenti per prendermi cura della mia salute. Ho allestito una piccola palestra a casa e amo anche giocare a tennis e calcio.

Il Mix Perfetto di Passione, Abilità e Strategia
Guardare la Formula 1

Il Mix Perfetto di Passione, Abilità e Strategia

Amo la Formula 1 perché rappresenta l'apice delle corse, combinando tecnologia all'avanguardia con abilità umana e pensiero strategico.

Se non vai più per un varco che esiste, non sei più un pilota da corsa. — Ayrton Senna

Una Tradizione di Famiglia Duratura
Guardare il Calcio

Una Tradizione di Famiglia Duratura

Ho ereditato da mio nonno la passione per il calcio e per il tennis. Amo guardare e analizzare le partite e sono un grande tifoso del Milan da sempre.

Contatti

Connettiamoci

Aperto a opportunità e collaborazioni. Sentiti libero di contattarmi!

Connettiamoci

Aperto a opportunità e collaborazioni

LinkedIn
Andrea Alberti
GitHub
@AndreaAlberti07
Tempo di Risposta
Di solito entro 24 ore
Andrea Alberti | GenAI Engineer & AI Systems Architect