Ciao, sono

Andrea Alberti

Costruisco sistemi intelligenti con l'AI

Machine Learning

Multi-Agent Systems

LLM Models

Deep Learning

RAG Systems

Scorri per esplorare

Chi Sono

Andrea Alberti

GenAI Engineer & Data Scientist

Laureato con un doppio titolo in Ingegneria Gestionale e Informatica–Data Science, ho acquisito una sostanziale esperienza in progetti multidisciplinari. Mi specializzo nell'applicare tecniche di machine learning, deep learning e, più recentemente, Generative AI per sviluppare soluzioni innovative e automatizzate.

Il mio percorso accademico, dall'Ingegneria Gestionale (110/110 e lode) a una Magistrale in Data Science (110/110 e lode), mi ha dato un mix di competenza tecnica e pensiero strategico. Questo mi permette di affrontare problemi complessi sia da una prospettiva business che tecnologica.

Professionalmente, mi concentro sulla costruzione di sistemi intelligenti—dalle architetture multi-agente che automatizzano processi aziendali complessi all'AI conversazionale avanzata—per aumentare l'efficienza e ridurre i costi operativi. Il mio obiettivo è migliorarmi continuamente, usando l'AI per creare valore tangibile.

Scarica CV Completo

2022 - 2024110/110 L

Magistrale Data Science - Ingegneria Informatica

Università di Pavia

Scarica Tesi

2018 - 2021110/110 L

Triennale Ingegneria Gestionale

Università di Brescia

Scarica Tesi

Certificazione

Google Cloud Professional ML Engineer

Google Cloud

Verifica

Competenze Tecniche

Competenze Core

RAG

Multi-Agent Systems

Prompt Engineering

Few-Shot Learning

Problem Solving

System Design

Data Analysis

Research

Public Speaking

Presentation Design

Workshop Creation

Strumenti AI

Claude Code

Codex

GitHub Copilot

Gemini

ChatGPT

Claude

NotebookLM

Gemini CLI

Cloud & Infrastruttura

Google Cloud Platform

Vertex AI

Cloud Run

Cloud Functions

BigQuery

WebSocket

Agent Engine

Linguaggi di Programmazione

Python

SQL

HTML/CSS

Framework & Librerie

Google ADK

Dialogflow CX

Gemini SDK

Vertex AI Search

TensorFlow

PyTorch

Scikit-learn

Keras

XGBoost

FastAPI

Flask

PySpark

Hadoop

MongoDB

NetworkX

Pandas

NumPy

OpenCV

Matplotlib

Lavoro Professionale

Progetti Professionali

Una selezione di progetti professionali dove ho applicato Generative AI e Machine Learning per risolvere problemi reali.

LiveFeatured

Assistente AI per Selezione Pneumatici

Perfezionamento e test di un agente conversazionale Dialogflow CX per il mercato UK, che guida gli utenti nella selezione di pneumatici tramite sistema multi-agente con RAG e API esterne. Migrazione con successo della soluzione a Google Agent Development Kit (ADK), espandendo a mercati internazionali e nuove categorie di veicoli con integrazione cross-cloud AWS-GCP.

Dialogflow CXGoogle ADKMulti-AgentRAG

Multi

Mercati

Cross-Cloud

Architettura

Expanded

Categorie

CompletatoFeatured

Sistema Automatizzato di Validazione Documenti

Implementazione full-stack di un sistema multi-agente per automatizzare verifica e validazione documenti per richieste di finanziamento pubblico. Sviluppo backend in Python e frontend in HTML, CSS e JavaScript. Progettata architettura modulare e flessibile che permette adattamento del comportamento degli agenti senza modifiche al codice.

Multi-AgentPythonProcess AutomationGCP

90%

Riduzione Tempi

Modular

Architettura

Full

Stack

Completato

Chatbot Avanzato su Knowledge Base

Implementazione architettura avanzata di agente chatbot per rispondere a domande utenti usando knowledge base di pagine web e documenti PDF. Sistema progettato con agente orchestratore principale che instrada richieste a cinque sotto-agenti specializzati. Sviluppo pipeline gestione dati con parsing PDF, strategia chunking e layer sicurezza per domande inappropriate.

Dialogflow CXGCPMulti-AgentRAG

Sotto-Agenti

Multi

Domini

PDF+Web

Documenti

Completato

Agente Multimodale in Tempo Reale

Sviluppo e implementazione agente conversazionale multimodale in tempo reale basato su Google Agent Development Kit (ADK). Sistema capace di processare input audio e video simultaneamente, sostenere conversazioni fluide ed eseguire autonomamente operazioni su browser tramite reasoning e tool. Architettura asincrona dual-server con comunicazione WebSocket per streaming bidirezionale a bassa latenza.

Google ADKGemini Live APIMultimodal AIBrowser Automation

<500ms

Latenza

A+V

Modalità

Async

Architettura

Completato

Assistente Virtuale per Yacht di Lusso

Implementazione assistente virtuale con obiettivo di rispondere a domande utenti basate su knowledge base aziendale. Configurato come applicazione RAG (Retrieval-Augmented Generation), sfruttando Google Cloud ADK e Vertex AI Search per recuperare informazioni rilevanti da datastore dedicato. Architettura usa modelli Gemini per processare richieste e generare risposte accurate e contestualizzate in italiano.

RAGVertex AI SearchGoogle ADKGCP

Gemini

LLM

95%

Accuratezza

RAG

Tecnologia

Completato

Sistema Ticketing Multi-Agente

Implementazione sistema ticketing multi-agente per automatizzare risposte utenti. Progetto sviluppato come Proof of Concept (POC), coinvolgendo creazione agenti specializzati, ciascuno capace di interagire con database esterni via API per fornire risposte accurate e complete. Architettura multi-agente assicura che richieste utenti siano instradate all'agente più competente, riducendo carico lavoro staff e costi gestione.

Multi-AgentGoogle ADKAPI IntegrationAutomation

-70%

Carico Lavoro

Multi

Agenti

POC

Tipo

Completato

Pipeline Classificazione Email Basata su LLM

All'interno progetto più ampio mirato ad automatizzare processo manuale e ridurre costi operativi, contributo focalizzato su creazione pipeline basata su LLM per classificazione e smistamento email certificate (PEC). Attività chiave includono prompt engineering e few-shot learning per raffinare output modelli, insieme a sviluppo metriche e strumenti analitici per valutazione performance sistema.

LLMPrompt EngineeringFew-Shot LearningProcess Automation

High

Riduzione Costi

Few-Shot

Tecnica

85%

Automazione

Completato

Motore Liquidazione Assicurativa - Progetto Demo

Sviluppo architettura collaborativa multi-agente completa per dimostrazione Sharing Days interno. Sistema analizza automaticamente, processa ed emette giudizi di liquidabilità su pratiche assicurative. Architettura combina agenti paralleli per analisi documenti con agenti sequenziali per valutazione finale, utilizzando tool custom, servizi Google Cloud built-in e integrazione MCP.

Google ADKMulti-AgentCloud RunMCP

Tipi Agenti

Hybrid

Architettura

Demo

Scopo

Ricerca Accademica

Ricerca & Lavoro Accademico

8 paper

80+ pagine

6 cum laude

Machine Learning

Rilevamento Malattie Cardiache da Segnali Audio

Machine Learning Biomedico Avanzato

Progettati ensemble per la prevenzione e il supporto clinico dello screening cardiaco sul Dangerous Heartbeat Dataset (CHSC2011). I toni cardiaci sono stati ricampionati a 4 kHz, suddivisi in finestre da 1 secondo, descritti con MFCC, cromagrammi, descrittori spettrali e temporali e ridotti da 338 a 41 feature tramite filtri basati su Spearman. L’ensemble di prevenzione limita i falsi negativi (ROC-AUC 0.96, TPR 43.4% a 1% FPR) mentre l’ensemble diagnostico a cinque classi raggiunge macro F1 81.6 con analisi di rischio per classe e spiegazioni SHAP.

Risultati Chiave

0.82

F1-Score

0.96

ROC-AUC

43.4%

TPR @1% FPR

74.3%

TPR @5% FPR

86.6%

TPR @10% FPR

lug 2024

17 pagine

Scikit-learnTorchaudioLibrosa

DettagliCode

Graph ML

Predizione Malattie con Graph Machine Learning

Data Science Finanziaria

Rappresentate 773 malattie e 377 sintomi in una rete bipartita per ingegnerizzare feature grafo-aware utili alla diagnosi. Method of Reflections, indici di Influenza di malattia/sintomo, rilevamento di comunità e betweenness centrality generano nuovi descrittori a complemento del one-hot dei sintomi. Sono stati confrontati modelli di Regressione Logistica, Random Forest e MLP; il modello logistico migliore eguaglia la baseline basata sui soli sintomi usando meno input e fornendo insight sull’accuratezza per classe.

Risultati Chiave

Logistic Regression

Best Model

28%

Feature Reduction

1.5%

Accuracy Drop

dic 2023

23 pagine

PythonNetworkXScikit-learn

DettagliCode

Big Data

Predizione Utilità Recensioni con Big Data

Data Science & Big Data Analytics

Analizzati circa 3 milioni di recensioni di libri Amazon con uno stack big data (HDFS, Spark, MongoDB) per spiegare e predire l’utilità percepita. I test d’ipotesi hanno quantificato l’impatto di lunghezza, sentiment e valutazione in stelle, mentre embedding Word2Vec hanno alimentato regressori Random Forest, SVR e MLP. Il miglior Random Forest ha ottenuto MSE 0.0259 (RMSE 0.1609, R² 0.253).

Risultati Chiave

Random Forest

Best Model

0.026

MSE

0.25

R²

set 2023

6 pagine

Hadoop HDFSApache SparkPySpark

DettagliCode

NLP

Rilevamento Clickbait in Titoli di Notizie

Machine Learning

Confrontati Multinomial Naive Bayes e Regressione Logistica su 32 mila titoli bilanciati per rilevare il clickbait. Sono stati esplorati due obiettivi: massima accuratezza (97.12% sul test con stopword e vocabolario da 8k) e assenza di falsi positivi (0% FPR, accuratezza 84%, TPR 68%). Un’analisi puntuale degli errori evidenzia le parole più impattanti e i trade-off introdotti dalla calibrazione del bias.

Risultati Chiave

97.12%

Accuracy

0.0%

Best FPR

84.00%

FPR Accuracy

8000 words

Vocabulary

feb 2024

6 pagine

PythonScikit-learnNumPy

DettagliCode

Security

Rilevamento e Mitigazione Attacchi DDoS

Infrastruttura Digitale d'Impresa

Ricreati attacchi di riflessione e amplificazione DNS in una LAN controllata per misurare fattori di amplificazione, latenza sul bersaglio e risorse del server. Script Scapy personalizzati hanno effettuato spoofing del bersaglio variando i tipi di query (A, MX, NS, ANY) tra 10k e 50k pacchetti/s. Lo studio documenta latenza oltre 100 ms per le richieste ANY, saturazione della CPU durante gli attacchi intensificati e valuta contromisure.

Risultati Chiave

1.46

AF A

4.14

AF MX

4.46

AF NS

gen 2024

11 pagine

PythonScapyWireshark

DettagliCode

Machine Learning

Analisi Features per Classificazione Torte

Machine Learning

Confrontati descrittori hand-crafted e feature derivate da CNN per classificare 15 categorie di torte (1.800 immagini). Le statistiche di basso livello (istogramma dei colori, direzione dei bordi, matrice di co-occorrenza) alimentavano un MLP ma si sono fermate al 31% di accuratezza, mentre le mappe di PVMLNet (layer −5) abbinate a un MLP hanno raggiunto il 90% sul test. Il transfer learning con PVMLNet fine-tunata si è fermato all’80%, evidenziando il valore delle rappresentazioni profonde.

Risultati Chiave

90%

Accuracy

90%

Neural Features

31%

Low-Level Features

80%

Transfer Learning

feb 2024

5 pagine

Pythonpvml libraryPVMLNet

DettagliCode

Computer Vision

Rilevamento Punti di Fuga nelle Immagini

Computer Vision

Realizzate due utilità di computer vision: (1) uno strumento di binarizzazione guidato dall'istogramma con tuning auto/manuale e GUI, e (2) un rilevatore di punti di fuga che combina Canny, Hough probabilistico e RANSAC (500 iterazioni, tolleranza 5 px). La pipeline adatta le soglie alle statistiche dell'immagine, sovrappone le 15 linee più significative e documenta confronti SSIM con Otsu.

Risultati Chiave

500

RANSAC Iterations

5 pixels

Threshold

10 longest per run

Hough Lines

mar 2024

7 pagine

Python 3.9+OpenCVNumPy

DettagliCode

NLP

Analisi del Sentimento sui Social Media

Machine Learning

Implementati classificatori di sentiment sul dataset IMDb (50k recensioni) confrontando Naive Bayes Multinomiale e Regressione Logistica. Sono stati analizzati dimensione del vocabolario, rimozione di stopword e stemming per bilanciare accuratezza e overfitting. Naive Bayes con stopword (vocabolario 1k) ha raggiunto l’82.6% sul test, mentre la Regressione Logistica è arrivata all’85.4% con tuning minimo.

Risultati Chiave

85.4%

Accuracy

82.6%

MNB Accuracy

85.4%

LR Accuracy

1000 words

Best Vocabulary

feb 2024

5 pagine

PythonScikit-learnNLTK

DettagliCode

Progetti Personali

Trasformare le idee in realtà attraverso codice e creatività.

In Cucina con Chiara

Un blog di cucina che offre una vasta gamma di ricette, dai piatti tradizionali a idee veloci. Include un pianificatore di pasti, convertitore di ricette e un assistente culinario basato su AI.

incucinaconchiara.com

Visita Sito

Liberti Hub

Un hub di conoscenza progettato per rendere i concetti di Data Science e AI accessibili e intuitivi. Copre Machine Learning, Deep Learning, Big Data e Statistical Learning con spiegazioni chiare ed esempi pratici.

libertihub.altervista.org

Visita Sito

Le Mie Passioni

Oltre il Lavoro

Altre cose che amo fare

Fare Sport

Corpo Attivo, Mente Attiva

È importante per me avere momenti per prendermi cura della mia salute. Ho allestito una piccola palestra a casa e amo anche giocare a tennis e calcio.

Guardare la Formula 1

Il Mix Perfetto di Passione, Abilità e Strategia

Amo la Formula 1 perché rappresenta l'apice delle corse, combinando tecnologia all'avanguardia con abilità umana e pensiero strategico.

Se non vai più per un varco che esiste, non sei più un pilota da corsa. — Ayrton Senna

Guardare il Calcio

Una Tradizione di Famiglia Duratura

Ho ereditato da mio nonno la passione per il calcio e per il tennis. Amo guardare e analizzare le partite e sono un grande tifoso del Milan da sempre.

Contatti

Connettiamoci

Aperto a opportunità e collaborazioni. Sentiti libero di contattarmi!

Connettiamoci

Aperto a opportunità e collaborazioni

andalberti99@gmail.com

Andrea Alberti

GitHub

@AndreaAlberti07

Tempo di Risposta

Di solito entro 24 ore