Obiettivo del progetto
Restare aggiornato su AI, sviluppo web e automazione richiede ore di lettura al giorno tra newsletter, blog e feed. L'obiettivo era ribaltare il flusso: non andare a cercare i contenuti, ma farsi consegnare ogni mattina solo quelli rilevanti, già classificati e con una sintesi pronta all'uso.
Problema iniziale
- decine di fonti (RSS, blog, newsletter) con un rapporto segnale/rumore molto basso;
- gli stessi contenuti rimbalzano su più fonti e arrivano duplicati;
- la valutazione "vale la pena leggerlo?" consuma più tempo della lettura stessa;
- gli spunti interessanti si perdono se non vengono archiviati subito in modo strutturato.
Come funziona il workflow
Il sistema è un workflow n8n schedulato che esegue una pipeline in cinque fasi:
- Ingestione — un trigger schedulato raccoglie gli articoli dalle fonti RSS configurate;
- Deduplica — normalizzazione degli URL e confronto con lo storico per scartare i contenuti già processati;
- Classificazione AI — ogni articolo passa da un nodo LLM (OpenAI) che assegna categoria, punteggio di rilevanza e una sintesi di due righe, con output vincolato a uno schema JSON;
- Archiviazione — gli articoli sopra soglia vengono salvati in un database Notion con metadati (fonte, categoria, punteggio, data);
- Consegna — ogni mattina un messaggio Telegram riepiloga i contenuti migliori del giorno, ordinati per rilevanza.
Scelte tecniche
- Output strutturato dall'LLM: il nodo di classificazione forza una risposta JSON validata prima di proseguire — se il parsing fallisce, l'item viene accodato per un retry invece di rompere la run;
- Batch e rate limiting: gli articoli vengono processati in batch per contenere i costi API e rispettare i rate limit;
- Error handling: un error workflow dedicato notifica su Telegram le run fallite con il contesto dell'errore, così niente si perde in silenzio;
- Costi sotto controllo: il filtro di deduplica avviene prima della chiamata LLM, così si paga l'inferenza solo sui contenuti realmente nuovi.
Stato attuale
Il workflow è attivo e in evoluzione: la roadmap prevede lo scoring basato sullo storico delle letture e la generazione assistita di bozze per i contenuti da ripubblicare.
Cosa dimostra nel portfolio
- progettazione di pipeline dati end-to-end su n8n (trigger, branching, error handling);
- integrazione LLM in un flusso di automazione con output strutturato e gestione dei fallimenti;
- attenzione a costi API, deduplica e idempotenza — le cose che distinguono un'automazione robusta da una demo.