Content Radar — Pipeline editoriale automatizzata

Obiettivo del progetto

Restare aggiornato su AI, sviluppo web e automazione richiede ore di lettura al giorno tra newsletter, blog e feed. L'obiettivo era ribaltare il flusso: non andare a cercare i contenuti, ma farsi consegnare ogni mattina solo quelli rilevanti, già classificati e con una sintesi pronta all'uso.

Problema iniziale

decine di fonti (RSS, blog, newsletter) con un rapporto segnale/rumore molto basso;
gli stessi contenuti rimbalzano su più fonti e arrivano duplicati;
la valutazione "vale la pena leggerlo?" consuma più tempo della lettura stessa;
gli spunti interessanti si perdono se non vengono archiviati subito in modo strutturato.

Come funziona il workflow

Il sistema è un workflow n8n schedulato che esegue una pipeline in cinque fasi:

Ingestione — un trigger schedulato raccoglie gli articoli dalle fonti RSS configurate;
Deduplica — normalizzazione degli URL e confronto con lo storico per scartare i contenuti già processati;
Classificazione AI — ogni articolo passa da un nodo LLM (OpenAI) che assegna categoria, punteggio di rilevanza e una sintesi di due righe, con output vincolato a uno schema JSON;
Archiviazione — gli articoli sopra soglia vengono salvati in un database Notion con metadati (fonte, categoria, punteggio, data);
Consegna — ogni mattina un messaggio Telegram riepiloga i contenuti migliori del giorno, ordinati per rilevanza.

Scelte tecniche

Output strutturato dall'LLM: il nodo di classificazione forza una risposta JSON validata prima di proseguire — se il parsing fallisce, l'item viene accodato per un retry invece di rompere la run;
Batch e rate limiting: gli articoli vengono processati in batch per contenere i costi API e rispettare i rate limit;
Error handling: un error workflow dedicato notifica su Telegram le run fallite con il contesto dell'errore, così niente si perde in silenzio;
Costi sotto controllo: il filtro di deduplica avviene prima della chiamata LLM, così si paga l'inferenza solo sui contenuti realmente nuovi.

Stato attuale

Il workflow è attivo e in evoluzione: la roadmap prevede lo scoring basato sullo storico delle letture e la generazione assistita di bozze per i contenuti da ripubblicare.

Cosa dimostra nel portfolio

progettazione di pipeline dati end-to-end su n8n (trigger, branching, error handling);
integrazione LLM in un flusso di automazione con output strutturato e gestione dei fallimenti;
attenzione a costi API, deduplica e idempotenza — le cose che distinguono un'automazione robusta da una demo.