Servizi informativi per edilizia · Italia
Riconoscimento testo per PDF di delibere — meno controllo manuale, dati migliori
La situazione di partenza
Migliaia di delibere comunali italiane all’anno vengono lette da una pipeline OCR/NER più datata. Con la qualità campo esistente, troppi match anagrafici errati finiscono nel database, le euristiche sulle date confondono varianti di formato, accenti e rotture layout richiedono controllo manuale.
Come la risolviamo
Ricostruiamo la pipeline con Document AI moderna — LLM vision per OCR e information extraction, cross-check su due modelli, ricerca di progetti precedenti tramite database vettoriale. I dati anagrafici non lasciano l’infrastruttura cliente; solo i candidati top-K vanno al reranker LLM. Una confidence heatmap nell’interfaccia porta ai revisori solo i campi sotto soglia.
Cosa porta
La qualità dei dati sui campi critici — ente appaltante, numero delibera, data, importo — migliora sensibilmente. I falsi positivi diminuiscono, il controllo manuale si concentra sui casi davvero incerti e il database diventa più affidabile come base di calcolo e indice di ricerca.
Riconosci un processo simile nella tua azienda?
Se questo caso d'uso è vicino al tuo lavoro quotidiano, valutiamo insieme dati disponibili, impegno e un primo MVP realistico.
Perché i progetti IA funzionano →Questo caso d'uso si basa su un progetto cliente reale. Settore e regione sono indicati, l'azienda resta anonima.