Servizi informativi per edilizia · Italia

Riconoscimento testo per PDF di delibere — meno controllo manuale, dati migliori

La situazione di partenza

Migliaia di delibere comunali italiane all’anno vengono lette da una pipeline OCR/NER più datata. Con la qualità campo esistente, troppi match anagrafici errati finiscono nel database, le euristiche sulle date confondono varianti di formato, accenti e rotture layout richiedono controllo manuale.

Come la risolviamo

Ricostruiamo la pipeline con Document AI moderna — LLM vision per OCR e information extraction, cross-check su due modelli, ricerca di progetti precedenti tramite database vettoriale. I dati anagrafici non lasciano l’infrastruttura cliente; solo i candidati top-K vanno al reranker LLM. Una confidence heatmap nell’interfaccia porta ai revisori solo i campi sotto soglia.

Cosa porta

La qualità dei dati sui campi critici — ente appaltante, numero delibera, data, importo — migliora sensibilmente. I falsi positivi diminuiscono, il controllo manuale si concentra sui casi davvero incerti e il database diventa più affidabile come base di calcolo e indice di ricerca.

Riconosci un processo simile nella tua azienda?

Se questo caso d'uso è vicino al tuo lavoro quotidiano, valutiamo insieme dati disponibili, impegno e un primo MVP realistico.

Perché i progetti IA funzionano

Questo caso d'uso si basa su un progetto cliente reale. Settore e regione sono indicati, l'azienda resta anonima.