Successivo

HowTo

Software Ocr e la gestione delle tabelle

Redazione | 27 Giugno 2014

Scanner Software

Domanda: Ho installato Cuneiform Ocr dal link riportato sul Dvd virtuale allegato a PC Professionale di Febbraio scorso ma non […]

Domanda: Ho installato Cuneiform Ocr dal link riportato sul Dvd virtuale allegato a PC Professionale di Febbraio scorso ma non riesco in alcun modo ad acquisire le tabelle. Alla pressione dell’apposito pulsante il software produce un errore “nessuna tabella” e nel menù dei blocchi riconosciuti la voce relativa risulta disattivata. Inoltre, anche per documenti contenenti solo testo ed immagini, dopo il riconoscimento il programma apre i contenuti in un editor Rtf ma non permette di effettuare un controllo di quanto acquisito a monte del salvataggio. Infine dopo il salvataggio non viene effettuato il refresh della pagina, continuando così a visualizzare artefatti della finestra di salvataggio (o di altre schermate), rendendo praticamente impossibile proseguire il lavoro. Ho provato l’installazione su altri due Pc diversi dal mio ma le situazioni che vi ho descritto si sono ripresentate in maniera del tutto analoga.

Avete già  avuto segnalazioni o notizie in merito? Vorrei infine un chiarimento riguardo al software Ocr di Abbyy Software. Qualche anno fa avevo installato FineReader 5.0 che era stato anch’esso fornito in allegato alla vostra rivista.

cuneiform22Risposta: Cuneiform Ocr è stato uno dei principali concorrenti di mercato del FineReader di Abby Software. Entrambi questi applicativi sono stati sviluppati in Russia come prodotti commerciali poi a partire dal 2007 Cuneiform è stato rilasciato, completo dei sorgenti, sotto forma di freeware. Questo software implementa una strategia di riconoscimento dei caratteri che gli consente di acquisire con una ridotta percentuale di errori anche testi che siano stati fotocopiati più volte oppure pagine provenienti da fax o stampanti ad aghi. In generale si hanno risultati accettabili anche per quanto riguarda la preservazione della formattazione del documento originale. Più complicato è il caso delle tabelle: nonostante questo software preveda l’acquisizione anche di fogli elettronici, sembra avere qualche difficoltà  nell’isolare le tabelle quando questi elementi sono circondati dal testo. Infatti in molti casi la tabella viene acquisita sotto forma di unica colonna di testo oppure trasformata in immagine. A discolpa del Cuneiform Ocr possiamo dire che questa operazione è tra quelle che mettono facilmente in crisi anche i software di riconoscimento testi più avanzati e non bisogna quindi sorprendersi se i risultati ottenuti non sono quelli sperati.

In alcuni test proprio le ultime versioni di FineReader sono risultate tra i migliori software che riescono a eseguire la conversione delle tabelle preservando sia la forma sia i contenuti. Purtroppo l’offerta che consentiva l’attivazione di FineReader 5.0 aveva una durata limitata e al momento non possiamo prevedere se in futuro potremo rinnovare la collaborazione con Abby Software.

Sul sito del produttore è però possibile scaricare ed installare una versione di prova dell’ultima versione di questo software che consentirà  di utilizzare l’Ocr gratuitamente per 30 giorni. In alternativa, con un utilizzo accorto dei motori di ricerca, il nostro lettore potrà  facilmente individuare alcune offerte che consentono di scaricare e attivare, per una durata illimitata, la versione Sprint di questo applicativo. Si tratta di un pacchetto ridotto rispetto alla versione commerciale, che spesso viene fornito a corredo degli scanner, ma riteniamo possa essere sufficiente per gli scopi del lettore.