Come eseguire l'OCR dei documenti online con ABBYY FineReader

Se stai andando senza carta, avrai bisogno di un modo semplice per rendere ricercabili i tuoi documenti scansionati in modo che siano più che semplici immagini statiche dei tuoi documenti cartacei. Abbiamo già esaminato le modalità per i documenti OCR in app come Adobe Acrobat, PDFPen e Google Drive. Sebbene ognuna di queste app possa riconoscere il testo nei tuoi documenti, non è la loro funzione principale.

Forse uno degli sviluppatori di OCR più conosciuti è ABBYY, che produce diversi programmi di gestione senza carta. In questo tutorial, ti mostrerò come puoi utilizzare la loro app web FineReader e la sua tecnologia OCR per convertire PDF, scansioni e altri file immagine in testo modificabile.

Il vantaggio di ABBYY FineReader

Anche se la versione online non è potente quanto la versione desktop, ABBYY FineReader Online è forse il servizio OCR online più potente disponibile ora. 

Pre-elaborazione

ABBYY FineReader estrae la maggior parte del lavoro che sarebbe stato necessario per consentire all'OCR di avere successo in un altro servizio, poiché la pre-elaborazione viene eseguita nell'app stessa. ABBYY FineReader corregge le distorsioni dell'immagine, come l'orientamento della pagina e il rumore, prima di avviare la scansione. Naturalmente, aspetti come la luminosità e la qualità dell'immagine dipendono dall'utente, ma non è necessario apportare ulteriori modifiche all'utente.

Il processo di scansione

Dopo la pre-elaborazione, ABBYY FineReader suddivide il documento in elementi quali tabelle, immagini e blocchi di testo prima di rilevare linee e singole lettere e parole. La tecnologia determina quindi la relazione tra tutte le proprietà della pagina. Questo per garantire una replica accurata non solo del testo nel documento, ma dell'intero layout della pagina stessa.

Supporto linguistico

ABBYY FineReader Online supporta attualmente 42 lingue, anche quelle con caratteri non latini come l'ebraico e il coreano. C'è un supporto di dizionario per 37 di queste lingue, che aiuta a creare una ricreazione ancora più accurata controllando le parole rilevate in almeno un dizionario. Il servizio è in grado di eseguire OCR su documenti con un massimo di tre lingue diverse in un dato momento.

L'elenco completo delle lingue supportate per ABBYY FineReader Online.

Oltre al supporto linguistico, il servizio può eseguire la scansione di vecchi testi in tedesco e lettone che sono stati impostati in caratteri neri, rendendo ABBYY FineReader Online un'opzione praticabile per l'OCR dei documenti storici. 

Il costo

Un servizio così potente non arriva senza un prezzo. L'OCR su ABBYY FineReader Online non è troppo costoso: i crediti di pagina costano tra $ 3- $ 10 USD per incrementi rispettivamente di 20-200 pagine. Tuttavia, ricevi 20 crediti pagina gratuitamente al momento della registrazione per il servizio.

Il processo OCR

Dopo aver effettuato l'accesso all'account ABBYY FineReader Online, verrai reindirizzato alla pagina di caricamento. 

Iniziare

Innanzitutto, trova il documento o l'immagine che desideri caricare e assicurati che ABBYY FineReader supporti OCR per il tuo file. Il servizio supporta OCR per file PDF, .jpg, .png, .bmp, .pcx, .dcx, .tif, .gif e .djvu. La dimensione massima del file è 30 MB. 

Mancia: Per i migliori risultati, assicurati che il tuo file sia di alta qualità e che la dimensione del testo sia almeno di 9pt o 10pt. 

Se si desidera eseguire l'OCR di un documento fisico, utilizzare uno scanner hardware, come Doxie o un'app mobile per convertire il documento fisico in un formato di file compatibile con ABBYY FineReader.

Caricamento del documento

Una volta che il documento è pronto per il caricamento, fai clic su Caricare pulsante sotto il Carica un file da elaborare campo. Trova il tuo file in Finestra del Finder, e fare clic Aperto. Consiglierei di controllare il Inviami un link per il download via e-mail casella appena sotto il campo del file per un facile accesso al documento ricreato dopo che è stato eseguito l'OCR. Il file caricato appare nel Seleziona i file da elaborare seleziona alcune sezioni di seguito.

Seleziona un file per il caricamento.

Quindi, definire le lingue del documento sotto Seleziona la lingua (s) del tuo documento campo. Scorri l'elenco fino a trovare le lingue del documento. Se ne hai più di uno, seleziona le lingue aggiuntive tenendo premuto il pulsante Comando chiave, se si utilizza un Mac o il Controllo chiave, se si utilizza un PC e si fa clic.

ABBYY FineReader Online supporta OCR per un massimo di tre lingue in un singolo documento.

Se si esegue la scansione di un documento precedente impostato in nero, fare clic su collegamento ipertestuale a destra della casella di selezione della lingua. L'elenco delle lingue cambierà e offrirà le opzioni tedesche e lettoni corrette per l'OCR.

Quindi, vai al Seleziona un formato di output campo per selezionare il formato in cui il file verrà OCR. A questo punto, ABBYY FineReader Online può esportare i file come Microsoft Word o Excel (nei formati sia della versione 97-2003 e della nuova versione), Open Office, PDF, RTF o Testo normale. Scegli il formato in cui desideri convertire il documento finale dal menu a discesa. 

Seleziona un formato di output dal menu a discesa.

Mancia: Quando selezioni l'output del documento, fai attenzione alle tabelle, ai grafici e ad altre immagini che potrebbero trovarsi nel tuo documento di input, poiché il word processor potrebbe non essere in grado di gestirli correttamente e ottenere scarsi risultati.

Assicurati che i documenti che vuoi OCR siano spuntati nel Seleziona i file da elaborare campo. Ora, premi il Riconoscere e ABBYY FineReader avvierà l'OCR. 

stampa Riconoscere per iniziare il processo OCR.

Elaborazione del documento

Dopo aver premuto Riconoscere, verrai reindirizzato al Cronologia delle attività pagina, dove potrai controllare i progressi del documento OCR. A seconda delle dimensioni del file, l'OCR può richiedere da pochi secondi a pochi minuti. 

L'elaborazione può richiedere tra pochi secondi e alcuni minuti.

Al termine dell'elaborazione, puoi scaricare il documento nel formato che hai selezionato, nonché esportare il documento direttamente dall'app Web su Google Drive, Evernote e Dropbox. È anche possibile valutare la qualità del lavoro OCR, che consente ad ABBYY di migliorare i propri prodotti. 

Al termine dell'elaborazione, è possibile scaricare il documento o esportarlo direttamente su un servizio cloud.

I documenti OCR rimangono sul server di ABBYY FineReader per due settimane prima che vengano automaticamente eliminati. 

Ora vai al lavoro!

ABBYY FineReader Online è un modo semplice per OCR di documenti complicati sul web a basso costo. Sebbene non sia completamente perfetto mentre si gestiscono immagini e altri elementi stilistici, traduce il testo in modo impeccabile, anche in documenti con più di una lingua, in molti diversi formati di file modificabili. 

In caso di problemi con OCR in ABBYY FineReader Online, o qualsiasi idea o preoccupazione relativa all'OCR o in generale senza carta, lasciare un commento sotto!