Google Docs introduce l'OCR

Puoi estrarre testi da PDF.

google_docs_167407
|

Gli utenti di Google Docs saranno contenti di sapere che da oggi possono estrarre testo da immagini e PDF in maniera del tutto gratuita. Tramite il procedimento chiamato OCR (optical character recognition) è possibile importare PDF e immagini convertendoli in testo. Finora le uniche possibilità di OCR sono soprattutto date da prodotti commerciali o open source, in un intervallo di qualità abbastanza ampio. Da oggi si potrà fare OCR anche da Google docs: la possibilità è data nell'apposita pagina upload di documenti. Al momento dell'invio, infatti, basta selezionare un apposito campo "Convert text" per effettuare l'analisi ed estrapolare del testo.

 

Anche se questa funzionalità è stata introdotta dopo svariati mesi di testing e sviluppo, il prodotto è ancora carente. Difatti, in alcune prove si è visto che l'OCR di casa Google presenta ancora dei problemi ed è ancora immaturo. Ad esempio non riesce in nessun modo a riconoscere la formattazione e, stranamente, ha risultati peggiori con caratteri di dimensione maggiore.

 

Chi deve utilizzarlo in maniera massiccia o per scopi professionali dovrà ancora affidarsi a prodotti commerciali a pagamento. Ma si sa com'è Google, chissà se prima o poi darà battaglia anche in questo campo.

 

23 giugno 2010