Accéder au contenu principal

Scanner du texte avec un smartphone, c'est possible!

Les smartphones et autres PDA communiquant disposant d'une optique à 5 megapixels devenant légion, on pouvait légitimement se poser la question: est-ce qu'avec un tel mobile  je peux scanner une page de journal et la transformer en texte lisible par Word?
La réponse est oui, sans problème!
Ci-contre une page de 01 Informatique photographiée sur un coin de bureau en lumière ambiante avec un HTC Touch HD à 5 megapixels.
La page est enregistrée en format .jpg, lue par Omnipage 16, qui repère les zones de texte tout de suite, sauf le petit aplat couleur en haut à droite qu'il faut lui indiquer.


On lance la conversion avec les réglages par défaut et on obtient le texte Word ci-joint qui est déjà très bon. On voit juste que la lettrine n'a pas été bien traitée, problème classique.
Le tout s'est fait en quelques minutes.
Les ajustements du texte pour en faire quelque chose de parfait en Word demanderont néanmoins quelques minutes de plus, n'exagérons quand même pas! Notamment sur les encadrés avec des aplats couleurs et des listes à puce, qui perturbent un peu le logiciel OCR.
Mais une nouvelle étape est assurément franchie dans l'accès à l'information, car cette démo sur une page de magazine peut se répéter sur de nombreux types de documents.

Commentaires

Posts les plus consultés de ce blog

Concerné ou impliqué? La métaphore de l'oeuf au bacon

En attendant de répondre plus longuement à Baron(sur communication et information) qui me signale qu'elle est concernée voire impliquée... "Etre impliqué ou "être concerné"? : pour faire comprendre la différence à des gens, par exemple en séminaire de motivation des troupes, vous leur dites simplement: "Si vous voulez faire des oeufs au bacon, vous avez besoin, au départ, d'une poule et d'un cochon; la différence à l'arrivée, dans votre poèle, c'est que la poule est concernée mais le cochon, lui, est impliqué."

Newsletter Galerie Amavero art et poésie

Abonnez-vous à notre newsletter "Galerie Amavero art et poésie" sur Linkedin!  Vous aurez ainsi les dernières news et publications de poèmes écrits inspirés par des œuvres d'art contemporain, publiés côte à côte, œuvre et texte, sur notre galerie virtuelle. Nous en sommes à 27 artistes et 9 auteurs et le groupe grandit tous les jours! S’abonner Newsletter

Supprimer les DRM des ebooks: une solution qui marche

La plupart des soi-disant solutions qu'on vous propose pour supprimer les DRM  (Digital Rights Management), des ebooks, afin de pouvoir les lire sur le terminal/liseuse de votre choix, sont des copier-coller des mêmes remèdes. Ceux-ci ont un seul défaut: ils ne sont pas mis à jour et donc ils ne marchent plus dès que les éditeurs, comme s'ils n'avaient pas mieux à faire, par exemple élargir leur bibliothèque ridicule d'ebooks,  s'amusent à renforcer leurs DRM ces soi-disant droits de protection antipiratage qui ne sont que des abus du droit et qui devraient être interdits. Bref j'ai trouvé et testé une solution qui marche, dans ma configuration actuelle: logiciel de gestion de bibliothèque d'ebooks Calibre 1.47, sous Mac OS 10.9.4. Mais il y a aussi des solutions Windows. Cette solution est décrite sur le blog Apprentice Alf's Blog et il propose les liens suivants: "The latest tools_v6.0.8.zip can be downloaded from http://www1.datafilehost.c