Comment convertir une image ou photo avec du texte en texte entièrement modifiable.

Le sigle OCR vient de : Optical Character Recognition. En français, ROC (Reconnaissance Optique de Caractères). Ce programme est lié à la numérisation de textes ; il identifie automatiquement à partir d'une image des caractères ou des symboles appartenant à un alphabet, puis les enregistre sous forme de données pour pouvoir plus tard les manipuler grâce à un programme de traitement de texte ou autre programmes similaires.

Ce type de logiciel ou service peut être utile pour les utilisateurs qui voyagent à l'étranger et qui doivent faire face à différents signes ou à des affiches à traduire, qui peuvent être très difficile à transcrire sur leur ordinateur ou smartphones pour une traduction ultérieure. D’autres utilisateurs pouvant également être intéressés sont ceux qui se servent couramment de fichiers PDF qui ne permettent pas la modification ou la copie du texte pour l’éditer dans d'autres logiciels bureautiques comme ils le souhaitent.

De cette façon, nous avons besoin seulement de prendre une capture photo du texte ou d’une image contenant n'importe quel texte, et nous pouvons les transformer totalement ou les convertir en texte éditable et manipulable. Vous pouvez trouver ce logiciel ou ce service sous différentes formes: logiciel de bureau,  page Web ou service Web bureautique.

La plupart de ces services ou logiciels sont gratuits. Si vous voulez connaitre les plus importants, nous vous les présentons ci-dessous:

Google Drive (bureau Online Suite)

Google Drive en utilisant votre éditeur de texte Google Docs peut effectuer des captures de texte d’une image pour pouvoir les modifier plus tard dans l'éditeur de texte choisi.  

- La première chose à faire est d’accéder à Google Drive depuis votre ordinateur. Pour cela vous avez besoin d'un compte Google ou Gmail.
- Une fois que vous vous trouvez dans l'interface de Google Drive, téléchargez le fichier image dont vous voulez capturer le texte.
- Une fois que le fichier est téléchargé, faites un clic-droit sur celui-ci et sélectionnez l'option «Ouvrir avec ... Google Docs".
- Quand Google Docs s'ouvre, il affiche l'image sélectionnée et, juste en dessous d’elle, s’affiche le texte qui apparaît sur l'image ouverte. Maintenant, vous pouvez utiliser le texte comme bon vous semble.
Le résultat est assez bon, car il reconnait le formatage de base tel que le gras et l’italique.

FreeOCR.net Télécharger (Software)

FreeOCR est libre et sa principale fonction est de reconnaître du texte à partir d'images et de PDF. Le programme est capable d’utiliser des documents importés du scanner ou avec des fichiers déjà créés, de sorte que le travail avec le document est immédiat. Il est également fourni avec un soutien linguistique de 11 langues, y compris le français.

L'interface est facile à utiliser car elle est tout à fait similaire à la barre d'outils de Microsoft Office dans sa version la plus récente. Vous avez en effet accès aux fonctions du programme à travers des icônes.

 
OCR est utilisable de deux manières: en se servant d’un fichier de texte que vous avez rédigé ou que vous possédez, ou bien en scannant un fichier avec FreeeOCR. Utilisez l’option souhaitée sur la barre d'outils. Si vous choisissez de parcourir le contenu, le programme vous proposera de sélectionner un périphérique de numérisation et de régler les paramètres de base, tels que la couleur (noir / blanc, couleur, niveaux de gris) et la taille du document.

Si vous avez déjà un document PDF ou une image dans la mémoire de l'ordinateur, le fichier doit être seulement ouvert et lu après l'exécution du programme. Les formats d'image populaires sont facilement pris en charge par FreeOCR.

L’exécution d’OCR est rapide. Dans la fenêtre de droite le fichier reconnu sera affiché comme texte, ce qui rend plus facile la réalisation des opérations secondaires, comme sauvegarder ou éditer en format COD, RTF ou d’autres formats. Vous pouvez choisir une police par défaut que vous avez enregistré.

ABBYY FineReader Professional Edition (logiciel)

ABBY FineReader Professional Edition est un programme pour convertir OCR, PDF, images scannées et photos numériques en un format qui peut être édité. Le programme permet de préserver de façon précise et en toute sécurité la disposition du document original. La dernière version de FineReader propose les dernières technologies: L'Adaptive Document Recognition Technology (ADRT) analyse l'ensemble du document plutôt que le faire page par page. Elle est capable de traiter très précisément des fichiers texte et des formats contenant du texte, notamment la mise en page, le style et le format. 

La caméra OCR a été mise à jour et elle identifie maintenant automatiquement les images de la caméra numérique en ajustant la distorsion pour obtenir de bons résultats dans l’OCR sans avoir à configurer les paramètres avant le changement. L'interface est axée sur les résultats et l'automatisation de QuickTasks  pour que la conversion devienne la plus rapide, précise et facile possible. Le programme reconnait 179 langues.

Image to PDF OCR Converter. (Logiciel)

Image to PDF OCR Converter convertit directement TIFF, JPEG, TIF, BMP et d'autres formats d'image en format PDF, ce qui permet effectuer des recherches. Avec ce programme, vous pouvez créer facilement des fichiers PDF et pouvez convertir de JPEG en PDF, de PNG en PDF, de GIF en PDF, de TIFF en PDF, de BMP en PDF, ou d’EMF en PDF. Il est compatible avec B/W et peut, avec une image claire, créer des PDF de haute résolution.
 

Free Online OCR (Page Web)

La tendance actuelle et la plus recommandée est l'utilisation des services Web sans avoir à télécharger et installer le logiciel sur votre ordinateur.

Le service web gratuit OCR en ligne vous permet de télécharger un fichier PDF (ou une image) pour obtenir directement du texte. Cette option est peut-être la plus attractive vers laquelle vous pouvez vous tourner. L’exécution se compose de seulement deux étapes. La première est le choix du fichier de votre disque. La seconde est la sélection du format de sortie du texte capturé. Les formats de sortie parmi lesquels vous pouvez choisir sont PDF, TXT, DOC et RTF. En quelques secondes, vous pouvez commencer à télécharger les résultats sur votre ordinateur.

 
Le fichier obtenu ne contient pas la même qualité que celui fait par Google Docs, et certains paragraphes peuvent même être omis, mais en retour vous pouvez créer un document de type DOC en gardant le format d'origine, ce que Docs Google ne permet pas.

NewOCR (Page Web)

Une alternative, qui comprend un peu plus de publicité, est NewOCR, qui a plus de sources et reconnaît jusqu'à 58 langues, possède un grand nombre d'options, et de formats d’entrée et de sortie. L'inconvénient: il extrait seulement du texte sans format.

Le fonctionnement est très similaire à celui des autres sites. Utilisez une URL ou sélectionnez un fichier à partir de votre ordinateur. Après avoir choisi votre langue, vous avez seulement à cliquer sur le bouton Télécharger. NewOCR affichera la captation du texte en-dessous, mais non formaté, il sera donc nécessaire de le copier et de le coller dans un éditeur de texte.

OCR en ligne (Page Web)

Le processus comporte deux étapes, vous avez seulement à télécharger l'image et la reconnaissance est effectuée après l'introduction d'un CAPTCHA.
Free OCR en ligne a sur son site Internet une version payante et une version gratuite. La différence entre les versions est un nombre de limitations dans la version libre. Ces limitations sont les suivantes : vous ne pouvez convertir que 15 images par heure, jusqu'à 4 Mb et vous n’êtes pas autorisé à charger plusieurs images en un seul ZIP.

Cependant, il présente un certain nombre d'avantages. Par exemple le fait qu’il ne soit pas nécessaire de l’installer. Il reconnaît le texte et les caractères des documents PDF scannés (y compris des documents de plusieurs pages) et des photographies captées par des caméras numériques. Vous avez également dans la version gratuite la reconnaissance de 32 langues.


Il convertit en texte des images en formats (JPG, JPEG, BMP, TIFF, GIF) et les transmet aux formats de sortie Word, texte, Excel, PDF et HTML

Les documents traités avec ce programme sont identiques à l'original, y compris les graphiques, les colonnes et les tableaux qui peuvent être contenues.
Plus tard, le résultat ressemblera au texte brut, mais il pourra être téléchargé au format que vous choisirez: DOC, XLS ou TXT.

Le résultat atteint est surprenant, dépassant tous les précédents. Il reconnait le texte parfaitement et il l’affiche au format DOC en respectant la mise en page originale (bien que les images apparaissent en noir et blanc).

Commentaires