Il y a un peu plus d’un an, je vous avais parlé d’une extension pour Chrome qui permettait de copier du texte sur une image : Project Naphta. Aujourd’hui, l’outil dont je vais vous parler est un peu différent puisqu’il s’agit d’un service en ligne gratuit qui permet d’extraire le texte d’une image grâce à la reconnaissance de texte (OCR : Optical Character Recognition) et qui se nomme tout simplement Free OCR. Ce n’est pas une nouveauté, loin de là, mais c’est un outil à connaitre !
Free OCR est donc un outil très simple d’utilisation qui va vous permettre de récupérer le texte sur des fichiers JPG, GIF, TIFF BMP ou même PDF (mais uniquement la première page).
Ce service fonctionne dans près de 30 langues dont le français (mais aussi l’anglais, l’espagnol, l’allemand… entre autre) et peut gérer les textes avec plusieurs colonnes.
Seule restriction, votre image ne doit pas faire plus de 2Mo, ne doit pas mesurer plus de 5 000 pixels de haut ou de large et vous êtes limité à 10 utilisations par heure (ce qui est assez peu restreignant).
Pour essayer, rendez-vous sur Free OCR, choisissez un fichier sur votre ordinateur, sélectionnez le langage dans lequel votre texte est écrit pour améliorer la reconnaissance, remplissez le captcha (le test anti-robot) et pressez sur « Send File ».
Comptez quelques secondes, et le tour est joué…
Voici un exemple que j’ai réalisé avec une image contenant du texte (un extrait de la page d’accueil de Byothe.fr) et en dessous le résultat extrait par Free OCR :
Et le résultat est plutôt bon… Bien sûr comme tout outil OCR, les résultats ne sont pas parfaits (et cela peut varier en fonction de la qualité de votre image), mais une chose est sûre c’est un outil qui peut s’avérer très pratique pour récupérer de longs textes sur des images.
A noter que la reconnaissance ne fonctionne pas avec des écritures manuscrites.
Article mis à jour le 28 décembre 2022 par Byothe