Comment extraire le texte d’une image avec l’OCR
l’OCR est un procédé de reconnaissance optique des caractères. Il permet d’exploiter le texte que contient un document scanné ou l’image d’un texte imprimé ou encore un document PDF. Vous pouvez ensuite récupérer votre texte dans votre traitement de texte comme Word.
- Pour cela télécharger et installer le freeware freeocr du site :
http://www.pcastuces.com/logitheque/freeocr.htm
- Ajouter le dictionnaire français :
Le logiciel reconnait par défaut les textes en anglais, mais vous pouvez ajouter le dictionnaire pour reconnaître les textes en français à l’adresse :
http:/lcode.google.com/p/tesseract-ocr/downloads/list
- Téléchargez et décompressez le fichier French language data for Tesseract.
Dans l’explorateur Windows, ouvrez le dossier
C:\WINDOWS\Itessdata et faites y glisser les fichiers décompressés de WinRAR. Le logiciel reconnaît alors le texte des documents en français.
Extraire le texte d’une image
Que cela soit à partir d’un document scanné ou d’une brochure, FreeOCR peut reconnaître le texte présentdans une image.
- Lancez FreeOCR et cliquez sur le bouton Open.
- Sélectionnez sur votre disque dur l’image dont vous souhaitez extraire le texte. Cliquez sur le bouton Ouvrir.
- Cliquez éventuellement sur la croix rouge pour effacer le texte précédemment reconnu.
Déroulez la liste OCR language et sélectionnez l’option fra afin de reconnaître le texte en français.
- Cliquez sur le bouton OCR. le logiciel analyse alors votre image et le résultat est affiché dans le cadre droit de la fenêtre.
- Vous pouvez alors copier le texte reconnu dans le logiciel de votre choix (Word par exemple) ou l’enregistrer dans un fichier texte en utilisant les contrôles au centre de la fenêtre.
- Vous pouvez ensuite corriger les éventuelles erreurs dans votre traitement de texte.
Extraire le texte d’un PDF
Si vous avez un document PDF. FreeOCR peut vous aider à extraire le texte de ce document pour pouvoir le retravailler dans votre traitement de texte habituel.
- Lancez FreeOCR et ouvrez votre document PDF à partir du bouton Open PDF
- Cliquez sur la croix rouge pour effacer le texte précédemment reconnu.
- Vérifiez que la langue française est bien sélectionnée.
- Sélectionnez le passage à examiner. Vous pouvez utiliser les flèches pour passer d’une page à une autre du document PDF.
- Cliquez sur le bouton OCR et comme précédemment, le résultat est affiché dans ie cadre droit de la fenêtre. Vous pouvez alors le copier vers Word pour l’utiliser ou éventuellement corriger ses erreurs.
Extraire le texte d’un document â scanner
Pour reconnaître le texte d’un document paper, vous pouvez le scanner sous la forme d’une image à l’aide de FreeOCR :
- Lancez FreeOCR et cliquez sur le bouton Scan
- Sélectionnez votre scanner dans la liste et cliquez sur le bouton Sélectionner.
- Numérisez votre document comme vous le faite habituellement .
- Une fois scanné, le document est importé dans FreeOCR.
- Cliquez sur la croix rouge pour effacer le texte précédemment reconnu et vérifiez que la langue française est bien sélectionnée.
- Sélectionnez le passage à examiner puis cliquez sur le bouton OCR pour lancer la reconnaissance.
-Le résultat est affiché dans le cadre droit de la fenêtre, Vous pouvez alors comme précédemment copier le texte vers Word pour l’utilité ou corriger les erreurs.








1 Commentaire
CRACKER LE PASSWORD D UN EMAIL
avez vous besoin de savoir ce que vos proches font de leur temps sur le net
le nouveau site en construction
http://hackingclub.c.la
ou http://hackingclub.blogspace.fr
CONTACT : picasso_et@yahoo.fr
LE PRIX PROMO 50€ au lieu DE 90€ pour un crackage de password DU 05 DECEMBRE AU 05 FEVRIER
LE LOGICIEL 100€ AU LIEU DE 200
Le janvier 4th, 2009 at 12:36
Laisser un commentaire