Pages : 1
#1 Le 15/07/2011, à 17:28
- nalvak
Ocr & Roc
Bonsoir !
Sur Ubuntu 11.04
J'ai tenté, sans succès, d'utiliser OCRFeend.
Par contre Xsane m'a permis de réussir la ROC.
Voici ma petite recette :
Optical Character Recognition : en français "ROC" Reconnaissance Optique de Caractères)
Pour obtenir un fichier simple texte (extension ".txt") à partir d'une image scannée.
Avant tout :
Installer xsane et gocr par >Système>Administration>Gestionnaire de paquets Synaptic.
"xsane" est un programme complet pour scanner mais pour passer à la Reconnaissance Optique de Caractère
il a besoin de passer le relai à "gocr". Si "gocr" n'est pas installé, xsane ne peut effectuer seul l'opération "ocr".
Comment opérer ?
D'abord utiliser Xsane
Ouvrir la fenêtre "aperçu"
Acquérir l'aperçu
Sélectionner le texte à numériser.
Il faut éviter de mélanger les images, des gros titres, des polices très différentes et
mieux vaut décomposer la page en plusieurs opérations si nécessaire.
Choisir des paramètres favorables :
-Le répertoire où l'on va enregistrer le résultat.
-Le type "texte"
-Le "gris" (couleur est trait sont à éviter)
-Laisser "pleine échelle couleur"
-Pour du texte de taille normale (revue, livre) la définition de 400ppp convient.
-Avec une luminosité réglée à -20 pousser le contraste à +70
-Numériser
-Enregistrer le résultat.
-vérifier le résultat dans un éditeur de texte.
En espérant que cette petite recette puisse dépanner quelqu'un…
Bien sûr, il y a sûrement plus astucieux…Je suis preneur.;)
Bien cordialement
Au festin du savoir plus l'on partage, plus les parts sont copieuses.
Scii ke oni kredas pli sajas ol kredi ke oni scias. Eraro homas sed persisti diablas.
Hors ligne
#2 Le 15/07/2011, à 17:42
- sputnick
Re : Ocr & Roc
Salut,
j'ai dev un script bien pratique qui me sert à chaque fois que j'ai besoin d'OCR.
Sans argument, il va prendre une capture d'une portion d'écran à choisir puis il affiche le resultat.
Avec argument, il detecte le type de fichier et affiche le résultat.
Tes recommandations restent valables.
Necessite :
- tesseract
- imagemagick
wget http://sputnick-area.net/scripts/OCR.bash
chmod +x OCR.bash
./OCR.bash
PS : c'est plus pratique que d'ouvrir xsane et cette solution fonctionne bien
++
Dernière modification par sputnick (Le 15/07/2011, à 17:51)
Il existe un tunnel obscur dans la lumière infinie. Lao-Tseu
https://sputnick.fr
Hors ligne
#3 Le 16/07/2011, à 14:59
- nalvak
Re : Ocr & Roc
Bonjour sputnick,
Effectivement ce script "OCR.bash" fonctionne très bien.
Il peut s'avérer encore plus pratique selon ce que l'on veut faire.:D
Merci pour me l'avoir fait découvrir.
A+
Au festin du savoir plus l'on partage, plus les parts sont copieuses.
Scii ke oni kredas pli sajas ol kredi ke oni scias. Eraro homas sed persisti diablas.
Hors ligne
#4 Le 20/07/2011, à 15:13
- yarland
Re : Ocr & Roc
Bonjour à tous,
j'avais trouvé une astuce sur le sujet. je ne sais pas si cela peut intéresser quelqu'un.
Le lien est la http://forum.ubuntu-fr.org/viewtopic.php?id=441200
A très bientôt
MSI G31 M - Dual 2 core - 2mb RAM DDR2 - Ecran 24'' - DD 2 x 500Go
Hors ligne
#5 Le 20/07/2011, à 18:04
- nalvak
Re : Ocr & Roc
Bonsoir yarland,
Merci pour ce lien qui permet de compléter l'information.
Cordialement
Au festin du savoir plus l'on partage, plus les parts sont copieuses.
Scii ke oni kredas pli sajas ol kredi ke oni scias. Eraro homas sed persisti diablas.
Hors ligne
Pages : 1