Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 15/07/2011, à 17:28

nalvak

Ocr & Roc

Bonsoir !
Sur Ubuntu 11.04
J'ai tenté, sans succès, d'utiliser OCRFeend.
Par contre Xsane m'a permis de réussir la ROC.

Voici ma petite recette :

Optical Character Recognition : en français "ROC" Reconnaissance Optique de Caractères)
Pour obtenir un fichier simple texte (extension ".txt") à partir d'une image scannée.

Avant tout :
Installer xsane et gocr par >Système>Administration>Gestionnaire de paquets Synaptic.
"xsane" est un programme complet pour scanner mais pour passer à la Reconnaissance Optique de Caractère
il a besoin de passer le relai à "gocr". Si "gocr" n'est pas installé, xsane ne peut effectuer seul l'opération "ocr".

Comment opérer ?
D'abord utiliser Xsane
Ouvrir la fenêtre "aperçu"
Acquérir l'aperçu
Sélectionner le texte à numériser.
Il faut éviter de mélanger les images, des gros titres, des polices très différentes et
mieux vaut décomposer la page en plusieurs opérations si nécessaire.
Choisir des paramètres favorables :
-Le répertoire où l'on va enregistrer le résultat.
-Le type "texte"
-Le "gris" (couleur est trait sont à éviter)
-Laisser "pleine échelle couleur"
-Pour du texte de taille normale (revue, livre) la définition de 400ppp convient.
-Avec une luminosité réglée à -20 pousser le contraste à +70
-Numériser
-Enregistrer le résultat.
-vérifier le résultat dans un éditeur de texte.

En espérant que cette petite recette puisse dépanner quelqu'un…
Bien sûr, il y a sûrement plus astucieux…Je suis preneur.;)

Bien cordialement


Au festin du savoir plus l'on partage, plus les parts sont copieuses.
Scii ke oni kredas pli sajas ol kredi ke oni scias. Eraro homas sed persisti diablas.

Hors ligne

#2 Le 15/07/2011, à 17:42

sputnick

Re : Ocr & Roc

Salut,

j'ai dev un script bien pratique qui me sert à chaque fois que j'ai besoin d'OCR.
Sans argument, il va prendre une capture d'une portion d'écran à choisir puis il affiche le resultat.
Avec argument, il detecte le type de fichier et affiche le résultat.

Tes recommandations restent valables.

Necessite :
- tesseract
- imagemagick

wget http://sputnick-area.net/scripts/OCR.bash
chmod +x OCR.bash
./OCR.bash

PS : c'est plus pratique que d'ouvrir xsane et cette solution fonctionne bien wink

++

Dernière modification par sputnick (Le 15/07/2011, à 17:51)


Il existe un tunnel obscur dans la lumière infinie. Lao-Tseu
https://sputnick.fr

Hors ligne

#3 Le 16/07/2011, à 14:59

nalvak

Re : Ocr & Roc

Bonjour sputnick,

Effectivement ce script "OCR.bash" fonctionne très bien.
Il peut s'avérer encore plus pratique selon ce que l'on veut faire.:D
Merci pour me l'avoir fait découvrir.
A+


Au festin du savoir plus l'on partage, plus les parts sont copieuses.
Scii ke oni kredas pli sajas ol kredi ke oni scias. Eraro homas sed persisti diablas.

Hors ligne

#4 Le 20/07/2011, à 15:13

yarland

Re : Ocr & Roc

Bonjour à tous,
j'avais trouvé une astuce sur le sujet. je ne sais pas si cela peut intéresser quelqu'un.
Le lien est la http://forum.ubuntu-fr.org/viewtopic.php?id=441200
A très bientôt


MSI G31 M - Dual 2 core - 2mb RAM DDR2 - Ecran 24'' - DD 2 x 500Go

Hors ligne

#5 Le 20/07/2011, à 18:04

nalvak

Re : Ocr & Roc

Bonsoir yarland,
Merci pour ce lien qui permet de compléter l'information.
Cordialement


Au festin du savoir plus l'on partage, plus les parts sont copieuses.
Scii ke oni kredas pli sajas ol kredi ke oni scias. Eraro homas sed persisti diablas.

Hors ligne