#1 Le 26/01/2023, à 19:13
- Diamant40
Reconnaissance de caractères Tesserract
Bonjour,
J'ai essayé d'installer Tesserract, il se télécharge, mais je ne le retrouve pas dans mon Ubuntu 20.04;
"Aucun résultat" .....
Y a t-il une autre application qui fonctionne pour traduire un scan de texte (.pdf) en document texte (LibreOffice writer)
Merci pour vos conseils.
Dernière modification par Ayral (Le 27/01/2023, à 20:43)
Chacun à sa place, chaque chose en son temps, et tout ira bien.
Hors ligne
#2 Le 26/01/2023, à 19:18
- xubu1957
Re : Reconnaissance de caractères Tesserract
Bonjour,
Nota : notre Modération a scindé le fil > [résolu] Recherche OCR simple qui fonctionne.
===========
Tu n'aurais pas pris le snap ?
Montre :
snap list
Dernière modification par xubu1957 (Le 27/01/2023, à 21:27)
Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci. Membre de Linux-Azur
Hors ligne
#3 Le 27/01/2023, à 14:03
- Diamant40
Re : Reconnaissance de caractères Tesserract
Tu as raison, xubu, Tesseract est bien dans le dossier /snap-store. Mais ensuite, comment le lancer ?
Ou bien dois-je le réinstaller autrement ? (S'il en vaut le coup !)
Je découvre Snap !
Chacun à sa place, chaque chose en son temps, et tout ira bien.
Hors ligne
#4 Le 27/01/2023, à 14:10
- gl38
Re : Reconnaissance de caractères Tesserract
Laisse tomber snap !
Installe tesseract et son module de langage en deb.
Cordialement,
Guy
Hors ligne
#5 Le 27/01/2023, à 15:42
- Diamant40
Re : Reconnaissance de caractères Tesserract
Bon ! Comprends pas...
tesseract était dans /snap
J'ai tenté un sudo apt-get install, mais tesseract est inconnu...
Je l'ai donc désinstallé depuis Ubuntu software.
Puis tenté une nouvelle installation depuis Ubuntu software sans avoir le choix de l'installer autrement.
Maintenant il n'est pas apparent dans les applications installées, ni dans snap.
Chacun à sa place, chaque chose en son temps, et tout ira bien.
Hors ligne
#6 Le 27/01/2023, à 16:16
- gl38
Re : Reconnaissance de caractères Tesserract
En fait le moteur s'appelle tesseract-ocr.
Il faut donc faire
sudo apt install tesseract-ocr
puis pour du français
sudo apt install tesseract-ocr-fra
pour de l'anglais
sudo apt install tesseract-ocr-eng
Cordialement,
Guy
Dernière modification par gl38 (Le 27/01/2023, à 16:16)
Hors ligne
#7 Le 27/01/2023, à 17:30
- Diamant40
Re : Reconnaissance de caractères Tesserract
Décidément, j'y perds mon latin (que je ne maîtrise pas non plus !)
Installé Tesseract-ocr, le process s'est déroulé normalement en console, y compris le module en français, le module en anglais est, paraît il installé automatiquement.
Mais il n'apparaît pas dans les applis !
J'ai fait un redémarrage pour voir: idem.
Je suis sous 22.04, et j'ai tenté la même installation sous 20.04: même absence dans les applications.
Merci pour le coup de main,
Michel
Dernière modification par Diamant40 (Le 27/01/2023, à 17:42)
Chacun à sa place, chaque chose en son temps, et tout ira bien.
Hors ligne
#8 Le 27/01/2023, à 17:34
- iznobe
Re : Reconnaissance de caractères Tesserract
Bonjour , dans la doc citée au message #2 qui date 2016 ! ( le message , pas la doc elle doit etre encore plus ancienne ) , au paragraphe 1.3 en rapport avec tesseract , tu peux y lire :
Peut être utilisé dans les interfaces graphiques XSane
il faut voir ca comme un addon ou un plugin de xsane en fait . Donc normal que ca ne soit pas un logiciel avec un raccourci comme dans windows ...
il faut passer par xsane pour pouvoir utilise tesseract .
Dernière modification par iznobe (Le 27/01/2023, à 17:37)
retour COMPLET et utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .
Hors ligne
#9 Le 27/01/2023, à 17:34
- xubu1957
Re : Reconnaissance de caractères Tesserract
Bonjour,
Pourquoi tu ne fournis aucun retour de tes commandes, comme recommandé dans le tutoriel Retour utilisable de commande ?
Lecture conseillée > memento des balises code.
Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Réso|u] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci. Membre de Linux-Azur
Hors ligne
#10 Le 27/01/2023, à 17:41
- gl38
Re : Reconnaissance de caractères Tesserract
tesseract est fait pour être lancé en ligne de commande, voir la doc
Par exemple :
tesseract essai.jpg out -l fra
qui va donner un fichier out.txt à partir de l'image essai.jpg qui contient un texte en français.
La doc donne des moyens de mettre la commande dans une interface graphique qui peut-être commode si on veut traiter seulement une partie de la page.
Cordialement,
Guy
Hors ligne
#11 Le 27/01/2023, à 18:07
- erresse
Re : Reconnaissance de caractères Tesserract
Bonjour,
Tu peux peut-être essayer d'installer "gimageReader". Ce n'est pas trop compliqué à prendre en main.
C'est une interface graphique qui utilise "tesseract-ocr" et ça donne des résultats acceptables, à corriger en général car il est rare que la scrutation d'une image ne rencontre pas quelques zones plus floues ou plus pâles, mais en gros, on obtient quand même un texte de base.
Edit : Et au sujet de la prise en compte de "tesseract" par Xsane, c'est au moment du scan du document qu'il faut lui demander de produire un texte OCR, on ne passe pas par un pdf ou un fichier image...
Dernière modification par erresse (Le 27/01/2023, à 18:09)
Plus de 50 ans d'informatique, ça en fait des lignes de commandes en console, mais on n'avait pas le choix...
Excellente raison pour, aujourd'hui qu'on le peut, utiliser au maximum les INTERFACES GRAPHIQUES !
Important : Une fois le problème solutionné, pensez à clore votre sujet en ajoutant [Résolu] devant le titre du 1er message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.
Hors ligne
#12 Le 27/01/2023, à 18:15
- iznobe
Re : Reconnaissance de caractères Tesserract
j ' aurais peut etre du ajouter " en mode graphique " . dans ma phrase precedente , mais ca me semblait evident puisque le demandeur cherche un logiciel a lancer en mode graphique justement , puisque :
Mais il n'apparaît pas dans les applis !
ce qui donnerait :
il faut passer par xsane pour pouvoir utilise tesseract " en mode graphique " .
Dernière modification par iznobe (Le 27/01/2023, à 18:16)
retour COMPLET et utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .
Hors ligne
#13 Le 27/01/2023, à 19:09
- gl38
Re : Reconnaissance de caractères Tesserract
N’oublions pas yagf !
Cordialement,
Guy
Hors ligne
#14 Le 27/01/2023, à 22:42
- Diamant40
Re : Reconnaissance de caractères Tesserract
Bon ! Merci à tous pour vos avis, mais je laisse tomber.
On se fait maintenant des noeuds au cerveau dès qu'on sort des sentiers battus.
Il y a 20 ans sous un vieux Win, utiliser un OCR était simple au possible.....
C'est sans doute le progrès !
Merci quand même.
Chacun à sa place, chaque chose en son temps, et tout ira bien.
Hors ligne
#15 Le 28/01/2023, à 10:00
- iznobe
Re : Reconnaissance de caractères Tesserract
Salut , pour utiliser tessearact avec xsane il faut creer un script : voir comment faire ici : https://doc.ubuntu-fr.org/xsane2tess .
et suivre les indications decrites a la lettre . seul bemol , avec mon HP je ne peux pas choisir noir et blanc , mais ca fonctionne quand meme avec niveaux de gris , je viesn de tester
Pour les autres moyen graphique " yagf " etc en cli , je n ' ai pas testé . ca m 'a pris 10 min pour le faire fonctionner . le plus long etait de trouver comment faire avec l' interface graphique ...
Dernière modification par iznobe (Le 28/01/2023, à 10:01)
retour COMPLET et utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .
Hors ligne