Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 26/01/2023, à 19:13

Diamant40

Reconnaissance de caractères Tesserract

Bonjour,
J'ai essayé d'installer Tesserract, il se télécharge, mais je ne le retrouve pas dans mon Ubuntu 20.04;
"Aucun résultat" .....
Y a t-il une autre application qui fonctionne pour traduire un scan de texte (.pdf) en document texte (LibreOffice writer)
Merci pour vos conseils.

Dernière modification par Ayral (Le 27/01/2023, à 20:43)


Chacun à sa place, chaque chose en son temps, et tout ira bien.

Hors ligne

#2 Le 26/01/2023, à 19:18

xubu1957

Re : Reconnaissance de caractères Tesserract

Bonjour,

Nota : notre Modération a scindé le fil > [résolu] Recherche OCR simple qui fonctionne. 

                                                                                  ===========

Tu n'aurais pas pris le snap ?

Montre :

snap list

Dernière modification par xubu1957 (Le 27/01/2023, à 21:27)


Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Résolu] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.                   Membre de Linux-Azur

Hors ligne

#3 Le 27/01/2023, à 14:03

Diamant40

Re : Reconnaissance de caractères Tesserract

Tu as raison, xubu, Tesseract est bien dans le dossier /snap-store. Mais ensuite, comment le lancer ?
Ou bien dois-je le réinstaller autrement ? (S'il en vaut le coup !)
Je découvre Snap !


Chacun à sa place, chaque chose en son temps, et tout ira bien.

Hors ligne

#4 Le 27/01/2023, à 14:10

gl38

Re : Reconnaissance de caractères Tesserract

Laisse tomber snap !
Installe tesseract et son module de langage en deb.
Cordialement,
Guy

Hors ligne

#5 Le 27/01/2023, à 15:42

Diamant40

Re : Reconnaissance de caractères Tesserract

Bon ! Comprends pas...
tesseract était dans /snap
J'ai tenté un sudo apt-get install, mais tesseract est inconnu...
Je l'ai donc désinstallé depuis Ubuntu software.
Puis tenté une nouvelle installation depuis Ubuntu software sans avoir le choix de l'installer autrement.
Maintenant il n'est pas apparent dans les applications installées, ni dans snap.


Chacun à sa place, chaque chose en son temps, et tout ira bien.

Hors ligne

#6 Le 27/01/2023, à 16:16

gl38

Re : Reconnaissance de caractères Tesserract

En fait le moteur s'appelle tesseract-ocr.
Il faut donc faire

sudo apt install tesseract-ocr

puis pour du français

sudo apt install tesseract-ocr-fra

pour de l'anglais

sudo apt install tesseract-ocr-eng

Cordialement,
Guy

Dernière modification par gl38 (Le 27/01/2023, à 16:16)

Hors ligne

#7 Le 27/01/2023, à 17:30

Diamant40

Re : Reconnaissance de caractères Tesserract

Décidément, j'y perds mon latin (que je ne maîtrise pas non plus !)
Installé Tesseract-ocr, le process s'est déroulé normalement en console, y compris le module en français, le module en anglais est, paraît il installé automatiquement.
Mais il n'apparaît pas dans les applis !
J'ai fait un redémarrage pour voir: idem.
Je suis sous 22.04, et j'ai tenté la même installation sous 20.04: même absence dans les applications.
Merci pour le coup de main,
Michel

Dernière modification par Diamant40 (Le 27/01/2023, à 17:42)


Chacun à sa place, chaque chose en son temps, et tout ira bien.

Hors ligne

#8 Le 27/01/2023, à 17:34

iznobe

Re : Reconnaissance de caractères Tesserract

Bonjour , dans la doc citée au message #2 qui date 2016 ! ( le message , pas la doc elle doit etre encore plus ancienne hmm ) , au paragraphe 1.3 en rapport avec tesseract , tu peux y lire :

DOC a écrit :

Peut être utilisé dans les interfaces graphiques XSane

il faut voir ca comme un addon ou un plugin de xsane en fait . Donc normal que ca ne soit pas un logiciel avec un raccourci comme dans windows ...
il faut passer par xsane pour pouvoir utilise tesseract .

Dernière modification par iznobe (Le 27/01/2023, à 17:37)


retour utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .

Hors ligne

#9 Le 27/01/2023, à 17:34

xubu1957

Re : Reconnaissance de caractères Tesserract

Bonjour,

Pourquoi tu ne fournis aucun retour de tes commandes, comme recommandé dans le tutoriel  Retour utilisable de commande ?

Lecture conseillée > memento des balises code.


Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Résolu] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.                   Membre de Linux-Azur

Hors ligne

#10 Le 27/01/2023, à 17:41

gl38

Re : Reconnaissance de caractères Tesserract

tesseract est fait pour être lancé en ligne de commande, voir la doc
Par exemple :

tesseract essai.jpg out -l fra

qui va donner un fichier out.txt à partir de l'image essai.jpg qui contient un texte en français.
La doc donne des moyens de mettre la commande dans une interface graphique qui peut-être commode si on veut traiter seulement une partie de la page.
Cordialement,
Guy

Hors ligne

#11 Le 27/01/2023, à 18:07

erresse

Re : Reconnaissance de caractères Tesserract

Bonjour,
Tu peux peut-être essayer d'installer "gimageReader". Ce n'est pas trop compliqué à prendre en main.
C'est une interface graphique qui utilise "tesseract-ocr" et ça donne des résultats acceptables, à corriger en général car il est rare que la scrutation d'une image ne rencontre pas quelques zones plus floues ou plus pâles, mais en gros, on obtient quand même un texte de base.
Edit : Et au sujet de la prise en compte de "tesseract" par Xsane, c'est au moment du scan du document qu'il faut lui demander de produire un texte OCR, on ne passe pas par un pdf ou un fichier image...

Dernière modification par erresse (Le 27/01/2023, à 18:09)


Plus de 50 ans d'informatique, ça en fait des lignes de commandes en console, mais on n'avait pas le choix...
Excellente raison pour, aujourd'hui qu'on le peut, utiliser au maximum les INTERFACES GRAPHIQUES !
Important : Une fois résolu, pensez à clore votre sujet en ajoutant [Résolu] devant le titre du 1er message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.

Hors ligne

#12 Le 27/01/2023, à 18:15

iznobe

Re : Reconnaissance de caractères Tesserract

j ' aurais peut etre du ajouter " en mode graphique " . dans ma phrase precedente , mais ca me semblait evident puisque le demandeur cherche un logiciel a lancer en mode graphique justement , puisque :

Diamant40 a écrit :

Mais il n'apparaît pas dans les applis !

ce qui donnerait :
il faut passer par xsane pour pouvoir utilise tesseract " en mode graphique " .

Dernière modification par iznobe (Le 27/01/2023, à 18:16)


retour utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .

Hors ligne

#13 Le 27/01/2023, à 19:09

gl38

Re : Reconnaissance de caractères Tesserract

N’oublions pas yagf !
Cordialement,
Guy

Hors ligne

#14 Le 27/01/2023, à 22:42

Diamant40

Re : Reconnaissance de caractères Tesserract

Bon ! Merci à tous pour vos avis, mais je laisse tomber.
On se fait maintenant des noeuds au cerveau dès qu'on sort des sentiers battus.
Il y a 20 ans sous un vieux Win, utiliser un OCR était simple au possible.....
C'est sans doute le progrès !
Merci quand même.


Chacun à sa place, chaque chose en son temps, et tout ira bien.

Hors ligne

#15 Le 28/01/2023, à 10:00

iznobe

Re : Reconnaissance de caractères Tesserract

Salut , pour utiliser tessearact avec xsane il faut creer un script : voir comment faire ici : https://doc.ubuntu-fr.org/xsane2tess .

et suivre les indications decrites a la lettre . seul bemol , avec mon HP je ne peux pas choisir noir et blanc , mais ca fonctionne quand meme avec niveaux de gris , je viesn de tester wink

Pour les autres moyen graphique " yagf " etc en cli , je n ' ai pas testé .  ca m 'a pris 10 min pour le faire fonctionner . le plus long etait de trouver comment faire avec l' interface graphique ...

Dernière modification par iznobe (Le 28/01/2023, à 10:01)


retour utilisable de commande
MSI Z490A-pro , i7 10700 , 32 GB RAM .

Hors ligne