Pages : 1
#1 Le 13/01/2016, à 23:34
- Xzu Rukneg
Dictée numérique? reconnaiscance vocale?
Bonjour.
Après des recherches sur la doc et le forum, je n'ai pas trouvé de réponse claire et satisfaisante à ma question:
Existe-t-il actuellement un logiciel empaqueté permettant de saisir un texte depuis un micro pour ubuntu?
Mon seul but est de faire de la dictée "vocale" de texte "numérique". (j'ai déjà micros et cartes sons)
J'aimerai aussi savoir si quelqu'un peu témoigner l'avoir déjà fait.
Merci.
Dernière modification par Xzu Rukneg (Le 18/01/2016, à 11:31)
Hors ligne
#2 Le 14/01/2016, à 13:38
- nam1962
Hors ligne
#3 Le 14/01/2016, à 20:05
- Xzu Rukneg
Re : Dictée numérique? reconnaiscance vocale?
Ce fil est intéressant oui.
Mais je cherche plus simple, genre un paquet à installer, et quelqu'un qui me dit que ça marche!
Hors ligne
#4 Le 14/01/2016, à 20:48
- agensbur
Re : Dictée numérique? reconnaiscance vocale?
A défaut d'une solution Linux pur jus, tu peux jeter un coup d'œuil sur google doc.
Tu trouveras un module de reconnaissance et de dictée vocale (il y a une fonction native qui n'est pas excellente mais aussi une extension à charger qui elle est de meilleure qualité. Tout cela ne tourne qu'avec chrome).
Je l'ai testé vraiment très rapidement, et par rapport à ce que je faisais jadis avec dragon naturaly speaking, ça ne semble pas totalement ridicule - du moins pour des textes courts.
Dernière modification par agensbur (Le 14/01/2016, à 22:31)
Hors ligne
#5 Le 17/01/2016, à 15:57
- Xzu Rukneg
Re : Dictée numérique? reconnaiscance vocale?
Si je comprend bien, à l'heure actuelle c'est dragon machin qui détiens le monopole pour les utilisateurs?
Hors ligne
#6 Le 17/01/2016, à 17:24
- nam1962
Re : Dictée numérique? reconnaiscance vocale?
Grosso (et ce n'est pas si fluide que çà).
pas contre côté Linux, je ne vois rien de probant et c'est fort dommage.
[ Modéré ]
Hors ligne
#7 Le 18/01/2016, à 11:33
- Xzu Rukneg
Re : Dictée numérique? reconnaiscance vocale?
Merci quand même!
C'est le genre de question où on a parfois une bonne surprise, car tout ne peut pas être dans la doc.
Je ne sais pas si le fil de Kholo permettrait d'arriver à faire ça, tellement c'est technique et que je ne vois pas vraiment ce qu'il fait et comment.
Mais bon, je sent que je vais devoir essayer malgré tout!
Hors ligne
#8 Le 20/01/2016, à 10:21
- alexarnaud
Re : Dictée numérique? reconnaiscance vocale?
Merci quand même!
C'est le genre de question où on a parfois une bonne surprise, car tout ne peut pas être dans la doc.
Je ne sais pas si le fil de Kholo permettrait d'arriver à faire ça, tellement c'est technique et que je ne vois pas vraiment ce qu'il fait et comment.
Mais bon, je sent que je vais devoir essayer malgré tout!
Si tu arrives à un résultat, ça peut-être intéressant. Si tu penses également qu'il y aurait moyen de rendre la tâche plus simple cela peut-être intéressant aussi.
La partie la plus complexe est la reconnaissance vocale, si elle existe et qu'il manque une intégration on peut envisager de monter un projet.
#9 Le 23/01/2016, à 12:05
- Benoitfra
Re : Dictée numérique? reconnaiscance vocale?
On remet le couvert sur la reconnaissance vocale !
J'ai déjà joué avec et ça marche plutôt bien ! Il faut distinguer 2 usages:
- la commande vocale
- la dictée vocale
Comment mettre ne place un pipeline de reconnaissance vocale facilement ? Utilisr Pocketsphinx & GStreamer. C'est pas très dur mais il faut installer les dépendances et les gens n'aiment pas trop ça.
En ce moment, je distingue 2 solutions principales :
- PocketSphinx (offline) + GStreamer pour la commande vocale
- Wit.ai/Google ou Mozilla web speech api pour la dictée vocale
Je vais concentrer mes mots sur Pocketsphinx que je connais bien qui est libre !
il faut lui fournir plusieurs fichiers:
- modèle de langage
- modèle acoustique
- dictionnaire
Tout cela est disponible sur le site de CMUSPhinx.
J'ai un projet dans les cartons pour l'intégrer dans Gnome. Le problème c'est que tout est éparpillé un peu partout, qu'il faut compiler pas mal de chose et les gens n'aiment pas trop ça. D'autre problèmes peuvent aussi apparaitres notamment ceux liés au micro.
Comment je vois l'intégration dans Gnome ?
l'idée serait de faire de la commande vocale un service DBus générique. Que ce soit le moteur pocketsphinx, ou tout autre api online, tous devront implémenter une interface permettant d'obtenir certaines infos:
- savoir si le service est actif
- connaistre le texte prononcé
- une liste de tags
- sa probabilité
- pouvoir changer à la volée de modèle de langage ou de grammaire
Toutes les infos transiteront donc via dbus. Quiconque voulant supporter la commande vocale devra alors se connecter à ce bus et récupérer les infos. L'interêt de Dbus c'est que l'on peut réveiller un service quand on en a besoin mais également qu'il est déjà très bien intégrer.
Je vous assure que tout cela n'est pas très compliqué à faire. Si jamais l'élan est là je veux bien aidé car il serait bon d'avoir différent point de vue qui aboutiront peut-être à l'écriture de specs et à la mise ne place d'un design.
Pour ceux que cela interesse, je vous invite à voir mes périgrinations sur Github:
- Pocketvox (pour appréhender le couple Gstreamer, Pocketsphinx en C et avec de l'introspection pour du Python)
- VOXGenerator (en Python, pour appréhender DBus, Gstreamer et Pocketsphinx)
Une liste de lien:
CMUSphinx
PocketVox
VOXGenerator
Dernière modification par Benoitfra (Le 23/01/2016, à 12:19)
Hors ligne
#10 Le 23/01/2016, à 13:33
- Xzu Rukneg
Re : Dictée numérique? reconnaiscance vocale?
Merci Benoitfra, ça motive! (même si j'avoue que je vais attendre d’avoir beaucoup de temps libre pour me coller à ça).
J'ai déjà joué avec et ça marche plutôt bien ! Il faut distinguer 2 usages:
- la commande vocale
- la dictée vocale
Question dictée vocale (vu que c'est uniquement ça qui m’intéresse personnellement), quel est ton retour d'utilisation?
Expérimental? fonctionnel? utilisable?
Hors ligne
#11 Le 23/01/2016, à 14:06
- Benoitfra
Re : Dictée numérique? reconnaiscance vocale?
Pour la dictée vocale ! C'est plus compliqué !
Je n'ai jamais réussi a avoir de la dictée vocale avec pocketsphinx car le dictionnaire et le modèle de langage qui nous sont fournis ne sont pas très précis même si ils comportent 65000 mots. Par contre Pocketsphinx fonctionne très bien pour de la commande vocale justement en créant mes propres modèle de langage avec moins de mot (voir CMUCLMTK)
Voilà
Dernière modification par Benoitfra (Le 23/01/2016, à 14:31)
Hors ligne
#12 Le 23/01/2016, à 19:26
- Xzu Rukneg
Re : Dictée numérique? reconnaiscance vocale?
Ok merci.
Bon, je crois que je vais mettre mon idée de dictée vocale sous ubuntu en veilleuse pour quelques années.
Hors ligne
#13 Le 26/01/2016, à 17:29
- alexarnaud
Re : Dictée numérique? reconnaiscance vocale?
On remet le couvert sur la reconnaissance vocale !
- PocketSphinx (offline) + GStreamer pour la commande vocale
- Wit.ai/Google ou Mozilla web speech api pour la dictée vocale
Il faudrait investiguer tout ça pour savoir si quelqu'un s'est déjà penché sur la dictée vocale de manière sérieuse.
La dictée vocale fait partie des chantier de R&D à mener si effectivement rien de probant n'existe. Si un jour j'ai dû temps de disponible je tenterai de mener une enquête sur le sujet.
#14 Le 26/01/2016, à 20:06
- Benoitfra
Re : Dictée numérique? reconnaiscance vocale?
Ce n est pas les solutions techniques qui posent problemes mais plus les moyens.
Le modele de langage est trop peu precis et vraiment tres gros. Faudrait essayer sur d autre machine.
Donc il y a les perfs d un coté et la precision du modèle de l autre.
Sinon, je pense que si l on veut integrer la reconnaissance vocale il faut propser un service. C est a dire un objet qui pulie sur un bus le texte brut issu de la reconnaissance. J ai pas beaucoup de temps mais je suis en train d ecrire quelque chose pour cela en vala.
Une fois le service integré peut importe le fournisseur de transcription n importe qui pourra aller chercher l info et s en servir comme il le souhaite pour de la dictee ou de la commande.
Ensuite, suivant l isage on peut imaginer des services d indexation qui permettrait d
e tagguer le texte brut (voir NLP Stanford notamment les modeles Ngram). d ou deux possibiliés:
1) dictee vocale
fournisseur -> service debus -> application
2) commande vocale
fournisseur -> service dbus -> contexte manager -> application
J aimerai vraiment que la reconnaissance vocale soit vu comme un service
Dernière modification par Benoitfra (Le 26/01/2016, à 20:23)
Hors ligne
#15 Le 26/01/2016, à 20:25
- Benoitfra
Re : Dictée numérique? reconnaiscance vocale?
Le mieu se serait d avoir nos serveurs faisant tourner pocketsphinx
Hors ligne
#16 Le 27/01/2016, à 09:53
- alexarnaud
Re : Dictée numérique? reconnaiscance vocale?
Ce n est pas les solutions techniques qui posent problemes mais plus les moyens.
J'entends bien ton discours. Pour moi l'objectif est de permettre à une personne n'ayant pas la possibilité de taper au clavier d'utiliser la reconnaissance vocale.
Que dirais-tu d’entamer un chantier communautaire ? Pour cela il faudrait faire les choses de manière structuré :
0) Facultatif : trouver un relais communautaire pour pouvoir trouver des développeurs intéressés
1) Savoir vers quoi fonctionnellement on souhaite aller
2) Faire une analyse de l'existant fonctionnel
3) Faire une analyse de l'existant technique
4) Estimer la complexité technique et les compétences requises et surtout le temps que cela implique
#17 Le 27/01/2016, à 19:45
- Benoitfra
Re : Dictée numérique? reconnaiscance vocale?
Je suis tout a fait d accord j hante ce forum pour attiser la motivatin des devs sur ce sujet depuis longtemps. Mais je suis toujours seul. C est cool si les gens se bougent
je suis opérationnel.
Comment on organise tout ça ?
Hors ligne
#18 Le 27/01/2016, à 22:04
- Xzu Rukneg
Re : Dictée numérique? reconnaiscance vocale?
Je rêverais de vous aider, mais je ne connais rien à la programmation.
Mais je peut saluer votre motivation et vous soutenir par encouragement!!
Hors ligne
#19 Le 18/02/2017, à 14:47
- Sefran
Re : Dictée numérique? reconnaiscance vocale?
C'est avec un peux de retard que j'écrit sur ce blog, mais que pensez-vous de http://www.voxforge.org/ ?
Et merci de tous ces volontaires francophones qui se sont investis dans la reconnaissance vocale libre
Je pense que l'approche dbus est une bonne idée.
Cela implique peut-être d'adapter les API des frameworks graphiques non ?
Perso j'ai des compétences système sous linux...
Dernière modification par Sefran (Le 18/02/2017, à 14:53)
La coopération et la valeur de l'activité est l'avenir de l'humanité.
Sefran
Hors ligne
#20 Le 18/02/2017, à 15:14
- nam1962
Re : Dictée numérique? reconnaiscance vocale?
...voxforge cite julius qui semble en panne depuis 2014, ISIP qui semble éteint. Il y a peut-être Sphynx qui vit encore.
De ce je comprend du côté des soluces commerciales, elles se sont tournées bers l'IA et font des progrès à pas de géant depuis.
Ceci est-il possible en open source ? (Les outils d'IA sont souvent open source cela dit)
[ Modéré ]
Hors ligne
#21 Le 18/02/2017, à 15:23
- erresse
Re : Dictée numérique? reconnaiscance vocale?
@Xzu Rukneg :
Je ne sais pas où en est l'avancement de la reconnaissance vocale sous Linux, en revanche, sous Androïd, ça fonctionne plutôt bien...
Si tu veux développer un projet rapidement pour saisir du texte à partir d'une entrée vocale, tu peux procéder comme je l'ai eu fait :
- Enregistrer sur une tablette ou un smartphone Androïd un texte dicté au micro avec une application de saisie de texte.
La fonction "saisie depuis le micro" est standard dans les applications Google et le résultat est assez correct.
- L'appareil Androïd étant relié au réseau local, il est alors très simple de transférer le fichier texte produit vers la machine Linux par simple liaison wifi pour les traitements ultérieurs.
On peut pratiquement considérer que l'appareil Androïd est un périphérique de la machine Linux, comme une sorte de micro évolué.
Bien sûr, ce n'est là ni une solution entièrement libre, ni une solution entièrement sous Linux, mais ça peut dépanner sans chercher midi à quatorze heures, et cela reste une solution gratuite...
Plus de 50 ans d'informatique, ça en fait des lignes de commandes en console, mais on n'avait pas le choix...
Excellente raison pour, aujourd'hui qu'on le peut, utiliser au maximum les INTERFACES GRAPHIQUES !
Important : Une fois le problème solutionné, pensez à clore votre sujet en ajoutant [Résolu] devant le titre du 1er message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.
Hors ligne
#22 Le 18/02/2017, à 17:19
- agensbur
Re : Dictée numérique? reconnaiscance vocale?
Comme errese je ne sais pas trop ce qui est possible en open source.
En solution de contournement, outre android, on peut aussi se servir de google doc.
Hors ligne
#23 Le 18/02/2017, à 21:26
- nam1962
Re : Dictée numérique? reconnaiscance vocale?
???
[ Modéré ]
Hors ligne
#24 Le 27/03/2017, à 08:16
- abach
Re : Dictée numérique? reconnaiscance vocale?
Je reviens là dessus...
Demain, je suis opéré de la main. Je tourne sous Ubuntu (et Mint, sa déclinaison) depuis pas mal de temps. Je vais être inopérationnel au clavier pendant pas mal de temps. Vais-je devoir investir dans une petite bécane sous W$, avec un petit écran tactile et une reconnaissance vocale ou vais-je trouver une solution sous Linux ?
J'avoue que là, je suis paumé...
Les chiens vous regardent tous avec vénération. Les chats vous toisent tous avec dédain. Il n’y a que les cochons qui vous considèrent comme leurs égaux. - Winston Churchill
Je suis parrain Linux
Hors ligne
#25 Le 02/11/2018, à 20:05
- phleconte
Re : Dictée numérique? reconnaiscance vocale?
Bonsoir,
je déterre ce sujet car j'étais à la recherche d'une solution de dictée vocale sur mon PC. je viens d'utiliser Google Docs en utilisant chrome sur Kubuntu et cela marche remarquablement bien.
Certes, utiliser les outils de Google me pose un peu souci mais l'efficacité est là. Il y a quelques problèmes avec les signes de ponctuation mais par ailleurs, le vocabulaire médical qui est important pour mon métier est bien reconnu.
Ce texte a été dicté sur Chrome et je n'ai corrigé que les signes de ponctuation et le terme Kubuntu.
bonne soirée
HP x360 1040 G8 / station d'accueil
Kubuntu 24.04.1
Kernel 6.8
Hors ligne
Pages : 1