Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 02/11/2013, à 20:04

User12.4

Sphinx-4: programmation de la reconnaissance de la parole

Bonjour.
Je travaille sur Sphinx-4 pour la reconnaissance de la parole en français. Il s'agit de lire de faire une reconnaissance par mot-clé à partir d'un fichier audio, sur la base d'une grammaire. Alternativement, je voulais transcrire tout l'enregistrement puis faire une détection de mot-clé sur le fichier texte obtenu. Mais cette deuxième solution me paraît fastidieuse hmm .
J'ai installé Sphinx et tester les démos, tout fonctionne correctement. J'essaye maintenant d'adapter à mon travail les sources des démos: rien ne marche sad .
Quelqu'un saurait-il me prêter main forte? Merci de vous signaler avant que je ne commence à polluer le forum.

Merci

PS: Je travaille sous Ubuntu 12.4 Server et Sphinx-4 est développé en Java.

Dernière modification par User12.4 (Le 08/11/2013, à 18:14)

Hors ligne

#2 Le 08/11/2013, à 18:12

User12.4

Re : Sphinx-4: programmation de la reconnaissance de la parole

Bonjour.
Le silence signifie certainement que mon sujet sujet n'a eu aucun retentissement conséquent. Quelle galère! Je ne désespère pas encore, jusqu'à ce que je revienne pour clore le discussion.

Salut!

Hors ligne

#3 Le 09/11/2013, à 01:55

temps

Re : Sphinx-4: programmation de la reconnaissance de la parole

Bonjour,
J'ai aussi un projet sur la reconnaissance vocale,
mais j'utilise mon propre format audio.
Et en plus comme j'ai une dizaine de projets en cours et très peu de temps, il n'avance pas trop.
Ce que je peux dire c'est que le son de la même consonne peut s'écrire de plusieurs manières, c'est un rapport d'amplitude.
Dans mon application lm3jo, j'ai mis des captures d'écran pour expliquer.
De plus en fait dans la voix humaine, les consonnes sont un mix du début des voyelles, j'ai mis quelques notes qui expliquent les caractéristiques de la voix humaine. Les formes des différentes consonnes, comment modifier la proportion d'amplitude d'une consonne pour la transformer en une autre consonne ....
Si cela peut aider.
Cordialement


Parce que l'USB bootable est le support des systèmes experts,
Parce que l'USB bootable contient sa propre image au démarrage.
L'USB bootable permet de créer un monde à la dimension de son imagination
https://www.letime.net

Hors ligne