#1 Le 24/03/2010, à 23:00
- Mpok
Déterminer l'encodage d'un fichier
Bonjour,
Je voudrais pouvoir déterminer par une commande (existante ou à créer) l'encodage d'un fichier, à savoir : soit ISO-8859-*, soit UTF-8.
D'après mes recherches, on oriente généralement vers la commande standard "file".
Mais 'file' ne suffit pas :
- sur les fichiers texte purs (.txt par exemple), ça fonctionne plus ou moins (la mention "ISO-8859" est explicite, UTF-8 est implicite).
- mais sur les fichiers PHP, ça donne "PHP script" [u]SANS mention de l'encodage[∕u] (parce que l'on considère que l'encodage n'est pas important dans ce cas, c'est indiqué dans l'aide de 'file').
Il me faudrait donc une commande "moins intelligente" que 'file'...
Je veux juste un résultat 'ISO-8859' ou 'UTF-8' (voire 'unknown' sur les fichiers binaires).
Au cas où, je veux bien faire ma propre commande (en shell ou en C), mais je ne sais pas par quoi commencer (j'ai pas réussi à trouver les sources de 'file'....).
Hors ligne
#2 Le 24/03/2010, à 23:32
- Frédéric Stemmelin
Re : Déterminer l'encodage d'un fichier
Bonjour,
dans un navigateur web:
ftp://ftp.astron.com/pub/file/
Information trouvée dans le readme du package (clic droit "fichiers installés" dans synaptic).
Hors ligne
#3 Le 27/03/2010, à 14:31
- Mpok
Re : Déterminer l'encodage d'un fichier
Merci.
(du coup, j'ai mieux compris le "pbm" : s'il n'y a aucun caractère accentué ou spécial dans le fichier, file est incapable de déterminer l'encodage...)
Hors ligne
#4 Le 27/03/2010, à 15:17
- credenhill
Re : Déterminer l'encodage d'un fichier
hello
mais je ne sais pas par quoi commencer (j'ai pas réussi à trouver les sources de 'file'....).
les sources sont là : http://directory.fsf.org/project/file/
download -> ftp://ftp.astron.com/pub/file/
Hors ligne