Problème de codage de caractères

Tubezlob · Le 18/05/2017, à 20:32

Bonjour à tous, j'utilise Ubuntu 16.04 LTS et je rencontre des problèmes avec le codage des caractères. En téléchargeant le résultat de cette requête en CSV ([url]http://[Merci de relire les règles]/n6j6522[/url]) et en l'ouvrant avec LibreOffice (ou n'importe quel autre logiciel), je n'arrive jamais à visualiser les caractères spéciaux (du type ş).

J'ai LibreOffice 5.1.6.2 et 5.3.2.2.

Merci de votre aide !

abelthorne · Le 18/05/2017, à 23:25

Ubuntu utilise par défaut un codage en UTF-8, peut-être que ton fichier .csv est en ISO-xxxx ? Essaie de l'ouvrir avec l'éditeur de texte et de le réenregistrer (Fichier → enregistrer sous) pour choisir un encodage UTF-8 puis de l'ouvrir ensuite dans LO.

Tubezlob · Le 19/05/2017, à 11:28

Bonjour abelthorne. Merci de ta réponse.

J'ai essayé avec gedit mais cela ne change rien. gedit n'arrive pas non plus à m'afficher correctement les caractères que j'arrive pourtant à visualiser dans le navigateur. Mais serait-ce dû plutôt au fichier en lui-même ?

abelthorne · Le 19/05/2017, à 12:00

Effectivement, je viens de faire le test et c'est assez bizarre. La page web est bien en UTF-8 mais il a l'air de te télécharger un .csv en ISO-8859-15 en perdant les caractères Unicode au passage.

J'ai peut-être une solution mais je ne suis pas sûr qu'elle soit valide, étant donné que je n'obtiens apparemment pas les mêmes données avec que dans le fichier CSV (à moins qu'elles soient juste organisées différemment) : sur la page de ta requête Wikidata, tu as apparemment un lien SPARQL (Link → SPARQL endpoint) : est-ce que ce qu'il génère correspond à ce que tu essaies d'obtenir ? Si c'est le cas, tu peux télécharger les données en CSV avec cURL en faisant un copier/coller du lien en question avec une syntaxe de ce genre pour télécharger un fichier monfichier.csv :

curl "https://query.wikidata.org/bigdata/namespace/wdq/sparql?query=SELECT%20%3Fitem%20%3Flabel_id%20WHERE%20%7B%0A%20%20%3Fitem%20wdt%3AP31%20wd%3AQ101352.%0A%20%20%3Fitem%20wdt%3AP282%20wd%3AQ8229.%0A%20%20%3Fitem%20rdfs%3Alabel%20%3Flabel_id.%0A%20%20MINUS%20%7B%0A%20%20%20%20%3Fitem%20rdfs%3Alabel%20%3Flabel_fr.%0A%20%20%20%20FILTER((LANG(%3Flabel_fr))%20%3D%20%22fr%22)%0A%20%20%7D%0A%20%20FILTER((LANG(%3Flabel_id))%20%3D%20%22en%22)%0A%7D%0ALIMIT%201000" -H "Accept: text/csv" -o monfichier.csv

(Attention à bien mettre la requête entre guillemets.)

Si cURL n'est pas installé, il est dans les dépôts :

sudo apt-get install curl

Dernière modification par abelthorne (Le 19/05/2017, à 12:41)

Tubezlob · Le 19/05/2017, à 18:36

Super merci cela fonctionne ! Les résultats sont juste dans un ordre différent mais cela n'a pas d'incidence.

C'est donc un problème du côté de Wikidata Query Service (je pensais que cela venait de chez moi vu que j'ai pas mal de problèmes avec LibreOffice). J'ai ouvert un sujet sur le Bistro de Wikidata pour mieux comprendre d'où cela peut venir et voir si on peut régler cela.

Merci beaucoup de ton aide abelthorne !

Amicalement.

Ubuntu-fr

Navigation

Liens de recherche

Annonce

#1 Le 18/05/2017, à 20:32

Problème de codage de caractères

#2 Le 18/05/2017, à 23:25

Re : Problème de codage de caractères

#3 Le 19/05/2017, à 11:28

Re : Problème de codage de caractères

#4 Le 19/05/2017, à 12:00

Re : Problème de codage de caractères

#5 Le 19/05/2017, à 18:36

Re : Problème de codage de caractères

Pied de page des forums