Contenu | Rechercher | Menus

Annonce

Ubuntu 16.04 LTS
Commandez vos DVD et clés USB Ubuntu-fr !

Pour en savoir un peu plus sur l'équipe du forum.

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

#1 Le 18/05/2017, à 19:32

Tubezlob

Problème de codage de caractères

Bonjour à tous, j'utilise Ubuntu 16.04 LTS et je rencontre des problèmes avec le codage des caractères. En téléchargeant le résultat de cette requête en CSV (http://tinyurl.com/n6j6522) et en l'ouvrant avec LibreOffice (ou n'importe quel autre logiciel), je n'arrive jamais à visualiser les caractères spéciaux (du type ş).

J'ai LibreOffice 5.1.6.2 et 5.3.2.2.

Merci de votre aide !

Hors ligne

#2 Le 18/05/2017, à 22:25

abelthorne

Re : Problème de codage de caractères

Ubuntu utilise par défaut un codage en UTF-8, peut-être que ton fichier .csv est en ISO-xxxx ? Essaie de l'ouvrir avec l'éditeur de texte et de le réenregistrer (Fichier → enregistrer sous) pour choisir un encodage UTF-8 puis de l'ouvrir ensuite dans LO.

Hors ligne

#3 Le 19/05/2017, à 10:28

Tubezlob

Re : Problème de codage de caractères

Bonjour abelthorne. Merci de ta réponse.

J'ai essayé avec gedit mais cela ne change rien. gedit n'arrive pas non plus à m'afficher correctement les caractères que j'arrive pourtant à visualiser dans le navigateur. Mais serait-ce dû plutôt au fichier en lui-même ?

Hors ligne

#4 Le 19/05/2017, à 11:00

abelthorne

Re : Problème de codage de caractères

Effectivement, je viens de faire le test et c'est assez bizarre. La page web est bien en UTF-8 mais il a l'air de te télécharger un .csv en ISO-8859-15 en perdant les caractères Unicode au passage.

J'ai peut-être une solution mais je ne suis pas sûr qu'elle soit valide, étant donné que je n'obtiens apparemment pas les mêmes données avec que dans le fichier CSV (à moins qu'elles soient juste organisées différemment) : sur la page de ta requête Wikidata, tu as apparemment un lien SPARQL (Link → SPARQL endpoint) : est-ce que ce qu'il génère correspond à ce que tu essaies d'obtenir ? Si c'est le cas, tu peux télécharger les données en CSV avec cURL en faisant un copier/coller du lien en question avec une syntaxe de ce genre pour télécharger un fichier monfichier.csv :

curl "https://query.wikidata.org/bigdata/namespace/wdq/sparql?query=SELECT%20%3Fitem%20%3Flabel_id%20WHERE%20%7B%0A%20%20%3Fitem%20wdt%3AP31%20wd%3AQ101352.%0A%20%20%3Fitem%20wdt%3AP282%20wd%3AQ8229.%0A%20%20%3Fitem%20rdfs%3Alabel%20%3Flabel_id.%0A%20%20MINUS%20%7B%0A%20%20%20%20%3Fitem%20rdfs%3Alabel%20%3Flabel_fr.%0A%20%20%20%20FILTER((LANG(%3Flabel_fr))%20%3D%20%22fr%22)%0A%20%20%7D%0A%20%20FILTER((LANG(%3Flabel_id))%20%3D%20%22en%22)%0A%7D%0ALIMIT%201000" -H "Accept: text/csv" -o monfichier.csv

(Attention à bien mettre la requête entre guillemets.)

Si cURL n'est pas installé, il est dans les dépôts :

sudo apt-get install curl

Dernière modification par abelthorne (Le 19/05/2017, à 11:41)

Hors ligne

#5 Le 19/05/2017, à 17:36

Tubezlob

Re : Problème de codage de caractères

Super merci cela fonctionne ! Les résultats sont juste dans un ordre différent mais cela n'a pas d'incidence.

C'est donc un problème du côté de Wikidata Query Service (je pensais que cela venait de chez moi vu que j'ai pas mal de problèmes avec LibreOffice). J'ai ouvert un sujet sur le Bistro de Wikidata pour mieux comprendre d'où cela peut venir et voir si on peut régler cela.

Merci beaucoup de ton aide abelthorne !

Amicalement.

Hors ligne