Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 13/03/2020, à 16:12

Plug

[Résolu] wget https récupère une page (chiffrée) - compressée

Bonjour,

Je n'utilise pas tous les jours wget mais là je suis un peu étonné.
Il me semblait que wget savait gérer le https (de plus en plus présent sur le web).
Je tape simplement :

root@pc-linuxshop:~# wget https://mabbox.bytel.fr

et je récupère bien un fichier index.html

Mais impossible de le lire, même dans un navigateur (il est rempli de caractères spéciaux - certainement du chiffrage) sad.

Quelqu'un a-t-il une idée de ce qui se passe ?

Merci

Dernière modification par Plug (Le 14/03/2020, à 23:13)

Hors ligne

#2 Le 13/03/2020, à 16:41

krodelabestiole

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

wget gère le https sans problème. donc ton problème n'est très certainement pas lié au https, mais vu que le domaine mabbox.bytel.fr pointe sûrement sur ta box bouygues et que je ne suis pas chez bouygues, aucune idée du problème que tu rencontres sans plus d'info.

tu peux éventuellement poster le contenu de ton index.html si la page ne contient pas d'info sensible.

Hors ligne

#3 Le 13/03/2020, à 17:36

Plug

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

difficile de poster le contenu d'un fichier qui n'est visiblement pas en ASCII.
Éventuellement avec une copie d'écran mais je ne vois pas bien ce que tu pourrais en tirer.

Néanmoins, si tu penses que ça peut servir dis-moi par quelle méthode tu voudrais que j'en copie le contenu (hexdump ?)

Hors ligne

#4 Le 13/03/2020, à 17:47

krodelabestiole

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

si tu affiches le code source de ta page avec un navigateur, ça n'a rien à voir ?

peut-être que la box retourne différents contenus en fonction du user-agent ?

Hors ligne

#5 Le 13/03/2020, à 18:45

Plug

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

Désolé je ne comprends pas ta question.

Affichée dans le navigateur, voilà ce que donne la page récupérée par wget :

¬ôù“"I 厰NÑ)Áþþ†9€i$kŒêæ£7dƒ¼!"F–PAâ†íYÅJ“L:I&=IHžÉç³â dõÙ3`È:€dÅœšP¬°2‘ƒÛ‡ís¨›dÊ.5!àîA¦b%T¢¬yNºMÈW@±0¾Cˆ¼1Ìs5ú3-jÝ‹²$Ó'ZÄO+Ý÷ªÿ¦BêDNíWàlyƒÅÑàA@³àÙÐœ§NôùN0•›îFÓó,MÉŠkÇÃÕ »qµU¨·y©Æh™$ECÎEÒ$½uãÙleQ¡5ùALKäfÿÃÛEâœè¸;àȲÐ$t8Ñ#‡ß|ôlR»A±b+Þ¢ ¶ÍÑ,ÿ©Å `á °J8:FÄ.'HýPH†ð’kNÝ䊈P#çN”x%`uÍÛ°mˆ˜êy·“Ck±çõòºŒŽ¹ÐØ]ädX1¿9ÆH•ˆ'«(F6@㦸þzt,§Ò†eüéüG€ƒ/¡¦v†à8¨(9×RN¦i—Ì5Rœºh¾GÚGï‘öñ/¦½j1¼\j°Ed)Y˜©¨…æå²µLÚn1÷U V)iéíúÁýk@ê„áÙ™˜ ¥íŠ¬›fÅs¢¹ÖŒ'Ms…Qkxº7ÝâÇáÛ8ãuÁf°Šêºæ͆)Ú_Á©‚ó1PèßÛ£ Žù·ô£ŠÉÊ…Ã+.í‹LŸo„šHtÂ(‘7kÐð…@ŒT+)’5B>å¤üÖ']sD%½HYrùxrj£&°½Ø]st˜o(ƒ&çðKroä9‹áWüÒý œá°[„ÞN

Avec quoi voudrais-tu comparer ça pour dire si ça a à voir avec autre chose ? ? ?

C'est typiquement du chiffré et par définition le chiffré n'a rien à voir avec le clair.

Pour moi c'est donc wget qui ne fait pas le boulot (ou alors il lui faut un paramètre supplémentaire...)

Hors ligne

#6 Le 13/03/2020, à 23:22

krodelabestiole

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

ça peut être chiffré ou compressé, je miserai plutôt sur la 2e option.
ceci dit je vois pas comment un certificat valide pourrait être installé sur ce domaine.

quel est le retour de :

curl -I https://mabbox.bytel.fr

Hors ligne

#7 Le 14/03/2020, à 00:28

Plug

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

Heu... de mémoire, quand on a un certificat "maison" wget renvoi un message d'erreur.
Il me semble qu'on peut alors contourner le problème avec une option de wget.

En l'occurrence, là je n'ai aucun message d'erreur.

Qu'est-ce qui te fait penser que ça pourrait être du compressé ?

Hors ligne

#8 Le 14/03/2020, à 00:51

krodelabestiole

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

la plupart des serveurs web compressent les données. les navigateurs les décompressent automatiquement, j'aurai supposé que wget aussi mais peut-être pas toujours. tu donnes le retour de curl ?

Hors ligne

#9 Le 14/03/2020, à 06:56

Plug

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

Bravo, tu avais vu juste.

root@pc-linuxshop:~# curl -I https://mabbox.bytel.fr
HTTP/1.1 307 Temporary Redirect
Location: /login.html
Content-Language: fr
Content-Encoding: gzip
Date: Sat, 14 Mar 2020 04:51:21 GMT
Server: Lighttpd

Du coup, existe-t-il une option pour dézipper "à la volée" (comme le fait le navigateur) ?

Hors ligne

#10 Le 14/03/2020, à 09:41

krodelabestiole

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

il existe bien une option --header="accept-encoding: gzip"

wget --header="accept-encoding: gzip" https://mabbox.bytel.fr

mais en principe cette option est plutôt sensée autoriser le téléchargement du gzip, et donc à obtenir le fichier compressé, ce que fait visiblement déjà ton wget...
ça peut être le serveur qui force la compression du contenu, ou alors tu as peut-être modifié le fichier /etc/wgetrc ou créé un fichier ~/.wgetrc qui change les options par défaut ?

éventuellement tu peux regarder si tu as le même comportement sur https://wordpress.com qui retourne aussi du gzip :

wget -S --header="accept-encoding: gzip" https://wordpress.com

devrait retourner un contenu compressé, tandis que :

wget -S https://wordpress.com

devrait retourner un contenu clair.


en l'occurrence pour résoudre le problème tu peux soit essayer de vérifier côté options de wget et paramètres du serveur, soit décompresser manuellement :

wget -O- https://mabbox.bytel.fr | gzip -cdf > index.html

Hors ligne

#11 Le 14/03/2020, à 23:10

Plug

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

C'est ça, on a bien :

  • du clair sans l'option

  • du compressé avec

Mais du coup je vois pas trop pourquoi ma box renvoi du gzip alors que je ne mets pas l'option (?)
Je passe quand même en résolu...
En te remerciant smile

Hors ligne

#12 Le 15/03/2020, à 10:25

krodelabestiole

Re : [Résolu] wget https récupère une page (chiffrée) - compressée

contrairement à ce que j'ai supposé en #8, wget ne décompresse jamais automatiquement le contenu, par contre il permet d'indiquer au serveur si il accepte le gzip ou pas, et en fonction, un serveur bien configuré envoi le contenu compressé ou brut.

ici lighttpd ne semble pas prendre en compte ce qu'accepte, ou pas, le client (wget), et envoie du gzip dans tous les cas.

Hors ligne