Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 04/01/2024, à 12:27

Ubuntu1

wget

Bonjour,

Je trouve certains TUTO et réponse du Forum super  ==> je voudrais garder une version html.

Alors j'ai tapé :

wget -p https://forum.ubuntu-fr.org/viewtopic.php?id=1988280

Mais je n'obtiens pas la page attendue sad

(je dois trouver la commande wget pour y ajouter mon MDP ??)

Dernière modification par Ubuntu1 (Le 04/06/2024, à 22:01)

Hors ligne

#2 Le 04/01/2024, à 17:28

alv37

Re : wget

Slt, essaye ceci:

wget -E -k -p https://forum.ubuntu-fr.org/viewtopic.php?id=1988280

PC #1: Dual-Boot (Custom) : MS-7823 (MSI B85M-G43) | CPU:  Intel i7 4790k | RAM:  8 Go | GPU:  Nvidia Geforce GTX 970 | DE: Cinnamon
VoidLinux // ArchLinux
PC #2 :(Custom) :  Linux Mint 22 | DE:  Cinnamon | MB:  Gigabyte GA-G31M-ES2L v2 | CPU:  Intel Pentium D 915 | RAM:  4 Go | GPU:  Intel 82G33/G31 Express Integrated Graphics

Hors ligne

#3 Le 04/01/2024, à 21:50

Ubuntu1

Re : wget

alv37 a écrit :

Slt, essaye ceci:

wget -E -k -p https://forum.ubuntu-fr.org/viewtopic.php?id=1988280

Trop Top !! Super !! Merci !

Hors ligne

#4 Le 26/05/2024, à 17:29

Ubuntu1

Re : wget

Hello,
J'essaie de récupérer aussi les fiches qui sont en pdf à la racine mais ça ne fonctionne pas quand je tape : 
wget -E -k -p https://www.charivarialecole.fr/archives/2539

pour le site:
https://www.charivarialecole.fr/archives/2539

qu'est ce qui me manque ?

merci

Hors ligne

#5 Le 26/05/2024, à 18:45

berserk

Re : wget

Bonjour

Ubuntu1 a écrit :

Hello,
J'essaie de récupérer aussi les fiches qui sont en pdf à la racine mais ça ne fonctionne pas quand je tape : 
wget -E -k -p https://www.charivarialecole.fr/archives/2539

pour le site:
https://www.charivarialecole.fr/archives/2539

qu'est ce qui me manque ?

merci

wget -r -l1 -H -t1 -nd -N -np -A.pdf -erobots=off --wait=2 --random-wait --limit-rate=20k https://www.charivarialecole.fr/archives/2539

vu ici : https://unix.stackexchange.com/question … using-wget

Sinon il me semble que y avait une extension Firefox qui permettait de faire ça, je sais pas si elle existe toujours.

EDIT : oui elle existe toujours c'est Downthemall et ça peut faire exactement ce que tu demandes.
Tu peux filtrer les liens pour n'avoir que les pdf cochés et ensuite les télécharger.

Dernière modification par berserk (Le 26/05/2024, à 18:51)

Hors ligne

#6 Le 03/06/2024, à 18:43

Ubuntu1

Re : wget

oh super !! MERCI je vais tester les deux !!

Hors ligne

#7 Le 04/06/2024, à 22:03

Ubuntu1

Re : wget

Finalement je réouvre le topic j'ai tapé :

wget -r -l 1 -nH -nd -np --ignore-case -A '*.pdf' https://www.charivarialecole.fr/archives/2539

j'ai obtenu un message d'erreur :

--2024-06-04 21:59:32--  https://www.charivarialecole.fr/archives/2539
Résolution de www.charivarialecole.fr (www.charivarialecole.fr)… 178.32.112.212
Connexion à www.charivarialecole.fr (www.charivarialecole.fr)|178.32.112.212|:443… connecté.
requête HTTP transmise, en attente de la réponse… 200 OK
Taille : 138645 (135K) [text/html]
Enregistre : ‘2539.tmp’

2539.tmp            100%[===================>] 135,40K  --.-KB/s    ds 0,1s    

2024-06-04 21:59:32 (1,34 MB/s) - ‘2539.tmp’ enregistré [138645/138645]

Suppression de 2539.tmp puisqu’il devrait être rejeté.

Terminé — 2024-06-04 21:59:32 —
Temps total effectif : 0,3s
Téléchargés : 1 fichiers, 135K en 0,1s (1,34 MB/s)

Et je ne trouve aucun fichier sad

Hors ligne

#8 Le 05/06/2024, à 17:04

erresse

Re : wget

2539.tmp            100%[===================>] 135,40K  --.-KB/s    ds 0,1s    

2024-06-04 21:59:32 (1,34 MB/s) - ‘2539.tmp’ enregistré [138645/138645]

Suppression de 2539.tmp puisqu’il devrait être rejeté.

Ben, c'est plutôt normal, puisqu'il y a un message qui t'avertit que le fichier a été supprimé...
Par contre, je ne saurais pas expliquer la raison de cette suppression.


Plus de 50 ans d'informatique, ça en fait des lignes de commandes en console, mais on n'avait pas le choix...
Excellente raison pour, aujourd'hui qu'on le peut, utiliser au maximum les INTERFACES GRAPHIQUES !
Important : Une fois le problème solutionné, pensez à clore votre sujet en ajoutant [Résolu] devant le titre du 1er message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.

Hors ligne

#9 Le 05/06/2024, à 18:23

Astrolivier

Re : wget

le fichier est supprimé parce que c'est demandé, (on ne veut que les liens)

après tentative et aide de chat gpt il manque l'option -H pour suivre les liens

wget -r -l1 -nH -nd -np -H  --ignore-case -A '*.pdf' https://www.charivarialecole.fr/archives/2539

ou plus simplement

wget -r -l1 -H -nd -A pdf  https://www.charivarialecole.fr/archives/2539

S'il faut absolument faire des sacrifices pour assurer le progrès de l'humanité, ne serait-il pas indispensable de s'en tenir au principe selon lequel c'est à ceux dont on exige le sacrifice que la décision doit revenir en dernier ressort ? (howard zinn)

Hors ligne

#10 Le 09/06/2024, à 22:47

Ubuntu1

Re : wget

oh merci pour l'aide il falllait le trouver !!!

je pensais que wget suivait les liens d'une pageweb ? tu as mis quoi pour avoir trouver avec Chat GPT ?

Hors ligne

#11 Le 10/06/2024, à 19:05

Ubuntu1

Re : wget

question : je ne retrouve pas la page web HTML ou HTM sur laquelle cliquer,  j'ai bien par contre la globalité des fichiers pdf ... sad

Dernière modification par Ubuntu1 (Le 12/06/2024, à 18:53)

Hors ligne