Pages : 1
#1 Le 28/11/2009, à 22:00
- Motux
Aspirer un site : )
Bonsoir à tous, voila, ça fais un moment que ça me titille et ce soir je me jette à l'eau en esperant que ce soit utile a quelqu'un autant que ça m'a été utile, mon "ancien" probleme c'est que ma livebox bugger non-stop et c'est super frustrant d'etre tranquillou sur un site et paf ! en une seconde firefox n'affiche plus la page web et on se retrouve seul face à son pc, sans internet, alors j'en ai eu marre et j'ai pondu un S.Shell que voici que voila, en esperant que çe soit utile a ceux qui ont une connexion pourri comme moi et qui veulent se rebeller contre leur Box. @ +
#!/bin/bash
#
#
#
#
# Megatuxway V 1.0 Fr
#
# Par Tourret anthony
#
# licence GNU GPL
#
#
#
#
var=$(zenity --entry --title="####- MegaTuxway -####" --text="Entrez l'URL du site que vous voulez aspirer :")
if [ "$?" != 0 ] ; then
exit
fi
mkdir /home/$USER/Bureau/$var
cd /home/$USER/Bureau/$var
wget $var
zenity --info --title=" ##- MegaTuxway -##" --text="Le site $var à été aspiré ! "
exit 0;
#2 Le 28/11/2009, à 22:08
- guilhem91
Re : Aspirer un site : )
Bonsoir
pas mal J'avais fait un truc dans le même genre pour aspirer toutes les images d'un site.
Mais juste comme ça : ça doit prendre un bon bout de temps d'aspirer un site tout entier, non ?
Debian Squeeze 6.0.1 64 bits sur AMD Phenom II X4 945 3GHz + Nvidia Geforce 9600 GT
Hors ligne
#3 Le 28/11/2009, à 22:09
- milkshake
Re : Aspirer un site : )
C'est un peu dans le style :
http://forum.ubuntu-fr.org/viewtopic.php?id=21805
Mais juste comme ça : ça doit prendre un bon bout de temps d'aspirer un site tout entier, non ?
Ca dépend... de plein de paramètres
Dernière modification par milkshake (Le 28/11/2009, à 22:11)
Hors ligne
#4 Le 28/11/2009, à 22:20
- gentil_philou
Re : Aspirer un site : )
Bonsoir guilhem91 et à tous
J'avais fait un truc dans le même genre pour aspirer toutes les images d'un site.
ça m'interesse pour certains sites !
petit cadeau en échange : http://www.73lab.com/index.php?_d_=YToy … x3YWxsIjt9
si vous avez d'autres sites dans le même style, je suis preneur,
merci d'avance
________________________
Configuration matérielle : MSI VR700 - 1,73 Ghz - 1 Go - 120 Go Ubuntu 10.04. et HP pvillon g6 - 2,6 Ghz - 4 Go - 500 GO
Mes logiciels courants : OOo 3 - BlueFish 2 - The GIMP 2.6 - FireFox 3.0.10
Mon nouveau moteur de recherche préféré : http://www.ethicle.com/fr/
Hors ligne
#5 Le 29/11/2009, à 08:19
- Motux
Re : Aspirer un site : )
Mais juste comme ça : ça doit prendre un bon bout de temps d'aspirer un site tout entier, non ?
Ben mllkshake a raison sa depend de plein dechoses, sinon en general c'est fais en deux trois secondes ^^
#6 Le 29/11/2009, à 13:11
- guilhem91
Re : Aspirer un site : )
Ça dépend...
2-3 secondes, c'est plutôt pour des sites assez petits, non ? (Ubuntu-fr, ça prend sûrement plus de temps )
Debian Squeeze 6.0.1 64 bits sur AMD Phenom II X4 945 3GHz + Nvidia Geforce 9600 GT
Hors ligne
#7 Le 29/11/2009, à 13:52
- miniSeb
Re : Aspirer un site : )
Je suis peut-être complètement à la masse, mais à quoi ça sert ?
Y a des aspirateurs web qui existent déjà (genre httrack) alors pourquoi refaire un script manuellement ?
S'il y a une différence que je n'ai pas saisie, désolé de ce post "inutile"
Hors ligne
#8 Le 29/11/2009, à 14:05
- Motux
Re : Aspirer un site : )
Un script c'est leger, ça use pas de ressource, c'est portable et on sais exactement comment il fonctionne, ( et c'est plus facile a modifier qu'un logiciel comme httrack)
(Attention j'ai pas dit que httrack ou autre use des ressources mais c'est quand meme des machins plus elaboré qu'un script ^^ )
@ +
Dernière modification par Motux (Le 29/11/2009, à 14:09)
#9 Le 29/11/2009, à 15:36
- noska
Re : Aspirer un site : )
Je n'ai pas testé ton script, mais quand je vois "wget $var", j'en déduis qu'il n'aspire pas un site mais juste une page ! (et encore, juste le code html de la page, sans les images ou autres)
Si tu veux en savoir plus, regarde le sujet épinglé "rapatrier un site", tu verras quelles options sont à utiliser.
Par ailleurs, quand je vois : "mkdir /home/$USER/Bureau/$var", j'imagine que ça ne marche plus dès qu'on donne une adresse avec un slash.
Désolé, mais tu es proche du 0/20 sur ce coup... ce n'est pas grave, tu vas sans doute vite progresser !
Hors ligne
#10 Le 29/11/2009, à 17:05
- Motux
Re : Aspirer un site : )
j'imagine que ça ne marche plus dès qu'on donne une adresse avec un slash.
je comprends pas tres bien ce que tu veux dire, en tout cas le dossier se crée bien
.
j'en déduis qu'il n'aspire pas un site mais juste une page
tu as raison, il n'aspire qu'une page mais sa faisait un moment que je n'avais plus eu a utiliser wget ( je sais c'est une excuse de m... mais c'est vrai ^^ ) et en plus c'est l'histoire d'un soir pr me depanner enfin ^^@ +
Sinon il n'aspire pas que le code mais les photos viennent aussi ^^
Dernière modification par Motux (Le 29/11/2009, à 17:06)
#11 Le 29/11/2009, à 17:12
- jrev
Re : Aspirer un site : )
t'as pas essayé d'aspirer le site du forum ubuntu.fr ?
Il paraît que c'est interdit
Mal nommer les choses, c'est ajouter au malheur du monde
Hors ligne
#12 Le 30/11/2009, à 12:17
- noska
Re : Aspirer un site : )
Sinon il n'aspire pas que le code mais les photos viennent aussi ^^
Je ne pense pas, en revanche il est possible que dans certaines pages, le chemin vers les images soit noté en "absolu" (chemin complet) : dans ce cas s'il y a une connexion internet ou si les images sont dans le cache du navigateur, elles s'afficheront.
Hors ligne
#13 Le 04/12/2009, à 05:39
- TSIPC
Re : Aspirer un site : )
Pour aspirer un site, y'a pas mieux que ça.
wget -r -l5 -k -E "http://www.l_adresse_du_site.a_recuperer.com"
Portable HP G60 414-CA, 4 gigs de mémoire.
Ubuntu 9.10 depuis le 12 décembre 2009. Mise à jour à 10.04 ensuite à 10.10. Seul et unique OS sur le portable. Aucun problème non résolu à ce jour (30 novembre 2010) très stable et rapide.
Hors ligne
Pages : 1