Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 28/11/2009, à 22:00

Motux

Aspirer un site : )

Bonsoir à tous, voila,  ça fais un moment que ça me titille et ce soir je me jette à l'eau en esperant que ce soit utile a quelqu'un autant que ça m'a été utile, mon "ancien" probleme c'est que ma livebox bugger non-stop et c'est super frustrant d'etre tranquillou sur un site et paf ! en une seconde firefox n'affiche plus la page web et on se retrouve seul face à son pc, sans internet, alors j'en ai eu marre et j'ai pondu un S.Shell que voici que voila, en esperant que çe soit utile a ceux qui ont une connexion pourri comme moi et qui veulent se rebeller contre leur Box. @ +


#!/bin/bash
#
#
#
#
# Megatuxway V 1.0 Fr
#
# Par Tourret anthony
#
#    licence GNU GPL
#
#
#
#


var=$(zenity --entry --title="####- MegaTuxway -####" --text="Entrez l'URL du site que vous voulez aspirer :")
if [ "$?" != 0 ] ; then
    exit
 fi

    
      mkdir /home/$USER/Bureau/$var
    cd /home/$USER/Bureau/$var
         wget $var
   zenity --info --title=" ##- MegaTuxway -##" --text="Le site $var à été aspiré ! "
exit 0;

#2 Le 28/11/2009, à 22:08

guilhem91

Re : Aspirer un site : )

Bonsoir

pas mal smile J'avais fait un truc dans le même genre pour aspirer toutes les images d'un site.

Mais juste comme ça : ça doit prendre un bon bout de temps d'aspirer un site tout entier, non ?


Debian Squeeze 6.0.1 64 bits sur AMD Phenom II X4 945 3GHz + Nvidia Geforce 9600 GT

Mon site : GNU/Linux, et conseils en vrac...

Hors ligne

#3 Le 28/11/2009, à 22:09

milkshake

Re : Aspirer un site : )

C'est un peu dans le style :
http://forum.ubuntu-fr.org/viewtopic.php?id=21805

guilhem91 a écrit :

Mais juste comme ça : ça doit prendre un bon bout de temps d'aspirer un site tout entier, non ?

Ca dépend...  de plein de paramètres smile

Dernière modification par milkshake (Le 28/11/2009, à 22:11)

Hors ligne

#4 Le 28/11/2009, à 22:20

gentil_philou

Re : Aspirer un site : )

Bonsoir guilhem91 et à tous

J'avais fait un truc dans le même genre pour aspirer toutes les images d'un site.

ça m'interesse pour certains sites !

petit cadeau en échange : http://www.73lab.com/index.php?_d_=YToy … x3YWxsIjt9

si vous avez d'autres sites dans le même style, je suis preneur,

merci d'avance


________________________
Configuration matérielle : MSI VR700 - 1,73 Ghz - 1 Go - 120 Go Ubuntu 10.04. et HP pvillon g6 - 2,6 Ghz - 4 Go - 500 GO
Mes logiciels courants : OOo 3 - BlueFish 2 - The GIMP 2.6 - FireFox 3.0.10
Mon nouveau moteur de recherche préféré : http://www.ethicle.com/fr/

Hors ligne

#5 Le 29/11/2009, à 08:19

Motux

Re : Aspirer un site : )

guilhem91 a écrit :

Mais juste comme ça : ça doit prendre un bon bout de temps d'aspirer un site tout entier, non ?

Ben mllkshake a raison sa depend de plein dechoses,  sinon en general c'est fais en deux trois secondes ^^

#6 Le 29/11/2009, à 13:11

guilhem91

Re : Aspirer un site : )

Ça dépend...

2-3 secondes, c'est plutôt pour des sites assez petits, non ? (Ubuntu-fr, ça prend sûrement plus de temps wink)


Debian Squeeze 6.0.1 64 bits sur AMD Phenom II X4 945 3GHz + Nvidia Geforce 9600 GT

Mon site : GNU/Linux, et conseils en vrac...

Hors ligne

#7 Le 29/11/2009, à 13:52

miniSeb

Re : Aspirer un site : )

Je suis peut-être complètement à la masse, mais à quoi ça sert ?

Y a des aspirateurs web qui existent déjà (genre httrack) alors pourquoi refaire un script manuellement ? hmm

S'il y a une différence que je n'ai pas saisie, désolé de ce post "inutile" wink

Hors ligne

#8 Le 29/11/2009, à 14:05

Motux

Re : Aspirer un site : )

Un script c'est leger, ça use pas de ressource, c'est portable et on sais exactement comment il fonctionne, ( et c'est plus facile a modifier qu'un logiciel comme httrack)


(Attention j'ai pas dit que httrack ou autre use des ressources mais c'est quand meme des machins plus elaboré qu'un script ^^ )
@ +

Dernière modification par Motux (Le 29/11/2009, à 14:09)

#9 Le 29/11/2009, à 15:36

noska

Re : Aspirer un site : )

Je n'ai pas testé ton script, mais quand je vois "wget $var", j'en déduis qu'il n'aspire pas un site mais juste une page ! (et encore, juste le code html de la page, sans les images ou autres)

Si tu veux en savoir plus, regarde le sujet épinglé "rapatrier un site", tu verras quelles options sont à utiliser.

Par ailleurs, quand je vois : "mkdir /home/$USER/Bureau/$var", j'imagine que ça ne marche plus dès qu'on donne une adresse avec un slash.

Désolé, mais tu es proche du 0/20 sur ce coup... ce n'est pas grave, tu vas sans doute vite progresser !

Hors ligne

#10 Le 29/11/2009, à 17:05

Motux

Re : Aspirer un site : )

j'imagine que ça ne marche plus dès qu'on donne une adresse avec un slash.

je comprends pas tres bien ce que tu veux dire, en tout cas le dossier se crée bien
.

j'en déduis qu'il n'aspire pas un site mais juste une page

tu as raison, il n'aspire qu'une page mais sa faisait un moment que je n'avais plus eu a utiliser wget ( je sais c'est une excuse de m... mais c'est vrai ^^ ) et en plus c'est l'histoire d'un soir pr me depanner enfin ^^@ +
Sinon il n'aspire pas que le code mais les photos viennent aussi ^^

Dernière modification par Motux (Le 29/11/2009, à 17:06)

#11 Le 29/11/2009, à 17:12

jrev

Re : Aspirer un site : )

t'as pas essayé d'aspirer le site du forum ubuntu.fr ?
Il paraît que c'est interdit tongue


Mal nommer les choses, c'est ajouter au malheur du monde

Hors ligne

#12 Le 30/11/2009, à 12:17

noska

Re : Aspirer un site : )

Motux a écrit :

Sinon il n'aspire pas que le code mais les photos viennent aussi ^^

Je ne pense pas, en revanche il est possible que dans certaines pages, le chemin vers les images soit noté en "absolu" (chemin complet) : dans ce cas s'il y a une connexion internet ou si les images sont dans le cache du navigateur, elles s'afficheront.

Hors ligne

#13 Le 04/12/2009, à 05:39

TSIPC

Re : Aspirer un site : )

Pour aspirer un site, y'a pas mieux que ça.

wget -r -l5 -k -E "http://www.l_adresse_du_site.a_recuperer.com"


Portable HP G60 414-CA, 4 gigs de mémoire.
Ubuntu 9.10 depuis le 12 décembre 2009. Mise à jour à 10.04 ensuite à 10.10. Seul et unique OS sur le portable. Aucun problème non résolu à ce jour (30 novembre 2010) très stable et rapide.

Hors ligne