Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 21/12/2014, à 15:43

dva2tlse

Comment lire en python une page web protégée par mdp

Bonjour le forum,
comme dit dans le titre, je voudrais recopier dans un fichier texte le contenu de certaines pages web auxquelles je ne peux accèder qu'une fois identifié avec mdp.
J'ai déjà envoyé des requêtes à des serveurs web depuis un programme en python, donc c'est ce programme qui me vient le premier à l'esprit. (J'imagine qu'il esiste d'autres moyens, mais au prix d'un apprentissage que je voudrais éviter si le python me le permet)
Et en plus, il y a du python à mon boulot sur des Red Hat, donc je pourrais utiliser là bas ce que j'aurais pondu chez moi.
Quelqu'un pourrait il m'indiquer un exemple que je n'aurais à modifier que le moins possible ?
Merci,
David

Dernière modification par dva2tlse (Le 04/01/2015, à 18:55)


xubuntu 22.04 dans un PC assemblé
PS: Dis toto, pourquoi l'univers existe-t'il ?
Je vais y réfléchir avec Morphée et lui dès avant 22h55, donc ici, il faut se contacter auparavant.

Hors ligne

#2 Le 21/12/2014, à 18:22

Haleth

Re : Comment lire en python une page web protégée par mdp

Identifié, c'est à dire ?
Si c'est un site web avec un clickou, alors tu dois envoyer le formulaire, récupérer le cookie, et faire les GET avec ledit cookie
Si c'est du http basic auth (l'espèce de popup qui gére l'authentification), alors tu peux l'envoyer avec ton GET (peut-être sous la forme http://user:password@hostname/resources


Ubuntu is an ancien African word which means "I can't configure Debian"

Because accessor & mutator are against encapsulation (one of OOP principles), good OOP-programmers do not use them. Obviously, procedural-devs do not. In fact, only ugly-devs are still using them.

Hors ligne

#3 Le 21/12/2014, à 19:06

dva2tlse

Re : Comment lire en python une page web protégée par mdp

Merci Haleth,
merci de m'avoi répondu, mais je ne comprends rien à ce que tu me dis.

Par "s'identifier" je veux dire qu'il y a une première page sur le site où tu entres un nom d'utilisateur et un mdp, et ensuite tu navigues jusqu'à la page où se trouvent les infos que je voudrais collecter.

En farfouillant sur le site et sur le net', j'ai trouvé que certaines choses pourraient m'être utiles, mais je ne sais pas très bien comment les utiliser :
import urllib, urllib2

# Ok mauvais code html :
import beautifullsoup

# ZZZ code html propre impératif :
# import htmlparser

Je vois à peu près à quoi servent ces choses là, mais je ne sais pas du tout comment les utiliser. C'est pourquoi j'aimerais avoir un exemple qui fait une partie du boulot, et un autre éventuellement pour faire du LÉGO avec.

Il ya aussi
import pexpect
que je ne sais pas utiliser non plus mais qui peut peut-être me servir.

Merci de m'aider à avancer,
David


xubuntu 22.04 dans un PC assemblé
PS: Dis toto, pourquoi l'univers existe-t'il ?
Je vais y réfléchir avec Morphée et lui dès avant 22h55, donc ici, il faut se contacter auparavant.

Hors ligne