Contenu | Rechercher | Menus

Annonce

DVD, clés USB et t-shirts Ubuntu-fr disponibles sur la boutique En Vente Libre

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 05/02/2021, à 19:47

Arbiel

Comprendre la procédure d'identification d'un site protégé par mdp

Bonsoir à tous

Je veux aller chercher des informations avec un script python dans les pages d'un site réservé à ses abonnés. Je suis confronté à la procédure d'authentification dont je ne sais absolument rien.
Pour contourner le problème et bien que cele ne soit pas pratique, j'ai inséré dans mon script l'appel de procédures bash.

La première procédure provoque l'affichage de la page de demande d'authentification. Je saisis l'identification et le mot de passe, je valide et laisse firefox actif pour conserver la session sur le serveur, de sorte qu'il réponde aux apels suivants.

La deuxième procédure repose sur le principe suivant : affichage du code de la page en préfixant par l'url par 'view-script:', affichage d'un message d'attente, sélection à la main de l'intégralité du code, validation du message d'attente pour débloquer la procédure bash, envoi du contenu de la sélection vers un fichier temporaire par 'xclip', fin de la procudure et retour vers python pour le traitement du fichier temporaire.

Outre le problème de l'authentification, je rencontre également la difficulté de voir le message d'attente disparaître derrière l'écran firefox.

Je cherche ainsi à résoudre deux points :

obtenir la liste des messages envoyés par le navigateur pour faire envoyer ces mêmes messages par python

et en attendant de savoir exécuter la procédure d'authentification par python, faire en sorte que le message d'attente reste au premier plan.

Il est probable que ce besoin puisse se résoudre en javascript, mais je ne connais absolument pas ce langage.

Merci de me conseiller sur ces deux points, et éventuellement de m'indiquer une autre manière d'arriver à mes fins.

Arbiel


Arbiel Perlacremaz
Dell Vostro Ubuntu 18.04 64 bits, LDLC Aurore NK3S-8-S4 Ubuntu 20.04
Abandon d'azerty au profit de bépo, de google au profit de Lilo et de la messagerie électronique violable au profit de Protonmail, une messagerie chiffrée de poste de travail à poste de travail.

Hors ligne

#2 Le 05/02/2021, à 21:36

beuguissime

Re : Comprendre la procédure d'identification d'un site protégé par mdp

Bonsoir,

Le couple identifiant/mot de passe peut être transmis de différentes manières. Il faudrait que tu indiques le site que tu cibles.

Bien sûr, dès qu'il s'agit d'automatiser le parcours d'un site web, il faut être raisonnable sur le nombre de requêtes par minutes afin de 1/ ne pas surcharger le serveur et 2/ ne pas risquer de voir son adresse IP/son compte banni.

Hors ligne

#3 Le 06/02/2021, à 19:11

Arbiel

Re : Comprendre la procédure d'identification d'un site protégé par mdp

Bonjour beuguissime

Merci pour ta réponse et pour ton avertissement sur la fréquence des accès aux pages.

Mon idée initiale était d'enregistrer à la volée les messages envoyés par firefox pour y découvrir comment sont transmis mon identifiant et mon mot de passe.

Pour l'instant, je vais me contenter de la procédure que j'ai décrite au #1. La première page que je lis contient une description sommaire des vidéos youtube disponibles. Mon script boucle sur ces descriptions pour afficher un écran qui me permet de choisir ou non la vidéo en question. Si je sélectionne la vidéo, je dois aller chercher dans une page référencée dans la descrption l'adresse de la vidéo. Ceci me demande plusieurs secondes. Au total, la fréquence des accès ne dépasse pas quelques pages par minute.


Arbiel Perlacremaz
Dell Vostro Ubuntu 18.04 64 bits, LDLC Aurore NK3S-8-S4 Ubuntu 20.04
Abandon d'azerty au profit de bépo, de google au profit de Lilo et de la messagerie électronique violable au profit de Protonmail, une messagerie chiffrée de poste de travail à poste de travail.

Hors ligne