Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 26/06/2021, à 10:15

toitoinebzh

GrabMail

Bonjour,

Je vous présente un développement perso d'un outil qui sert à scraper des mails sur le web.
A partir d'un url de départ, il visite de manière récursive des pages web et à chaque visite récupère les mails qui s'y trouve.
Une fois la recherche terminée, on peut sauvegarder les mails trouvés dans un fichier csv.

L'outil s'appelle GrabMail et est dispo sur framagit
https://framagit.org/anto1ne/grabmail

pour le lancer, il suffit d'utiliser la commande suivante

python3 GrabMail.py 

Je ne suis pas particulièrement fan de ce type d'applications mais j'ai vu sur le forum quelqu'un qui cherchait à faire tourner une application windows propriétaire similaire, si on peut en avoir une en libre c'est mieux wink

J'ai codé ça en quelques heures, cet outil reste donc améliorable sur de nombreux points
* regex pour bien sélectionner les urls et mails
* affichage de l'avancement en temps réel/risque de freeze

Hors ligne

#2 Le 29/06/2021, à 15:03

herveD

Re : GrabMail

Bonjour,
C'est moi qui cherche désespérément à faire tourner un programme sous windows (voir fils de discussion par ailleurs, seul reliquat que je n'ai jamais pu migrer sous un linux
Effectivement une solution simple qui fonctionne sous linux serait bien meilleur :-)

Merci d'avoir pris le temps de faire cela et de ne pas m'avoir jugé sur le besoin de récupérer des emails en nombre car c'est pour 2 sites associatifs dont celui en signature : https://www.clibre.eu/fr/
on demande une collaboration mais bon en attendant il faut saisir du contenu et c'est laborieux.
D'ou l'idée de noter dans un fichier calc des sites que l'on trouve intéressant ET leur mail de contact  pour pouvoir leur demander s'il peuve saisir une présentation de leur site ou activité!

Ce programme fonctionne déjà bien. Néanmoins, si toi ou une autre personne souhaite contribuer à l'améliorer, cela nous aiderait car nous ne sommes pas dev'
Dans ce cas comment faire ?

Dernière modification par herveD (Le 16/07/2021, à 16:19)


Ma config actuelle : Ubuntu 23.10 - 64b - https://clibre.eu/

Hors ligne