#1 Le 22/04/2018, à 22:27
- Pam547
[Résolu] Regex, copier un même interval de plusieurs lignes.
Bonjour,
Je fais des recherches documentaire sur le web et vérifie avec « whois » les noms de domaine.
De plus en plus de sites proposant de l'information ou des renseignement sont anonymes et je préfère m'en méfier.
Alors je réussis à obtenir à partir d'une page de résultat de recherche un fichier txt avec des lignes ne comportant que des liens http :
<a href="https://www.deco.fr/jardin-jardinage/actualite-842623-comment-entretenir-outils-jardin.html">Comment entretenir ses outils de jardin - deco.fr</a>
<div class="resulturl"> https://www.deco.fr/jardin-jardinage/actualite-842623-comment...</div>
<a href="https://www.cornerjob.com/fr/i/entretenir-outil-travail-equipement-essuyer-ranger-vaisselle-verreries-poste-30h-plus-KhtXI9YyPk/">Entretenir un outil de travail, un équipement et essuyer ...</a>
<div class="resulturl"> https://www.cornerjob.com/fr/i/<b>entretenir</b>-<b>outil</b>-<b>travail</b>-equipement...</div>
<a href="https://www.toutbricoler.com/outils-travail-menuiserie/">Tous les outils de travail d'une menuiserie - Le Bricolage ...</a>
<div class="resulturl"> https://www.toutbricoler.com/<b>outils</b>-<b>travail</b>-menuiserie</div>
<a href="https://www.leborgne.fr/comment-faire/preparer-entretenir-son-potager.html">Préparer et entretenir son potager - Outils du bâtiment ...</a>
[...]
Je voudrais recopier dans un fichier txt ce qui est compris entre « :// » et « / » ; puis supprimer les doublons.
Entre les caractères spéciaux et sed que je suis loin de maîtriser, j'ai perdu courage et fait appelle à vous. ;)
Auriez-vous s'il vous plaît une piste, ou une solution à me proposer s'il vous plaît.
Merci pour votre attention.
Dernière modification par Pam547 (Le 23/04/2018, à 11:28)
Art.9.(code civil) Chacun a droit au respect de sa vie privée.
Art.12.(déclaration universelle des DDH) Nul ne sera l'objet d'immixtions arbitraires dans sa vie privée, sa famille, son domicile ou sa correspondance, ni d'atteintes à son honneur et à sa réputation. Toute personne a droit à la protection de la loi contre de telles immixtions ou de telles atteintes.
Hors ligne
#2 Le 22/04/2018, à 23:11
- Watael
Re : [Résolu] Regex, copier un même interval de plusieurs lignes.
salut,
/ n'est pas le seul séparateur possible.
s'il n'y a pas de substitution, il faut indiquer, au début, en le protégeant, le séparateur choisi.
par exemple : sed -n '\@motif@p' fichier
si il y a une substitution, il n'est pas nécessaire de protéger le séparateur choisi.
Connected \o/
Welcome to sHell. · eval is evil.
En ligne
#3 Le 23/04/2018, à 06:22
- pingouinux
Re : [Résolu] Regex, copier un même interval de plusieurs lignes.
Bonjour,
Par exemple, avec ton fichier :
$ grep -o '//[^/]\+/' ton_fichier | sort -u
//www.cornerjob.com/
//www.deco.fr/
//www.leborgne.fr/
//www.toutbricoler.com/
Hors ligne
#4 Le 23/04/2018, à 11:22
- Pam547
Re : [Résolu] Regex, copier un même interval de plusieurs lignes.
Bonjour,
C'est génial. J'espère en avoir fini avec mes difficultés à utiliser les expressions régulières (regex).
Merci beaucoup, et tout particulièrement à vous deux.
Bonne continuation. Au plaisir, à la satisfaction, à la récompense, à la justesse et au respect de vous « rencontrer » à nouveau.
(Morale soit disant universelle) Et vive l'application, l'exactitude et les soins.
Au revoir.
Art.9.(code civil) Chacun a droit au respect de sa vie privée.
Art.12.(déclaration universelle des DDH) Nul ne sera l'objet d'immixtions arbitraires dans sa vie privée, sa famille, son domicile ou sa correspondance, ni d'atteintes à son honneur et à sa réputation. Toute personne a droit à la protection de la loi contre de telles immixtions ou de telles atteintes.
Hors ligne