Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 09/10/2013, à 14:02

uniuxjavascript

affichage des urls

Bonjour
je voudrai savoir comment je peux trouver les listes des URL dans un fichier
j ai essayé avec cette commande
grep -E 'www\.[[:alnum:]]+\.[[:alnum:]]+'  fichiers.html

elle me donne pas tous les adrsse
dans mon fichier  il y a www.org.com
www.facebook.com
www.org-univ.fr

ma commande affiche que le deux premiers URL
merci

Hors ligne

#2 Le 09/10/2013, à 14:11

genma

Re : affichage des urls

Normal que la 3ème url ne soit pas renvoyé, elle contient un tiret. Or ton expression régulière est "alnum", donc l'équivalent de 0-9a-z, on ne prend donc que des noms composés de lettres et de chiffres, pas avec des tirets. ;-)


"Lorsque tu as découvert le libre, tu sais que tu ne pourras plus jamais revenir en arrière".
Utilisateur d'Ubuntu depuis la version 4.10 !
Mon blog ?      https://blog.genma.fr
Mon twitter?     http://twitter.com/genma

Hors ligne

#3 Le 09/10/2013, à 14:16

uniuxjavascript

Re : affichage des urls

genma a écrit :

Normal que la 3ème url ne soit pas renvoyé, elle contient un tiret. Or ton expression régulière est "alnum", donc l'équivalent de 0-9a-z, on ne prend donc que des noms composés de lettres et de chiffres, pas avec des tirets. ;-)

oui mais comment faire pour récupérer le-??

Hors ligne

#4 Le 09/10/2013, à 14:22

genma

Re : affichage des urls

Essaie cette commande

grep -o 'http://[^"]*' fichiers.html

Ca devrait passer. Et si c'est bon, change le titre du post en résolu. Merci ;-)


"Lorsque tu as découvert le libre, tu sais que tu ne pourras plus jamais revenir en arrière".
Utilisateur d'Ubuntu depuis la version 4.10 !
Mon blog ?      https://blog.genma.fr
Mon twitter?     http://twitter.com/genma

Hors ligne

#5 Le 09/10/2013, à 15:49

pingouinux

Re : affichage des urls

Salut,
Essaye ceci :

grep -Eo 'www\.[[:alnum:]-]+\.[[:alnum:]]+'  fichiers.html

Hors ligne