#1 Le 05/08/2010, à 08:32
- chalavi
wget // génération des pages html avec des fins de lignes mac ??
J'ai un comportement bizarre de wget et les pages récupérées ont des fins de ligne codées en Mac au lieu d'être codées en unix.
Une sauvegarde ordinaire via Chrome de ces mêmes pages sont correctement enregistrées avec des fins de ligne unix.
Cela pose des problêmes lors des manipulations de chaînes avec grep, sed ou autres.
J'utilise geany qui dispose d'une fonction de changement de la gestion des fins de lignes et qui sait très bien ouvrir ces pages et numéroter les lignes "mac".
Une page avec des fins de ligne codées en mac, ouvertes avec geany et enregistrées avec des fins de ligne unix corrige ce problême. Mais j'ai des dizaines de pages à retraiiter...
Ma question : y a t il un paramètre dans wget permettant de gérer le codage des fins de lignes ?
Sinon ... une autre solution ???
J'ai testé "recode" qui change bien les fins de lignes, mais qui bouzille aussi l'iso 8859-1 en transformant les accents en lettres majuscules avec accents ....
Je suis sous Ubuntu Karmic
Hors ligne
#2 Le 06/08/2010, à 15:06
- Jos31
Re : wget // génération des pages html avec des fins de lignes mac ??
salut,
Peut-être essaye de faire un pipe de ton wget / cat vers
tr '\r' '\n'
Hors ligne