[gull] Uprgade Samba2 à Samba3 et noms de fichiers farfellus

Félix Hauri felix at f-hauri.ch
Sun Mar 30 14:03:05 CEST 2008


Bonjour Erik,

On Sun, Mar 30, 2008 at 11:25:03AM +0200, Erik Rossen wrote:
> > voient des noms bizares comme: ``O748HA~8'' à la place d'un nom comme:
> >  ``Impressions ok '' (remarquez l'espace en fin du nom de dossier.
> 
> ...snip...
> 
> > Comme il y en a plusieur centaines, avant de commencer à pondre un
> > truc en perl, basé sur les dicos pour évaluer l'encodage utilisé pour
> > chaque entrée de chaque répertoire et le passer par un ``recode -d -f
> > XXX..flat''...
> 
> T'as déjà regardé le package "convmv"?
Oui, cependant, merci Erik, je dois reconnaitre que j'ai envoyé ce mail
*avant* de mettre la main sur ``convmv'';). Le problème de convmv est
que dans mon cas, j'ai plusieur encodages différents dans le même répertoire...
(Je ne me vois pas lancer convmv en mode interactif non plus;)
(Je crois même qu'il y a des noms de fichiers en U8 qui ont été interprété,
puis recopiés en Latin1 puis re en U8, si bien que j'ai 4 caractères
farfellus à la plus d'1 seul accentué.)

De plus, convmv ne va pas s'occuper de espaces en fin de nom de fichier,
que samba transforme par soucis d'accessibilité...

> ,,,
> Même avec convmv, il y aura beaucoup des cas à traiter à la main.
C'est bien ce que j'avais compris...

> C'est peut-être le moment pour demander aux utilisateurs de faire un
> nettoyage de printemps en expliquant que les noms des fichiers qui
> finissent avec " " ne sont pas acceptables.
... oui, ou qui commencent pas un `` '', ou qui contiennent un
saut de ligne... etc.

Bref, je ne me vois pas demander aux utilisateurs de parcourir quelques
millier de répertoires pour faire de l'ordre...

Je sens que je vais devoir scripter.

J'ai déjà commencé par ``find . -print >/tmp/bigliste'', puis
``tr '0-9a-zA-Z(),_.@! /~-' \\n < /tmp/bigliste | sort -u >/tmp/allspecchars''
pour me faire une idée:
$ wc -l /tmp/bigliste /tmp/allspecchars
   483926 /tmp/bigliste
      129 /tmp/allspecchars

483'926 entrées de répertoire à vérifier, et 129 caractères à
comprendre, interpréter et aplatir.

Je songe sérieusement à utiliser un dico pour m'en sortir...
(Au fait, si quelqu'un à des exemples d'utilisation d'ispell
 en mode non-interactif, je suis preneur).

Bref, a+!

--
 Félix Hauri  -  <felix at f-hauri.ch>  -  http://www.f-hauri.ch



More information about the gull mailing list