[gull] Caractères accentués Linux-Windows

Gregoire Metral gregoire.metral at cig.unige.ch
Fri Jul 2 22:18:02 CEST 2004


Marc Mongenet wrote:

> Le mauvais passage observé ici est le résultat d'un programme qui
> croit recevoir des caractères encodés en ISO-8859-1 (aussi appelé
> ISO Latin 1) alors qu'il les reçoit en fait encodés en UTF-8.

[...]

Merci Marc pour ces explications détaillées. J'avais trouvé quelques 
documents qui parlaient de tous ces standards d'encodage. Ce que je ne 
comprends toujours pas, c'est où tout cela est configuré... Pour définir 
un périphérique d'entrée (clavier), un format de date, etc., il y a des 
fichiers de configuration. Certains programmes proposent d'encoder les 
caractères d'une certaine manière (Thunderbird m'a effectivement averti 
que mon message précédent serait codé en UTF-8 parce qu'il contenait des 
caractères spéciaux). On peut définir ces paramètres quand on crée une 
page web, etc.

Mais dans le système (ou le shell?), où dit-on que les noms de fichiers 
sont codés de telle manière plutôt que de telle autre? Est-ce avant la 
compilation du kernel? Y a-t-il un fichier de config que je pourrais 
changer pour que mes caractères apparaissent bizarrement, mais soient au 
moins présents? Est-ce que je dois dire quelque part à mon serveur de 
reconnaître les fichiers codés en UTF-8? Est-ce que je dois changer de 
"locale" (il me semble que j'avais fait ce qu'il fallait pour mettre des 
paramètres suisses romands...)? Encore une fois, j'ai des fichiers qui 
ont des noms pas reconnus du tout, et qui du coup ne sont pas backupés, 
ce qui est gênant... Mais vous l'aurez compris, j'atteinds aussi une de 
mes limites et j'ai encore de la peine à comprendre (j'ai lu plusieurs 
des documents cités par la Penn State*, mais je n'ai pas trouvé celui 
qui me disait ce que je devais faire...).

* http://tlt.its.psu.edu/suggestions/international/links.html

Encore merci pour vos lumières!
Grégoire



More information about the gull mailing list