[gull] Comment optimiser spamassassin

Marc SCHAEFER schaefer at alphanet.ch
Fri Apr 2 09:31:02 CEST 2004


On Thu, Apr 01, 2004 at 06:23:46PM +0200, Patrick GELIN wrote:
> change pas grand chose... Je me comment se gère la blacklist, je n'ai

[ spamassassin ]

   schaefer at defian:~% ls -la .spamassassin/
   total 2168
   drwx------    2 schaefer schaefer     4096 Mar 11 21:50 .
   drwx---r-x  102 schaefer testgrp      8192 Apr  2 08:56 ..
   -rw-------    1 schaefer schaefer    90112 Mar  3 16:01 bayes_seen
   -rw-------    1 schaefer schaefer  2625536 Mar 11 21:50 bayes_toks
   -rw-r--r--    1 schaefer schaefer     1075 Sep 17  2002 user_prefs

Si le fichier bayes_toks est inexistant, votre système n'apprend pas les
nouveaux spams.

S'il est petit, il faudrait le `bootstrapper' avec beaucoup de spams --
mais aussi de hams (messages légitimes) sinon l'algorithme peut risquer
d'être faussé.

Notes:
   - assurez-vous de donner à sa-learn des spams et des hams *non
     modifiés* (en particulier des forwards de Microsoft Outlook
     sont déconseillés)
   - vous pouvez directement faire apprendre d'une mailbox UNIX RMAIL
     (--mbox)

PS: pour mes clients, je bootstrappe souvent avec ma base de données
personnelle. En théorie c'est peu conseillé car chacun a une statistique
de mail reçue différente (p.ex. je ne reçois très peu d'HTML car je le
filtre, donc mes clients savent qu'il faut le déconfigurer pour
m'atteindre, je ne reçois pas ou presque pas de documents Microsoft
Office, etc), mais en pratique cela marche très bien.

PS/2: ma solution `despam-check' (postfix + interface WWW de déblocage
simple + notifications + apprentissage automatique sur false-positives
débloqués) est du logiciel libre (http://packages.cril.ch/). Je suis
entrain de l'améliorer pour le support IMAP à la fois pour les spams et
les hams / false positives.





More information about the gull mailing list