[gull] Comment optimiser spamassassin
Marc SCHAEFER
schaefer at alphanet.ch
Fri Apr 2 09:31:02 CEST 2004
On Thu, Apr 01, 2004 at 06:23:46PM +0200, Patrick GELIN wrote:
> change pas grand chose... Je me comment se gère la blacklist, je n'ai
[ spamassassin ]
schaefer at defian:~% ls -la .spamassassin/
total 2168
drwx------ 2 schaefer schaefer 4096 Mar 11 21:50 .
drwx---r-x 102 schaefer testgrp 8192 Apr 2 08:56 ..
-rw------- 1 schaefer schaefer 90112 Mar 3 16:01 bayes_seen
-rw------- 1 schaefer schaefer 2625536 Mar 11 21:50 bayes_toks
-rw-r--r-- 1 schaefer schaefer 1075 Sep 17 2002 user_prefs
Si le fichier bayes_toks est inexistant, votre système n'apprend pas les
nouveaux spams.
S'il est petit, il faudrait le `bootstrapper' avec beaucoup de spams --
mais aussi de hams (messages légitimes) sinon l'algorithme peut risquer
d'être faussé.
Notes:
- assurez-vous de donner à sa-learn des spams et des hams *non
modifiés* (en particulier des forwards de Microsoft Outlook
sont déconseillés)
- vous pouvez directement faire apprendre d'une mailbox UNIX RMAIL
(--mbox)
PS: pour mes clients, je bootstrappe souvent avec ma base de données
personnelle. En théorie c'est peu conseillé car chacun a une statistique
de mail reçue différente (p.ex. je ne reçois très peu d'HTML car je le
filtre, donc mes clients savent qu'il faut le déconfigurer pour
m'atteindre, je ne reçois pas ou presque pas de documents Microsoft
Office, etc), mais en pratique cela marche très bien.
PS/2: ma solution `despam-check' (postfix + interface WWW de déblocage
simple + notifications + apprentissage automatique sur false-positives
débloqués) est du logiciel libre (http://packages.cril.ch/). Je suis
entrain de l'améliorer pour le support IMAP à la fois pour les spams et
les hams / false positives.
More information about the gull
mailing list