Portál AbcLinuxu, 7. května 2025 05:43

Dotaz: spamassassin (sa-learn)

14.5.2009 16:26 chinook | skóre: 28
spamassassin (sa-learn)
Přečteno: 797×
Odpovědět | Admin
Na firewallu mam sagatora se spamassassinem. Bohuzel userum chodi cim dal vice spamu. Chci se pokusit spamassassin naucit rozeznavat lepe spam. Podle tvurcu je idealni, aby uzivatele rozdelovali prislou postu do slozek napr. spam a nospam podle obsahu posty. Az takto ziskam 1000-5000 vzorku, tak bych mel pomoci prikazu rict antispamu co je spam a co ham.

sa-learn --no-sync --spam /home/vmail/domain/user/Maildir/spam/cur/
sa-learn --no-sync --ham /home/vmail/domain/user/Maildir/nospam/cur/
sa-learn --sync
Jsou ty prikazy spravne?

Otazka je, jak ty vzorky ziskat. Je jasne, ze to museji roztridit uzivatele. Budu muset vypnout uplne spamassassin, aby neupravoval hlavicky emailu? Nebo staci nastavit jen at do predmetu napise SPAM a nebo je prototo nejaka specialni konfigurace?

Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

14.5.2009 16:59 abc
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)
Odpovědět | | Sbalit | Link | Blokovat | Admin

Spamassassin rozezná hlavičky, které sám přidal. Kromě toho je možné mu v konfiguraci říci, které hlavičky nemá brát v úvahu. Příkazy jsou dobře. Nezapomeňte učit pod tím uživatelem, pod kterým spamassassin doopravdy běží.

Nejlépe se učí spamassassin sám automaticky ve firmě, která dokáže přinutit zaměstnance, aby nepoužívali firemní maily k soukromým účelům. Pak není celkem co řešit. Různé cirkulující maily s obrázky, 100x přeposílanými vtipy a podobnými blbostmi přidělávají spamassassinu a jeho administrátorovi jenom potíže.

14.5.2009 18:11 chinook | skóre: 28
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)
Spamassassin rozezná hlavičky, které sám přidal.
Takze predmet muzu klidne nechat prepsat na SPAM, at uzivatele vidi co by slo do spamu a co ne?
Nezapomeňte učit pod tím uživatelem, pod kterým spamassassin doopravdy běží.
diky toto jsem nevedel. takze pred spustenim sa-learn dat su vscan? Kdyz bezi pod uzivatelem
vscan
? Pod rootem to spustit nemuzu? Jestli jde o cesty ka baysovi, tak v konfiguraku mam toto:

bayes_path /etc/mail/spamassassin/bayes/bayes
14.5.2009 22:52 abc
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)

Můžete ho učit pod čím chcete. Ale musíte zajistit, aby se výsledky zapisovaly do té správné databáze, kterou používá běžící spamassassin a aby ta databáze byla pro něj i po učení přístupná pro čtení i zápis. Takže když to budete dělat pod uživatelem, pod kterým běží spamassassin, máte ty požadavky celkem bez problémů zajištěny. Když to budete dělat pod rootem, přestane vám to jednoho krásného dne fungovat, protože se seknete v právech pro databázi.

15.5.2009 11:19 chinook | skóre: 28
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)
spamassassin se doted ucil sam. Odhadem nim proslo tak 150K emailu a z toho tak min. pulka byla spam. Nebude na skodu ta stara db? Protoze nejspis nektere emaily co nesjou spam hazel tez do spamu. Nevim kolik toho je, protoze je rovnou maze.
15.5.2009 09:03 linuxik | skóre: 32 | Milovice
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)
Odpovědět | | Sbalit | Link | Blokovat | Admin

Musis se podivat kde ma spamassassin databazi a pod jakym uzivatelem bezi, treba ja to mam na serveru takhle:

/usr/bin/sa-learn --dbpath /var/lib/MailScanner/ -u postfix --spam  /var/spool/cyrus/mail/s/user/12345/SPAMLEARN/*\.

 

 

 

15.5.2009 09:28 chinook | skóre: 28
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)
Tento udaj zjistim jak?

/usr/bin/spamd -d -c -m5 -H -u vscan -r /var/run/spamd.pid

spamd bezi pod rootem, ale s volbou -u vscan, takze uceni spoustet s uzivatelem vscan? Budu muset povolit prihlasovani tomuto uzivateli, abych se pod nim mohl prihlasit do konzole a pak spustit sa-learn nebo to lze udelat elegantneji?

15.5.2009 11:20 oron | skóre: 27
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)

skus sa prepnut na usera vscan

a spustit spamassassin v debug mode

neviem isto: spamassassin -D (alebo tak nejako)

a v tom vypise bude asi nieco ako:

[6512] dbg: bayes: tie-ing to DB file R/O /var/amavis/var/.spamassassin/bayes_toks
[6512] dbg: bayes: tie-ing to DB file R/O /var/amavis/var/.spamassassin/bayes_seen
[6512] dbg: bayes: found bayes db version 3
[6512] dbg: bayes: DB journal sync: last sync: 1206525194


 

 

15.5.2009 11:46 chinook | skóre: 28
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)

su vscan
This account is currently not available.
ale jak jsem psal vyse cestu k bayesovi mam nastavenou natvrdo a tam tyto soubory jsou. Jsou potreba jeste nejake jine?
17.5.2009 16:44 oron | skóre: 27
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)

myslim ze nie.

daj mu nieco naucit spam a on ti aj napise ze sa naucil napr. spam,

pozri si potom vypis

 sa-learn --dump magic
0.000          0          3          0  non-token data: bayes db version
0.000          0     583115          0  non-token data: nspam             <---- kolko spamov som sa naucil
0.000          0     243389          0  non-token data: nham                <- kolko hamov som sa naucil
0.000          0     280095          0  non-token data: ntokens

 

  ono to presne sa robi tusim tak ze kazdy mail sa  analyzuje a rozlozi na tokeny a tie sa potom ukladaju.

neviem ci jeden mail je jeden token alebo nie? snad niekdo poradi

kolko tokenov si spamassassin drzi je udaj: 280095 ntokens

#aka velka moze max. byt bayes db - default je 150 000 tokenov

#zvacsenie na 300 000 tokenov
bayes_expiry_max_db_size 300000

po prekorocnei si on sam maze stare tokeny ...
 

 

treba si aj aktualizovat db spamassassinu -  napr: sa-learn -D
 

 

17.5.2009 16:56 oron | skóre: 27
Rozbalit Rozbalit vše Re: spamassassin (sa-learn)

oprava:

treba si aj aktualizovat db spamassassinu -  napr: sa-update -D

 

zizstenie verzie poslednej db:

 host -t txt x.2.3.updates.spamassassin.org
 

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.