Portál AbcLinuxu, 24. dubna 2024 03:45


Dotaz: Spamassassin a jeho uceni

11.8.2004 13:01 Kamorek | skóre: 33 | blog: předvolební mazec | VB
Spamassassin a jeho uceni
Přečteno: 288×
Odpovědět | Admin
Zdravim podruhem vim ,z etoto tema tu uz bylo, treba to poslouzi i jinzm, kdyz to trochu shrnu.
Muj dotaz se tyka spamassassina a jeho uceni. Shlednul jsem clanky: http://www.abclinuxu.cz/forum/show/40643 http://www.abclinuxu.cz/forum/show/62006 Nejsem si jistej, ze jsem vse pochopil spravne, mozna jsem prisel na novy, jednodussi postup. Proste Muj postup je tento: /v etc/mail/spamassassin/local.cf:
use_bayes 1
bayes_path /var/spool/amavis/.spamassassin/bayes #v tomto DIR jsou :bayes_journal, bayes_seens, bayes_toks
auto_learn 0

Tak: U vsech uctu jsem vytvoril aliasy na usery SPAM a HAM, takze posta pro vsechny se mi posila krom svym adresatu na 2 stejne ucty. K temto 2 uctum se 1x za tyden pripojim pres IMAP a na uctu SPAM vymazu vsechny rozumne zpravy a na uctu HAM vsechny spamy.
Pak spustim sa-learn ham na uctu HAM a sa-learn spam na uctu SPAM. Je to correct? A bijte do me, pokud se vam neco nezda. Dik
Taky si udělám nějakou studii.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

11.8.2004 13:25 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Odpovědět | | Sbalit | Link | Blokovat | Admin
K temto 2 uctum se 1x za tyden pripojim pres IMAP a na uctu SPAM vymazu vsechny rozumne zpravy a na uctu HAM vsechny spamy. Pak spustim sa-learn ham na uctu HAM a sa-learn spam na uctu SPAM. Je to correct?

Ne, to je chyba, protože takhle bude stále dělat tatáž chybná rozhodnutí, zlepší se leda náhodou. Musíš přesunout chybně klasifikované maily do správné kategorie, a pak učit.
11.8.2004 13:40 Kamorek | skóre: 33 | blog: předvolební mazec | VB
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Prolil bych objasnit posledni vetu. "Presunout do spravne kategorie..."
na uctu SPAM zustane prece pouze spam a na HAM zustane pouze OK posta...
Taky si udělám nějakou studii.
11.8.2004 13:48 Kamorek | skóre: 33 | blog: předvolební mazec | VB
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
jinak:
sa-learn --spam /var/spool/amavis/ham sa-learn --spam /var/spool/amavis/spam
kde ham je addr s uctem, kde je ham a spam je addr s uctem, kde je spam?
Taky si udělám nějakou studii.
11.8.2004 13:49 jm
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
To asi ne... :-)
11.8.2004 13:55 Kamorek | skóre: 33 | blog: předvolební mazec | VB
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
dik za radu jm :-), Mohl bys to trochu objasnit ?
Taky si udělám nějakou studii.
11.8.2004 13:57 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
sa-learn --spam /var/spool/amavis/ham

;-)
11.8.2004 13:57 jm
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Hint: Opravdu je v obou adresarich spam? ;-)
11.8.2004 13:56 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
na uctu SPAM zustane prece pouze spam a na HAM zustane pouze OK posta

To je sice pěkné, ale když špatně zařazené maily jen tak smažeš, SA se nikdy nedozví, co klasifikoval špatně, takže to s velkou pravděpodobností špatně klasifikuje opět. A bude se jen utvrzovat v tom, jak už to stejně třídí.

Buď mluvíme každý o něčem jiném, nebo vůbec netušíš, jak funguje bayesovský klasifikátor, a pak to řekni rovnou.
11.8.2004 14:18 Kamorek | skóre: 33 | blog: předvolební mazec | VB
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Pro jm. Jasne, preklep jako krava :-)
Bayes se nemá co dozvídat, co klasifikoval spatne protoze klasifikuje pouze 100% spam, nebo 100% ok maily.
Takze takhle.
1) Vsechny firemni emaily preposilam krom svych adresatu na ucet BUFET
2) Pres IMAP otevru tento ucet a spamy presunu v outlooku do slozky SPAM, okpostu presunu do slozky HAM. Takze v /home/bufet mam krom jineho soubory spam a ham.
3) soubor spam frknu do /var/spool/amavis/spam
4) soubor ham frknu do /var/spool/amavis/ham
5) sa-learn --ham /var/spool/amavis/ham
6) sa-learn --spam /var/spool/amavis/spam
A ted me pos**, jestli to neni OK.
Me staci v tomto pripade, kdyz vim, ze to funguje, nepotrebuju vedet jak to funguje. Nemusim vedet vsechno :-)
Dikec
Taky si udělám nějakou studii.
11.8.2004 14:22 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Bayes se nemá co dozvídat, co klasifikoval spatne protoze klasifikuje pouze 100% spam, nebo 100% ok maily.

Obávám se, že jsi ztracený případ.
11.8.2004 14:24 jm
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Priznam se, ze nerozumim hned tomu vychodisku, takze tech dalsich 6 bodu uz jsem ani necetl.
11.8.2004 14:33 Kamorek | skóre: 33 | blog: předvolební mazec | VB
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
No, myslim, ze muj postup je spravny. Uvidim a dam vedet jak to dopadlo.:-) Mozna se jen spatne vyjadruju.
Yeti:
To je sice pěkné, ale když špatně zařazené maily jen tak smažeš, SA se nikdy nedozví, co klasifikoval špatně, takže to s velkou pravděpodobností špatně klasifikuje opět.
jen jsem myslel, ze zadne spatne zarazene emaily nemam... V souboru ham je pouze 100% ham a v souboru spam je pouze 100% spam.Prece ty soubory vytvarim ja.:-)
Nicmene doufam, ze postupuju spravne. SA se vypnout da vzdy :-)
Taky si udělám nějakou studii.
11.8.2004 14:36 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Když nemáš, tak nemáš. Až budeš mít, tak je nemaž (já z toho snad začnu básnit ;-) ale přesuň z ham do spam či naopak.
11.8.2004 14:45 Kamorek | skóre: 33 | blog: předvolební mazec | VB
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
ok. Dik óóóó nejvyssi.
alik
Taky si udělám nějakou studii.
11.8.2004 14:48 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Jestli jsou v 3) a 4) soubory (formát mbox), tak sa-learn --mbox.
12.4.2005 10:25 Honza
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Odpovědět | | Sbalit | Link | Blokovat | Admin
Zdravim. Mam takovej mensi problem. SpamAssassin frci ale spatne filtruje spamy...resp. nefiltruje. Dokonce sem vypnul samouceni aby se posta filtroval jen skrze Razor a DCC.Jenze ackoliv dojde jakejkoliv spam stejne mu to dava hodnoceni -20 az -40...obcas neco dostane 0.05 ale kdyz ho poslu znovu tak se to hodnoceni jeste zmensi(coz by mohlo byt logicke v ramci casove posloupnosti)...ale coz?! Muze nekdo poradit?Diky
12.4.2005 10:32 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
A za co ty záporné body dostává? Máš to nejspíš napsáno hlavičkách.
12.4.2005 12:47 Honza
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Defaultni scoring. V hlavickach se me to uklada od 0.0 hodnoceni a navic nemam podrobne hodnoceni do hlavicky.Hodnoceni vycitam z logu. Prenastavim to....
13.4.2005 10:26 Honza
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Tak tady jsou hlavicky 2 spamu.
X-Spam-Status: No, hits=-16.189 tagged_above=-55 required=6.3 tests=AWL,
 LOCAL_RCVD, RAZOR2_CF_RANGE_51_100, RAZOR2_CHECK, URIBL_AB_SURBL,
 URIBL_OB_SURBL, URIBL_SBL, URIBL_SC_SURBL, URIBL_WS_SURBL

X-Spam-Status: No, hits=-29.755 tagged_above=-55 required=6.3 tests=AWL,
 LOCAL_RCVD, RAZOR2_CF_RANGE_51_100, RAZOR2_CHECK, URIBL_AB_SURBL,
 URIBL_OB_SURBL, URIBL_SBL, URIBL_SC_SURBL
Docela zajimave ohodnoceni na spam -16 a dokonce -29 a to sou jeste horsi(-40atd).Dost mozna ze tam nevidim DCC ze by nejak nefungoval? Zkousel jsem ./cdcc "info" a vse vypada v poradku.
13.4.2005 10:57 unchallenger | skóre: 69 | blog: unchallenger
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
Sice za to nejspíš může AWL, ale v těch testech není nic, za co by defaultně bylo tak velké záporné skóre (viz http://spamassassin.apache.org/tests_3_0_x.html), takže to máš nějak zvláštně nakonfigurované...
13.4.2005 11:17 Honza
Rozbalit Rozbalit vše Re: Spamassassi a jeho uceni
To mas nejspis pravdu. Ja sice pozdeji nastavil AWL na 0 ale nesmazel .spamassassin/auto-whitelist takze to mozna pouziva ale nepridaval nove polozky.Nicmene to vyzkousim.Diky

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.