Portál AbcLinuxu, 12. května 2025 14:00

Dotaz: filtrovani webu spamovym filtrem

13.5.2010 17:26 wosambo | skóre: 5
filtrovani webu spamovym filtrem
Přečteno: 290×
Odpovědět | Admin

Dobrý den,


zajímalo by mě, jestli někdo z přítomných už někdy řešil či narazil na řešení filtrování webu bayesovským filtrem. Rád bych něco takového pospojoval na Linuxu.

Narazil jsem už na Dansguardian a další, ale přímo myšlenka bayesovské filtrace webu mě hodně nadchla (pokud by to nebylo pekelně pomalé).

Konkrétně si to představuju idealisticky tak, že bych popadl nějaký spamfiltr, zkonfiguroval, případně ještě s něčím zkombinoval a napojil na nějakou proxynu.

Uvítám jakékoli podněty, rady či varování před slepými uličkami.


Děkuji


Jirka alias wosambo

Nástroje: Začni sledovat (2) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

13.5.2010 18:24 NN
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Odpovědět | | Sbalit | Link | Blokovat | Admin
Ted jsem uspesne rozchodil havp + squid, nechyti to vsechno, ale jako predvoj to nevypada spatne. Testovaci vyrus to chytlo:

http://www.eicar.org/anti_virus_test_file.htm

Samozrejme existuji komercni boxy a IDS implenetace.

NN
21.5.2010 12:30 wosambo | skóre: 5
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem

Děkuji za podnět. Mám ale spíš na mysli něco, co bude blokovat obsah, který osobně označím za závadný pro skupinu lidí, která je přes tento sw připojena k netu.

Narazil jsem na zajímavé programy, ale něco, co by zvládlo filtrovat webový obsah v českém jazyce s jeho variabilitou, zatím nenacházím. Proto mě zaujala myšlenka Bayesovských filtrů používaných proti spamu.

Dokonce jsem na takové řešení už i narazil, ale jen v podobě jakéhosi pluginu pro MS Internet Explorer, což mi je na serveru při nejlepší vůli k ničemu :)

Prostě pospojovat hotové programy, trošku si zaskriptovat a zaprogramovat a sem tam něco přivohnout. Programovat to celý ambice nemám

21.5.2010 13:04 NN
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Jako porno, nebo warez ? Daji se udelat urcite regex filtry do ve squidu, plus nektere security boxy(juniper SSG, cisco ASA) umeji "web content filtering" podle cilove skupiny(drug, adult..), ale do fungovani tohoto moc nevidim.

NN
21.5.2010 13:17 wosambo | skóre: 5
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Děkuji, ty regexy vypadaji zajímavě.
21.5.2010 13:42 Robert | skóre: 16 | blog: zabak
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Pouzivam Dansguardian, celkem zajimave ma nadefinovane filtrovani dle obsahu?, zkousim to cca tyden a tvari se to rozumne. Pod Dansguardem bezi Squid, do budoucna planuju jeste Havp, ale ted na to neni moc cas.
21.5.2010 13:46 wosambo | skóre: 5
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
A jak se to chová např. na Seznamu, když dám vyhledat nějaké peprné české pornoslovo, které anglické filtry neodhalí?
21.5.2010 18:58 Robert | skóre: 16 | blog: zabak
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Porno je porno skoro vsude :-), ale nemel by byt problem doplnit soubor o dalsi fraze a jejich vahu. Zkus nadhodit seznam slov a v pondeli ti reknu jak se to chovalo.
21.5.2010 19:13 wosambo | skóre: 5
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
oooo jéééé, moc děkuji.

Tak např. kundička, šukání, šukáníčko, šukny, šuká, šukající, nadržený holky, ...

Možná by nebylo špatné mít něco jako má jyxo.cz - skloňování a takový ty češtinský věci.

Doufám, že mě nebude tento příspěvek nějak zablokován jako mravně nevhodný :-)
21.5.2010 23:02 Piškot | skóre: 7 | blog: Uživatel | Přerov nad labem
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Jen pro některé proxy ...
22.5.2010 08:38 wosambo | skóre: 5
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Nechápu smysl vašeho příspěvku. Co platí jen pro některé proxy?
24.5.2010 12:36 Robert | skóre: 16 | blog: zabak
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Tak jsem to vyzkousel a celkem dobry, odfiltrovano uz pri zadani klicovych slov v google (Byl prekrocen limit pro vážené fráze) - proste slova jsou nevhodna. Jedine co prolezlo byly sukny.cz a uz jsem zabanovane :-). Rekl bych ze je to to co hledas. Nadrzene holky v googlu jako fraze hledani projdou, otazkou je co vsechno je pak blokovano, rekl bych ze vetsina a tak zase ok.
24.5.2010 18:19 wosambo | skóre: 5
Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
Zajimave,zajimave, hodne jsi me povzbudil do toho jit.

Diky.

Jirka

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.