abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 19:22 | Nová verze

    Wine bylo po roce vývoje od vydání verze 9.0 vydáno v nové stabilní verzi 10.0. Přehled novinek na GitLabu. Vypíchnuta je nová architektura ARM64EC a podpora High DPI škálování.

    Ladislav Hagara | Komentářů: 0
    dnes 16:11 | Zajímavý software

    Edvard Rejthar na blogu zaměstnanců CZ.NIC představil nástroj deduplidog pro odstranění duplicitních souborů.

    Ladislav Hagara | Komentářů: 3
    dnes 05:22 | IT novinky

    Společnost DeepSeek představila (𝕏) AI model DeepSeek-R1 (Hugging Face) srovnatelný s OpenAI o1 a uvolnila jej pod open source licencí MIT, tj. zdarma i pro komerční použití.

    Ladislav Hagara | Komentářů: 26
    včera 23:44 | Nová verze

    GKrellM (GNU Krell Monitors, Wikipedie), tj. grafická aplikace pro sledování systémů a různých událostí, byla po pěti a půl letech vydána v nové verzi 2.4.0. Přehled novinek na Gitea.

    Ladislav Hagara | Komentářů: 4
    včera 19:55 | Humor

    Americká první dáma Melania Trumpová vydala v předvečer manželovy inaugurace vlastní kryptoměnu. Jmenuje se $Melania. Donald Trump vydal vlastní kryptoměnu $Trump den před manželkou.

    Ladislav Hagara | Komentářů: 22
    včera 11:33 | Nová verze

    GNU Project Debugger aneb GDB byl vydán ve verzi 16.1. Podrobný přehled novinek v souboru NEWS.

    Ladislav Hagara | Komentářů: 0
    včera 03:00 | Nová verze

    Po 9 týdnech vývoje od vydání Linuxu 6.12 oznámil Linus Torvalds vydání Linuxu 6.13. Přehled novinek a vylepšení na LWN.net: první a druhá polovina začleňovacího okna a Linux Kernel Newbies. Odstraněn byl souborový systém ReiserFS.

    Ladislav Hagara | Komentářů: 0
    19.1. 16:11 | IT novinky

    19. ledna 2038 přeteče hodnota time_t na 32bitových systémech, na vyřešení problému roku 2038 (Y2K38) tedy zbývá 13 let. Např. Debian v uplynulém roce přešel na 64bitový čas. Bernhard Wiedemann z openSUSE sdílí chyby v sestavení rozšířeného softwaru.

    Fluttershy, yay! | Komentářů: 1
    19.1. 15:44 | Nová verze

    Byla vydána druhá opravná verze 21.2 v dubnu loňského roku vydané verze 21 multimediálního centra Kodi (dříve XBMC, Wikipedie) s kódovým označením Omega.

    Ladislav Hagara | Komentářů: 0
    19.1. 12:22 | IT novinky

    TikTok ve Spojených státech v sobotu večer místního času přerušil činnost. Uživatelé čínskou firmou vlastněné sociální sítě dostali zprávu, že aplikaci kvůli zákazu nelze používat. TikTok je momentálně nedostupný v obchodech s aplikacemi Google Play a App Store. Podle zákona přijatého loni a potvrzeného v pátek soudem měla platforma do dneška přerušit spojení se svou mateřskou společností ByteDance, která sídlí v Číně, nebo činnost v

    … více »
    Ladislav Hagara | Komentářů: 18
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: filtrovani webu spamovym filtrem

    13.5.2010 17:26 wosambo | skóre: 5
    filtrovani webu spamovym filtrem
    Přečteno: 286×

    Dobrý den,


    zajímalo by mě, jestli někdo z přítomných už někdy řešil či narazil na řešení filtrování webu bayesovským filtrem. Rád bych něco takového pospojoval na Linuxu.

    Narazil jsem už na Dansguardian a další, ale přímo myšlenka bayesovské filtrace webu mě hodně nadchla (pokud by to nebylo pekelně pomalé).

    Konkrétně si to představuju idealisticky tak, že bych popadl nějaký spamfiltr, zkonfiguroval, případně ještě s něčím zkombinoval a napojil na nějakou proxynu.

    Uvítám jakékoli podněty, rady či varování před slepými uličkami.


    Děkuji


    Jirka alias wosambo

    Odpovědi

    13.5.2010 18:24 NN
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Ted jsem uspesne rozchodil havp + squid, nechyti to vsechno, ale jako predvoj to nevypada spatne. Testovaci vyrus to chytlo:

    http://www.eicar.org/anti_virus_test_file.htm

    Samozrejme existuji komercni boxy a IDS implenetace.

    NN
    21.5.2010 12:30 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem

    Děkuji za podnět. Mám ale spíš na mysli něco, co bude blokovat obsah, který osobně označím za závadný pro skupinu lidí, která je přes tento sw připojena k netu.

    Narazil jsem na zajímavé programy, ale něco, co by zvládlo filtrovat webový obsah v českém jazyce s jeho variabilitou, zatím nenacházím. Proto mě zaujala myšlenka Bayesovských filtrů používaných proti spamu.

    Dokonce jsem na takové řešení už i narazil, ale jen v podobě jakéhosi pluginu pro MS Internet Explorer, což mi je na serveru při nejlepší vůli k ničemu :)

    Prostě pospojovat hotové programy, trošku si zaskriptovat a zaprogramovat a sem tam něco přivohnout. Programovat to celý ambice nemám

    21.5.2010 13:04 NN
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Jako porno, nebo warez ? Daji se udelat urcite regex filtry do ve squidu, plus nektere security boxy(juniper SSG, cisco ASA) umeji "web content filtering" podle cilove skupiny(drug, adult..), ale do fungovani tohoto moc nevidim.

    NN
    21.5.2010 13:17 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Děkuji, ty regexy vypadaji zajímavě.
    21.5.2010 13:42 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Pouzivam Dansguardian, celkem zajimave ma nadefinovane filtrovani dle obsahu?, zkousim to cca tyden a tvari se to rozumne. Pod Dansguardem bezi Squid, do budoucna planuju jeste Havp, ale ted na to neni moc cas.
    21.5.2010 13:46 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    A jak se to chová např. na Seznamu, když dám vyhledat nějaké peprné české pornoslovo, které anglické filtry neodhalí?
    21.5.2010 18:58 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Porno je porno skoro vsude :-), ale nemel by byt problem doplnit soubor o dalsi fraze a jejich vahu. Zkus nadhodit seznam slov a v pondeli ti reknu jak se to chovalo.
    21.5.2010 19:13 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    oooo jéééé, moc děkuji.

    Tak např. kundička, šukání, šukáníčko, šukny, šuká, šukající, nadržený holky, ...

    Možná by nebylo špatné mít něco jako má jyxo.cz - skloňování a takový ty češtinský věci.

    Doufám, že mě nebude tento příspěvek nějak zablokován jako mravně nevhodný :-)
    21.5.2010 23:02 Piškot | skóre: 7 | blog: Uživatel | Přerov nad labem
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Jen pro některé proxy ...
    22.5.2010 08:38 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Nechápu smysl vašeho příspěvku. Co platí jen pro některé proxy?
    24.5.2010 12:36 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Tak jsem to vyzkousel a celkem dobry, odfiltrovano uz pri zadani klicovych slov v google (Byl prekrocen limit pro vážené fráze) - proste slova jsou nevhodna. Jedine co prolezlo byly sukny.cz a uz jsem zabanovane :-). Rekl bych ze je to to co hledas. Nadrzene holky v googlu jako fraze hledani projdou, otazkou je co vsechno je pak blokovano, rekl bych ze vetsina a tak zase ok.
    24.5.2010 18:19 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Zajimave,zajimave, hodne jsi me povzbudil do toho jit.

    Diky.

    Jirka

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.