abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 21:22 | Nová verze

    Bylo vydáno Eclipse IDE 2025-09 aneb Eclipse 4.37. Představení novinek tohoto integrovaného vývojového prostředí také na YouTube.

    Ladislav Hagara | Komentářů: 0
    včera 18:22 | IT novinky

    T-Mobile od 15. září zpřístupňuje RCS (Rich Communication Services) zprávy i pro iPhone.

    Ladislav Hagara | Komentářů: 1
    včera 13:22 | IT novinky

    Společnost ARM představila platformu Arm Lumex s Arm C1 CPU Cluster a Arm Mali G1-Ultra GPU pro vlajkové chytré telefony a počítače nové generace.

    Ladislav Hagara | Komentářů: 0
    včera 05:44 | Nová verze

    Unicode Consortium, nezisková organizace koordinující rozvoj standardu Unicode, oznámila vydání Unicode 17.0. Přidáno bylo 4 803 nových znaků. Celkově jich je 159 801. Přibylo 7 nových Emoji.

    Ladislav Hagara | Komentářů: 0
    9.9. 21:00 | IT novinky Ladislav Hagara | Komentářů: 10
    9.9. 18:33 | Nová verze

    Realtimová strategie Warzone 2100 (Wikipedie) byla vydána ve verzi 4.6.0. Podrobný přehled novinek, změn a oprav v ChangeLogu na GitHubu. Nejnovější verzi Warzone 2100 lze již instalovat také ze Snapcraftu a Flathubu.

    Ladislav Hagara | Komentářů: 1
    9.9. 12:22 | IT novinky

    Polské vývojářské studio CD Projekt Red publikovalo na Printables.com 3D modely z počítačové hry Cyberpunk 2077.

    Ladislav Hagara | Komentářů: 1
    9.9. 11:44 | Pozvánky

    Organizátoři konference LinuxDays 2025 vydali program a zároveň otevřeli registrace. Akce se uskuteční 4. a 5. října na FIT ČVUT v pražských Dejvicích, kde vás čekají přednášky, workshopy, stánky a spousta šikovných lidí. Vstup na akci je zdarma.

    Petr Krčmář | Komentářů: 7
    8.9. 22:00 | IT novinky

    Uživatelé komunikátoru Signal si mohou svá data přímo v Signalu bezpečně zálohovat a v případě rozbití nebo ztráty telefonu následně na novém telefonu obnovit. Zálohování posledních 45 dnů je zdarma. Nad 45 dnů je zpoplatněno částkou 1,99 dolaru měsíčně.

    Ladislav Hagara | Komentářů: 0
    8.9. 18:44 | Zajímavý článek

    Server Groklaw, zaměřený na kauzy jako právní spory SCO týkající se Linuxu, skončil před 12 lety, resp. doména stále existuje, ale web obsahuje spam propagující hazardní hry. LWN.net proto v úvodníku připomíná důležitost zachovávání komunitních zdrojů a upozorňuje, že Internet Archive je také jen jeden.

    🇵🇸 | Komentářů: 30
    Pro otevření více webových stránek ve webovém prohlížečí používám
     (83%)
     (7%)
     (2%)
     (2%)
     (4%)
     (2%)
    Celkem 162 hlasů
     Komentářů: 12, poslední včera 13:00
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: filtrovani webu spamovym filtrem

    13.5.2010 17:26 wosambo | skóre: 5
    filtrovani webu spamovym filtrem
    Přečteno: 293×

    Dobrý den,


    zajímalo by mě, jestli někdo z přítomných už někdy řešil či narazil na řešení filtrování webu bayesovským filtrem. Rád bych něco takového pospojoval na Linuxu.

    Narazil jsem už na Dansguardian a další, ale přímo myšlenka bayesovské filtrace webu mě hodně nadchla (pokud by to nebylo pekelně pomalé).

    Konkrétně si to představuju idealisticky tak, že bych popadl nějaký spamfiltr, zkonfiguroval, případně ještě s něčím zkombinoval a napojil na nějakou proxynu.

    Uvítám jakékoli podněty, rady či varování před slepými uličkami.


    Děkuji


    Jirka alias wosambo

    Odpovědi

    13.5.2010 18:24 NN
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Ted jsem uspesne rozchodil havp + squid, nechyti to vsechno, ale jako predvoj to nevypada spatne. Testovaci vyrus to chytlo:

    http://www.eicar.org/anti_virus_test_file.htm

    Samozrejme existuji komercni boxy a IDS implenetace.

    NN
    21.5.2010 12:30 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem

    Děkuji za podnět. Mám ale spíš na mysli něco, co bude blokovat obsah, který osobně označím za závadný pro skupinu lidí, která je přes tento sw připojena k netu.

    Narazil jsem na zajímavé programy, ale něco, co by zvládlo filtrovat webový obsah v českém jazyce s jeho variabilitou, zatím nenacházím. Proto mě zaujala myšlenka Bayesovských filtrů používaných proti spamu.

    Dokonce jsem na takové řešení už i narazil, ale jen v podobě jakéhosi pluginu pro MS Internet Explorer, což mi je na serveru při nejlepší vůli k ničemu :)

    Prostě pospojovat hotové programy, trošku si zaskriptovat a zaprogramovat a sem tam něco přivohnout. Programovat to celý ambice nemám

    21.5.2010 13:04 NN
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Jako porno, nebo warez ? Daji se udelat urcite regex filtry do ve squidu, plus nektere security boxy(juniper SSG, cisco ASA) umeji "web content filtering" podle cilove skupiny(drug, adult..), ale do fungovani tohoto moc nevidim.

    NN
    21.5.2010 13:17 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Děkuji, ty regexy vypadaji zajímavě.
    21.5.2010 13:42 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Pouzivam Dansguardian, celkem zajimave ma nadefinovane filtrovani dle obsahu?, zkousim to cca tyden a tvari se to rozumne. Pod Dansguardem bezi Squid, do budoucna planuju jeste Havp, ale ted na to neni moc cas.
    21.5.2010 13:46 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    A jak se to chová např. na Seznamu, když dám vyhledat nějaké peprné české pornoslovo, které anglické filtry neodhalí?
    21.5.2010 18:58 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Porno je porno skoro vsude :-), ale nemel by byt problem doplnit soubor o dalsi fraze a jejich vahu. Zkus nadhodit seznam slov a v pondeli ti reknu jak se to chovalo.
    21.5.2010 19:13 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    oooo jéééé, moc děkuji.

    Tak např. kundička, šukání, šukáníčko, šukny, šuká, šukající, nadržený holky, ...

    Možná by nebylo špatné mít něco jako má jyxo.cz - skloňování a takový ty češtinský věci.

    Doufám, že mě nebude tento příspěvek nějak zablokován jako mravně nevhodný :-)
    21.5.2010 23:02 Piškot | skóre: 7 | blog: Uživatel | Přerov nad labem
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Jen pro některé proxy ...
    22.5.2010 08:38 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Nechápu smysl vašeho příspěvku. Co platí jen pro některé proxy?
    24.5.2010 12:36 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Tak jsem to vyzkousel a celkem dobry, odfiltrovano uz pri zadani klicovych slov v google (Byl prekrocen limit pro vážené fráze) - proste slova jsou nevhodna. Jedine co prolezlo byly sukny.cz a uz jsem zabanovane :-). Rekl bych ze je to to co hledas. Nadrzene holky v googlu jako fraze hledani projdou, otazkou je co vsechno je pak blokovano, rekl bych ze vetsina a tak zase ok.
    24.5.2010 18:19 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Zajimave,zajimave, hodne jsi me povzbudil do toho jit.

    Diky.

    Jirka

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.