abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:33 | IT novinky

    Na blogu Raspberry Pi byla představena rozšiřující deska Raspberry Pi AI HAT+ 2 s akcelerátorem Hailo-10 a 8 GB RAM. Na rozdíl od předchozí Raspberry Pi AI HAT+ podporuje generativní AI. Cena desky je 130 dolarů.

    Ladislav Hagara | Komentářů: 0
    dnes 12:11 | Komunita

    Wikipedie slaví 25. výročí svého založení. Vznikla 15. ledna 2001 jako doplňkový projekt k dnes již neexistující encyklopedii Nupedia. Doména wikipedia.org byla zaregistrována 12. ledna 2001. Zítra proběhne v Praze Večer svobodné kultury, který pořádá spolek Wikimedia ČR.

    Ladislav Hagara | Komentářů: 0
    dnes 04:44 | Nová verze

    Po více než dvou letech od vydání předchozí verze 2.12 byla vydána nová stabilní verze 2.14 systémového zavaděče GNU GRUB (GRand Unified Bootloader, Wikipedie). Přehled novinek v souboru NEWS a v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    dnes 02:22 | Nová verze

    Google Chrome 144 byl prohlášen za stabilní. Nejnovější stabilní verze 144.0.7559.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 10 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře (YouTube).

    Ladislav Hagara | Komentářů: 2
    dnes 01:55 | Humor

    Microsoft zveřejnil zdrojový kód XAML Studia a uvolnil ho pod MIT licencí. XAML Studio je nástroj ze světa Windows, určený pro tvorbu uživatelského rozhraní aplikací pomocí XAML (Extensible Application Markup Language). Stalo se tak zhruba po osmi letech od prvního prohlášení Microsoftu, že se tento kód chystá zveřejnit.

    NUKE GAZA! 🎆 | Komentářů: 0
    dnes 01:44 | Zajímavý projekt

    TimeCapsule, 'časová kapsle', je jazykový model trénovaný výhradně na datech z určitých míst a časových období, aby se tak napodobila autentická slovní zásoba, způsob vyjadřování a názory dané doby. Na Hugging face jsou k dispozici modely natrénované na historických textech dostupných v oblasti Londýna mezi lety 1800 až 1875.

    NUKE GAZA! 🎆 | Komentářů: 2
    včera 17:55 | Nová verze

    Radicle byl vydán ve verzi 1.6.0 s kódovým jménem Amaryllis. Jedná se o distribuovanou alternativu k softwarům pro spolupráci jako např. GitLab.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Upozornění

    Zemřel Scott Adams, tvůrce komiksových stripů Dilbert parodujících pracovní prostředí velké firmy.

    Ladislav Hagara | Komentářů: 3
    včera 13:00 | Nová verze

    Sdružení CZ.NIC vydalo novou verzi Knot Resolveru (6.1.0). Jedná se o první vydanou stabilní verzi 6, která je nyní oficiálně preferovanou a doporučovanou verzí, namísto předešlé verze 5. Více o Knot Resolveru 6 je možné se dočíst přímo v dokumentaci.

    VSladek | Komentářů: 2
    včera 01:22 | Nová verze

    Byl vydán Linux Mint 22.3 s kódovým jménem Zena. Podrobnosti v přehledu novinek a poznámkách k vydání. Vypíchnout lze, že nástroj Systémová hlášení (System Reports) získal mnoho nových funkcí a byl přejmenován na Informace o systému (System Information). Linux Mint 22.3 bude podporován do roku 2029.

    Ladislav Hagara | Komentářů: 1
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (5%)
     (0%)
     (8%)
     (19%)
     (3%)
     (6%)
     (3%)
     (11%)
     (44%)
    Celkem 442 hlasů
     Komentářů: 12, poslední včera 21:12
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: filtrovani webu spamovym filtrem

    13.5.2010 17:26 wosambo | skóre: 5
    filtrovani webu spamovym filtrem
    Přečteno: 330×

    Dobrý den,


    zajímalo by mě, jestli někdo z přítomných už někdy řešil či narazil na řešení filtrování webu bayesovským filtrem. Rád bych něco takového pospojoval na Linuxu.

    Narazil jsem už na Dansguardian a další, ale přímo myšlenka bayesovské filtrace webu mě hodně nadchla (pokud by to nebylo pekelně pomalé).

    Konkrétně si to představuju idealisticky tak, že bych popadl nějaký spamfiltr, zkonfiguroval, případně ještě s něčím zkombinoval a napojil na nějakou proxynu.

    Uvítám jakékoli podněty, rady či varování před slepými uličkami.


    Děkuji


    Jirka alias wosambo

    Odpovědi

    13.5.2010 18:24 NN
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Ted jsem uspesne rozchodil havp + squid, nechyti to vsechno, ale jako predvoj to nevypada spatne. Testovaci vyrus to chytlo:

    http://www.eicar.org/anti_virus_test_file.htm

    Samozrejme existuji komercni boxy a IDS implenetace.

    NN
    21.5.2010 12:30 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem

    Děkuji za podnět. Mám ale spíš na mysli něco, co bude blokovat obsah, který osobně označím za závadný pro skupinu lidí, která je přes tento sw připojena k netu.

    Narazil jsem na zajímavé programy, ale něco, co by zvládlo filtrovat webový obsah v českém jazyce s jeho variabilitou, zatím nenacházím. Proto mě zaujala myšlenka Bayesovských filtrů používaných proti spamu.

    Dokonce jsem na takové řešení už i narazil, ale jen v podobě jakéhosi pluginu pro MS Internet Explorer, což mi je na serveru při nejlepší vůli k ničemu :)

    Prostě pospojovat hotové programy, trošku si zaskriptovat a zaprogramovat a sem tam něco přivohnout. Programovat to celý ambice nemám

    21.5.2010 13:04 NN
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Jako porno, nebo warez ? Daji se udelat urcite regex filtry do ve squidu, plus nektere security boxy(juniper SSG, cisco ASA) umeji "web content filtering" podle cilove skupiny(drug, adult..), ale do fungovani tohoto moc nevidim.

    NN
    21.5.2010 13:17 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Děkuji, ty regexy vypadaji zajímavě.
    21.5.2010 13:42 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Pouzivam Dansguardian, celkem zajimave ma nadefinovane filtrovani dle obsahu?, zkousim to cca tyden a tvari se to rozumne. Pod Dansguardem bezi Squid, do budoucna planuju jeste Havp, ale ted na to neni moc cas.
    21.5.2010 13:46 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    A jak se to chová např. na Seznamu, když dám vyhledat nějaké peprné české pornoslovo, které anglické filtry neodhalí?
    21.5.2010 18:58 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Porno je porno skoro vsude :-), ale nemel by byt problem doplnit soubor o dalsi fraze a jejich vahu. Zkus nadhodit seznam slov a v pondeli ti reknu jak se to chovalo.
    21.5.2010 19:13 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    oooo jéééé, moc děkuji.

    Tak např. kundička, šukání, šukáníčko, šukny, šuká, šukající, nadržený holky, ...

    Možná by nebylo špatné mít něco jako má jyxo.cz - skloňování a takový ty češtinský věci.

    Doufám, že mě nebude tento příspěvek nějak zablokován jako mravně nevhodný :-)
    21.5.2010 23:02 Piškot | skóre: 7 | blog: Uživatel | Přerov nad labem
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Jen pro některé proxy ...
    22.5.2010 08:38 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Nechápu smysl vašeho příspěvku. Co platí jen pro některé proxy?
    24.5.2010 12:36 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Tak jsem to vyzkousel a celkem dobry, odfiltrovano uz pri zadani klicovych slov v google (Byl prekrocen limit pro vážené fráze) - proste slova jsou nevhodna. Jedine co prolezlo byly sukny.cz a uz jsem zabanovane :-). Rekl bych ze je to to co hledas. Nadrzene holky v googlu jako fraze hledani projdou, otazkou je co vsechno je pak blokovano, rekl bych ze vetsina a tak zase ok.
    24.5.2010 18:19 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Zajimave,zajimave, hodne jsi me povzbudil do toho jit.

    Diky.

    Jirka

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.