abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 00:55 | Pozvánky

    Spolek OpenAlt zve příznivce otevřených řešení a přístupu na 209. brněnský sraz, který proběhne tento pátek 16. května od 18:00 ve studentském klubu U Kachničky na Fakultě informačních technologií Vysokého učení technického na adrese Božetěchova 2/1. Jelikož se Brno stalo jedním z hlavních míst, kde se vyvíjí open source knihovna OpenSSL, tentokrát se OpenAlt komunita potká s komunitou OpenSSL. V rámci srazu Anton Arapov z OpenSSL

    … více »
    Ladislav Hagara | Komentářů: 0
    dnes 00:22 | Komunita

    GNOME Foundation má nového výkonného ředitele. Po deseti měsících skončil dočasný výkonný ředitel Richard Littauer. Vedení nadace převzal Steven Deobald.

    Ladislav Hagara | Komentářů: 0
    10.5. 15:00 | Zajímavý článek

    Byl publikován přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie) za uplynulé dva měsíce. Servo zvládne už i Gmail. Zakázány jsou příspěvky generované pomocí AI.

    Ladislav Hagara | Komentářů: 7
    9.5. 17:22 | Nová verze

    Raspberry Pi Connect, tj. oficiální služba Raspberry Pi pro vzdálený přístup k jednodeskovým počítačům Raspberry Pi z webového prohlížeče, byla vydána v nové verzi 2.5. Nejedná se už o beta verzi.

    Ladislav Hagara | Komentářů: 3
    9.5. 15:22 | Komunita

    Google zveřejnil seznam 1272 projektů (vývojářů) od 185 organizací přijatých do letošního, již jednadvacátého, Google Summer of Code. Plánovaným vylepšením v grafických a multimediálních aplikacích se věnuje článek na Libre Arts.

    Ladislav Hagara | Komentářů: 0
    8.5. 19:22 | Nová verze

    Byla vydána (𝕏) dubnová aktualizace aneb nová verze 1.100 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.100 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    8.5. 18:00 | Nová verze

    Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.5.

    Ladislav Hagara | Komentářů: 0
    8.5. 01:22 | Nová verze Ladislav Hagara | Komentářů: 0
    8.5. 00:55 | Zajímavý projekt

    PyXL je koncept procesora, ktorý dokáže priamo spúštat Python kód bez nutnosti prekladu ci Micropythonu. Podľa testov autora je pri 100 MHz približne 30x rýchlejší pri riadeni GPIO nez Micropython na Pyboard taktovanej na 168 MHz.

    vlk | Komentářů: 0
    7.5. 19:44 | Nová verze

    Grafana (Wikipedie), tj. open source nástroj pro vizualizaci různých metrik a s ní související dotazování, upozorňování a lepší porozumění, byla vydána ve verzi 12.0. Přehled novinek v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    Jaký filesystém primárně používáte?
     (57%)
     (1%)
     (8%)
     (22%)
     (4%)
     (2%)
     (3%)
     (1%)
     (1%)
     (3%)
    Celkem 583 hlasů
     Komentářů: 26, poslední 8.5. 09:58
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: filtrovani webu spamovym filtrem

    13.5.2010 17:26 wosambo | skóre: 5
    filtrovani webu spamovym filtrem
    Přečteno: 290×

    Dobrý den,


    zajímalo by mě, jestli někdo z přítomných už někdy řešil či narazil na řešení filtrování webu bayesovským filtrem. Rád bych něco takového pospojoval na Linuxu.

    Narazil jsem už na Dansguardian a další, ale přímo myšlenka bayesovské filtrace webu mě hodně nadchla (pokud by to nebylo pekelně pomalé).

    Konkrétně si to představuju idealisticky tak, že bych popadl nějaký spamfiltr, zkonfiguroval, případně ještě s něčím zkombinoval a napojil na nějakou proxynu.

    Uvítám jakékoli podněty, rady či varování před slepými uličkami.


    Děkuji


    Jirka alias wosambo

    Odpovědi

    13.5.2010 18:24 NN
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Ted jsem uspesne rozchodil havp + squid, nechyti to vsechno, ale jako predvoj to nevypada spatne. Testovaci vyrus to chytlo:

    http://www.eicar.org/anti_virus_test_file.htm

    Samozrejme existuji komercni boxy a IDS implenetace.

    NN
    21.5.2010 12:30 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem

    Děkuji za podnět. Mám ale spíš na mysli něco, co bude blokovat obsah, který osobně označím za závadný pro skupinu lidí, která je přes tento sw připojena k netu.

    Narazil jsem na zajímavé programy, ale něco, co by zvládlo filtrovat webový obsah v českém jazyce s jeho variabilitou, zatím nenacházím. Proto mě zaujala myšlenka Bayesovských filtrů používaných proti spamu.

    Dokonce jsem na takové řešení už i narazil, ale jen v podobě jakéhosi pluginu pro MS Internet Explorer, což mi je na serveru při nejlepší vůli k ničemu :)

    Prostě pospojovat hotové programy, trošku si zaskriptovat a zaprogramovat a sem tam něco přivohnout. Programovat to celý ambice nemám

    21.5.2010 13:04 NN
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Jako porno, nebo warez ? Daji se udelat urcite regex filtry do ve squidu, plus nektere security boxy(juniper SSG, cisco ASA) umeji "web content filtering" podle cilove skupiny(drug, adult..), ale do fungovani tohoto moc nevidim.

    NN
    21.5.2010 13:17 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Děkuji, ty regexy vypadaji zajímavě.
    21.5.2010 13:42 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Pouzivam Dansguardian, celkem zajimave ma nadefinovane filtrovani dle obsahu?, zkousim to cca tyden a tvari se to rozumne. Pod Dansguardem bezi Squid, do budoucna planuju jeste Havp, ale ted na to neni moc cas.
    21.5.2010 13:46 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    A jak se to chová např. na Seznamu, když dám vyhledat nějaké peprné české pornoslovo, které anglické filtry neodhalí?
    21.5.2010 18:58 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Porno je porno skoro vsude :-), ale nemel by byt problem doplnit soubor o dalsi fraze a jejich vahu. Zkus nadhodit seznam slov a v pondeli ti reknu jak se to chovalo.
    21.5.2010 19:13 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    oooo jéééé, moc děkuji.

    Tak např. kundička, šukání, šukáníčko, šukny, šuká, šukající, nadržený holky, ...

    Možná by nebylo špatné mít něco jako má jyxo.cz - skloňování a takový ty češtinský věci.

    Doufám, že mě nebude tento příspěvek nějak zablokován jako mravně nevhodný :-)
    21.5.2010 23:02 Piškot | skóre: 7 | blog: Uživatel | Přerov nad labem
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Jen pro některé proxy ...
    22.5.2010 08:38 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Nechápu smysl vašeho příspěvku. Co platí jen pro některé proxy?
    24.5.2010 12:36 Robert | skóre: 16 | blog: zabak
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Tak jsem to vyzkousel a celkem dobry, odfiltrovano uz pri zadani klicovych slov v google (Byl prekrocen limit pro vážené fráze) - proste slova jsou nevhodna. Jedine co prolezlo byly sukny.cz a uz jsem zabanovane :-). Rekl bych ze je to to co hledas. Nadrzene holky v googlu jako fraze hledani projdou, otazkou je co vsechno je pak blokovano, rekl bych ze vetsina a tak zase ok.
    24.5.2010 18:19 wosambo | skóre: 5
    Rozbalit Rozbalit vše Re: filtrovani webu spamovym filtrem
    Zajimave,zajimave, hodne jsi me povzbudil do toho jit.

    Diky.

    Jirka

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.