abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:44 | Komunita

    Google zveřejnil seznam 1 141 projektů (vývojářů) od 184 organizací přijatých do letošního, již dvaadvacátého, Google Summer of Code. Přihlášeno bylo celkově 23 371 projektů od 15 245 vývojářů ze 131 zemí.

    Ladislav Hagara | Komentářů: 0
    dnes 03:00 | Komunita

    Na čem pracovali vývojáři GNOME a KDE Plasma minulý týden? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma.

    Ladislav Hagara | Komentářů: 0
    včera 03:44 | Nová verze

    Open source počítačová hra na hrdiny NetHack (Wikipedie, GitHub) byla vydána v nové verzi 5.0.0. První verze této hry byla vydána v roce 1987.

    Ladislav Hagara | Komentářů: 2
    1.5. 15:11 | IT novinky

    Evropská komise naléhavě vyzvala členské státy EU, aby kvůli ochraně nezletilých na internetu urychlily zavádění unijní aplikace pro ověřování věku a zajistily její dostupnost do konce roku. Členské státy mohou zavést aplikaci EU pro ověřování věku jako samostatnou aplikaci nebo ji integrovat do takzvané evropské peněženky digitální identity.

    Ladislav Hagara | Komentářů: 16
    30.4. 23:33 | Nová verze

    Richard Biener oznámil vydání verze 16.1 (16.1.0) kolekce kompilátorů pro různé programovací jazyky GCC (GNU Compiler Collection). Jedná se o první stabilní verzi řady 16. Přehled změn, nových vlastností a oprav a aktualizovaná dokumentace na stránkách projektu. Některé zdrojové kódy, které bylo možné přeložit s předchozími verzemi GCC, bude nutné upravit.

    Ladislav Hagara | Komentářů: 0
    30.4. 23:11 | Nová verze

    Zulip Server z open source komunikační platformy Zulip (Wikipedie, GitHub) byl vydán ve verzi 12.0. Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    30.4. 12:11 | IT novinky

    Před 30 lety, tj. v úterý 30. dubna 1996, byl spuštěn Seznam.cz.

    Ladislav Hagara | Komentářů: 40
    30.4. 11:44 | Komunita

    Byly zpracovány a zveřejněny všechny videozáznamy, které stojí za zveřejnění, z konference FOSDEM 2026.

    Ladislav Hagara | Komentářů: 0
    30.4. 01:11 | IT novinky

    Od úterý 28. dubna musí nově uváděné notebooky v Evropské unii podporovat nabíjení přes USB-C. Jednotná nabíječka byla schválena Evropským parlamentem v říjnu 2022.

    Ladislav Hagara | Komentářů: 58
    29.4. 23:44 | Bezpečnostní upozornění

    Byly publikovány informace o kritické zranitelnosti CVE-2026-31431 pojmenované Copy Fail v Linuxu, konkrétně v kryptografii (AF_ALG). Běžný uživatel může získat práva roota (lokální eskalaci práv). Na všech distribucích Linuxu vydaných od roku 2017. Pomocí 732bajtového skriptu. V upstreamu je již opraveno. Zranitelnost byla nalezena pomocí AI Xint Code.

    Ladislav Hagara | Komentářů: 4
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (9%)
     (2%)
     (13%)
     (31%)
     (4%)
     (7%)
     (3%)
     (16%)
     (24%)
    Celkem 1482 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Akože gramatický korektor

    2.11.2005 02:40 | Přečteno: 1294× | Spracovanie jazyka

    Pred zhruba mesiacom som reagoval na poznámku o tom aké by to bolo super mať aspoň jednoduchý gramatický korektor. Pôvodný autor v ňom zmieňoval, že by bolo fajn, keby to fungovalo aspoň pre tie javy, ktoré majú jasné pravidlá.

    Takto reaguje väčšina programátorov (a im spriaznených duší), všetko okolo nás je jednoduché a každý tomu rozumie bez toho, aby o tom vedel niečo viac. A je úplne jedno, či sa jedná o lingvistiku, alebo dotácie v EÚ :) Moja reakcia sa vtedy snažila o akýsi popis toho, prečo to vlastne nie je také jednoduché. Napísal som však, že jediná vec, ktorá je jednoduchá je vokalizácia predložiek. Vec, ktorá je na prvý pohľad nesmierne jednoduchá, stačí sa pozrieť a určiť kedy sa má písať v/vo, z/zo, s/so, ... Neprozreteľne som napísal, že sa to dá napísať za jedno poobedie. Včera pršalo a dnes ráno tiež. Tak som sa do toho pustil.

    Keďže som sa momentálne pripojil k projektu, ktorý sa zaoberá ovládaním autorádia pomocou hlasu, tak som to rovno využil aj na zoznámenie sa s novinkami (JDOM, Open Agent Architecture). Základom bolo preportovať knižnicu na prácu s hláskami (vedeli ste, že už toto nie je jednoznačné) a následne vytvoriť baseline, aby bolo následne s čím porovnávať.

    ak to je vokalizovana predlozka potom
            vrat chybu
    ak to nie vokalizovana predlozka potom
            vrat ze je to v poriadku
    
    Keďže na mojich testovacích dátach (korpus Harry, milión slov) je tých chýb minimálne, tak by to v ideálnom prípade malo vrátiť, že je všetko OK. A kebyže o tom nič neviem, tak nasleduje šok. Prezentovaná metóda má úspešnosť okolo 89.9%, ak nerobíme s jazykom, tak to je slušné číslo. Ale v prirodzenom jazyku to má k použiteľnosti ešte ďaleko. A tak prepisujem nejaký pravidlá z múdrej knižky a pridávam pár svojich. Po pár hodinách (a remíze Artmedie) sa dostávame k presnosti 97.7%, ale stále mi tam zostáva okolo 500 prípadov, ktoré sú nesprávne. Kde-tu to je pravda, ale väčšinu z toho tvoria chyby. A tak pozerám a hľadám. A moja lingvistická intuícia dostáva na frak. Nedokážem určiť, čo je ešte spisovné a čo už nie. No nič, idem spať.

    Celý balík (pod BSDL) pošlem na požiadanie, takto je to vhodné akurát tak pre niekoho, kto sa chce hrať. Ledaže by sa našiel niekto, kto by napísal rozhranie k OO.org. So skvalitnením pomôžem rád, s pridávaním do OO.org, či niečoho podobného len ťažko, keďže ich nepoužívam, takže by som z toho nemal žiaden osoh, a nemyslím si, že by ma to bavilo. Ale iniciatíve sa medze nekladú :) Ak máte nápady na nejaké podobné eazy lingvistické problémy, tak sem s nimi.

           

    Hodnocení: -

    zatím nehodnoceno
            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.