abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:44 | IT novinky

    S koncem roku 2025 skončila standardní podpora operačního systému HP-UX (Hewlett Packard Unix).

    Ladislav Hagara | Komentářů: 1
    dnes 14:33 | Nová verze

    K 1. lednu 2026 končí 70leté omezení majetkových autorských práv děl autorů zesnulých v roce 1955, viz 2026 in public domain. V americkém prostředí vstupují do public domain díla z roku 1930, viz Public Domain Day.

    |🇵🇸 | Komentářů: 1
    včera 15:00 | Nová verze

    Všem vše nejlepší do nového roku 2026.

    Ladislav Hagara | Komentářů: 10
    včera 13:33 | Zajímavý software

    Crown je multiplatformní open source herní engine. Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT a GPLv3+. Byla vydána nová verze 0.60. Vyzkoušet lze online demo.

    Ladislav Hagara | Komentářů: 1
    včera 12:11 | Zajímavý článek

    Daniel Stenberg na svém blogu informuje, že po strncpy() byla ze zdrojových kódů curlu odstraněna také všechna volání funkce strcpy(). Funkci strcpy() nahradili vlastní funkcí curlx_strcopy().

    Ladislav Hagara | Komentářů: 6
    včera 03:00 | Nová verze

    Byla vydána nová verze 25.12.30 svobodného multiplatformního video editoru Shotcut (Wikipedie) postaveného nad multimediálním frameworkem MLT. Shotcut je vedle zdrojových kódů k dispozici také ve formátech AppImage, Flatpak a Snap.

    Ladislav Hagara | Komentářů: 0
    30.12. 18:55 | IT novinky

    Společnost Valve publikovala přehled To nej roku 2025 ve službě Steam aneb ohlédnutí za nejprodávanějšími, nejhranějšími a dalšími nej hrami roku 2025.

    Ladislav Hagara | Komentářů: 0
    30.12. 16:11 | Komunita

    Byly publikovány výsledky průzkumu mezi uživateli Blenderu uskutečněného v říjnu a listopadu 2025. Zúčastnilo se více než 5000 uživatelů.

    Ladislav Hagara | Komentářů: 0
    30.12. 03:33 | Bezpečnostní upozornění

    V dokumentově orientované databázi MongoDB byla nalezena a v upstreamu již opravena kritická bezpečností chyba CVE-2025-14847 aneb MongoBleed.

    Ladislav Hagara | Komentářů: 0
    29.12. 23:11 | IT novinky

    Při úklidu na Utažské univerzitě se ve skladovacích prostorách náhodou podařilo nalézt magnetickou pásku s kopií Unixu V4. Páska byla zaslána do počítačového muzea, kde se z pásky úspěšně podařilo extrahovat data a Unix spustit. Je to patrně jediný známý dochovaný exemplář tohoto 52 let starého Unixu, prvního vůbec programovaného v jazyce C.

    NUKE GAZA! 🎆 | Komentářů: 21
    Kdo vám letos nadělí dárek?
     (29%)
     (1%)
     (28%)
     (1%)
     (2%)
     (1%)
     (10%)
     (9%)
     (18%)
    Celkem 233 hlasů
     Komentářů: 22, poslední včera 15:34
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Akože gramatický korektor

    2.11.2005 02:40 | Přečteno: 1280× | Spracovanie jazyka

    Pred zhruba mesiacom som reagoval na poznámku o tom aké by to bolo super mať aspoň jednoduchý gramatický korektor. Pôvodný autor v ňom zmieňoval, že by bolo fajn, keby to fungovalo aspoň pre tie javy, ktoré majú jasné pravidlá.

    Takto reaguje väčšina programátorov (a im spriaznených duší), všetko okolo nás je jednoduché a každý tomu rozumie bez toho, aby o tom vedel niečo viac. A je úplne jedno, či sa jedná o lingvistiku, alebo dotácie v EÚ :) Moja reakcia sa vtedy snažila o akýsi popis toho, prečo to vlastne nie je také jednoduché. Napísal som však, že jediná vec, ktorá je jednoduchá je vokalizácia predložiek. Vec, ktorá je na prvý pohľad nesmierne jednoduchá, stačí sa pozrieť a určiť kedy sa má písať v/vo, z/zo, s/so, ... Neprozreteľne som napísal, že sa to dá napísať za jedno poobedie. Včera pršalo a dnes ráno tiež. Tak som sa do toho pustil.

    Keďže som sa momentálne pripojil k projektu, ktorý sa zaoberá ovládaním autorádia pomocou hlasu, tak som to rovno využil aj na zoznámenie sa s novinkami (JDOM, Open Agent Architecture). Základom bolo preportovať knižnicu na prácu s hláskami (vedeli ste, že už toto nie je jednoznačné) a následne vytvoriť baseline, aby bolo následne s čím porovnávať.

    ak to je vokalizovana predlozka potom
            vrat chybu
    ak to nie vokalizovana predlozka potom
            vrat ze je to v poriadku
    
    Keďže na mojich testovacích dátach (korpus Harry, milión slov) je tých chýb minimálne, tak by to v ideálnom prípade malo vrátiť, že je všetko OK. A kebyže o tom nič neviem, tak nasleduje šok. Prezentovaná metóda má úspešnosť okolo 89.9%, ak nerobíme s jazykom, tak to je slušné číslo. Ale v prirodzenom jazyku to má k použiteľnosti ešte ďaleko. A tak prepisujem nejaký pravidlá z múdrej knižky a pridávam pár svojich. Po pár hodinách (a remíze Artmedie) sa dostávame k presnosti 97.7%, ale stále mi tam zostáva okolo 500 prípadov, ktoré sú nesprávne. Kde-tu to je pravda, ale väčšinu z toho tvoria chyby. A tak pozerám a hľadám. A moja lingvistická intuícia dostáva na frak. Nedokážem určiť, čo je ešte spisovné a čo už nie. No nič, idem spať.

    Celý balík (pod BSDL) pošlem na požiadanie, takto je to vhodné akurát tak pre niekoho, kto sa chce hrať. Ledaže by sa našiel niekto, kto by napísal rozhranie k OO.org. So skvalitnením pomôžem rád, s pridávaním do OO.org, či niečoho podobného len ťažko, keďže ich nepoužívam, takže by som z toho nemal žiaden osoh, a nemyslím si, že by ma to bavilo. Ale iniciatíve sa medze nekladú :) Ak máte nápady na nejaké podobné eazy lingvistické problémy, tak sem s nimi.

           

    Hodnocení: -

    zatím nehodnoceno
            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.