abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 07:33 | Komunita

    O víkendu probíhá konference OpenAlt 2025. Na programu je spousta zajímavých přednášek. Pokud jste v Brně, stavte se. Vstup zdarma.

    Ladislav Hagara | Komentářů: 0
    dnes 00:55 | IT novinky

    Josef Průša představil novou velkoformátovou uzavřenou CoreXY 3D tiskárnu Prusa CORE One L a nový open source standard chytrých cívek OpenPrintTag i s novou přepracovanou špulkou.

    Ladislav Hagara | Komentářů: 1
    včera 18:33 | IT novinky

    Na GOG.com běží Autumn Sale. Při té příležitosti je zdarma hororová počítačová hra STASIS (ProtonDB: Platinum).

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Komunita

    Ubuntu 25.10 má nově balíčky sestavené také pro úroveň mikroarchitektury x86-64-v3 (amd64v3).

    Ladislav Hagara | Komentářů: 6
    včera 01:22 | Nová verze

    Byla vydána verze 1.91.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 0
    včera 00:11 | IT novinky

    Ministerstvo průmyslu a obchodu vyhlásilo druhou veřejnou soutěž v programu TWIST, který podporuje výzkum, vývoj a využití umělé inteligence v podnikání. Firmy mohou získat až 30 milionů korun na jeden projekt zaměřený na nové produkty či inovaci podnikových procesů. Návrhy projektů lze podávat od 31. října do 17. prosince 2025. Celková alokace výzvy činí 800 milionů korun.

    Ladislav Hagara | Komentářů: 5
    30.10. 23:44 | Komunita

    Google v srpnu oznámil, že na „certifikovaných“ zařízeních s Androidem omezí instalaci aplikací (včetně „sideloadingu“) tak, že bude vyžadovat, aby aplikace byly podepsány centrálně registrovanými vývojáři s ověřenou identitou. Iniciativa Keep Android Open se to snaží zvrátit. Podepsat lze otevřený dopis adresovaný Googlu nebo petici na Change.org.

    Ladislav Hagara | Komentářů: 0
    30.10. 15:22 | Nová verze

    Byla vydána nová verze 18 integrovaného vývojového prostředí (IDE) Qt Creator. S podporou Development Containers. Podrobný přehled novinek v changelogu.

    Ladislav Hagara | Komentářů: 2
    30.10. 12:55 | Nová verze

    Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 2.0. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).

    Ladislav Hagara | Komentářů: 1
    30.10. 02:55 | Nová verze

    Google Chrome 142 byl prohlášen za stabilní. Nejnovější stabilní verze 142.0.7444.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 20 bezpečnostních chyb. Za nejvážnější z nich bylo vyplaceno 50 000 dolarů. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (48%)
     (19%)
     (18%)
     (23%)
     (16%)
     (21%)
     (16%)
     (17%)
    Celkem 292 hlasů
     Komentářů: 14, poslední 14.10. 09:04
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Akože gramatický korektor

    2.11.2005 02:40 | Přečteno: 1267× | Spracovanie jazyka

    Pred zhruba mesiacom som reagoval na poznámku o tom aké by to bolo super mať aspoň jednoduchý gramatický korektor. Pôvodný autor v ňom zmieňoval, že by bolo fajn, keby to fungovalo aspoň pre tie javy, ktoré majú jasné pravidlá.

    Takto reaguje väčšina programátorov (a im spriaznených duší), všetko okolo nás je jednoduché a každý tomu rozumie bez toho, aby o tom vedel niečo viac. A je úplne jedno, či sa jedná o lingvistiku, alebo dotácie v EÚ :) Moja reakcia sa vtedy snažila o akýsi popis toho, prečo to vlastne nie je také jednoduché. Napísal som však, že jediná vec, ktorá je jednoduchá je vokalizácia predložiek. Vec, ktorá je na prvý pohľad nesmierne jednoduchá, stačí sa pozrieť a určiť kedy sa má písať v/vo, z/zo, s/so, ... Neprozreteľne som napísal, že sa to dá napísať za jedno poobedie. Včera pršalo a dnes ráno tiež. Tak som sa do toho pustil.

    Keďže som sa momentálne pripojil k projektu, ktorý sa zaoberá ovládaním autorádia pomocou hlasu, tak som to rovno využil aj na zoznámenie sa s novinkami (JDOM, Open Agent Architecture). Základom bolo preportovať knižnicu na prácu s hláskami (vedeli ste, že už toto nie je jednoznačné) a následne vytvoriť baseline, aby bolo následne s čím porovnávať.

    ak to je vokalizovana predlozka potom
            vrat chybu
    ak to nie vokalizovana predlozka potom
            vrat ze je to v poriadku
    
    Keďže na mojich testovacích dátach (korpus Harry, milión slov) je tých chýb minimálne, tak by to v ideálnom prípade malo vrátiť, že je všetko OK. A kebyže o tom nič neviem, tak nasleduje šok. Prezentovaná metóda má úspešnosť okolo 89.9%, ak nerobíme s jazykom, tak to je slušné číslo. Ale v prirodzenom jazyku to má k použiteľnosti ešte ďaleko. A tak prepisujem nejaký pravidlá z múdrej knižky a pridávam pár svojich. Po pár hodinách (a remíze Artmedie) sa dostávame k presnosti 97.7%, ale stále mi tam zostáva okolo 500 prípadov, ktoré sú nesprávne. Kde-tu to je pravda, ale väčšinu z toho tvoria chyby. A tak pozerám a hľadám. A moja lingvistická intuícia dostáva na frak. Nedokážem určiť, čo je ešte spisovné a čo už nie. No nič, idem spať.

    Celý balík (pod BSDL) pošlem na požiadanie, takto je to vhodné akurát tak pre niekoho, kto sa chce hrať. Ledaže by sa našiel niekto, kto by napísal rozhranie k OO.org. So skvalitnením pomôžem rád, s pridávaním do OO.org, či niečoho podobného len ťažko, keďže ich nepoužívam, takže by som z toho nemal žiaden osoh, a nemyslím si, že by ma to bavilo. Ale iniciatíve sa medze nekladú :) Ak máte nápady na nejaké podobné eazy lingvistické problémy, tak sem s nimi.

           

    Hodnocení: -

    zatím nehodnoceno
            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.