abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 23:55 | Komunita

    Ubuntu 26.04 LTS bude (𝕏) Resolute Raccoon (rezolutní mýval).

    Ladislav Hagara | Komentářů: 0
    včera 21:00 | Nová verze

    Netwide Assembler (NASM) byl vydán v nové major verzi 3.00. Přehled novinek v poznámkách k vydání v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    včera 20:11 | Komunita

    Linuxová distribuce Frugalware (Wikipedie) ke konci roku 2025 oficiálně končí.

    Ladislav Hagara | Komentářů: 0
    včera 17:22 | Nová verze

    Byla vydána nová verze 3.0.6 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP bude brzy k dispozici také na Flathubu.

    Ladislav Hagara | Komentářů: 0
    včera 16:11 | IT novinky

    Americký výrobce čipů AMD uzavřel s americkou společností OpenAI smlouvu na několikaleté dodávky vyspělých mikročipů pro umělou inteligenci (AI). Součástí dohody je i předkupní právo OpenAI na přibližně desetiprocentní podíl v AMD.

    Ladislav Hagara | Komentářů: 1
    včera 12:22 | Nová verze Ladislav Hagara | Komentářů: 0
    5.10. 20:00 | Komunita

    Byly zpracovány a na YouTube zveřejněny videozáznamy z konference LinuxDays 2025.

    Ladislav Hagara | Komentářů: 0
    4.10. 15:22 | IT novinky

    Na konferenci LinuxDays 2025 byl oficiálně představen nový router Turris Omnia NG.

    Ladislav Hagara | Komentářů: 35
    4.10. 05:22 | Komunita

    Přímý přenos (YouTube) z konference LinuxDays 2025, jež probíhá tento víkend v Praze v prostorách FIT ČVUT. Na programu je spousta zajímavých přednášek.

    Ladislav Hagara | Komentářů: 17
    3.10. 22:44 | IT novinky

    V únoru loňského roku Úřad pro ochranu osobních údajů pravomocně uložil společnosti Avast Software pokutu 351 mil. Kč za porušení GDPR. Městský soud v Praze tuto pokutu na úterním jednání zrušil. Potvrdil ale, že společnost Avast porušila zákon, když skrze svůj zdarma dostupný antivirový program sledovala, které weby jeho uživatelé navštěvují, a tyto informace předávala dceřiné společnosti Jumpshot. Úřad pro ochranu osobních údajů

    … více »
    Ladislav Hagara | Komentářů: 11
    Jaké řešení používáte k vývoji / práci?
     (38%)
     (45%)
     (15%)
     (17%)
     (22%)
     (15%)
     (18%)
     (16%)
     (15%)
    Celkem 181 hlasů
     Komentářů: 12, poslední 4.10. 20:35
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Akože gramatický korektor

    2.11.2005 02:40 | Přečteno: 1263× | Spracovanie jazyka

    Pred zhruba mesiacom som reagoval na poznámku o tom aké by to bolo super mať aspoň jednoduchý gramatický korektor. Pôvodný autor v ňom zmieňoval, že by bolo fajn, keby to fungovalo aspoň pre tie javy, ktoré majú jasné pravidlá.

    Takto reaguje väčšina programátorov (a im spriaznených duší), všetko okolo nás je jednoduché a každý tomu rozumie bez toho, aby o tom vedel niečo viac. A je úplne jedno, či sa jedná o lingvistiku, alebo dotácie v EÚ :) Moja reakcia sa vtedy snažila o akýsi popis toho, prečo to vlastne nie je také jednoduché. Napísal som však, že jediná vec, ktorá je jednoduchá je vokalizácia predložiek. Vec, ktorá je na prvý pohľad nesmierne jednoduchá, stačí sa pozrieť a určiť kedy sa má písať v/vo, z/zo, s/so, ... Neprozreteľne som napísal, že sa to dá napísať za jedno poobedie. Včera pršalo a dnes ráno tiež. Tak som sa do toho pustil.

    Keďže som sa momentálne pripojil k projektu, ktorý sa zaoberá ovládaním autorádia pomocou hlasu, tak som to rovno využil aj na zoznámenie sa s novinkami (JDOM, Open Agent Architecture). Základom bolo preportovať knižnicu na prácu s hláskami (vedeli ste, že už toto nie je jednoznačné) a následne vytvoriť baseline, aby bolo následne s čím porovnávať.

    ak to je vokalizovana predlozka potom
            vrat chybu
    ak to nie vokalizovana predlozka potom
            vrat ze je to v poriadku
    
    Keďže na mojich testovacích dátach (korpus Harry, milión slov) je tých chýb minimálne, tak by to v ideálnom prípade malo vrátiť, že je všetko OK. A kebyže o tom nič neviem, tak nasleduje šok. Prezentovaná metóda má úspešnosť okolo 89.9%, ak nerobíme s jazykom, tak to je slušné číslo. Ale v prirodzenom jazyku to má k použiteľnosti ešte ďaleko. A tak prepisujem nejaký pravidlá z múdrej knižky a pridávam pár svojich. Po pár hodinách (a remíze Artmedie) sa dostávame k presnosti 97.7%, ale stále mi tam zostáva okolo 500 prípadov, ktoré sú nesprávne. Kde-tu to je pravda, ale väčšinu z toho tvoria chyby. A tak pozerám a hľadám. A moja lingvistická intuícia dostáva na frak. Nedokážem určiť, čo je ešte spisovné a čo už nie. No nič, idem spať.

    Celý balík (pod BSDL) pošlem na požiadanie, takto je to vhodné akurát tak pre niekoho, kto sa chce hrať. Ledaže by sa našiel niekto, kto by napísal rozhranie k OO.org. So skvalitnením pomôžem rád, s pridávaním do OO.org, či niečoho podobného len ťažko, keďže ich nepoužívam, takže by som z toho nemal žiaden osoh, a nemyslím si, že by ma to bavilo. Ale iniciatíve sa medze nekladú :) Ak máte nápady na nejaké podobné eazy lingvistické problémy, tak sem s nimi.

           

    Hodnocení: -

    zatím nehodnoceno
            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.