abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 19:44 | Komunita

    Na čem aktuálně pracují vývojáři GNOME a KDE? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE.

    Ladislav Hagara | Komentářů: 0
    včera 23:11 | IT novinky

    3D tiskárny Original Prusa MK4S (a MK4) v kombinaci s Prusamenty PLA a PETG mají mezinárodně uznávanou certifikaci UL 2904 GREENGUARD, která potvrzuje splnění přísných bezpečnostních standardů pro VOC a UFP.

    Ladislav Hagara | Komentářů: 0
    včera 22:11 | Nová verze

    Byla vydána verze R1/beta5 open source operačního systému Haiku (Wikipedie). Přehled novinek i s náhledy v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 5
    včera 16:33 | Komunita

    Sovereign Tech Fund (Wikipedie), tj. program financování otevřeného softwaru německým ministerstvem hospodářství a ochrany klimatu, podpoří Sambu částkou 688 800 eur.

    Ladislav Hagara | Komentářů: 7
    včera 13:11 | IT novinky

    Společnost OpenAI představila novou řadu svých AI modelů OpenAI o1 navržených tak, aby "strávily více času přemýšlením, než zareagují". Videoukázky na 𝕏 nebo YouTube.

    Ladislav Hagara | Komentářů: 1
    včera 12:55 | Pozvánky

    Sailathon 24, tj. hackathon mobilního operačního systému Sailfish OS, proběhne od 27. do 30. září v Praze na Strahově ve školícím centru Silicon Hill.

    Ladislav Hagara | Komentářů: 0
    včera 01:11 | Nová verze

    Bylo vydáno Ubuntu 22.04.5 LTS, tj. páté opravné vydání Ubuntu 22.04 LTS s kódovým názvem Jammy Jellyfish. Stejně tak Kubuntu 22.04.5 LTS, Ubuntu Budgie 22.04.5 LTS, Ubuntu MATE 22.04.5 LTS, Lubuntu 22.04.5 LTS, Ubuntu Kylin 22.04.5 LTS, Ubuntu Studio 22.04.5 LTS a Xubuntu 22.04.5 LTS.

    Ladislav Hagara | Komentářů: 0
    12.9. 22:55 | Zajímavý článek Ladislav Hagara | Komentářů: 0
    12.9. 22:33 | Nová verze

    Byla vydána nová verze 8.7 multiplatformní digitální pracovní stanice pro práci s audiem (DAW) Ardour. Přehled oprav, vylepšení a novinek v oficiálním oznámení.

    Ladislav Hagara | Komentářů: 0
    12.9. 22:11 | IT novinky

    Společnost Juno Computers prodávající počítače s předinstalovaným Linuxem má nově v nabídce linuxový tablet Juno Tab 3. Na výběr je Mobian Phosh, Ubuntu 24.04 (GNOME) a Kubuntu 24.04 (KDE Plasma). Cena začíná na 699 dolarech.

    Ladislav Hagara | Komentářů: 0
    Rozcestník

    Kontrola pravopisu - I

    2. 4. 2003 | Vlastimil Ott | Návody | 56590×

    Pokus o zmapování situace, ve které se nacházejí programy pro kontrolu pravopisu. Článek se zaměřuje na češtinu, ale stranou nezůstanou ani ostatní jazyky.

    Nejstarší je ispell

    Pravděpodobně nejstarší a nejznámější program pro kontrolu pravopisných překlepů v elektronicky uchovávaných textech se nazývá ispell (angl. to spell - hláskovat, správně číst a psát; i - znamená international, tzn. použitelný pro maximální množství jazyků). Dnes používaná verze je založena na verzi z roku 1983, která byla přepracováním programu z roku 1971. Dalšími změnami prošel program v letech 1987-1988, kdy byl přepsán (v souvislosti s rozvojem nadnárodních komunikačních sítí) pro použití v mnoha jazycích. Na jeho práci se podílelo mnoho lidí. Dnes vývoj stagnuje, doplňují se pouze jednotlivé slovníky.

    Váš systém by už měl obsahovat program ispell, který je vlastně jádrem celého korekčního mechanismu. Pochopitelně je nutné mít také slovníky. Ve vaší instalaci budou pravděpodobně slovníky pro angličtinu, možná němčinu a třeba i češtinu. Přesto vám doporučuji, abyste si stáhli aktuální verzi českého slovníku. Slovník je doplňován mnoha lidmi (ke kterým se můžete přidat i vy), proto se často objevují nové verze. Důležité ovšem je, že tento projekt je koordinován Petrem Kolářem, který hlídá jazykovou čistotu a správnost slovníku. Nemělo by se tudíž stát, že vám slovník nabídne nespisovný nebo vulgární tvar, nebo slovo z jiného jazyka. (O možné spolupráci na doplňování slovníku viz text níže.)

    Český slovník se instaluje (po rozbalení archivu do dočasného adresáře) příkazy make a make install, což není z přiloženého souboru README vůbec patrné. Slovníky všech jazyků se instalují do adresáře /usr/lib/ispell.

    Celý systém se uvádí do pohybu programem ispell. Spustí se jednoduché interaktivní prostředí, které zobrazuje cca dva řádky textu, program nalezne první "chybu" a čeká na vaši reakci. V X-window je pochopitelně třeba spustit program v emulátoru terminálu (nepěkné sousloví označující např. XTerm nebo Eterm). Program je nutné volat s patřičnými parametry, aby věděl, který slovník má použít. Jako příklad může sloužit zdrojový text tohoto článku:

    ispell -d czech kontrola_pravopisu.htm

    Spuštěný ispell nalezl chybu - cizojazyčné slovo

    a překlep...

    Parametr -d označuje použití slovníku pro češtinu (analogicky např. -d english nebo -d deutsch, pokud máte dané slovníky nainstalované).

    Podpora formátů

    Program podle přípony rozezná tři typy formátů a podle toho přizpůsobí své "chování". Jedná se o formáty HTML/SGML, nroff/troff a (La)TeX.

    • V případě HTML dokumentu program ignoruje všechny příkazy ohraničené lomenými závorkami "<" a ">", s výjimkou parametru alt="Popisek", jehož obsah kontroluje.
    • Ve zdrojovém textu (La)TeXu ignoruje vše, co se nachází mezi \ a řídicím znakem "mezera". To dostačuje pro korekturu validního dokumentu. Napíšete-li ale \Zapomněl jsem ještě něco (obrácené lomítko by byl překlep), ispell najde jako chybu sekvenci "ěl", protože zná kategorii znaků v TeXu a ví, že řídicí znak nesmí mít kategorii "vyšší než 127 v ASCII tabulce". Taktéž kontroluje obsah parametrů příkazů jako je \section{}, ale už ne např. \cite{Novacek2000}. Program ignoruje znak "%" jako znak uvozující v TeXu komentář; i ty jsou tedy kontrolovány.
    • Podporu dokumentu typu nroff/troff jsem nezkoušel, ale očekávám, že funguje stejným způsobem.

    Pokud soubor ke kontrole nemá příponu, kontroluje se vše. Typ dokumentu lze explicitně specifikovat parametry -t (LaTeX režim), -H (SGML/HTML režim) a -n (nroff/troff režim).

    Ovládání programu

    Hlavní režim programu je interaktivní; ten je pro běžného uživatele asi nejdůležitější. Po spuštění se program ovládá několika klávesami, které jsou zobrazeny na spodním řádku. Jsou to následující klávesy:

    Klávesa Význam Akce a její následky Nevýhoda
    r Replace/Zaměň Uživatel má možnost manuálně přepsat chybný tvar. Akci nelze stornovat bez ztráty původního (chybného) tvaru.
    mezerník Akceptuj teď Akceptuje zvýrazněný tvar v tomto jediném výskytu (ne v dokumentu). žádná
    a Akceptuj pořád Akceptuje tvar v celém dokumentu, tzn. už nehlásí chybu při jeho dalším výskytu. Při dalším spuštění ispellu se situace opakuje. žádná
    i Vlož do slovníku Vloží tento tvar (beze změny) do osobního slovníku .ispell_czech. Při dalším spuštění/výskytu je tvar považován za korektní. Tvar je načten až při dalším spuštění programu.
    u Vlož do slovníku Převede tento tvar na malá písmena a vloží jej do osobního slovníku .ispell_czech. Při dalším spuštění/výskytu je tvar považován za korektní. Tvar je načten až při dalším spuštění programu.
    0--n Zaměň Zamění nalezený tvar jednou z nabízených variant. Každá z nich má své číslo v rozmezí 0 až n. Pořadí může být i dvouciferné, pak je tedy nutno stisknout dvě číslice (např. "0" a "9" pro volbu devátého tvaru z celkem 25). žádná
    l Hledej Hledá požadovaný tvar v systémovém slovníku /usr/dict/words. Pokud systémový slovník neexistuje (můj případ), hlásí ispell chybu. Tento soubor není viditelně součástí ispellu, ale je systémově závislý. Nalezená slova nelze vybrat, pouze číst. Smysl funkce nechápu.
    x Ulož Zapíše soubor a skončí. Opravené překlepy jsou zachovány, neopravené zůstávají. Pokud bylo v parametru specifikováno více souborů, pokračuje kontrolou dalšího. žádná
    q Skonči Program se ukončí, kontrolovaný dokument zůstává nezměněn. žádná
    ? Nápověda Zobrazí nápovědu k ovládání. Příliš stručná, totožná s částí manuálové stránky.
    Ctrl-z Suspenduj Přesune program do pozadí. Praktické pro konsoli. žádná
    Ctrl-l Překresli Znovu vykreslí obrazovku, vhodné po přesunutí programu zpět do popředí (po Ctrl-z). žádná

    Program má ještě další, speciálnější, funkce, které v tomto článku nezmiňuji. Další parametry programu naleznete v manuálové stránce.

    Integrace do systému

    V této části se pokusím nastínit, jakým způsobem je nutné nastavit některé programy, aby používaly ispell. Omezím se na rozšířené textové editory, Midnight Commander apod. Nepoužívám ani Vi(m) ani Emacs, proto se těmto programům věnovat nebudu. Uživatel, který pracuje v těchto editorech, už v nich určitě kontrolu pravopisu dávno zprovoznil. Holt jsem bezvěrec ;-). Dále se nevěnuji kolosům typu OpenOffice a KOffice, které mají vlastní systém kontroly pravopisu.

    NEdit

    Oblíbený editor, který umí pracovat s mnoha formáty. Já v něm píšu LaTeXové a HTML dokumenty. Nastavení kontroly pravopisu je už dokonce provedeno, podle mého názoru ale zbytečně složitě. Mé řešení je následující (Preferences - Default Settings - Customize Menus - Shell Menu): xterm -e ispell -d czech %

    Nastavení ispellu v NEditu

    Pokud zatrhnete volbu "Output replaces input", dočkáte se nemilého překvapení - ispell má prázdný výstup. Ten se tedy stane obsahem vašeho (teď už bývalého) souboru :-D.

    Bluefish

    Nastavení kontroly pravopisu v tomto HTML editoru je triviální, existuje pro něj položka v hlavním konfiguračním okně - stačí pouze zapsat jazyk slovníku. Editor přebírá režii nad vizuálním ztvárněním celého procesu, dokonce nalezené tvary zobrazuje červeně.

    Nastavení ispellu v Bluefish

    Cooledit

    Midnight Commander (dále mc) je asi pro mnoho lidí základ a legenda. Jedná se o souborový manažer s mnoha vlastnostmi (kdo by jej neznal, že) a s interním editorem. Podivné (pro mě) je, že obdobné manažery vzniknuvší a vznikající pro X-window nesou často stejné jméno, ačkoliv s mc mají málo společného (např. gmc). Podobná situace platí i pro interní editor, který se jmenuje Cooledit. Jednak existuje ten původní, textový, pro mc, a potom také grafický editor, který nese stejné jméno. Nedosti na tom, on dokonce používá stejný konfigurační adresář! Tohle je pro mě opravdové překvapení. Zmatek je tedy dokonalý.

    Kontrola pravopisu pro interní textový editor Cooledit se nastavuje v souboru ~/.edit.spell.rc (jako vzor slouží /usr/local/lib/mc/edit.spell.rc). Do původního řádku tedy vepíšeme parametr pro použití českého slovníku: ispell -d czech "$2" 2>"$3". Po označení bloku textu se spustí klasický ispell a změny se po jeho ukončení promítnou do editovaného souboru.

    Stejně se chová Cooledit grafický. Jeho kontrolu pravopisu nastavíme v menu "Scripts" - "Edit a script" - "ispell". Pro kontrolu je vždy třeba text označit - editor vytvoří dočasný soubor s příponou .block, což odbourá dobrou vlastnost ispellu rozeznat obsah podle přípony a uživatele přivede k zoufalství, když odklepává "chyby" jako "<title>" nebo "\section". Řešením by bylo vytvořit pro každý typ dokumentu zvláštní skript, ale editor má příliš mnoho nedostatků na to, aby tato práce navíc měla nějaký význam. Jeho výhodou je, že překlepy podtrhává červeně, ale pouze v případě, že text píšete (a tedy jste ho nevkopírovali); a ještě navíc pouze jen na šedesát sekund.

    Nastavení ispellu v Cooleditu

    Ted

    Editor Ted je kvalitní textový editor zpracovávající dokumenty typu RTF. Kontrola pravopisu v něm je bezproblémová, využívá soubory uložené v adresáři /usr/local/ind, což jsou binární verze slovníků. (Popravdě řečeno, nezjistil jsem, kde se tam vzaly a kdy a jak byly vytvořeny, ale postarala se o to pravděpodobně instalace ispellu.) Nastavení kontroly pravopisu v Tedu je automatické: buď slovníky najde (jsou nainstalované), nebo ne. I tento editor používá vlastní správu procesu kontroly. Při spuštění kontroly je nutné vybrat z nalezených slovníků ten, který si přejete použít.

    Výběr slovníku v Tedu Kontrola pravopisu v Tedu

    Další programy

    Výše zmíněné programy mají sloužit jako ilustrace. Věřím, že nastavení kontroly pravopisu ve vašem oblíbeném editoru pro vás bude jednodušší, když teď víte jak na to. Nelze pochopitelně postihnout všechny; každý z nás navíc používá odlišný software. Pokud jsem zapomněl na některý program, se kterým si nevíte rady, sdělte mi to v diskuzi, článek mohu aktualizovat.

    Spolupráce na doplňování slovníku

    Kdykoliv přidáte tvar do svého osobního slovníku, zvyšujete šanci otevřeného softwaru postavit se komerčním programům čelem ;-). Tyto osobní slovníky se ukládají do adresáře každého uživatele. Jedná se o abecedně řazený seznam slovních tvarů a předpokládá se, že tento soubor bude odeslán koordinátorovi národního slovníku, což je v našem případě výše zmíněný Petr Kolář. (Omlouvám se slovenským čtenářům, slovenštinu jsem nebral moc v potaz, a nevím tedy, kdo se o totéž stará na Slovensku.) Ten zaslaný slovník určitě zkontroluje, vyčistí od nežádoucích tvarů a ty žádoucí doplní do další verze českého slovníku ispellu. Pouze společným úsilím mnoha uživatelů ispellu lze dosáhnout ještě kvalitnějšího slovníku. V tomto okamžiku nelze říct, kolik tvarů český slovník obsahuje, ale je to víc, než obsahuje slovník v jednom velkém programu jedné velké firmy :-D.

    Uživatelská prostředí

    Jak (doufám) vyplynulo z předchozího textu, ne každý program spustí kontrolu pravopisu v poměrně nepřátelském okně Xtermu. Existují programy, které celý proces "zabalí" do příjemného hávu. Jeden z nich je třeba kspell.

    Jiné jazyky

    V celém textu jsem bral v potaz pouze češtinu; domnívám se, že slovenština na tom není výrazně jinak, snad jen velikost slovníku se liší. Jiné jazyky, které mohou běžného uživatele zajímat (němčina, angličtina) nepředstavují žádný problém. (S ruštinou - s ohledem na specifičnost azbuky - žádné zkušenosti nemám.) Je pouze vhodné pravidelně aktualizovat slovník. Diametrálně odlišný problém ovšem nastává v případě, že potřebujeme zkontrolovat dokument, který je vícejazyčný. Podle mého názoru, který je podložen získanými zkušenostmi, nelze tento stav ispellem uspokojivě řešit. Otázka je principiální: jak má program rozeznat "přepnutí" do jiného jazyka? Zatím není tato otázka uspokojivě vyřešena, vše zůstává na trpělivosti uživatele, který musí cizojazyčná slova označit za ignorovatelná.

    Nevýhody

    Spell-check (toto běžné anglické označení používám poprvé až na konci článku ;-) ) je velký vynález. Není to ale kouzelník. Nelze spoléhat na to, že program najde a odstraní všechny nedostatky v textu, který stvořil člověk. Nikdy nebude možné strojově odstranit všechny chyby, které vymyslí lidský mozek. Proto přijměte na závěr velké(!) doporučení: používejte ispell, ale osvěžte si pravidla českého pravopisu a snažte se psát bez chyb a překlepů, čeština si to opravdu zaslouží. Příště se seznámíme s alternativou ispellu, která se nazývá (GNU) aspell.

           

    Hodnocení: 36 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    2.4.2003 08:18 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Vim
    Popravdě řečeno, Vim žádný pořádný interface ke kontrole pravopisu nemá (je to v TODO). Prostě pustíte ispell ;-)
    Ale jak dokazuje Wrait na svym auditku, da se to docela dobre integrovat :) http://mageo.cz/.chatroom/39103?n=400 Podivejte se na prispevek z [16.11.02 - 09:58]
    21.7.2003 19:58 Petr Mach (Wraith)
    Rozbalit Rozbalit vše Vim
    Prosim nekomolit me jmeno :-).

    VIM ma plugin, ktery zprovoznuje korekturu ve spolupraci s programem aspell. Jsou k tomu potreba tri veci, nainstalovany aspell se slovnikem, samotny plugin (obycejny textovy soubor) zkopirovany do adresare plugins VIMu a VIM s podporou skriptovani v jazyku ruby. Plugin je napsan prave v nem.
    2.4.2003 10:05 Tomáš
    Rozbalit Rozbalit vše Rozlišení podle přípony
    Tuším, že ispell nepoznává typ automaticky podle přípony, aspoň ne u mě. Musí se mu vnutit nějakou volbou (myslím že -t znamená TeX/LaTeX), je to popsané v manuálu. Btw. nedá se nějak Mozilla znásilnit, aby se dal ve formulářích taky kontrolovat pravopis?
    2.4.2003 10:27 Robert Krátký | skóre: 94 | blog: Robertův bloček
    Rozbalit Rozbalit vše Rozlišení podle přípony
    ad pripony: zkuste projet html soubor s priponou a bez - uvidite ten rozdil.
    2.4.2003 18:42 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
    Rozbalit Rozbalit vše Rozlišení podle přípony
    ad 1) Neznam stare verze, ale pochybuju, ze by to tam nebylo. Z jakeho programu tu kontrolu spoustite? Nebo z konzole? Ruzne programy vytvareji docasne soubory s pofidernimi priponami (napr. mc nebo standardne nedit). ad 2) Ve sve Mozille 1.2.1 jsem nenasel zadnou podporu pro ispell, tedy ani v Mozilla Mailu ne. Proste tam neni. Pak neni co znasilnovat. --vo
    Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
    2.4.2003 13:49 marx
    Rozbalit Rozbalit vše nástroj na kontrolu pravopisu
    to snáď nie :) ispell, aspell, fispell, ... nie sú nástroje na konrolu pravopisu, ale na kontrolu (opravu) preklepov. pokiaľ sa dobre pamatám, tak pre angličtinu už existujú (akademické určite) nástroje na kontrolu pravopisu (tj. aspoň na úrovni jednotlivých viet), pre češtinu sa podobné nástroje vyvíjajú. zatiaľ bez vačšieho úspechu, aj keď to už kdečo dokáže. posledný projekt vobec nesplnil očakávania :( čo sa týka rozpoznávania zmeny jazykov v texte, je to problém pri citátoch o veľkosti niekoľkých viet. pri dlhších textov sa to dá určiť dosť bezpečne aj na základe štatistických údajov (znaky, bigramy, trigramy, ...). nejaké podobné systémy majú aj webové rozhranie, s češtinou/slovenčinou je však problém že je potrebné určiť aj kódovanie a win1250/iso-2 je príliš podobné. takže je potrebné si pomoct slovníkom. normálny text v správnom kódovaní má v slovníku >90% v zlom kódovaní (win-1250) zhruba 73-78%.
    2.4.2003 18:34 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
    Rozbalit Rozbalit vše nástroj na kontrolu pravopisu
    "to snáď nie :) ispell, aspell, fispell, ... nie sú nástroje na konrolu pravopisu, ale na kontrolu (opravu) preklepov. " Castecne mate pravdu. Ale ja to chapu tak, ze napr. "fylozofie" neni preklep, ale gramaticka (tedy pravopisna) chyba. Ale uznavam, ze nazev je zavadejici. Ale jak to nazvat lip? ;-) --vo
    Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
    2.4.2003 19:54 marx
    Rozbalit Rozbalit vše nástroj na kontrolu pravopisu
    bezne zauzivany nazov je nastroj na kontrolu preklepov. zakladny rozdiel medzi nimi je v urovni na ktorej ten system pracuje. ispell & spol. pracuju na morfologickej urovni (slov), zatial co nastroje na kontrolu pravopisu pracuju na urovni viet (vyuziva sa syntakticka resp. parcialna syntakticka analyza). marx, Laboratory of Natural Language Processing
    2.4.2003 20:44 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
    Rozbalit Rozbalit vše nástroj na kontrolu pravopisu
    Zajima me to, muzete me kontaktovat na vlastimil@e-ott.info? Diky. --vo
    Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
    egg avatar 4.4.2003 00:20 egg | skóre: 20 | Praha
    Rozbalit Rozbalit vše nástroj na kontrolu pravopisu
    Co ja vim, tak v BFU terminologii se vetsinou syntakticke analyze rika "kontrola gramatiky", zatimco "kontrola pravopisu" oznacuje spell checkig. Ne? Cestinarsky termin pravopis zahrnuje oboji, ale co se tyce psani elektronickych dokumentu, znam to takhle.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.