abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 22:11 | IT novinky Ladislav Hagara | Komentářů: 0
    včera 20:55 | Nová verze

    Neziskové průmyslové konsorcium Khronos Group vydalo verzi 1.1 specifikace OpenXR (Wikipedie), tj. standardu specifikujícího přístup k platformám a zařízením pro XR, tj. platformám a zařízením pro AR (rozšířenou realitu) a VR (virtuální realitu). Do základu se z rozšíření dostalo XR_EXT_local_floor. Společnost Collabora implementuje novou verzi specifikace do platformy Monado, tj. open source implementace OpenXR.

    Ladislav Hagara | Komentářů: 2
    včera 17:22 | Nová verze

    Byla vydána nová verze 0.38.0 multimediálního přehrávače mpv (Wikipedie) vycházejícího z přehrávačů MPlayer a mplayer2. Přehled novinek, změn a oprav na GitHubu. Požadován je FFmpeg 4.4 nebo novější a také libplacebo 6.338.2 nebo novější.

    Ladislav Hagara | Komentářů: 1
    včera 17:11 | Nová verze

    ClamAV (Wikipedie), tj. multiplatformní antivirový engine s otevřeným zdrojovým kódem pro detekci trojských koní, virů, malwaru a dalších škodlivých hrozeb, byl vydán ve verzích 1.3.1, 1.2.3 a 1.0.6. Ve verzi 1.3.1 je mimo jiné řešena bezpečnostní chyba CVE-2024-20380.

    Ladislav Hagara | Komentářů: 1
    včera 12:11 | IT novinky

    Digitální a informační agentura (DIA) oznámila (PDF, X a Facebook), že mobilní aplikace Portál občana je ode dneška oficiálně venku.

    Ladislav Hagara | Komentářů: 7
    včera 05:11 | Komunita

    #HACKUJBRNO 2024, byly zveřejněny výsledky a výstupy hackathonu města Brna nad otevřenými městskými daty, který se konal 13. a 14. dubna 2024.

    Ladislav Hagara | Komentářů: 2
    17.4. 17:55 | IT novinky

    Společnost Volla Systeme stojící za telefony Volla spustila na Kickstarteru kampaň na podporu tabletu Volla Tablet s Volla OS nebo Ubuntu Touch.

    Ladislav Hagara | Komentářů: 3
    17.4. 17:44 | IT novinky

    Společnost Boston Dynamics oznámila, že humanoidní hydraulický robot HD Atlas šel do důchodu (YouTube). Nastupuje nová vylepšená elektrická varianta (YouTube).

    Ladislav Hagara | Komentářů: 1
    17.4. 15:11 | Nová verze

    Desktopové prostředí LXQt (Lightweight Qt Desktop Environment, Wikipedie) vzniklé sloučením projektů Razor-qt a LXDE bylo vydáno ve verzi 2.0.0. Přehled novinek v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 5
    17.4. 14:22 | IT novinky

    Nejvyšší soud podpořil novináře Českého rozhlasu. Nařídil otevřít spor o uchovávání údajů o komunikaci (data retention). Uvedl, že stát odpovídá za porušení práva EU, pokud neprovede řádnou transpozici příslušné směrnice do vnitrostátního práva.

    Ladislav Hagara | Komentářů: 0
    KDE Plasma 6
     (68%)
     (10%)
     (2%)
     (19%)
    Celkem 555 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník

    Kontrola pravopisu - II

    24. 4. 2003 | Vlastimil Ott | Návody | 19049×

    GNU korektor elektronických textů ASpell. Srovnání s ispellem.

    V tomto díle se seznámíme s dalším programem, který ve vašem textu hledá překlepy a pochopitelně je opraví. Jak mě správně upozornil jeden čtenář po přečtení prvního dílu tohoto miniseriálu, nejedná se o program pro kontrolu pravopisu, ale o program ke kontrole, resp. korekci překlepů. Žádný program pochopitelně ještě neumí na vysoké úrovni kontrolovat další roviny gramatického systému. Těmi myslím např. syntaktické vztahy nebo stylové roviny lexikální zásoby. Současné počítačové korektory pouze srovnávají záznam ve slovníku s formou nalezenou v textu. Nejsou schopny rozeznat, zda daný výraz patří do stylistické množiny výrazů, které autor v textu používá. Stejně tak nerozezná stavbu věty; neví, co je "věta". Na Masarykově univerzitě v Brně probíhá projekt Českého národního korpusu, který by měl v (daleké?) budoucnosti tyto prostředky pro počítačovou lingvistiku poskytnout. Zatím jsou však takové nástroje v plenkách a přínos Korpusu se omezuje na lexikální databázi výrazů ze všech stylových rovin češtiny. Tolik tedy k nepřesnému názvu.

    Dnešní díl je zasvěcen programu ASpell. Hned na úvod musím zmínit fakt, že od minule zmiňovaného ispellu se moc neliší. Naopak, cílem autora aspellu je naprosté nahrazení ispellu aspellem. Jestli vám už teď vadí ty téměř stejné názvy, čekejte ještě něco horšího. Aspell je poskytován jednak jako samostatný program pro explicitní kontrolu souboru a jednak jako programátorská knihovna. No a jak asi laskavý čtenář pochopil, spustitelný program se jmenuje (kromě jiných) ispell!

    Co, kde, proč a jak?

    Domovská stránka projektu GNU Aspell je strohá. Nabízí pouze a jenom to, co člověk potřebuje: základní i podrobné informace, aktuální archiv s programem a národní slovníky (český pochopitelně taky). V čem spočívá výhoda Aspellu oproti ispellu? Na stránce testů různých korektorů se dočteme, že Aspell je ze všech nejlepší, počítaje ve srovnání i korektor v Microsoft Wordu 97. Z přibližně 510 překlepů nenašel optimálně nakonfigurovaný Aspell pouze deset. Nevím přesně, jak tabulce rozumět a v čem je algoritmus Aspellu lepší než třeba ten v ispellu. Mé zkušenosti vycházejí z praktického používání. (Více o srovnání obou programů najdete na konci článku.) Aspell lze spustit nejen v čistě *nixových systémech, ale i ve Windows, BeOS, Mac OS, což pro vás určitě není žádné překvapení.

    Stejně jako minule vám doporučuji, abyste slovníky ve své distribuci aktualizovali, i když slovník pro češtinu je momentálně ve stádiu "jsem, tedy jsem". Nenarazil jsem na zmínku o tom, že by se o něj někdo staral. Poslední změnou prošel pouze slovník britské angličtiny (3. ledna 2003).

    Program se nainstaluje do adresáře /usr/share/aspell, slovníky do adresáře /usr/lib/aspell a dokumentace do /usr/doc/aspell. Program nemá klasickou manuálovou stránku, informace jsou uloženy ve formátu HTML a prostého textu.

    Praktické nasazení

    Korektor se spouští příkazem aspell. Jak jsem zmínil už výše, existuje i skript ispell pro náhradu ispellu, a také skript spell. Program se drze hlásí (aspell -v)

    @(#) International Ispell Version 3.1.20 (but really Aspell 0.50.3)

    takže zmatek je dokonalý. Může to uživatele zmást hlavně při výběru korektoru v menu některého editoru. Je však pravda, že skript ispell se skrývá v adresářové struktuře a není v proměnné PATH; nelze jej tedy najít příkazem which ispell. Kontrola souboru se provede příkazem

    aspell -c jmeno_souboru

    Program má podporu pro formáty email (?), HTML/SGML a TeX. Příkazy lze do interního seznamu přidávat, nebo je lze také odstraňovat (nevím ovšem, v jakém souboru je tento seznam uložen). Po spuštění se objeví jednoduché prostředí, které (stejně jako jiné věci) není nepodobné ispellu. Nevím, jestli je to zlomyslnost, nebo pokus o vylepšení, ale klávesy a a i, které v ispellu slouží pro akceptování výrazu (accept), resp. pro vložení výrazu do slovníku (insert), mají v Aspellu význam přesně opačný. Klávesou a přidáte (add) výraz do slovníku a klávesou i, I výraz ignorujete (teď/pořád). Praktická věc. Než se s Aspellem naučíte pracovat, zaneřádíte si osobní slovník překlepy a zkratkami. No a pokud oba slovníky střídáte, tak své dokumenty raději kontrolujte třetí osobou. ;-)

    Ovládání

    Pro uživatele nejdůležitější režim je ten interaktivní. Může v něm přímo rozhodovat o správnosti tvarů. Síla programu však spočívá např. i v tom, že ochotně zobrazí seznam slov ze slovníků. Příkazem

    ~/www/clanky/spell/2: aspell dump master czech | grep fenomenologie
    fenomenologie
    fenomenologiemi

    tedy zjistíme, že v cca 50 megabajtovém slovníku češtiny existuje také mnoho filozofických pojmů. Zajímal mě celkový počet výrazů ve slovníku češtiny. Zkusil jsem tedy

    ~: aspell dump master czech | nl

    a čekal mě výsledek 2551283 výrazů.

    Klávesa Význam Akce a její následky Nevýhoda
    0--n Oprav Zamění nalezený překlep tvarem ze slovníku, jehož číslo jste zadali. Žádná. Výraz je ihned zařazen do množiny správných tvarů.
    mezerník, i/I Ignore/ignore all Akceptuje výraz v tomto výskytu/během tohoto spuštění programu. Žádná. Při dalším spuštění se situace opakuje.
    r/R Replace/replace all Zamění výraz zde/v celém dokumentu. Žádná. Naopak, výraz je po změně okamžitě znovu kontrolován.
    a Add Přidá výraz do (českého) osobního slovníku .aspell.cs.pws Žádná. Výraz je ihned zařazen do množiny správných tvarů.
    l Add lower Přidá výraz do (českého) osobního slovníku .aspell.cs.pws ve formě malých písmen. Žádná. Výraz je ihned zařazen do množiny správných tvarů.
    b Abort Ukončí program bez uložení provedených změn. Žádná.
    x Exit Ukončí program a uloží provedené změny. Žádná.

    Kultivovaně

    Také Aspell lze spouštět z prostředí jednotlivých textových editorů, které přebírají režii celého procesu (nejčastěji zobrazují okno s tlačítky, kterými realizujete jednotlivé akce). Většina z nich nabízí výběr mezi oběma korekturními systémy, zvolte tedy Aspell a patřičný jazyk (nelze použít slovníky jednoho systému v systému druhém). Takto se korektor nastavuje v HTML editoru Quanta Plus.

    Quanta Plus

    Nevýhodou těchto integrovaných řešení je v to, že se často ochuzujete o možnost dopsat tvar "ručně". Závažnějším nedostatkem je skutečnost, že tyto editory často vytvoří z vašeho dokumentu dočasný soubor s nicneříkající příponou (např. .block), čímž se ztrácí vlastnost Aspellu rozeznat obsah souboru podle přípony. Tak tedy musíte "odklepávat" překlepy typu

    Je pravda, že tyto příkazy můžete přidat do slovníku přeskakovaných výrazů, ale je to řešení neelegantní.

    Závěrečné srovnání ispellu a Aspellu

    Nemohu se ubránit srovnání obou korekturních systémů. Berte prosím tyto informace jako subjektivní názor uživatele, který (kvůli tomuto článku ;-) ) používá oba programy.

    Vlastnost ispell Aspell
    Jednoduchost obsluhy Jednoduché ovládání z příkazové řádky, málo přepínačů a voleb. Složitější ovládání, mnoho přepínačů, tím tedy větší možnosti.
    Velikost českého slovníku Dostatečná (cca < 10 MB). Maximální (cca 50 MB).
    Podpora češtiny Výborná -- standardní. Výborná -- standardní.
    Aktualizace/správa českého slovníku Výborná, Petr Kolář Nejasná, manažer českého slovníku neznámý (existuje?).
    Možnosti interaktivního režimu Strohé, ale dostatečné. Často nabízí i několik desítek možných variant; inteligentní algoritmus je znatelný (dokáže rozdělit slovo na kořen, přípony, předpony). Strohé, dostatečné. Obvykle nabízí pouze slovníková hesla (lemmata).
    Integrace do grafických programů Obvykle bez problémů. Obvykle bez problémů, ale je nutné vybrat správný slovník z mnoha často nesrozumitelných názvů.
    Možnost integrace do vyvíjených programů Minimální, bez zvláštní podpory. Knihovna v programovacím jazyku C, podpora dalších vývojových prostředků.
    Celková využitelnost Praktický, jednoduchý, účelný. Budoucnost nejistá. Komplexní, použitelný nejen jako korektor překlepů. Progresivní.

    Zpočátku jsem korektor nepoužíval, potom jsem začal využívat ispell, protože výrazy, které nemá ve slovníku, zašlu správci českého slovníku (a že jich mám!). U Aspellu jsem na tuto možnost nezkoumal, protože správce celého systému vyzývá "všemi deseti" kohokoliv, aby Aspell převzal (což vlastně snižuje kredit celého projektu). Srovnám-li možnosti obou korektorů, přesvědčí mě asi velikost českého slovníku Aspellu a přikloním se k jeho používání. Je však možné, že výrazy ze slovníku Aspellu přejdou časem do slovníku ispellu. Podle mého názoru, který jsem získal po přečtení mnoha stránek věnovaných těmto programům, je nutné, aby se velice brzo chopil celého projektu tým lidí, kteří uvedou korektor (jediný) do aktuálního a pro všechny jazyky použitelného stavu. Ne že by současný stav nebyl funkční, ale je patrné, že vývoj programů stagnuje. Myslím, že by se mělo ve vývoji postupovat směrem k (polo)inteligentním lingvistickým analyzátorům jazyka. Otázkou zůstává, kdo takový náročný vývoj zaplatí. Vezměme si alespoň za své, že svými osobními slovníky můžeme rozšířit (jakýkoliv) český slovník, proto korektory používejte, získaná data bude možné určitě zúročit.

    Mimochodem. Používejte korektory, ale nespoléhejte na ně. Zopakujte si pravidla českého pravopisu a pište bez chyb. Čeština si to zaslouží! ;-)

           

    Hodnocení: 36 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    24.4.2003 08:13 svb
    Rozbalit Rozbalit vše Doplneni & opravy
    Vzhledem k tomu, ze se prave Aspellem zabyvam mam tri doplneni/opravy textu v clanku: 1, neni pravda, ze Aspell jen kontroluje preklepy. Je to totiz doopravdy "speller" a "bad spelling" v anglictine znamena nejen preklepy, ale i chybne zapsani slova (tedy chybny pravopis). Znamena to to, ze Aspell dokaze odhadnout jak zapsane slovo zni a vybrat korektni slovo, ktere zni stejne. V praxi to vypada tak, ze pokud napisete "gdybi", tak program na kontrolu preklepu by vam pravdepodobne nenabidl nic, ale Aspell odhadne, ze slovo "kdyby" se vyslovuje stejne a poradi vam ho. Tahle vlastnost je ale bohuzel pro cestinu k nicemu, jednak proto, ze pro cestinu nikdo nevytvoril soubor stejne znejicich skupin hlasek (napr. gd==kd, ...), ale hlavne proto, ze aglicke a ceske pojeti pravopisu se dost lisi - v cestine jsou bezne chyby i/y a podobne, kde se da odlisit jen podle kontextu a soundslike pristup by byl k nicemu, zatimco v aglictine (alespon podle toho, co pise Kevin Atkinson na strankach Aspellu) pise polovina lidi slova tak, jak je slysi, takze maji jen malou sanci, ze se strefi do pravopisne spravneho zapisu slova (protoze jak vsichni vime, v anglictine se vse pise naprosto nepravidelne a chaoticky). Tem pak Aspell muze pomoci. 2, autor pise "Nevím přesně, jak tabulce rozumět a v čem je algoritmus Aspellu lepší než třeba ten v ispellu." Takze odpoved: rozdil Aspellu a Ispellu je prave v tom (autorem Aspellu tolik propagovanem) soundslike pristupu, ktery v Ispellu chybi. Ispell je tedy opravdu jen kontrolorem preklepu. A jak tabulce rozumet? To je jednoduche - jsou to vysledky pro testovaci korpus slov. A kdo ze ho sestavoval? Podle vysledku vas asi neprekvapi, ze autor Aspellu. Je jasne, ze pokud tam dal prave slova ktera se stejne ctou ale zcela jinak pisi (a nepochybuji o tom, protoze to je prave jeho predstava o beznych pravopisnych chybach), musel Aspell zakonite dopadnout o mnoho lepe nez ostatni spellcheckery. V nasich podminkach (kde vetsina lidi zatim vi, ze kdyby se nepise gdybi) by podobne srovnani pravdepodobne Aspellu tak dobre vysledky neprineslo (ono by mozna stacilo to srovnat na nejakem oficialnim korpusu, treba i anglickem). 3, zminovana "podpora pro formaty" znamena vlastne filtry, ktere dokazou odfiltrovat napr. SGML tagy nebo URL, takze se nekontroluji a Aspell pak v nich nehlasi chyby. Filter email (u ktereho ma autor otaznik) filtruje jen emailove adresy (tzn. s "podporou formatu email" to ma pramalo spolecneho). Jinak doporucuji vzit v uvahu, ze Aspell je momentalne ve verzi 0.50.3 a jeho dokoncenost opravdu opdovida tomu, ze jeste neni ani prvni verze. Zdrojove kody obsahuji mnoho chyb, ja sam jsem uz byl nucen pri implementaci Aspellu nekolik opravit.
    24.4.2003 10:07 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
    Rozbalit Rozbalit vše Doplneni & opravy
    Diky za doplneni. Jsem rad, ze jsem tak nejak spravne pochopil tu tabulku, nebyl jsem si jen jisty tim, kdo a z ceho ji sestavil. Taky o te podpore vyslovnosti jsem vedel, jenom jsem nepochopil jeji prinos. Takze diky za vysvetleni, skoda, ze jsem tato fakta neznal pred napsanim clanku (asi moje chyba). Polepsim se. --vo
    Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress
    24.4.2003 10:54 Robert Krátký | skóre: 94 | blog: Robertův bloček
    Rozbalit Rozbalit vše Doplneni & opravy
    Je to trochu OT, ale neda mi to...

    Rikate, ze "v anglictine se vse pise naprosto nepravidelne a chaoticky".

    Chapu to spravne jako nadsazku, ze?

    24.4.2003 11:04 marx
    Rozbalit Rozbalit vše Doplneni & opravy
    Zapis zvukovej formy anglictiny do pisanej sa skutocne blizi obtiaznosti zapisu do egyptskych hieroglyfov. takze to az taka 'nadsazka' nebude :)
    24.4.2003 11:27 Robert Krátký | skóre: 94 | blog: Robertův bloček
    Rozbalit Rozbalit vše Doplneni & opravy
    dalsi nadsazka ;-) ("zapis do egyptskych hieroglyfu").

    ja jsem vsak zminoval "nepravidelnost a chaoticnost".

    24.4.2003 12:41 marx
    Rozbalit Rozbalit vše Doplneni & opravy
    a ty vidis v hieroglyfoch nejaku pravidelnost ? :)
    24.4.2003 12:45 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Doplneni & opravy
    [nadsázka] Pokud si myslíte, že vztah mezi zvukovou a psanou formou angličtiny není nepravidelný a chaotický, doporčuji tohle ;-) [/nadsázka]
    24.4.2003 14:15 Robert Krátký | skóre: 94 | blog: Robertův bloček
    Rozbalit Rozbalit vše Doplneni & opravy
    ukazovali nam tu rikanku ve skole. moc pekne :-). nicmene opravdove reseni se nachazi na temze webu. kdyz jsem to kdysi cetl poprve, moc jsem se nasmal.
    24.4.2003 11:01 marx
    Rozbalit Rozbalit vše dalsie opravy
    ad1) cesky narodny korpus sa nevytvara na Masarykovej univerzite v Brne (okrem ineho to vidno aj z URL :), na MU sa robia trosku ine zvacsa specializovanejsie a radovo mensie korpusy) ad2) pokial sa toho este prilis nezmenilo, tak hlavnym dovodom preco je slovnik v aspelli tak velky nie je jeho kvalita, ale to ze aspell nezvlada (na rozdiel od ispellu) robit kompresiu a tym padom ma ulozene kazde slovo zvlast. pamatam sa, ze bola snaha to tam dorobit, vtej dobe mal cesky slovnik ~60mb co ma aj doteraz, takze sa to nepohlo. ad3) existuje este program fispell, ktory dosahuje (pre cestinu) podobnych vysledkov ako aspell, lenze s pamatovymi narokmi podobnymi ispellu. momentalne nie je na webe :( ale nemal by byt az taky problem ho tam dat.
    24.4.2003 11:14 Tomáš
    Rozbalit Rozbalit vše Díky
    Díky za článek, zprovoznil jsem si aspell do mutta na školním serveru, na kterém není ispell (nejsem tam root). Ale zjistil jsem, že oproti ispellu je aspell brutálně pomalý. Zmáčknu klávesu a ono nic, po dvou sekundách se provede akce. Dokud nebudu mít počítač s přebytkem výkonu, tak u mě vyhrává ispell.
    24.4.2003 14:18 Wolf | skóre: 7
    Rozbalit Rozbalit vše aspell pres PHP
    Dobry den, chci pouzit aspell, ktery by se spoustel na linuxovem serveru, na kontrolu pravopisu na pracovnich stanicich (v prostredi IE6) s Windows. Aspell se spousti pomoci PHP skriptu a vysledek se vypise zpet na stranku. Stranka je v kodovani iso-8859-2, aspellu posilam kodovani iso8859-2. Problem je v kodovani - kdyz kontroluji napr. slovo "šek" tak aspell ignoruje prvni pismenko a kontroluje pouze posledni dve takze vyhodi chybu i ve slove, ktere je spravne... Nevite nekdo jak to vyresit? Budu vdecny za kazdou radu jak to vyresit, nebo odkazy. Diky Evzen Vlk
    24.4.2003 14:31 svb
    Rozbalit Rozbalit vše aspell pres PHP
    S kodovanim uz jsem mel problem taky. Jste si jisty, ze tomu posilate ISO8859-2? Pokud uzivatel vyplni neco ve formulari umistenem na strance v IE na Windows, je to v kodovani Win1250. Popisovany problem by tomu zcela odpovidal, protoze ISO8859-2 a Win1250 se lisi pouze znaky šžťľŠŽŤĽ. "š" tudiz Aspell povazuje za neznakovy element a slovo pro nej zacina az za nim.
    25.4.2003 21:58 Wolf | skóre: 7
    Rozbalit Rozbalit vše aspell pres PHP
    opravdu se to posilalo ve windows-1250, kdyz to po odeslani prekoduju do iso a pred vypisem do windows-1250 funguje to dobre diky za radu
    24.4.2003 14:26 svb
    Rozbalit Rozbalit vše Doplneni II
    Par reakci na veci, co zaznely v diskuzi: 1, Komprese slovniku je (pry) u Aspellu nerealizovatelna prave kvuli tem soundslike - zpracovani neprobiha jako jednoduche vyhledavani podobnych retezcu (napr podle Levenshteinovy vzdalenosti) ale sloziteji, coz (udajne) kompresi v pameti vylucuje. Komprese na disku je bezpredmetna. 2, Neplati, ze velikost slovniku = kvalita (zcela odhlednuto od komprese), protoze pokud ve slovniku bude "prilis mnoho" slov, zvysuje se pravdepodobnost, ze nejake bezne spatne zapsane slovo bude mylne povazovano za zcela nepouzivane slovo zapsane spravne (tohle taky nastava casteji v anglictine, protoze ma mensi slovni zasobu). 3, Rychlost Aspellu je velice slusna, radove minimalne stovky slov / sec (muzu zmerit presneji, jestli chcete), takze pokud vam to chodi pomalu, neni chyba na strane Aspellu ale na strane hostitelske aplikace. (Jedine dalsi vysvetleni je, ze to je tim Unixem - ja pouzivam Aspell jedine na Windowsech :-) /*koneckoncu ani nevim to je to ten Mutt*/ 4, Aspell se na Windows kompiluje velmi obtizne a je v tomto ohledu bohuzel napsan velice spatne (tzn. zavisle na platforme). OT, Tvrzeni, ze v anglictine se vse pise chaoticky a nepravidelne nadsazka nebyla (spise eufemismus), stejne jako tvrzeni, ze ma malou slovni zasobu. Zajemci o dalsi diskusi na toto OT tema necht si nejdriv prectou nejakou lingvistickou literaturu.
    24.4.2003 15:26 Robert Krátký | skóre: 94 | blog: Robertův bloček
    Rozbalit Rozbalit vše Doplneni II
    ad chaos a nepravidelnost: Nebyl bych neco podobneho zminoval, kdybych nejakou literaturu nactenou nemel...

    Vsechny vyjimky, ktere pravdepodobne zpusobuji nejvice potizi, lze etymologicky odvodit. I samotna (na prvni pohled matouci) vyslovnost anglictiny je zpusobena postupnymi zmenami pravopisu - zatimco vyslovnost zustavala vicemene stejna (zjednodusene receno).

    Zalezi tedy na tom, co si v tomto smyslu predstavujete pod slovem "nepravidelnost". Pokud je to mnozstvi vyjimek a zdanlivych nelogicnosti, pak proti tomu nelze nic namitat. Avsak rozhodne to nemuze byt vykladano jako "chaos" nebo "nahodilost".

    25.4.2003 07:40 svb
    Rozbalit Rozbalit vše Doplneni II
    Myslel jsem tim spise to, ze to neni diskuse, ktera by se hodila sem. Nicmene (jak jiste vite) prave ten vyvoj Anglictiny, ktery zminujete, probihal naprosto zivelne (coz souvisi s hospodarskymi pomery v Anglii a prilehlych oblastech od odchodu Rimanu az do ted) a hovorovy jazyk se stava(l) normou. Proto je Anglictina natolik nepravidelna a chaoticka.
    27.4.2003 15:01 kokot
    Rozbalit Rozbalit vše Doplneni II
    No co na to rict?:-) Anglictina je jazyk ve kterem se jiz pred dlouhymi staletimi odelila psana stranka veci a mluvena. Proto ten rozdil. Rodilemu cechovi asi muze prijit, ze je anglictina chaoticka, ale to je proto, ze cesti jazykovedci upenlive dbaji na stejne psani i cteni slov. V ostatnich jazycich to tak uplne neni. Extremem je francouzstina ktera nejen ze se jinak pise a cte podobne jako u anglictiny ale ma i slozita pravopisna pravdila. Takze pokud znate nekdo anglicky a francouzsky tak pochopite, ze anglictina velmi presne odpovida mluvena stranka jazyka psane i kdyz pro cecha to muze byt problem pochopit. A jeste neco, jak tu jiz bylo zminovano. Francouzstina a anglictina maji spolecny zaklad a v davne historii se jazyky odelili. Muzeme byt radi ze pocitacovemu svetu vladne jednoducha anglictina:-)
    24.4.2003 15:47 marx
    Rozbalit Rozbalit vše Doplneni II
    ad) velkost slovniku je to presne tak ako pises, pre ostatnych len ako porovnanie. ajka (*): 5.678.117 slov aspell 0.50-2: 1.201.844 slov (*) ajka nie je (a nebude volne dostupna) cisla su mierne skreslene tym, ze obsahuju aj priezviska z ceskych telefonnych zoznamov. co sa tyka pouzitych slov, tak pri elektronickych zdrojoch v cestine (niekolko GB textu) mame 1.201.844 roznych slov, pricom tych ktore boli pouzite viac nez raz je 'len' 640,966. ad) rychlost v tomto nemozem suhlasit. Aj ked nie je rozumne porovnavat ispell s aspellom pretoze ispel hlada len to vzdialenosti 1 a aspell do vzdialenosti 2 od fonetickeho tvaru slova. ale aj tak (rozdelenie aby sa porovnavalo porovnatelne) program priemer na najdenie nahrady ispell 0.056 fispell -e1 0.034 ----- fispell -e2 0.464 aspell 1.631
    25.4.2003 07:45 svb
    Rozbalit Rozbalit vše Doplneni II
    S rychlosi mate asi pravdu, neuvedomil jsem si, ze jsem u Aspellu povypinal vsechny veci u soundslike co sly, protoze se me to zdalo pro Cestinu zbytecne.
    Kazdopadne ale pokud trva reakce na klavesu 2 sekundy, nebude chyba na strane Aspellu, ale te aplikace co ho vyuziva.
    25.4.2003 08:03 marx
    Rozbalit Rozbalit vše Doplneni II
    To su nie 2 sekundy na klavesu, ale na najdenie alternativ zleho slova. Co znamena, ze ak je tam tych dobrych slov 50, tak to cele moze trvat 2.5s a menej :) aspell je hrozne zavisly od mnozstva pamati a ten vysledok je scasti taky hrozny aj tym, ze na testy bolo pouzite co najmenej vykonne zelezo (ak sa pamatam tak P233, 128MB). Ono robit taketo testy na 'novych' pocitach ma velmi malu vypovednu hodnotu. Vidim to tak, ze sa pridam k tomuto threadu clanok a napisem cosi aj o tej teorii.
    25.4.2003 16:33 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Doplneni II
    Mně aspell akorát žere pamět. Mám pocit, že kdysi dávno to nedělal, ale v RH 8.0 mi to dělal určitě, v RH 9 to dělá taky (aspell-0.33.7.1). Když myslím jen žere pamět, tak fakt prostě jen žere pamět -- když to přeleze 700MB, tak ho vždycky zabiju, protože mám jen 512MB (ještě že mám ten velký swap ;-) ), ale nevěřím, že kdybych ho nechal pokračovat, že s tím někdy přestal. Nesetkal se s tím někdo? Dělám něco špatně?
    30.4.2003 16:17 Permon
    Rozbalit Rozbalit vše Doplneni II
    Setkali. RH 8.0 Zjevne ma nejaky problem prave s tim filtrovanim tagu. Mam pocit, ze to delalo temer u libovolneho html. Pote co se mu rekol, ze to nema brat jako html, ale jako plaintext, tak to zvladl bez pozirani pameti. Nicmene jsem nemel silu zdroj hledat.
    24.4.2003 18:22 Petr
    Rozbalit Rozbalit vše chyby v ceskem slovniku
    posledni (nevim jestli uplne) verze ceskeho slovniku pro aspell (aspell-cs 0.2-3) obsahuje "zapomnetlivy" i "zapometlivy" (vcetne vsech odvozenych tvaru). Pritom spravne je "..mne..". Starsi verze aspell-cs 0.1 to ma dobre. Da se tem slovnikum vubec verit, nebo budou casem pro kazde slovo obsahovat vsechny varianty, v nichz se nejcasteji chybuje? Komu se daji tyto chyby hlasit?
    21.7.2003 23:28 bbb
    Rozbalit Rozbalit vše chyby v ceskem slovniku
    Kdyz je mozne pridavat si svoje "nova" slova do lokalniho slovniku, melo by byt pro takovehle pripady (pritomnost chybnych slov ve slovniku) mozne naopak vyhazovat slova za slovniku velkeho. Pujde to nekdy? Pokud by byla realizace obtizna, mohlo by aspon jit vytvaret jeste jeden lokalni slovnik slov, ktera se najit _nemaji_, a ten pouzit k filtraci vysledku. To by umoznilo lidem s jistou mirou vkusu vyradit si ze slovniku slova, ktera se asi v "modernejsich" versich budou objevovat.
    25.4.2003 19:05 unchallenger | skóre: 69 | blog: unchallenger
    Rozbalit Rozbalit vše Unicode?
    Jak spellcheckujete UTF-8 soubory? Ať už ispellem nebo aspellem? Píšu si na to wrapper, který vychází z toho, že co není representovatelné v ISO-8859-2, nemá cenu spellcheckovat na češtinu, takže se to transparentně zachová -- ale pokud už někdo má něco v tom smyslu hotového...

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.