abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 21:55 | Nová verze

    MicroPython (Wikipedie), tj. implementace Pythonu 3 optimalizovaná pro jednočipové počítače, byl vydán ve verzi 1.28.0. Z novinek lze vypíchnout novou třídu machine.CAN.

    Ladislav Hagara | Komentářů: 0
    včera 10:22 | Komunita

    Michael Meeks, CEO společnosti Collabora, na apríla oznámil, nebyl to ale apríl, že nadace The Document Foundation zastřešující vývoj kancelářského balíku LibreOffice vyloučila ze svých řad všechny zaměstnance a partnery společnosti Collabora, tj. více než třicet lidí, kteří po mnoho let přispívali do LibreOffice. Nadace The Document Foundation po několika dnech publikovala oficiální vyjádření. Přiznává pochybení při zakládání

    … více »
    Ladislav Hagara | Komentářů: 5
    6.4. 05:33 | Pozvánky

    Protože je už po aprílu, můžou strahováci opět zveřejnit program další Virtuální Bastlírny, aniž by připravená témata působila dojmem, že jde o žert. Vězte tedy, že v úterý 14. dubna (změna!!!) od 20:00 proběhne VB, kde se setkají bastlíři, technici, učitelé i nadšenci do techniky a kde i vy se můžete zapojit do družného hovoru, jako by všichni seděli u pomyslného piva. Co mají bastlíři tento měsíc na srdci? Pravděpodobně by nás musel zasáhnout

    … více »
    bkralik | Komentářů: 3
    5.4. 23:33 | Nová verze

    Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.

    Ladislav Hagara | Komentářů: 1
    5.4. 23:00 | Zajímavý projekt

    VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.

    NUKE GAZA! 🎆 | Komentářů: 8
    5.4. 05:22 | Zajímavý software

    Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.

    Ladislav Hagara | Komentářů: 17
    5.4. 04:11 | Zajímavý software

    Příspěvek na blogu herního enginu Godot představuje aplikaci Xogot přinášející Godot na iPad a iPhone. Instalovat lze z App Storu. Za Xogotem stojí Miguel de Icaza (GitHub) a společnost Xibbon.

    Ladislav Hagara | Komentářů: 1
    4.4. 04:22 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za březen (YouTube).

    Ladislav Hagara | Komentářů: 21
    3.4. 16:44 | Nová verze

    ESP-IDF (Espressif IoT Development Framework), tj. oficiální vývojový framework pro vývoj aplikací na mikrokontrolérech řady ESP32, byl vydán v nové verzi 6.0. Detaily na portálu pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    3.4. 12:33 | Nová verze

    DeepMind (Alphabet) představila novou verzi svého multimodálního modelu, Gemma 4. Modely jsou volně k dispozici (Ollama, Hugging Face a další) ve velikostech 5-31 miliard parametrů, s kontextovým oknem 128k až 256k a v dense i MoE variantách. Modely zvládají text, obrázky a u menších verzí i audio. Modely jsou optimalizované pro běh na desktopových GPU i mobilních zařízeních, váhy všech těchto modelů jsou uvolněny pod licencí Apache 2.0. Návod na spuštění je už i na Unsloth.

    NUKE GAZA! 🎆 | Komentářů: 13
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (7%)
     (1%)
     (12%)
     (30%)
     (3%)
     (6%)
     (1%)
     (14%)
     (23%)
    Celkem 1236 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: Rozpoznávání řeči – CMUSphinx

    25.5.2020 09:41 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozpoznávání řeči – CMUSphinx
    Přečteno: 720×
    Najde se mezi vámi někdo, kdo má alespoň nějakou zkušenost se software pro rozpoznávání řeči CMUSphinx?

    Odpovědi

    27.5.2020 09:53 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    Jak se zdá, nezbývá než odpovědět sám sobě.

    Na téma rozpoznávání řeči a převodu na text u nás vzniklo několik diplomových prací – 2015. Od té doby v tomto směru chcípl pes. Zřejmě si všichni chrochtají nad tím, jaký je ten google pašák a je jim u zadku, že přes něj honí veškerá svá data. Ale k věci.

    Z těch prací se mi jeví jako užitečná a použitelná diplomová práce Lukáše Kryške, která se zaobírá i vytvořením aktustického modelu pro češtinu. Bakalářská práce Kláry Kufové češtinu vůbec neřeší.

    Nicméně závěr, který potvrzuje i diplomová práce Aleše Bricha z r. 2016 je ten, že úspěšnost rozpoznávání u češtiny je pod 50%. Otázkou je, za jak dlouho bude tahle mizerná úspěšnost lepší než nic, protože hledání sekretářky, která by nabušila text audinahrávky do počítače za nějaký rozumný obolus připomíná hledání pověstné jehly v kupce sena.

    Jen pro úplnost přidávám ještě link na diplomovou práci Ondřeje Plátka, která se zaobírá rozpoznáváním řeči přes Kaldi z r.2013. Ovšem ta je pouze v angličtině a o češtině se v ní vůbec nemluví.
    jose17 avatar 27.5.2020 22:15 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    tak mozno za par rokov nieco vypadne z https://voice.mozilla.org/cs
    Ja vim, on vi, ty nano!
    1.6.2020 21:00 TechnikTom
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    A nešlo by za stávajícího stavu, kdy podpora češtiny není ideální, pouze lokálně sledovat audio na výskyt specifického slova označujícího začátek dotazu - to by mohl zvládnout třeba TensorFlow taky od Google ( ale jistě i řada dalších projektů ) a až pak poslat do cloudu audio k rozpoznání a hned se zas přepojit do lokálního sledování audia. Tím by se vyloučilo neustálé odesílání důvěrných dat.
    2.6.2020 10:52 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    Myslel jsem, že jsem zmínil dostatečně jasně, že nechci honit data přes nějaký cloud u něhož nemám sebemenší záruku, že ten audiozáznam někdo nezneužije - třebas jenom tím, že si ho někam uloží a časem někomu prodá.
    1.6.2020 22:59 Tibor
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    I ja bych byl moc rad za offline cestinu, treba nekoho vyburcujeme a poradne do toho slapne :-)
    2.6.2020 15:07 PetebLazar | skóre: 35 | blog: l_eonardovo_odhodlani
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    Pokud jde toto, tak musí jít asi cokoli.
    Pavel 'TIGER' Růžička avatar 1.6.2020 23:32 Pavel 'TIGER' Růžička | skóre: 54
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    Jestli se nepletu, tak již v dobách W2000 existoval perfektní offline slovník, a offline ovládání PC v češtině. Vešlo se to na jedno CD. Jenže pak byl velký boom nakupování, či prodej, nebo likvidace firem. Bohužel se to dotklo i mnou zmiňované firmy. Bohužel název už si nepamatuji. Ano, byl to komerční projekt, který nebyl nejlevnější a to byl asi celý kámen úrazu. Lidé nechtějí za software platit, pokud nemusí, avšak též se nechtějí učit novým věcem. A to je přesně důvod, proč je Linux na desktopu tam, kde je. Sice je zdarma, ale musí se vynaložit alespoň minimální snaha k plnému nasazení a to lidé odmítají. Stačí se podívat na programové vybavení, které ve windows používají a které je dávno překonané i pod těmi windows. Chyba není v systémech, ale jako vždycky v lidech. My ostatní na tom můžeme jenom vydělat.
    2.6.2020 12:53 OldFrog {Ondra Nemecek} | skóre: 36 | blog: Žabákův notes | Praha
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    Pro offline ovládání stačí rozpoznat předtím registrované povely (vyhodnocuje se shoda), což je jednodušší úloha než např. přepsat řeč do textu. Takže není rozpoznávání jako rozpoznávání.
    -- OldFrog
    Pavel 'TIGER' Růžička avatar 2.6.2020 22:07 Pavel 'TIGER' Růžička | skóre: 54
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    Přepisování řeči do textu je záležitostí posledních let, to je fakt. Tehdy to umělo jen dobře číst texty. Nevím nakolik je náročný převod hlasu do textu (rozuměj hardwerově), třeba by to z výkonnostního hlediska před těmi dvaceti lety nebylo ani možné.
    2.6.2020 22:33 PetebLazar | skóre: 35 | blog: l_eonardovo_odhodlani
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    Pokud se člověk podívá na výsledky automatických titulků na YouTube, je jasné že minimálně v rámci off-line zpracování je to zvládnuté jak kvalitativně tak objemově. Čeština by proti angličtině snad měla mít ještě výhodu, jelikož jak se čte tak se píše (až na y/i což se snad dá dohnat pravidly).

    Například: https://www.youtube.com/watch?v=RdXXyn0jYQU Zvolit titulky "Angličtina (vytvořeno automaticky)".
    |🇵🇸 avatar 3.6.2020 00:07 |🇵🇸 | skóre: 94 | blog:
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    „oběti“, nebo „objeti“?
    🇵🇸Touch grass🇺🇦 ✊ ani boha, ani pána
    3.6.2020 10:10 jiwopene | skóre: 31 | blog: Od každého trochu…
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    S přízvukem nebo u některých slov to trochu zlobí – např. „cereal port“ (má být „serial“).
    .sig virus 3.2_cz: Prosím, okopírujte tento text do vaší patičky.
    3.6.2020 19:36 PetebLazar | skóre: 35 | blog: l_eonardovo_odhodlani
    Rozbalit Rozbalit vše Re: Rozpoznávání řeči – CMUSphinx
    Nejhůře dopadla asi "šlehačka" jako "slight Hachiko". ;-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.