abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 05:33 | Pozvánky

    Protože je už po aprílu, můžou strahováci opět zveřejnit program další Virtuální Bastlírny, aniž by připravená témata působila dojmem, že jde o žert. Vězte tedy, že již v úterý 7. dubna od 20:00 proběhne VB, kde se setkají bastlíři, technici, učitelé i nadšenci do techniky a kde i vy se můžete zapojit do družného hovoru, jako by všichni seděli u pomyslného piva. Co mají bastlíři tento měsíc na srdci? Pravděpodobně by nás musel zasáhnout meteorit

    … více »
    bkralik | Komentářů: 0
    včera 23:33 | Nová verze

    Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.

    Ladislav Hagara | Komentářů: 1
    včera 23:00 | Zajímavý projekt

    VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.

    NUKE GAZA! 🎆 | Komentářů: 6
    včera 05:22 | Zajímavý software

    Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.

    Ladislav Hagara | Komentářů: 12
    včera 04:11 | Zajímavý software

    Příspěvek na blogu herního enginu Godot představuje aplikaci Xogot přinášející Godot na iPad a iPhone. Instalovat lze z App Storu. Za Xogotem stojí Miguel de Icaza (GitHub) a společnost Xibbon.

    Ladislav Hagara | Komentářů: 1
    4.4. 04:22 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za březen (YouTube).

    Ladislav Hagara | Komentářů: 14
    3.4. 16:44 | Nová verze

    ESP-IDF (Espressif IoT Development Framework), tj. oficiální vývojový framework pro vývoj aplikací na mikrokontrolérech řady ESP32, byl vydán v nové verzi 6.0. Detaily na portálu pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    3.4. 12:33 | Nová verze

    DeepMind (Alphabet) představila novou verzi svého multimodálního modelu, Gemma 4. Modely jsou volně k dispozici (Ollama, Hugging Face a další) ve velikostech 5-31 miliard parametrů, s kontextovým oknem 128k až 256k a v dense i MoE variantách. Modely zvládají text, obrázky a u menších verzí i audio. Modely jsou optimalizované pro běh na desktopových GPU i mobilních zařízeních, váhy všech těchto modelů jsou uvolněny pod licencí Apache 2.0. Návod na spuštění je už i na Unsloth.

    NUKE GAZA! 🎆 | Komentářů: 12
    3.4. 03:55 | Nová verze

    Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 3. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).

    Ladislav Hagara | Komentářů: 0
    2.4. 19:55 | Zajímavý projekt

    Průkopnická firma FingerWorks kolem roku 2000 vyvinula vícedotykové trackpady s gesty a klávesnice jako TouchStream LP. V roce 2005 ji koupil Apple, výrobu těchto produktů ukončil a dotykové technologie využil při vývoji iPhone. Multiplatformní projekt Apple Magic TouchstreamLP nyní implementuje funkcionalitu TouchStream LP na současném Apple Magic Trackpad, resp. jejich dvojici. Diskuze k vydání probíhá na Redditu.

    |🇵🇸 | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (7%)
     (1%)
     (12%)
     (30%)
     (3%)
     (6%)
     (1%)
     (14%)
     (23%)
    Celkem 1224 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník

    Dotaz: Program na převod řeči na text

    Bilbo avatar 1.6.2017 10:10 Bilbo | skóre: 29
    Program na převod řeči na text
    Přečteno: 3282×
    Sháním aktuálně program pro převod řeči na text.

    Nahromadilo se mi větší množství audio a video záznamů (velká část jsou záznamy z různých přednášek, ale nejen to) a sháním software, který by k danému audiu (resp. zvukové stopě vyextrahované z audia) automaticky doplnil transkript (a v něm bych pak mohl např. vyhledávat, apod.).

    Potřeboval bych něco co by fungovalo aniž bych to musel sám učit (pokud bych to musel před použitím na nějakých datech dlouho trénovat, nebo si sestavovat slovník, tak to pro mne použitelné nebude ... ledaže by to byl unsupervised learning, který by se natrénoval sám bez mého zasahování :).

    Jazykem je z menší části čeština, z větší části angličtina.

    Ideálně něco opensource běžící pod Linuxem, ale není to zase podmínka. :)

    Část ze záznamů je "public", takže by (pro část) šlo v nejhorším použít např. i nějakou cloudovou službu kdy se audio nahrává pro zpracování někam "buhvíkam".

    Nevíte někdo o něčem použitelném?
    Big brother is not watching you anymore. Big Brother is telling you how to live...

    Odpovědi

    1.6.2017 10:42 NN
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    Zacal bych treba zde List_of_speech_recognition_software.
    Jendа avatar 1.6.2017 16:52 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    https://github.com/UFAL-DSG/alex-asr

    Pro záznamy v dobré kvalitě by to snad mohlo nějak chodit. Já to zkoušel na záznamy se šumem a bordelem okolo a generovalo to surrealistickou poezii.

    Kdybys přišel na něco použitelného, dej vědět. Dokonce nepotřebuju celý transcript, ale chtěl bych nad ~10000 hodinama nahrávek udělat fulltext.
    2.6.2017 11:56 David Indra | skóre: 15 | Prostějov
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    Ten fulltext zní zajímavě, o co přesně jde? Nějaké záznamy přednášek? :)
    Jendа avatar 2.6.2017 17:04 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    Odposlechy… :-) Proto to má taky špatnou kvalitu.
    Jendа avatar 2.6.2017 17:12 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    Nechce se mi věřit, že někdo, kdo má třeba hovory z callcentra, neřeší stejný problém.
    3.6.2017 07:03 Honza
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    Řeší. A pěkně za to zaplatí.
    3.6.2017 08:39 lertimir | skóre: 64 | blog: Par_slov
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    Řeší to komerčně, například soudy dost často používájí Newton.
    Bilbo avatar 2.6.2017 19:17 Bilbo | skóre: 29
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    Koukám má to celkem dost parametrů, zkusím si s tím pohrát a pokud vyleze něco použitelného, dám vědět :)
    Big brother is not watching you anymore. Big Brother is telling you how to live...
    9.6.2017 17:44 Gregi
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    A pouzi kodek "CODEC2", ktory ma fenomenalnu kompresiu na rec (2500bit/s). :) http://www.rowetel.com/?page_id=452
    Jendа avatar 9.6.2017 20:56 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Program na převod řeči na text
    1. speex
    2. jak to souvisí s rozpoznáváním řeči?

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.