Portál AbcLinuxu, 24. prosince 2025 11:31
využívá k převodu hlasu na text Web Speech API a služby GoogleTo znamená, že vše co řeknu, se bude posílat na servery Googlu a zpátky přijde rozpoznaný text?
To znamená, že vše co řeknu, se bude posílat na servery Googlu a zpátky přijde rozpoznaný text?Nie
.
Ale možná že by to šlo udělat oblikou, třeba přes zapískání - zatímco analýza řeči je velmi složitá a náročná, tak detekování zapískání je relativně jednoduché, a to jak hardwarově (pamatujete na pípací klíčenky, co reagovaly na písknutí?), tak softwarově (viz Goertzelův algoritmus, kterému narozdíl od FFT stačí jen násobení a sčítání). Teprve pak by se spustila analýza/odeslání dat na vzdálený server.
Dalsi otazka, ale je jak je to s licensi, obavam se ze to asi nebude FOSS?Je to komerční program a ne zrovna levný.
BTW fakulta mechatroniky?, nevim zda se tak jeste stale jmenujeMechatroniky, informatiky a mezioborových studií :D Ale nedodělal jsem to.
Je to komerční program a ne zrovna levný.A jak velkou část vývoje zaplatili daňoví poplatníci?
A jak velkou část vývoje zaplatili daňoví poplatníci?Jak to mám vědět, jsem snad pokladní? Osobně si myslím, že žádnou. Co se univerzity týče, na přednáškách nám kdosi říkal, že od státu nedostává ani půlku toho, co by měl stát dodat, zbytek si nějak vydělává sama. Zrovna tento program byl vytvořen ve spolupráci s komerční firmou, která má teď jediné právo na prodej. Pokud tě zajímají detaily, prostě jim napiš, jsou to docela komunikativní lidé a imho odpoví.
Je zajímavé sledovat, jak to s tím rozpoznáváním řeči nejde a nejde.Nejde? Ono je to s rozpoznáváním řeči podobné jako s Linuxovým desktopem. Taky to jde, jenom to má spoustu ale. To, co je dneska docela zvládnuté jsou "drobnosti" jako rozpoznání jazyka, nebo převod telefoního hovoru na text a vyhledávání v něm. Což není tak podivné, když vezmeme v potaz, že tohle je oblast výzkumu, kterou financuje, mimo jiné, americká DARPA.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.