MicroPython (Wikipedie), tj. implementace Pythonu 3 optimalizovaná pro jednočipové počítače, byl vydán ve verzi 1.28.0. Z novinek lze vypíchnout novou třídu machine.CAN.
Michael Meeks, CEO společnosti Collabora, na apríla oznámil, nebyl to ale apríl, že nadace The Document Foundation zastřešující vývoj kancelářského balíku LibreOffice vyloučila ze svých řad všechny zaměstnance a partnery společnosti Collabora, tj. více než třicet lidí, kteří po mnoho let přispívali do LibreOffice. Nadace The Document Foundation po několika dnech publikovala oficiální vyjádření. Přiznává pochybení při zakládání
… více »Protože je už po aprílu, můžou strahováci opět zveřejnit program další Virtuální Bastlírny, aniž by připravená témata působila dojmem, že jde o žert. Vězte tedy, že v úterý 14. dubna (změna!!!) od 20:00 proběhne VB, kde se setkají bastlíři, technici, učitelé i nadšenci do techniky a kde i vy se můžete zapojit do družného hovoru, jako by všichni seděli u pomyslného piva. Co mají bastlíři tento měsíc na srdci? Pravděpodobně by nás musel zasáhnout
… více »Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.
VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.
Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.
Příspěvek na blogu herního enginu Godot představuje aplikaci Xogot přinášející Godot na iPad a iPhone. Instalovat lze z App Storu. Za Xogotem stojí Miguel de Icaza (GitHub) a společnost Xibbon.
Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za březen (YouTube).
ESP-IDF (Espressif IoT Development Framework), tj. oficiální vývojový framework pro vývoj aplikací na mikrokontrolérech řady ESP32, byl vydán v nové verzi 6.0. Detaily na portálu pro vývojáře.
DeepMind (Alphabet) představila novou verzi svého multimodálního modelu, Gemma 4. Modely jsou volně k dispozici (Ollama, Hugging Face a další) ve velikostech 5-31 miliard parametrů, s kontextovým oknem 128k až 256k a v dense i MoE variantách. Modely zvládají text, obrázky a u menších verzí i audio. Modely jsou optimalizované pro běh na desktopových GPU i mobilních zařízeních, váhy všech těchto modelů jsou uvolněny pod licencí Apache 2.0. Návod na spuštění je už i na Unsloth.
James McClain zveřejnil na serveru GitHub zdrojové kódy aplikace pro rozpoznávání řeči a hlasové ovládání linuxového desktopu. Aplikace Ubuntu Speech Recognition (autor ji plánuje přejmenovat) využívá k převodu hlasu na text Web Speech API a služby Google. Videoukázka na YouTube.
Tiskni
Sdílej:
využívá k převodu hlasu na text Web Speech API a služby GoogleTo znamená, že vše co řeknu, se bude posílat na servery Googlu a zpátky přijde rozpoznaný text?
To znamená, že vše co řeknu, se bude posílat na servery Googlu a zpátky přijde rozpoznaný text?Nie
.
Ale možná že by to šlo udělat oblikou, třeba přes zapískání - zatímco analýza řeči je velmi složitá a náročná, tak detekování zapískání je relativně jednoduché, a to jak hardwarově (pamatujete na pípací klíčenky, co reagovaly na písknutí?), tak softwarově (viz Goertzelův algoritmus, kterému narozdíl od FFT stačí jen násobení a sčítání). Teprve pak by se spustila analýza/odeslání dat na vzdálený server.
Dalsi otazka, ale je jak je to s licensi, obavam se ze to asi nebude FOSS?Je to komerční program a ne zrovna levný.
BTW fakulta mechatroniky?, nevim zda se tak jeste stale jmenujeMechatroniky, informatiky a mezioborových studií :D Ale nedodělal jsem to.
Je to komerční program a ne zrovna levný.A jak velkou část vývoje zaplatili daňoví poplatníci?
A jak velkou část vývoje zaplatili daňoví poplatníci?Jak to mám vědět, jsem snad pokladní? Osobně si myslím, že žádnou. Co se univerzity týče, na přednáškách nám kdosi říkal, že od státu nedostává ani půlku toho, co by měl stát dodat, zbytek si nějak vydělává sama. Zrovna tento program byl vytvořen ve spolupráci s komerční firmou, která má teď jediné právo na prodej. Pokud tě zajímají detaily, prostě jim napiš, jsou to docela komunikativní lidé a imho odpoví.
Je zajímavé sledovat, jak to s tím rozpoznáváním řeči nejde a nejde.Nejde? Ono je to s rozpoznáváním řeči podobné jako s Linuxovým desktopem. Taky to jde, jenom to má spoustu ale. To, co je dneska docela zvládnuté jsou "drobnosti" jako rozpoznání jazyka, nebo převod telefoního hovoru na text a vyhledávání v něm. Což není tak podivné, když vezmeme v potaz, že tohle je oblast výzkumu, kterou financuje, mimo jiné, americká DARPA.