Protože je už po aprílu, můžou strahováci opět zveřejnit program další Virtuální Bastlírny, aniž by připravená témata působila dojmem, že jde o žert. Vězte tedy, že již v úterý 7. dubna od 20:00 proběhne VB, kde se setkají bastlíři, technici, učitelé i nadšenci do techniky a kde i vy se můžete zapojit do družného hovoru, jako by všichni seděli u pomyslného piva. Co mají bastlíři tento měsíc na srdci? Pravděpodobně by nás musel zasáhnout meteorit
… více »Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.
VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.
Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.
Příspěvek na blogu herního enginu Godot představuje aplikaci Xogot přinášející Godot na iPad a iPhone. Instalovat lze z App Storu. Za Xogotem stojí Miguel de Icaza (GitHub) a společnost Xibbon.
Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za březen (YouTube).
ESP-IDF (Espressif IoT Development Framework), tj. oficiální vývojový framework pro vývoj aplikací na mikrokontrolérech řady ESP32, byl vydán v nové verzi 6.0. Detaily na portálu pro vývojáře.
DeepMind (Alphabet) představila novou verzi svého multimodálního modelu, Gemma 4. Modely jsou volně k dispozici (Ollama, Hugging Face a další) ve velikostech 5-31 miliard parametrů, s kontextovým oknem 128k až 256k a v dense i MoE variantách. Modely zvládají text, obrázky a u menších verzí i audio. Modely jsou optimalizované pro běh na desktopových GPU i mobilních zařízeních, váhy všech těchto modelů jsou uvolněny pod licencí Apache 2.0. Návod na spuštění je už i na Unsloth.
Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 3. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).
Průkopnická firma FingerWorks kolem roku 2000 vyvinula vícedotykové trackpady s gesty a klávesnice jako TouchStream LP. V roce 2005 ji koupil Apple, výrobu těchto produktů ukončil a dotykové technologie využil při vývoji iPhone. Multiplatformní projekt Apple Magic TouchstreamLP nyní implementuje funkcionalitu TouchStream LP na současném Apple Magic Trackpad, resp. jejich dvojici. Diskuze k vydání probíhá na Redditu.
Univerzita RMIT v Melbourne představila (YouTube) font Sans Forgetica. Čtenář by si měl texty napsané v tomto fontu lépe zapamatovat.
Tiskni
Sdílej:
Tak schválně sám na sobě udělej pokus - převeď si několik A4 neznámého textu do tohoto fontu a zkus si ten text přečíst. Podle mě budeš mít na konci první A4 tak uvařenou hlavu, že na druhou už nebudeš mít ani chuť, natož aby jsi si pamatoval obsah.zkusil sem, vzal sem clanek z root.cz o XML v Pythonu, pro me oboje nezname, nastavil tento font, precetl 1x A4 bez zadrhnuti, pomerne rychle, tedy nelze prelitnout radek, ale musi se jit po slovech, hlavu uvarenou nemam
Nestačilo by to psát ve švabachu? Na co vymýšlet nový font? :-)
Problém těsnopisu je, že typicky zaznamenává fonetiku, potažmo celé fráze, a tak si nejsem jistý adaptací na odbornou terminologiiJo, to mě taky napadlo. Mám o tom ale jen základní představu, takže si vůbec netroufám odhadovat, jak by to šlo pro převážně odborné texty upravit nebo uzpůsobit. Když se na to podívám obecněji ne z hlediska přímo těsnopisu, ale obecně komprese, tak unikátní názvy se prostě komprimují dost blbě. Největší prostor pro zefektivnění by byl, pokud se budeme bavit o tom lékařství, u často se vyskytujících frází typu pacient přichází s obtížemi. Ale spíš než instalovat do ordinací stenotypy (ať už hardwarové nebo softwarové) by mi přišlo rozumnější naučit doktory psát ± všemi deseti. Tráví psaním lékařských zpráv nezanedbatelné množství času a u málokoho z nich vidím byť jen správně položené ruce na klávesnici (většinou datlují). Odhadoval bych, že jen tímhle by se dala propustnost zvýšit třeba o 10 %.
Aby to ale nebylo jako automatické doplňování/opravy na mobilech. Pokud by se doktor přehlédl, tak by to mohlo mít i dost tragické následky. Ona ta redundance v přirozeném jazyce má i svoje přínosy.
Co se týče rozpoznávání řeči -- obávám se, že dneska by to většina firem implementovala tak, že by se zvuk posílal někam do cloudu a tam se analyzoval -- takže by diktované lékařské zprávy byly dostupné kde komu. To už je pomalu, jako když doktor sdílí rentgeny pacientů jako veřejné soubory na ulož.to.
Něco mi říká, že ses absolutně neobtěžoval před odesláním komentáře nabýt nějakou představu o tom, jak to v praxi funguje. Smutné.
Aby to ale nebylo jako automatické doplňování/opravy na mobilech. Pokud by se doktor přehlédl, tak by to mohlo mít i dost tragické následky. Ona ta redundance v přirozeném jazyce má i svoje přínosy.
Vstupní metody typu T9 nebo algoritmy pro automatické opravy řeší nejednoznačnost (ambiguity) na základě predikce pomocí buď fixního slovníku a vizuální kontroly pisatele (to ostatně platí např. také pro vstupní metody orientálních písem, nebo stochastických metod.
Expanze textu je založená právě na slovníku a rutinně se používá zvláště při zápisu či tvorbě např. právních dokumentů.
Ostatně, běžný expanzní software jako PhraseExpress, potažmo jeho linuxový klon AutoKey, si můžeš rovnou vyzkoušet.
Že v tom někdo může udělat chybu? Ano, může. Stejně jako může myšlenkami zabloudit někam jinam a začít psát něco jiného.
Co se týče rozpoznávání řeči -- obávám se, že dneska by to většina firem implementovala tak, že by se zvuk posílal někam do cloudu a tam se analyzoval -- takže by diktované lékařské zprávy byly dostupné kde komu.
Žhavinka: rozpoznávání řeči se (a) v nemocnicích (aspoň v technicky vyspělejších končinách) rutinně používá, byť třeba ne při interakci přímo s pacientem, ale (b) expertní systémy pro diagnostiku (populární příklad: IBM Watson) už tu s námi také chvíli jsou… překvapivě i ony pracují s analýzou velkých objemů dat.
Automatickým opravám bych tady nevěřil, ale s tou expanzí textu máš pravdu. Je to, jako když napíši psvmTAB a IDE mi doplní public static void main(String[] args) {}.
Ale ještě lepší by bylo, kdyby doktor zadával data ve strojově čitelné podobě (ať už klikáním nebo psaním a vybíráním položek v nějakém průvodci nebo formou nějakého DSL) a zpráva v přirozeném jazyce by se z těchto dat pouze generovala.
Pokud by se doktor přehlédl, tak by to mohlo mít i dost tragické následky. Ona ta redundance v přirozeném jazyce má i svoje přínosy.
To je mimochodem pozoruhodná myšlenka. Myslíš, že správci kritických systémů by měli psát místo „rm“ „remove“, místo „/usr/local/bin“ „directory user directory local directory binaries“ atd.?
by mi přišlo rozumnější naučit doktory psát ± všemi deseti.
Např. já píši všemi deseti pomaleji, než když "datluji" cca šesti prsty. Z psaní všemi deseti mám sice lepší pocit a časem1 se to zlepší, ale s tím "datlováním" mám pořád větší cvik. IMHO je to víc o tom cviku než o počtu prstů -- a pokud i po X letech praxe doktor hledá písmenka na klávesnici, tak bude něco špatně. Jinak by totiž psal rychle i třeba čtyřmi (šesti, osmi) prsty.
[1] dlouho jsem na to kašlal a dodnes mi nepřijde, že by mě ne-psaní všemi deseti brzdilo při práci -- s rychlostí "datlování" jsem spokojený
U textu typu "přečti mnohokrát"A i jen pro zběžné čtení datasheetu by to nefungovalo dobře, ty znaky jsou jakoby schválně zamaskovaný.