Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.
VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.
Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.
Příspěvek na blogu herního enginu Godot představuje aplikaci Xogot přinášející Godot na iPad a iPhone. Instalovat lze z App Storu. Za Xogotem stojí Miguel de Icaza (GitHub) a společnost Xibbon.
Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za březen (YouTube).
ESP-IDF (Espressif IoT Development Framework), tj. oficiální vývojový framework pro vývoj aplikací na mikrokontrolérech řady ESP32, byl vydán v nové verzi 6.0. Detaily na portálu pro vývojáře.
DeepMind (Alphabet) představila novou verzi svého multimodálního modelu, Gemma 4. Modely jsou volně k dispozici (Ollama, Hugging Face a další) ve velikostech 5-31 miliard parametrů, s kontextovým oknem 128k až 256k a v dense i MoE variantách. Modely zvládají text, obrázky a u menších verzí i audio. Modely jsou optimalizované pro běh na desktopových GPU i mobilních zařízeních, váhy všech těchto modelů jsou uvolněny pod licencí Apache 2.0. Návod na spuštění je už i na Unsloth.
Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 3. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).
Průkopnická firma FingerWorks kolem roku 2000 vyvinula vícedotykové trackpady s gesty a klávesnice jako TouchStream LP. V roce 2005 ji koupil Apple, výrobu těchto produktů ukončil a dotykové technologie využil při vývoji iPhone. Multiplatformní projekt Apple Magic TouchstreamLP nyní implementuje funkcionalitu TouchStream LP na současném Apple Magic Trackpad, resp. jejich dvojici. Diskuze k vydání probíhá na Redditu.
Byla vydána nová verze 10.3 sady aplikací pro SSH komunikaci OpenSSH. Přináší řadu bezpečnostních oprav, vylepšení funkcí a oprav chyb.
Vyšla nová verze OCR software OCRFeeder s číslem 0.7. Přináší několik novinek. Hlavní jsou změny v UI, ale také v lepší podpoře rozpoznávání křivého textu. Více detailů píše v článku Joaquim Rocha - hlavní vývojář.
Tiskni
Sdílej:
OCRFeede je ve skutečnosti jen grafické rozhraní ke skutečným OCR programům. Celé vylepšení spočívá v tom, že autor přidal možnost si nastavit nějaké další volby, které se těm programům předávají a navíc volá před vlastním OCR další externí program, který upravuje deformace obrazu (předchozí verze volala jen Unpaper).
I přes tato „zdokonalení“ je výsledek rozpoznávání dosti zoufalý, a nejen pro češtinu. Kdybys našel kvalitní program OCR v CLI, který by to mohlo volat, tak by ti to fungovalo dobře. Já jsem testoval dva, se kterými do standardně spolupracuje - ocrad a tesseract. Z těch dvou byl trochu lepší tesseract. Češtinu totálně nezvládal ani jeden. Ale možná to jde nějak vyštelovat, zkoušel jsem to jen zběžně v rámci toho, že jsem to překládal do češtiny.
-l cze -o /tmp/cune $IMAGE; cat /tmp/cunePřidáte do pole argumenty výkonného programu. Stupido, viďte?
Ocrodjvu s cuneiform pracuje rovněž. Na odkazované stránce najdeš ukázku výsledku, porovnanou s výsledkem profesionálního ocr (pravděpodobně engine z Readiris 10)