Protože je už po aprílu, můžou strahováci opět zveřejnit program další Virtuální Bastlírny, aniž by připravená témata působila dojmem, že jde o žert. Vězte tedy, že již v úterý 7. dubna od 20:00 proběhne VB, kde se setkají bastlíři, technici, učitelé i nadšenci do techniky a kde i vy se můžete zapojit do družného hovoru, jako by všichni seděli u pomyslného piva. Co mají bastlíři tento měsíc na srdci? Pravděpodobně by nás musel zasáhnout meteorit
… více »Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.
VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.
Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.
Příspěvek na blogu herního enginu Godot představuje aplikaci Xogot přinášející Godot na iPad a iPhone. Instalovat lze z App Storu. Za Xogotem stojí Miguel de Icaza (GitHub) a společnost Xibbon.
Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za březen (YouTube).
ESP-IDF (Espressif IoT Development Framework), tj. oficiální vývojový framework pro vývoj aplikací na mikrokontrolérech řady ESP32, byl vydán v nové verzi 6.0. Detaily na portálu pro vývojáře.
DeepMind (Alphabet) představila novou verzi svého multimodálního modelu, Gemma 4. Modely jsou volně k dispozici (Ollama, Hugging Face a další) ve velikostech 5-31 miliard parametrů, s kontextovým oknem 128k až 256k a v dense i MoE variantách. Modely zvládají text, obrázky a u menších verzí i audio. Modely jsou optimalizované pro běh na desktopových GPU i mobilních zařízeních, váhy všech těchto modelů jsou uvolněny pod licencí Apache 2.0. Návod na spuštění je už i na Unsloth.
Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 3. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).
Průkopnická firma FingerWorks kolem roku 2000 vyvinula vícedotykové trackpady s gesty a klávesnice jako TouchStream LP. V roce 2005 ji koupil Apple, výrobu těchto produktů ukončil a dotykové technologie využil při vývoji iPhone. Multiplatformní projekt Apple Magic TouchstreamLP nyní implementuje funkcionalitu TouchStream LP na současném Apple Magic Trackpad, resp. jejich dvojici. Diskuze k vydání probíhá na Redditu.
Tak a je to tady. Konečně byly oznámeny projekty, které jejichž účast v letošním GSoC byla schválena. Jak jinak, budu se zabývat projekty týkající se Hugin a přidružených aplikací. A samozřejmě nejvíc tomu svému
. Na co se tedy můžeme těšit?
James (autor skvělého FastPreview) bude v rámci GSoC pracovat na zlepšení práce s „bracketed“ fotkami a lepší práci s jednotlivými řadami fotek. To AFAIK mimo jiné umožní „sdílení“ control points (bodů, které označují stejné části v různých fotografiích a slouží k jejich spojení) a celkově lepší práci s generováním těchto bodů (už nebudou generovány pro všechny obrázky (což je v případě stacku při bracketed focení dost redundantní práce,) což by mimo jiné mělo o něco zrychlit vytvoření panoramatu (za předpokladu, že používáte bracketing).
Hugin v současnosti obsahuje skvělý prográmek hugin_hdrmerge, který je, mimo klasický averaging, schopen díky khan algoritmu odstraňovat duchy při vytváření HDR obrázků. Bohužel se jedná o relativně málo známou vlastnost (a popravdě i poměrně dost paměťově náročnou). Mým hlavním cílem bude „přenést“ implementaci khanu z Huginu do enfuse čehož bych rád dosáhl tím, že pro něj vytvořím obecné rozhraní a následným přiohnutím enfuse tak, aby to fungovalo. Výhoda tohoto řešení je v tom, že by se s určitými úpravami možná dala použít na částečné odstranění chyby paralaxy v enblendy. Jako sekundární cíl jsem si zvolil implementaci dalšího (a podle ukázek úplně skvělého) algoritmu na odstraňování duchů.
Pro přesnější optimalizaci a složení panoramatu je potřeba znát deformaci (lens distortion) způsobenou objektivem. Díky znalosti toho, jak objektiv deformuje obraz je možné tuto deformaci odstranit. Pro její zjištění je potřeba detekovat hrany alespoň v jednom obrázku a na jejich základě spočítat příslušné parametry parametry. Pokud nepoužíváte tzv. „rybí oko“ tak vás to trápit nebude, deformace je poměrně malá. I přes to se ale může se stát, že optimalizace trochu ulétne a obrázky nesedí úplně dokonale. V současnosti jsou dvě možnosti jak toto řešit: 1)neřešit to, pokud to jde (většinou to stejně vyjde dobré) 2)naklikat příslušné kontrolní body ručně a nastavit správně parametry. Na tenhle projekt se celkem těším, protože díky němu by měl hugin podávat lepší výsledky hlavně s objektivy typu „rybí oko“
Tohle bohužel asi málokdo z nás, alespoň v blízké době, uvidí. Bohužel já svou šanci vidět ho na letošním LGM v Montréalu zahodil. LightTwist má být jakýsi systém promítaček (sedmi nebo čtrnácti), které promítají panoramata na okolní stěny. O tohle se moc nezajímám, takže toho ani víc nevím.
Na tenhle projekt se dost těším. V současnosti celý toolchain (libpano, hugin) předpokládá, že panorama bylo foceno s fixní pozicí fotoaparátu, který se pak jen otáčí. To samozřejmě dělá problémy, když např. fotíte mapu po jednotlivých částech a přitom posouváte celý fotoaparát. Zatím ale nevím jak promáklé to bude. Původně se řešila možnost modelu, kde fotoaparát se libovolně pohybuje v prostoru, což je ale hodně náročný úkol. Proto se tento projek možná zaměří opravdu jen na případ, kdy se foťák hýbe stále ve stejné hladině.
Tiskni
Sdílej:
Munin, Hugin, Pidgin... taky se vám to plete?
nastavením stejné clony a času pro všechny fotky?