Byla vydána verze 26.1 aneb čtvrtletní aktualizace open source počítačového planetária Stellarium (Wikipedie, GitHub). Vyzkoušet lze webovou verzi Stellaria na Stellarium Web.
VOID (Video Object and Interaction Deletion) je nový open-source VLM model pro editaci videa, který dokáže z videí odstraňovat objekty včetně všech jejich fyzikálních interakcí v rámci scény (pády, kolize, stíny...) pomocí quadmaskingu (čtyřhodnotová maska, která člení pixely scény do čtyř kategorií: objekt určený k odstranění, překrývající se oblasti, objektem ovlivněné oblasti a pozadí scény) a dvoufázového inpaintingu. Za projektem stojí výzkumníci ze společnosti Netflix.
Design (GitHub) je 2D CAD pro GNOME. Instalovat lze i z Flathubu. Běží také ve webovém prohlížeči.
Příspěvek na blogu herního enginu Godot představuje aplikaci Xogot přinášející Godot na iPad a iPhone. Instalovat lze z App Storu. Za Xogotem stojí Miguel de Icaza (GitHub) a společnost Xibbon.
Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za březen (YouTube).
ESP-IDF (Espressif IoT Development Framework), tj. oficiální vývojový framework pro vývoj aplikací na mikrokontrolérech řady ESP32, byl vydán v nové verzi 6.0. Detaily na portálu pro vývojáře.
DeepMind (Alphabet) představila novou verzi svého multimodálního modelu, Gemma 4. Modely jsou volně k dispozici (Ollama, Hugging Face a další) ve velikostech 5-31 miliard parametrů, s kontextovým oknem 128k až 256k a v dense i MoE variantách. Modely zvládají text, obrázky a u menších verzí i audio. Modely jsou optimalizované pro běh na desktopových GPU i mobilních zařízeních, váhy všech těchto modelů jsou uvolněny pod licencí Apache 2.0. Návod na spuštění je už i na Unsloth.
Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 3. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).
Průkopnická firma FingerWorks kolem roku 2000 vyvinula vícedotykové trackpady s gesty a klávesnice jako TouchStream LP. V roce 2005 ji koupil Apple, výrobu těchto produktů ukončil a dotykové technologie využil při vývoji iPhone. Multiplatformní projekt Apple Magic TouchstreamLP nyní implementuje funkcionalitu TouchStream LP na současném Apple Magic Trackpad, resp. jejich dvojici. Diskuze k vydání probíhá na Redditu.
Byla vydána nová verze 10.3 sady aplikací pro SSH komunikaci OpenSSH. Přináší řadu bezpečnostních oprav, vylepšení funkcí a oprav chyb.
$ ffmpeg -f alsa -i usbmic -f alsa -i looprec -filter_complex "[0:a]highpass=10,volume=20dB[0:a];[0:a][1:a]amerge=inputs=2[a]" -map "[a]" -ac 2 test.wav
Guessed Channel Layout for Input Stream #0.0 : stereo
Input #0, alsa, from 'usbmic':
Duration: N/A, start: 1558195138.708653, bitrate: 1536 kb/s
Stream #0:0: Audio: pcm_s16le, 48000 Hz, stereo, s16, 1536 kb/s
Guessed Channel Layout for Input Stream #1.0 : stereo
Input #1, alsa, from 'looprec':
Duration: N/A, start: 1558195138.792802, bitrate: 1536 kb/s
Stream #1:0: Audio: pcm_s16le, 48000 Hz, stereo, s16, 1536 kb/s
Stream mapping:
Stream #0:0 (pcm_s16le) -> amerge:in0
Stream #1:0 (pcm_s16le) -> amerge:in1
amerge -> Stream #0:0 (pcm_s16le)
Press [q] to stop, [?] for help
[Parsed_amerge_2 @ 0x55d4d2c80700] No channel layout for input 1
[Parsed_amerge_2 @ 0x55d4d2c80700] Input channel layouts overlap: output layout will be determined by the number of distinct input channels
[Parsed_volume_1 @ 0x55d4d2c7f480] Cannot select sample rate for the link between filters Parsed_volume_1 and Parsed_highpass_0.
Error reinitializing filters!
Failed to inject frame into filter network: Invalid argument
Error while processing the decoded data for stream #1:0
Conversion failed!
Bude tam nejspíš zmatek s těma labels v hranatých závorkách.
Bez těch filtrů highpass a volume to downmixuje hezky.
Řešení dotazu:
ffmpeg -f alsa -i usbmic -filter_complex "highpass=10,volume=20dB" -ac 2 test.wavfunguje jak má.
ffmpeg -f alsa -i usbmic -f alsa -i looprec -filter_complex "[0:a]highpass=10,volume=20dB[aout];[aout][1:a]amerge=inputs=2[a]" -map "[a]" -ac 2 test.wav
The following filters could not choose their formats: Parsed_amerge_2 Consider inserting the (a)format filter near their input or output.Moc rozumu z toho teda nemám.
Stream #0:0: Audio: pcm_s16le, 48000 Hz, stereo, s16, 1536 kb/sAle budiž.
Celý ten příkaz je ale tak nechutně dlouhý, že jsem si to rači šoupnul do skriptu.
Co mě příjemně překvapilo, tak to vůbec není out-of-sync. Čekal jsem aspon 50-100 milisekund zpoždění u mikrofonu. V audacity musím mít nastaveno 130ms. Existuje vůbec nejaký commandline program na nahrávání karaoke? Toto by se na to dalo v klidu použít, když to nemá latence ..
Při odesílání komentáře mi to píše: "Značka C0\+\C2\|\C1 není povolena!" (bez těch zpětných lomítek) Co to znamená? Nemůžu sem kvuli tomu dát ten funkční ffmpeg filtr
ffmpeg -f alsa -i usbmic -f alsa -i looprec -filter_complex "join=inputs=2:channel_layout=quad" output.wavA případné filtrování a downmix udělám ručně v audacity. Je to sice víc práce ale výsledek za to stojí.
Tiskni
Sdílej: