DuckDuckGo AI Chat umožňuje "pokecat si" s GPT-3.5 Turbo od OpenAI nebo Claude 1.2 Instant od Anthropic. Bez vytváření účtu. Všechny chaty jsou soukromé. DuckDuckGo je neukládá ani nepoužívá k trénování modelů umělé inteligence.
VASA-1, výzkumný projekt Microsoftu. Na vstupu stačí jediná fotka a zvukový záznam. Na výstupu je dokonalá mluvící nebo zpívající hlava. Prý si technologii nechá jenom pro sebe. Žádné demo, API nebo placená služba. Zatím.
Nová čísla časopisů od nakladatelství Raspberry Pi: MagPi 140 (pdf) a HackSpace 77 (pdf).
ESPHome, tj. open source systém umožňující nastavovat zařízení s čipy ESP (i dalšími) pomocí konfiguračních souborů a připojit je do domácí automatizace, například do Home Assistantu, byl vydán ve verzi 2024.4.0.
LF AI & Data Foundation patřící pod Linux Foundation spustila Open Platform for Enterprise AI (OPEA).
Neziskové průmyslové konsorcium Khronos Group vydalo verzi 1.1 specifikace OpenXR (Wikipedie), tj. standardu specifikujícího přístup k platformám a zařízením pro XR, tj. platformám a zařízením pro AR (rozšířenou realitu) a VR (virtuální realitu). Do základu se z rozšíření dostalo XR_EXT_local_floor. Společnost Collabora implementuje novou verzi specifikace do platformy Monado, tj. open source implementace OpenXR.
Byla vydána nová verze 0.38.0 multimediálního přehrávače mpv (Wikipedie) vycházejícího z přehrávačů MPlayer a mplayer2. Přehled novinek, změn a oprav na GitHubu. Požadován je FFmpeg 4.4 nebo novější a také libplacebo 6.338.2 nebo novější.
ClamAV (Wikipedie), tj. multiplatformní antivirový engine s otevřeným zdrojovým kódem pro detekci trojských koní, virů, malwaru a dalších škodlivých hrozeb, byl vydán ve verzích 1.3.1, 1.2.3 a 1.0.6. Ve verzi 1.3.1 je mimo jiné řešena bezpečnostní chyba CVE-2024-20380.
Digitální a informační agentura (DIA) oznámila (PDF, X a Facebook), že mobilní aplikace Portál občana je ode dneška oficiálně venku.
#HACKUJBRNO 2024, byly zveřejněny výsledky a výstupy hackathonu města Brna nad otevřenými městskými daty, který se konal 13. a 14. dubna 2024.
Dobrý den,
snažím se převést jednu PDF knížku v češtině do UTF-8 plain text. Používám následující příkaz:
pdftotext -enc UTF-8 -eol unix kniha.pdf kniha.txt
Ale bohužel pdftotext si neporadí s diakritikou — vystup_z_pdftotext.png
ukazuje, jak to s diakritikou dopadlo (otevírám to v editoru gedit).
Budu moc vděčný za jakoukoli radu, jak diakritiku zprovoznit.
Řešení dotazu:
Děkuju za odpověď, ale bohužel toto nepomohlo.
Jsem já to vůl! Děkuju za nakopnutí, vyzkouším.
Zasek jsem se na tom, že nevím, jak zadat ty "Unicode znaky" (myslím ty znaky v tom obdélníčku).
Děkuju za reakci. Ale jsem z toho jelen. Mohl byste být konkrétnější?
iconv --from utf8 --to 8859_2 subor.txt > subor-1250.txt iconv --from cp1250 --to utf8 subor-1250.txt > subor-utf8.txt
pdftotext -enc UTF-8 -eol unix kniha.pdf subor.txt iconv --from utf8 --to 8859_2 subor.txt > subor-1250.txt iconv: nepovolená vstupní sekvence na pozici 122
Děkuju moc, chrono! Vyřešeno! Řešení je napsáno výše, jen je ještě třeba přidat parametr -c
programu iconv
. Já ho radši přidal k oběma příkazům.
Podle tech znaku to vypada, ze to z pdftotextu vypadne v CP1250. Zkusil bych tedy vysledek prevest iconv -f windows-1250 -t utf-8 < kniha.txt > knihautf8.txt
iconv: nepovolená vstupní sekvence na pozici 2243
Skončí to touhle chybou. Přesto díky za pomoc.
To uz je docela daleko. Mozna je tam vazne nejaky podivny znak. Bud bych se podival, co tam je, nebo bych rovnou doplnil parametry iconvu o -c.
TomasTiskni Sdílej: