Společnost Hugging Face ve spolupráci se společností Pollen Robotics představila open source robota Reachy Mini (YouTube). Předobjednat lze lite verzi za 299 dolarů a wireless verzi s Raspberry Pi 5 za 449 dolarů.
Dnes v 17:30 bude oficiálně vydána open source počítačová hra DOGWALK vytvořena v 3D softwaru Blender a herním enginu Godot. Release party proběhne na YouTube od 17:00.
McDonald's se spojil se společností Paradox a pracovníky nabírá také pomocí AI řešení s virtuální asistentkou Olivii běžící na webu McHire. Ian Carroll a Sam Curry se na toto AI řešení blíže podívali a opravdu je překvapilo, že se mohli přihlásit pomocí jména 123456 a hesla 123456 a získat přístup k údajům o 64 milionech uchazečů o práci.
Byla vydána (𝕏) červnová aktualizace aneb nová verze 1.102 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.102 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.
Byla vydána nová verze 2.4.64 svobodného multiplatformního webového serveru Apache (httpd). Řešeno je mimo jiné 8 bezpečnostních chyb.
Společnost xAI na síti 𝕏 představila Grok 4, tj. novou verzi svého AI LLM modelu Grok.
Ministerstvo vnitra odhalilo závažný kyberincident v IT systému resortu. Systém, do kterého se dostal útočník bez oprávnění, byl odpojen a nedošlo k odcizení dat [𝕏].
Před rokem byla streamovací služba HBO Max přejmenována na Max. Dle managementu slovo HBO v názvu nebylo důležité. Včera byl Max přejmenován zpět na HBO Max. Kolik milionů dolarů to stálo? 😂
Byla vydána nová major verze 8.0.0 svobodného systému pro detekci a prevenci průniků a monitorování bezpečnosti počítačových sítí Suricata (Wikipedie). Přehled novinek v oficiálním oznámení a v aktualizované dokumentaci.
Mastodon (Wikipedie) - sociální síť, která není na prodej - byl vydán ve verzi 4.4. Přehled novinek s náhledy a videi v oznámení na blogu.
Dobrý den,
snažím se převést jednu PDF knížku v češtině do UTF-8 plain text. Používám následující příkaz:
pdftotext -enc UTF-8 -eol unix kniha.pdf kniha.txt
Ale bohužel pdftotext si neporadí s diakritikou — vystup_z_pdftotext.png
ukazuje, jak to s diakritikou dopadlo (otevírám to v editoru gedit).
Budu moc vděčný za jakoukoli radu, jak diakritiku zprovoznit.
Řešení dotazu:
Děkuju za odpověď, ale bohužel toto nepomohlo.
Jsem já to vůl! Děkuju za nakopnutí, vyzkouším.
Zasek jsem se na tom, že nevím, jak zadat ty "Unicode znaky" (myslím ty znaky v tom obdélníčku).
Děkuju za reakci. Ale jsem z toho jelen. Mohl byste být konkrétnější?
iconv --from utf8 --to 8859_2 subor.txt > subor-1250.txt iconv --from cp1250 --to utf8 subor-1250.txt > subor-utf8.txt
pdftotext -enc UTF-8 -eol unix kniha.pdf subor.txt iconv --from utf8 --to 8859_2 subor.txt > subor-1250.txt iconv: nepovolená vstupní sekvence na pozici 122
Děkuju moc, chrono! Vyřešeno! Řešení je napsáno výše, jen je ještě třeba přidat parametr
-c
programu iconv
. Já ho radši přidal k oběma příkazům.
Podle tech znaku to vypada, ze to z pdftotextu vypadne v CP1250. Zkusil bych tedy vysledek prevest iconv -f windows-1250 -t utf-8 < kniha.txt > knihautf8.txt
iconv: nepovolená vstupní sekvence na pozici 2243
Skončí to touhle chybou. Přesto díky za pomoc.
To uz je docela daleko. Mozna je tam vazne nejaky podivny znak. Bud bych se podival, co tam je, nebo bych rovnou doplnil parametry iconvu o -c.
Tomas
Tiskni
Sdílej: