Společnost Perplexity AI působící v oblasti umělé inteligence (AI) podala nevyžádanou nabídku na převzetí webového prohlížeče Chrome internetové firmy Google za 34,5 miliardy dolarů (zhruba 723 miliard Kč). Informovala o tom včera agentura Reuters. Upozornila, že výše nabídky výrazně převyšuje hodnotu firmy Perplexity. Společnost Google se podle ní k nabídce zatím nevyjádřila.
Intel vydal 34 upozornění na bezpečnostní chyby ve svých produktech. Současně vydal verzi 20250812 mikrokódů pro své procesory řešící 6 bezpečnostních chyb.
Byla vydána nová verze 1.25 programovacího jazyka Go (Wikipedie). Přehled novinek v poznámkách k vydání.
Byla vydána beta verze Linux Mintu 22.2 s kódovým jménem Zara. Podrobnosti v přehledu novinek a poznámkách k vydání. Vypíchnout lze novou XApp aplikaci Fingwit pro autentizaci pomocí otisků prstů nebo vlastní fork knihovny libAdwaita s názvem libAdapta podporující grafická témata. Linux Mint 22.2 bude podporován do roku 2029.
Provozovatel internetové encyklopedie Wikipedie prohrál v Británii soudní spor týkající se některých částí nového zákona o on-line bezpečnosti. Soud ale varoval britského regulátora Ofcom i odpovědné ministerstvo před zaváděním přílišných omezení. Legislativa zpřísňuje požadavky na on-line platformy, ale zároveň čelí kritice za možné omezování svobody slova. Společnost Wikimedia Foundation, která je zodpovědná za fungování
… více »Byla vydána verze 2.0.0 nástroje pro synchronizaci dat mezi vícero počítači bez centrálního serveru Syncthing (Wikipedie). Přehled novinek na GitHubu.
Americký prezident Donald Trump se v pondělí osobně setkal s generálním ředitelem firmy na výrobu čipů Intel Lip-Bu Tanem. Šéfa podniku označil za úspěšného, informují agentury. Ještě před týdnem ho přitom ostře kritizoval a požadoval jeho okamžitý odchod. Akcie Intelu v reakci na schůzku po oficiálním uzavření trhu zpevnily asi o tři procenta.
Byl vydán Debian GNU/Hurd 2025. Jedná se o port Debianu s jádrem Hurd místo obvyklého Linuxu.
V sobotu 9. srpna uplynulo přesně 20 let od oznámení projektu openSUSE na konferenci LinuxWorld v San Franciscu. Pokuď máte archivní nebo nějakým způsobem zajímavé fotky s openSUSE, můžete se o ně s námi podělit.
Byl vydán Debian 13 s kódovým názvem Trixie. Přehled novinek v poznámkách k vydání.
Dobrý den,
snažím se převést jednu PDF knížku v češtině do UTF-8 plain text. Používám následující příkaz:
pdftotext -enc UTF-8 -eol unix kniha.pdf kniha.txt
Ale bohužel pdftotext si neporadí s diakritikou — vystup_z_pdftotext.png
ukazuje, jak to s diakritikou dopadlo (otevírám to v editoru gedit).
Budu moc vděčný za jakoukoli radu, jak diakritiku zprovoznit.
Řešení dotazu:
Děkuju za odpověď, ale bohužel toto nepomohlo.
Jsem já to vůl! Děkuju za nakopnutí, vyzkouším.
Zasek jsem se na tom, že nevím, jak zadat ty "Unicode znaky" (myslím ty znaky v tom obdélníčku).
Děkuju za reakci. Ale jsem z toho jelen. Mohl byste být konkrétnější?
iconv --from utf8 --to 8859_2 subor.txt > subor-1250.txt iconv --from cp1250 --to utf8 subor-1250.txt > subor-utf8.txt
pdftotext -enc UTF-8 -eol unix kniha.pdf subor.txt iconv --from utf8 --to 8859_2 subor.txt > subor-1250.txt iconv: nepovolená vstupní sekvence na pozici 122
Děkuju moc, chrono! Vyřešeno! Řešení je napsáno výše, jen je ještě třeba přidat parametr
-c
programu iconv
. Já ho radši přidal k oběma příkazům.
Podle tech znaku to vypada, ze to z pdftotextu vypadne v CP1250. Zkusil bych tedy vysledek prevest iconv -f windows-1250 -t utf-8 < kniha.txt > knihautf8.txt
iconv: nepovolená vstupní sekvence na pozici 2243
Skončí to touhle chybou. Přesto díky za pomoc.
To uz je docela daleko. Mozna je tam vazne nejaky podivny znak. Bud bych se podival, co tam je, nebo bych rovnou doplnil parametry iconvu o -c.
Tomas
Tiskni
Sdílej: