Dlouholetý balíčkář KDE Jonathan Riddell končí. Jeho práci na KDE neon financovala firma Blue Systems, která ale končí (Clemens Tönnies, Jr., dědic jatek Tönnies Holding, ji už nebude sponzorovat), někteří vývojáři KDE se přesunuli k nově založené firmě Techpaladin. Pro Riddella se již nenašlo místo. Následovala debata o organizaci těchto firem, které zahraniční vývojáře nezaměstnávají, nýbrž najímají jako kontraktory (s příslušnými důsledky z pohledu pracovního práva).
V Amsterdamu probíhá Blender Conference 2025. Videozáznamy přednášek lze zhlédnout na YouTube. V úvodní keynote Ton Roosendaal oznámil, že k 1. lednu 2026 skončí jako chairman a CEO Blender Foundation. Tyto role převezme současný COO Blender Foundation Francesco Siddi.
The Document Foundation, organizace zastřešující projekt LibreOffice a další aktivity, zveřejnila výroční zprávu za rok 2024.
Byla vydána nová stabilní verze 7.6 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 140. Přehled novinek i s náhledy v příspěvku na blogu.
Byla vydána verze 1.90.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.
GNUnet (Wikipedie) byl vydán v nové major verzi 0.25.0. Jedná se o framework pro decentralizované peer-to-peer síťování, na kterém je postavena řada aplikací.
Byla vydána nová major verze 7.0 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Nově je postavena je na Debianu 13 (Trixie) a GNOME 48 (Bengaluru). Další novinky v příslušném seznamu.
Společnost Meta na dvoudenní konferenci Meta Connect 2025 představuje své novinky. První den byly představeny nové AI brýle: Ray-Ban Meta (Gen 2), sportovní Oakley Meta Vanguard a především Meta Ray-Ban Display s integrovaným displejem a EMG náramkem pro ovládání.
Po půl roce vývoje od vydání verze 48 bylo vydáno GNOME 49 s kódovým názvem Brescia (Mastodon). S přehrávačem videí Showtime místo Totemu a prohlížečem dokumentů Papers místo Evince. Podrobný přehled novinek i s náhledy v poznámkách k vydání a v novinkách pro vývojáře.
Open source softwarový stack ROCm (Wikipedie) pro vývoj AI a HPC na GPU od AMD byl vydán ve verzi 7.0.0. Přidána byla podpora AMD Instinct MI355X a MI350X.
Český statistický úřad vydal publikaci Ženy, muži a digitalizace - 2023 (pdf) s celou řadou tabulek a grafů. Například průměrná hrubá měsíční mzda ICT odborníků byla v roce 2022 u žen 61 992 a u mužů 71 960.
Tiskni
Sdílej:
v dokumentu ktery ma byt o odbornicich v IT
Řekl kdo?
Jmenuje se to Ženy, muži a digitalizace. ICT odborníci jsou jenom sekce 2.3, resp. tabulky 30-32.
tabulky o tom kdo co nakupuje doma, nebo jestli se doma pouziva chat nebo email
Digitalizace. Neslyšeli? Neviděli? Nikdy?! Ani v tom titulku?
Život je otázkou priorit :)
Nedávno mě pobavil jeden Japonec, který vysvětloval, že v Japonsku prodávají osobní počítače o polovinu levněji než v Česku, tím, že tam není po nich žádná poptávka. Žáci dostanou školní tablety a studenti jsou schopni udělat vysokou školu s mobilním telefonem. Prý jsou i případy, kteří celou diplomku datlovali (bez externí klávesnice) do telefonu.
pdftoppm digitalizace.pdf -png x for x in $(seq -w 41); do tesseract -l ces x-$x.png x-$x pdf; done; gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -dAutoRotatePages=/None -sOutputFile="digitalizace-ocr.pdf" $(for x in $(seq -w 41); do echo x-$x.pdf; done)
office-pipe
mohl umět, ale nevím, jestli to tam úplně patří (nechtěl bych tam přidávat závislost na Tesseractu a PDF knihovnách, takže by to spíš volal jako podprocesy, a pak se to moc neliší od obyčejného shellového skriptu).
V Relačních rourách by tuhle funkcionalitu šlo implementovat jako streamlet a pustit ji nad více soubory, ale většinou asi člověk potřebuje převést jen jeden dokument, takže i tady je asi jednodušší mít obyčejný shellový skript.
Vzhledem k tomu, že tam nejsou žádná relační data (v tomhle případě je úspěch z toho dostat aspoň nestrukturovaný text místo rozsypaného čaje), tak je to dost mimo záběr Relačních rour.
Maximálně se z toho dají jako relační/strukturovaná data vytáhnout metadata dokumentu:
$ find -name digitalizace.pdf -print0 \ | relpipe-in-filesystem \ --file path \ --streamlet mime_type \ --streamlet exiftool \ | relpipe-out-recfile %rec: filesystem %type: path regexp /.*/ %type: mime__type regexp /.*/ %type: File_58_MIMEType regexp /.*/ %type: exiftool__xml regexp /.*/ path: ./digitalizace.pdf mime__type: application/pdf File_58_MIMEType: application/pdf exiftool__xml: <?xml version='1.0' encoding='UTF-8'?> + <rdf:RDF xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#'> + + <rdf:Description rdf:about='./digitalizace.pdf' + xmlns:et='http://ns.exiftool.org/1.0/' et:toolkit='Image::ExifTool 12.40' + xmlns:ExifTool='http://ns.exiftool.org/ExifTool/1.0/' + xmlns:System='http://ns.exiftool.org/File/System/1.0/' + xmlns:File='http://ns.exiftool.org/File/1.0/' + xmlns:PDF='http://ns.exiftool.org/PDF/PDF/1.0/' + xmlns:XMP-x='http://ns.exiftool.org/XMP/XMP-x/1.0/' + xmlns:XMP-xmp='http://ns.exiftool.org/XMP/XMP-xmp/1.0/' + xmlns:XMP-dc='http://ns.exiftool.org/XMP/XMP-dc/1.0/' + xmlns:XMP-xmpMM='http://ns.exiftool.org/XMP/XMP-xmpMM/1.0/' + xmlns:XMP-pdf='http://ns.exiftool.org/XMP/XMP-pdf/1.0/' + xmlns:XMP-pdfaid='http://ns.exiftool.org/XMP/XMP-pdfaid/1.0/'> + <ExifTool:ExifToolVersion>12.40</ExifTool:ExifToolVersion> + <System:FileName>digitalizace.pdf</System:FileName> + <System:Directory>.</System:Directory> + <System:FileSize>880 KiB</System:FileSize> + <System:FileModifyDate>2023:06:21 10:29:28+02:00</System:FileModifyDate> + <System:FileAccessDate>2023:06:28 23:02:18+02:00</System:FileAccessDate> + <System:FileInodeChangeDate>2023:06:29 13:35:47+02:00</System:FileInodeChang\ eDate> + <System:FilePermissions>-rw-rw-r--</System:FilePermissions> + <File:FileType>PDF</File:FileType> + <File:FileTypeExtension>pdf</File:FileTypeExtension> + <File:MIMEType>application/pdf</File:MIMEType> + <PDF:PDFVersion>1.4</PDF:PDFVersion> + <PDF:Linearized>No</PDF:Linearized> + <PDF:PageCount>41</PDF:PageCount> + <PDF:Author>myskova7414</PDF:Author> + <PDF:CreateDate>2023:06:21 09:38:55+02:00</PDF:CreateDate> + <PDF:Producer>Acrobat Distiller 9.5.5 (Windows)</PDF:Producer> + <PDF:Creator>PScript5.dll Version 5.2.2</PDF:Creator> + <PDF:ModifyDate>2023:06:21 09:38:55+02:00</PDF:ModifyDate> + <PDF:Title>Microsoft Word - ICT_gender_metodika_cs.docx</PDF:Title> + <XMP-x:XMPToolkit>Adobe XMP Core 4.2.1-c043 52.372728, 2009/01/18-15:08:04 \ </XMP-x:XMPToolkit> + <XMP-xmp:ModifyDate>2023:06:21 09:38:55+02:00</XMP-xmp:ModifyDate> + <XMP-xmp:CreateDate>2023:06:21 09:38:55+02:00</XMP-xmp:CreateDate> + <XMP-xmp:MetadataDate>2023:06:21 09:28:14+02:00</XMP-xmp:MetadataDate> + <XMP-xmp:CreatorTool>PScript5.dll Version 5.2.2</XMP-xmp:CreatorTool> + <XMP-dc:Format>application/pdf</XMP-dc:Format> + <XMP-dc:Title>Microsoft Word - ICT_gender_metodika_cs.docx</XMP-dc:Title> + <XMP-dc:Creator>myskova7414</XMP-dc:Creator> + <XMP-xmpMM:DocumentID>uuid:833e5971-ac60-4506-8d82-652f5b8a5ab7</XMP-xmpMM:D\ ocumentID> + <XMP-xmpMM:InstanceID>uuid:c9fa996a-e388-4108-907e-925f45d9d2fc</XMP-xmpMM:I\ nstanceID> + <XMP-pdf:Producer>Acrobat Distiller 9.5.5 (Windows)</XMP-pdf:Producer> + <XMP-pdfaid:Part>1</XMP-pdfaid:Part> + <XMP-pdfaid:Conformance>B</XMP-pdfaid:Conformance> + </rdf:Description> + </rdf:RDF> # Record count: 1Případně je tam streamlet
tesseract
, ale ten čte obrázek a generuje jeden atribut s rozpoznaným textem (tzn. nevyleze z toho PDF, ale jen ten text).