abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 01:22 | Nová verze

    Byl vydán Linux Mint 22.3 s kódovým jménem Zena. Podrobnosti v přehledu novinek a poznámkách k vydání. Vypíchnout lze, že nástroj Systémová hlášení (System Reports) získal mnoho nových funkcí a byl přejmenován na Informace o systému (System Information). Linux Mint 22.3 bude podporován do roku 2029.

    Ladislav Hagara | Komentářů: 0
    včera 21:33 | Nová verze

    Wine bylo po roce vývoje od vydání verze 10.0 vydáno v nové stabilní verzi 11.0. Přehled novinek na GitLabu. Vypíchnuta je podpora NTSYNC a dokončení architektury WoW64.

    Ladislav Hagara | Komentářů: 1
    včera 16:11 | Nová verze

    Byl vydán Mozilla Firefox 147.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Firefox nově podporuje Freedesktop.org XDG Base Directory Specification. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 147 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Humor

    Asociace repair.org udělila anticeny těm nejhorším produktům představeným na veletrhu CES 2026. Oceněnými jsou například šmírující kamery Amazon Ring AI, chytrý běžecký pás od společnosti Merach, která otevřeně přiznává, že nedokáže zabezpečit osobní data uživatelů, případně jednorázové lízátko, které rozvibrovává čelisti uživatele a tak přehrává hudbu. Absolutním vítězem je lednička od Samsungu, která zobrazuje reklamy a kterou lze otevřít pouze hlasovým příkazem přes cloudovou službu.

    NUKE GAZA! 🎆 | Komentářů: 7
    včera 12:00 | IT novinky

    Íránští protirežimní aktivisté si všímají 30% až 80% ztráty packetů při komunikaci se satelity služby Starlink. Mohlo by se jednat o vedlejší důsledek rušení GPS, kterou pozemní přijímače Starlinku používají k výpočtu polohy satelitů a kterou se režim rovněž snaží blokovat, podle bezpečnostního experta a iranisty Amira Rashidiho je ale pravděpodobnější příčinou terestrické rušení přímo satelitní komunikace Starlinku podobnou

    … více »
    NUKE GAZA! 🎆 | Komentářů: 8
    včera 00:55 | IT novinky

    Evropská komise (EK) zvažuje, že zařadí komunikační službu WhatsApp americké společnosti Meta mezi velké internetové platformy, které podléhají přísnější regulaci podle unijního nařízení o digitálních službách (DSA). Firmy s více než 45 miliony uživatelů jsou podle DSA považovány za velmi velké on-line platformy (Very Large Online Platforms; VLOP) a podléhají přísnějším pravidlům EU pro internetový obsah. Pravidla po

    … více »
    Ladislav Hagara | Komentářů: 17
    včera 00:44 | IT novinky

    Tržní hodnota technologické společnosti Alphabet poprvé v historii přesáhla čtyři biliony dolarů (83 bilionů Kč). Stalo se tak poté, co Apple oznámil, že bude na poli umělé inteligence (AI) spolupracovat s dceřinou firmou Alphabetu, společností Google.

    Ladislav Hagara | Komentářů: 4
    12.1. 11:11 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 161 (pdf).

    Ladislav Hagara | Komentářů: 0
    12.1. 10:44 | Nová verze

    Po delší době vývoje vyšla nativní linuxová verze virtuálního bubeníka MT-PowerDrumKit 2 ve formátu VST3. Mezi testovanými hosty jsou Reaper, Ardour, Bitwig a Carla.

    balda | Komentářů: 1
    11.1. 21:33 | Nová verze

    Desktopové prostředí Budgie bylo vydáno ve verzi 10.10. Dokončena byla migrace z X11 na Wayland. Budgie 10 vstupuje do režimu údržby. Vývoj se přesouvá k Budgie 11. Dlouho se řešilo, v čem bude nové Budgie napsáno. Budgie 10 je postaveno nad GTK 3. Přemýšlelo se také nad přepsáním z GTK do EFL. Budgie 11 bude nakonec postaveno nad Qt 6.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (12%)
     (5%)
     (0%)
     (8%)
     (19%)
     (3%)
     (6%)
     (3%)
     (11%)
     (46%)
    Celkem 413 hlasů
     Komentářů: 11, poslední včera 15:18
    Rozcestník

    Hrátky s exif tagy - popáté

    8.1.2020 18:26 | Přečteno: 3502× | Za vším hledej Linux | Výběrový blog

    Hm. Takže. Pro většinů laiků je využití exif tagů zcela mimo rámec jejich chápání. Takže když jim řeknete, že je lepší popis fotografie ukládat rovnou DO souboru s obrázkem, obvykle zůstanou čumět jak vlaštovky na drát. Je-li to i váš případ, asi nemá cenu abyste četli dál. Pokud ale potřebujete operativně přehazovat informace, které se časem mohou stát klíčové, pak se vám může moje know-how hodit.

    Tip pro sklerotiky…

    Mezi nástroje, bez kterých bych nedal ani ránu, patří xfce4-screenshoter (který mám namapovaný na klávesu Application) a Geeqie, který používám k editaci EXIF tagů o kterých jsem zde v rámci svého blogu publikoval více již před víc jak 11 lety. Viz

    Když se objeví v některém z terminálů či oken na mé obrazovce informace, na jejíž prostudování zrovna nemám čas, stačí udělat screenshot a prostřednictvím geeqie do komentáře vložit URL a případně vložit i kus textu, který mě zajímá. Kdykoliv se pak mohu k této informaci vrátit a mám k dispozici nejenom údaje o tom co to je, ale i časové razítko kdy byl screenshot pořízen – ať už je mezi tím soubor se screenshotem přejmenován, přesunut nebo ořezán. Neztratí se, pokud je screenshot zpracován přes Gimp a uložen ve formátu co podporuje exif tagy.

    Takto uloženou informaci lze klidně vyhodit z hlavy a kdykoliv se k ní, v případě potřeby, vrátit.

    Využívám toho ale nejenom při práci.

    Do pestré palety mých zájmů totiž patří také hrabání se v historii. To je pochopitelně spojeno se shromaďováním nejrůzmějších snímků, skenů a jiných elektronicky zpracovaných dokumentů, které jsou bez informace o původu zcela bezcenné. Ovšem pokud jsou tyhle informace v exif komentáři, lze s nimi dál pracovat. A tím se dostávám k impulsu, který mne přiměl k sepsání tohoto blogpostu.

    Před nějakým časem jsem se začal hrabat v digitalizovaných matrikách a tím se dostal k otázce, jak to udělat, abych nemusel jejich obsah opakovaně luštit a případně ho mohl dále zpracovávat už v nějaké rozumné formě.

    Něco málo o matrikách…

    Nevím kdo z vás se zajímá o genealogii, proto si neodpustím alespoň letmý úvod do problematiky.

    Matriky, jsou úřední seznamy osob, ve kterých se evidují základní informace o narození, úmrtí a sňatku. Ale nejsou s námi odjakživa, takže počítejte s tím, že se při pátrání po svém původu v drtivé většině případů dostanete maximálně 10 generací zpátky. Jen pro zajímavost – od Ježíšových vrstevníků nás nedělí (mým letmým odhadem) víc než 70 generací.

    Až na výjimky se u nás matriky začaly vést až v průběhu 17. století, po 30 leté válce. Jelikož předtím žádná evidence obyvatelstva nebyla, nikdo neví kolik lidí během ní vlastně zařvalo. Odhaduje se, že počet obyvatel v Evropě klesl v důsledku válečných útrap na polovinu, takže počátek evidence obyvatelstva byl nejspíš vyvolán potřebou zjistit, kdo tu válku vlastně přežil.

    O matriky se původně starala církev. Mělo to svou logiku, kdo jiný než místní páter měl přehled o tom co se kde šustne. Byl u zdroje informací. V kostele se oznamovalo kdy a s kým se kdo hodlá oženit. Kostelem projela na poslední cestě většina nebožtíků a v kostele byli také pokřtěni. Bordel do toho vnesla až sekularizace 20 století, poté co tuhle agendu převzaly obecní úřady. O dnešní době informačního temna ani nemluvě.

    K digitalizaci matrik Opavského archívu, ve kterých se hrabu já, došlo roce 2012 a možná vás, stejně jako mne, překvapí, že ji komplet zaplatili mormoni.

    Jenže pouhá digitalizace ke zpřístupnění informací nestačí. To s čím se budete při čtení matrik potýkat nejvíc, je čtení prasopisu – a garantuji vám, že na tohle ještě hodně dlouho žádná umělá inteligence mít nebude.

    Já to dávám jakž takž. Vždycky mne bavilo luštění klikyháků, takže toho mám docela dost načteno. Navíc texty v matrikách nejsou v zásadě nic složitého. Stačí když máte kromě češtiny nějaké ty znalosti němčiny a latiny. Také se většina textu často opakuje ale i tak je nutné mít bohaté zkušenosti a notnou dávku fantazie. Kupř. jen mé příjmení lze nalézt zapsáno a zkomoleno hned v několika podobách: Kapica, Kapitza, Kapicza, Kubitza, Pawlitza, & etc. Takže z ryze praktických důvodů jsem si začal psát přeluštěné texty rovnou do exif komentářů stažených skenů.

    Ovšem aby se z těch jednotlivých záznamů daly dešifrovat konkrétní data je třeba nalézt vzájemné souvislosti. Obzvláště u žen, v matrikách z konce 17. století, kde se ještě nepsaly tzv. vývody, je k jednoznačné identifikaci nutné najít záznam o sňatku, ze kterého lze zjistit rodné jméno – teprve pak máte šanci zjistit kdy, kde a komu se konkrétní osoba narodila.

    Typický záznam o narození vypadá takto: "Dne DD.MM.YYYY se narodila Jana, Jan Novák a Anna z XXX".

    Je třeba najít záznam o sňatku. Jenže kdy se Novákovi vzali, a kde? Můžete zkusit postupně vyhledat všechny potomky. Jenže je Anna pokaždé jedna a táž osoba? Co když to byla druhá žena a první žena se také jmenovala Anna? Nezbývá než najít záznam o úmrtí. Jenže co když její manžel zemřel dříve a ona se mezi tím znovu vdala? Nebo co když umřela jinde? Atd. atd.

    K tomu abyste snáze a rychleji našli vzájemné souvislosti, je optimální mít ty záznamy ve formě, kterou lze dále softwarově zpracovat. Tím se tedy konečně dostávám k věci.

    exiftool

    Aby bylo možné záznamy třídit, bylo nutné sjednotit jejich formu tak, aby je bylo možné obsah exif tagu importovat do tabulkového procesoru. Jenže kdybych měl postupně editovat sken po skenu, tak bych se z toho asi zbláznil. Takže jsem nejprve vytvořil jednoduchý html soubor s vloženými tabulkami:

    user@stroj~/matriky$ echo '<!DOCTYPE html><html lang="cs"><head><meta charset="utf-8" /><title>matriky</title></head><body>' > tabulka.html
    user@stroj~/matriky$ for i in $(ls -1 *.jpg) ; do exiftool -h -FileName -Caption-Abstract $i >> tabulka.html ; done
    user@stroj~/matriky$ echo '</body></html>' >> tabulka.html
    

    Ten jsem naimportoval do tabulky v Libreoffice a následně uložil jako csv soubor. Sjednocení obsahu v rámci jednoho textového souboru je mnohem rychlejší, než editovat tabulku buňku po buňce, či snad editovat obrázek po obrázku.

    A jak dostat data zpátky do souborů?

    U csv souboru je to brnkačka. Stačí ho přežvýkat shellovým skriptem. Názvy souborů jsou v tabulce a oddělovače pro obsah, co se má pomocí exiftool vložit do komentáře se při tom nahradí HTML entitami.

           

    Hodnocení: 80 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    Josef Kufner avatar 9.1.2020 00:38 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Hrátky s exif tagy - popáté
    Nebylo by lepší na toto použít nějaké PDF nebo něco takového a přidat to tam jako vrstvu, kde by se psalo rovnou na místo se jménem?
    Hello world ! Segmentation fault (core dumped)
    9.1.2020 00:56 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
    Rozbalit Rozbalit vše Re: Hrátky s exif tagy - popáté
    PDF? WTF?

    Já si práci snažím maximálně zjednodušovat, ne komplikovat. Pokud zkusíte kliknout na ten link s ukázkou prasopisu, tak si můžete všimnout, že lze odkazovanou stránku stáhnout a uložit pod unikátním názvem, který se ovšem liší matrika od matriky. Bohužel úzus pro jména není zrovna optimální z hlediska třídění, ale nešť. Opavská implementace, je ve srovnání se všemi ostatními archívy nejpoužitelnější. Jinde kupř. evidentně nepochopili, že pokud si nemůže badatel ten sken stáhnout, aby s ním mohl dále pracovat, tak tím jenom komplikují další zpracování. Naštěstí mohu v takovém případě použít alespoň fintu se screenshotem (viz výše).

    Pracovat s PDF je utrpení a křeč. Oproti tomu jpeg umí zobrazit kde co. A taky mohu obrázek ořezat, či jinak upravit, aby neobsahoval to co není nutné. Pokud bych nutně toužil po textové vrstvě, tak raději sáhnu po DjVu, které mi umožňuje přidat nejenom vrstvu v originále, ale i překlad a to vše mít v mnohem menším souboru, se kterým se mnohem líp pracuje než s PDF. Bohužel jen velmi málo lidí v téhle zemi pochopilo, proč se PDF jmenuje PDF.
    Max avatar 9.1.2020 13:27 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: Hrátky s exif tagy - popáté
    Určitě zajímavý koníček, ale mně by to nebavilo a ani bych na to neměl skill (do nekonečna pročítat knihy, které bych neuměl ani přečíst, a to nemluvě ani o těch v jiných zemích).
    Všechna čest, já na to dlabu :D.
    Zdar Max
    Měl jsem sen ... :(
    vencour avatar 9.1.2020 15:20 vencour | skóre: 56 | blog: Tady je Vencourovo | Praha+západní Čechy
    Rozbalit Rozbalit vše Re: Hrátky s exif tagy - popáté
    Dík.
    Přidal jsem do výběru.
    Ty nejhlubší objevy nečekají nutně za příští hvězdou. Jsou uvnitř nás utkány do vláken, která nás spojují, nás všechny.
    9.1.2020 16:54 Semo | skóre: 45 | blog: Semo
    Rozbalit Rozbalit vše Re: Hrátky s exif tagy - popáté
    for i in $(ls -1 *.jpg) ; do    ----->    for i in *.jpg; do
    If you hold a Unix shell up to your ear, you can you hear the C.
    15.1.2020 01:48 hermitek | skóre: 2
    Rozbalit Rozbalit vše Re: Hrátky s exif tagy - popáté
    Internetová genealogie mě zrovna taky docela baví... ale řešit přepis informací (jen) pomocí exif tagů mi připadá dost nevhodné. Doporučuju nainstalovat si nějaký genealogický software (tzn. GRAMPS), chvíli času strávit nad tím, jak jej efektivně používat a potom se naučit všechny údaje správně citovat. Jeho možnosti relevantního vyhledávání a exportu do vhodných formátů jsou určitě lepší, než řešit vše přes tagy samotných obrázků.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.