abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 21:33 | Komunita

    Fedora 40 release party v Praze proběhne v pátek 17. května od 18:30 v prostorách společnosti Etnetera Core na adrese Jankovcova 1037/49, Praha 7. Součástí bude program kratších přednášek o novinkách ve Fedoře.

    Ladislav Hagara | Komentářů: 0
    dnes 21:11 | IT novinky

    Stack Overflow se dohodl s OpenAI o zpřístupnění obsahu Stack Overflow pro vylepšení OpenAI AI modelů.

    Ladislav Hagara | Komentářů: 0
    dnes 17:55 | Nová verze

    AlmaLinux byl vydán v nové stabilní verzi 9.4 (Mastodon, 𝕏). S kódovým názvem Seafoam Ocelot. Přehled novinek v příspěvku na blogu a v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    dnes 17:11 | IT novinky

    Před 50 lety, 5. května 1974 v žurnálu IEEE Transactions on Communications, Vint Cerf a Bob Kahn popsali protokol TCP (pdf).

    Ladislav Hagara | Komentářů: 0
    dnes 13:44 | Zajímavý článek

    Bylo vydáno do češtiny přeložené číslo 717 týdeníku WeeklyOSM přinášející zprávy ze světa OpenStreetMap.

    Ladislav Hagara | Komentářů: 0
    dnes 04:00 | Nová verze

    Byla vydána (Mastodon, 𝕏) nová stabilní verze 2.10.38 svobodné aplikace pro úpravu a vytváření rastrové grafiky GIMP (GNU Image Manipulation Program). Přehled novinek v oznámení o vydání a v souboru NEWS na GitLabu. Nový GIMP je již k dispozici také na Flathubu.

    Ladislav Hagara | Komentářů: 5
    dnes 00:22 | Komunita

    Google zveřejnil seznam 1220 projektů od 195 organizací (Debian, GNU, openSUSE, Linux Foundation, Haiku, Python, …) přijatých do letošního, již dvacátého, Google Summer of Code.

    Ladislav Hagara | Komentářů: 2
    včera 22:22 | IT novinky

    Na základě DMCA požadavku bylo na konci dubna z GitHubu odstraněno 8535 repozitářů se zdrojovými kódy open source emulátoru přenosné herní konzole Nintendo Switch yuzu.

    Ladislav Hagara | Komentářů: 7
    včera 00:33 | Nová verze

    Webový prohlížeč Dillo (Wikipedie) byl vydán ve verzi 3.1.0. Po devíti letech od vydání předchozí verze 3.0.5. Doména dillo.org již nepatří vývojářům Dilla.

    Ladislav Hagara | Komentářů: 0
    4.5. 15:00 | Komunita

    O víkendu probíhá v Bostonu, a také virtuálně, konference LibrePlanet 2024 organizovaná nadací Free Software Foundation (FSF).

    Ladislav Hagara | Komentářů: 0
    Podle hypotézy Mrtvý Internet mj. tvoří většinu online interakcí boti.
     (63%)
     (8%)
     (15%)
     (14%)
    Celkem 118 hlasů
     Komentářů: 8, poslední 4.5. 08:25
    Rozcestník

    Administrace komentářů

    Jste na stránce určené pro řešení chyb a problémů týkajících se diskusí a komentářů. Můžete zde našim administrátorům reportovat špatně zařazenou či duplicitní diskusi, vulgární či osočující příspěvek a podobně. Děkujeme vám za vaši pomoc, více očí více vidí, společně můžeme udržet vysokou kvalitu AbcLinuxu.cz.

    Příspěvek
    12.1.2020 23:16 O'o'yam
    Rozbalit Rozbalit vše Re: ako ukladať digitalizované dokumenty?
    Dokumenty o ktere nechcete prijit je nejlepsi ukladat ve formatech, na ktere budete mit ctecku i za nekolik desetileti. Predstavte si, ze dnes najdete nejake dokumenty v AmiPro, C602, nebo v T602 (a z te ten text nakonec dostanete) - co s nimi? Leda hledat na netu nejaky konvertor.

    Pokud se chcete chranit pouze proti tomu, ze za 10 az 40 let nebude jak dokumenty otevrit, muzete asi pouzit jpg, nebo pdf. V techto formatech je dnes tolik dokumentu, ze by ctecky nemely zmizet velmi dlouho. Databazi nedoporucuji. Pouzijte nejaky obycejny a jednoduchy a velmi rozsireny souborovy system a dejte je do adresaru.

    Obrazek zabaleny v pdf a to ulozene v databazi je uzasne reseni az do okamziku, kdy prohlizec pdf prestane podporovat 30 let starou verzi jpg, protoze tu uz preci nikdo nepouziva, nebo ulozena data z databaze nedokaze nacist verze o 15 novejsi.

    Disky jsou dneska levne. 4TB poridite za 5000, kdyz koupite nejlevnejsi WD a nejlevnejsi Seagate a date je do mirroru (stejne disky ze stejne serie casto odchazi ve stejnou dobu - na to take nechcete prijit tim tezsim zpusobem).

    Takze ja osobne bych scannoval do pnm (nebo do jineho uplne cisteho bitmapoveho formatu, ktery dokazete popsat z hlavy za 2 minuty a naimplementovat ctecku v libovolnem programovacim jazyce za nekolik malo hodin). Vubec bych je nekomprimoval a idealne bych plytval mistem jeste vic tak, ze bych si zvolil beznou sirku obrazku (napriklad na celou sirku scanneru) a v te bych mel co nejvic obrazku a ostatni v jejich celociselnych nasobcich. Strankovani vyreste ve jmene souboru, nebo za pomoci adresaru.

    Pokud si navic ulozite ta sama data v jpg, pdf, nebo dokonce v cistem textu (po pruchodu OCR - hodi se pro vyhledavani), rozhodne to neuskodi. Jen nemazte originaly.

    Textove dokumenty ukladejte v textu. V cistem textu. Tak, aby sly cist, kdyz je otevre vim, less, nebo cat. I kdyby cele IT preslo z ASCII na EBCDIC, tak nekde najdete, jak vypadalo ASCII, nebo to odhadnete, pokud si to nepamatujete z hlavy. Ale to se nestane - neni duvod to menit. V IT se dnes veci nemeni, ale rozsiruji. Diakritiku si domyslite, at uz bude kodovana jakkoliv, pokud budete mit ve stejnem kodovani dostatek textu. UTF-8 vypada, ze tu s nami vydrzi velmi dlouho, takze ho doporucuji pouzivat na vsechno.

    Mozna se ptate proc doporucuji tak primitivni pristup?

    Predstavte si, ze najdete 5 1/4" disketu z roku 1990 a na ni je napsano neco jako "dulezite dokumenty". Sezenete nekoho, kdo ma nekde v krabici starou disketovou mechaniku, vysajete z ni vysavacem centimetr prachu, pripojite k prehistorickemu pocitaci (nebo naimplementujete FDC na arduinu), zkusite to precist ... a co dal? Data tecou byte za bytem, ale vy nevite, co s nimi. FAT 32 to neni, FAT 16 to neni, FAT 12 jste v encyklopedii nenasli (nebo to je disketa treba z Commodora, pripadne se prvni stopu nepodarilo precist spravne). Na disku mate binarni obraz cehosi.

    Pokud v tom je cisty holy ASCII text, tak ho tam najdete snadno. Mate mozek a ten je na tenhle typ uloh staveny - staci tim proscrollovat v textovem editoru, nebo to vypsat na terminal. I pokud to bude rozhazene po cele diskete po jednotlivych sektorech, tak to pravdeporobne dokazete poskladat dohromady. Tak, aby navazovala slova, vety, vyznam, smysl.

    Obrazky v bitmapach budou horsi, ale pokud znate sirku, tak muzete cely dump diskety zarovnat na tu sisrku a zobrazit jako jeden hodne vysoky obrazek. A ten nechat velmi rychle scrollovat. Data budou vypadat jako sum, obrazek bude mozna rozbity, mozna posunuty, mozna se zprehazenymi barvami, ale vsimnete si ho. A pak dokazete najit, kde zacina, kde konci a jak patri barvy. Mate mozek, v nem zrakovovu kuru a ta je v tom fakt dobra. Dalo by se rici, ze je na to stavena.

    Cokoliv jineho najdete jen za pouziti nastroju napsanych se znalosti formatu dat, ktera hledate. Tedy - takovou znalost potrebujete i tady - z retezce nul a jednicek byste to asi nevykoukali. Ale jestli je bila 255 a cerna 0, nebo naopak je jedno, protoze obrazek uvidite v obou pripadech stejne, jako s prehazenymi barvami. A to, ze A je v ASCII 65 (41 hexa), a je 97 (61 hexa) 0 je 48 (30 hexa) a znaky jdou pekne za sebou - to si pamatuje dost lidi z hlavy. Kolik lidi zna z hlavy format komprimovaneho PNG?

    To, ze je dobre drzet filesystem s obrazky nefragmentovany vam asi doslo, ze? Skladat obrazek z kousku vekych 512B, nebo i 4096B bude na dlouho.

    V tomto formuláři můžete formulovat svou stížnost ohledně příspěvku. Nejprve vyberte typ akce, kterou navrhujete provést s diskusí či příspěvkem. Potom do textového pole napište důvody, proč by měli admini provést vaši žádost, problém nemusí být patrný na první pohled. Odkaz na příspěvek bude přidán automaticky.

    Vaše jméno
    Váš email
    Typ požadavku
    Slovní popis
    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.