abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 17:33 | Nová verze

    Canonical vydal (email, blog, YouTube) Ubuntu 24.04 LTS Noble Numbat. Přehled novinek v poznámkách k vydání a také příspěvcích na blogu: novinky v desktopu a novinky v bezpečnosti. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu MATE, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 10. LTS verzi.

    Ladislav Hagara | Komentářů: 3
    dnes 14:22 | Komunita

    Na YouTube je k dispozici videozáznam z včerejšího Czech Open Source Policy Forum 2024.

    Ladislav Hagara | Komentářů: 0
    dnes 13:22 | Nová verze

    Fossil (Wikipedie) byl vydán ve verzi 2.24. Jedná se o distribuovaný systém správy verzí propojený se správou chyb, wiki stránek a blogů s integrovaným webovým rozhraním. Vše běží z jednoho jediného spustitelného souboru a uloženo je v SQLite databázi.

    Ladislav Hagara | Komentářů: 0
    dnes 12:44 | Nová verze

    Byla vydána nová stabilní verze 6.7 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 124. Přehled novinek i s náhledy v příspěvku na blogu. Vypíchnout lze Spořič paměti (Memory Saver) automaticky hibernující karty, které nebyly nějakou dobu používány nebo vylepšené Odběry (Feed Reader).

    Ladislav Hagara | Komentářů: 0
    dnes 04:55 | Nová verze

    OpenJS Foundation, oficiální projekt konsorcia Linux Foundation, oznámila vydání verze 22 otevřeného multiplatformního prostředí pro vývoj a běh síťových aplikací napsaných v JavaScriptu Node.js (Wikipedie). V říjnu se verze 22 stane novou aktivní LTS verzí. Podpora je plánována do dubna 2027.

    Ladislav Hagara | Komentářů: 0
    dnes 04:22 | Nová verze

    Byla vydána verze 8.2 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a v informačním videu. Zdůrazněn je průvodce migrací hostů z VMware ESXi do Proxmoxu.

    Ladislav Hagara | Komentářů: 0
    dnes 04:11 | Nová verze

    R (Wikipedie), programovací jazyk a prostředí určené pro statistickou analýzu dat a jejich grafické zobrazení, bylo vydáno ve verzi 4.4.0. Její kódové jméno je Puppy Cup.

    Ladislav Hagara | Komentářů: 0
    včera 22:44 | IT novinky

    IBM kupuje společnost HashiCorp (Terraform, Packer, Vault, Boundary, Consul, Nomad, Waypoint, Vagrant, …) za 6,4 miliardy dolarů, tj. 35 dolarů za akcii.

    Ladislav Hagara | Komentářů: 12
    včera 15:55 | Nová verze

    Byl vydán TrueNAS SCALE 24.04 “Dragonfish”. Přehled novinek této open source storage platformy postavené na Debianu v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 13:44 | IT novinky

    Oznámeny byly nové Raspberry Pi Compute Module 4S. Vedle původní 1 GB varianty jsou nově k dispozici také varianty s 2 GB, 4 GB a 8 GB paměti. Compute Modules 4S mají na rozdíl od Compute Module 4 tvar a velikost Compute Module 3+ a předchozích. Lze tak provést snadný upgrade.

    Ladislav Hagara | Komentářů: 0
    KDE Plasma 6
     (73%)
     (9%)
     (2%)
     (17%)
    Celkem 762 hlasů
     Komentářů: 4, poslední 6.4. 15:51
    Rozcestník

    Dotaz: Detekce excel souboru pomocí file

    10.4.2009 09:41 luk407 | skóre: 6
    Detekce excel souboru pomocí file
    Přečteno: 648×

    Jak pomocí příkazu file (nebo třeba nějakého jiného) poznám excel soubor?

    Jde o to, že výstup file u excel (MS Office) souboru je pouze  "Microsoft Office Document", ale tím pak nerozliším WORD a EXCEL, což potřebuji.

    Možná bude stačit doplnit soubor /etc/magic, ale nevím jak.

    Odpovědi

    10.4.2009 12:32 bhy | skóre: 35 | blog: bhyblog | brno
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    no, nevím, jestli to někdo bude vědět z hlavy, doporučil bych prostudovat manuálovou stránku magic (man magic). snadné na rozlišení to asi nebude, protože by to už udělali:) (a viz též např. http://doc.nuxeo.org/5.1/books/nuxeo-book/html/mimetype.html)
    10.4.2009 12:54 Filip Jirsák | skóre: 68 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Ono to asi půjde dost těžko, protože formát souborů MS Office je stejný, liší se jenom vnitřek. Takže když příkaz file používá pro rozlišení souborů jen signaturu hlavičky, těžko je rozliší. A bude hůř, všechny nové kancelářské formáty jsou XML v ZIPu, a těch formátů, které jsou "něco v ZIPu", je čím dál víc...
    10.4.2009 16:02 NN
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

    Podle pripony?

    NN 

    10.4.2009 16:21 l4m4
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    To ovšem pak není detekce, ale bezmezná důvěřivost...
    10.4.2009 16:51 hysterix
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Nicmene vzhledem k tomu, z jakeho prostredi ten format pochazi, naprosto dostacujici.
    10.4.2009 17:18 l4m4
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Prostě to nesplňuje zadání.

    Co třeba takovéto situace: Omylem jsem skriptem zrušil koncovky u 250 ms-officových souborů a chci to napravit? Hloupý mail filtr filtruje soubory .xls a .doc, takže je při vkládání do mailu lidi přejmenovávají, a chtělo by je to automaticky zase pojmenovat správně.
    10.4.2009 21:53 hysterix
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    a) Pokud nejste nositelem mnoha identit vcetne LukasVebr, tak o splneni zadani nerozhodujete. Rozhodne to neodporuje puvodnim podminkam dotazu.

    b) Mam pro vas taky hadanku: co kdyz uzivatel nahradil kazdy osmy bajt logickym souctem sesteho a ctvrteho? No, co potom ? Ani to nemusite vkladat do mailu :)

    Pokud chcete resit prasarny uzivatele strojovym hadanim, co kde prepsat, jste odsouzen k naproste agonii. Co odesilatel poslal, to prijemce obdrzi. Zbytek at si dohodnou treba potrubni postou.

    P.S. pokud jste scriptem zrusil extenze 250 ms-officovych souboru a nemate zalohu, uvazujte o zmene profese.
    11.4.2009 11:55 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    To vaše "splňuje zadání" je jak z nějakého vtipu o IT :) Odpověď je správná, ale zcela k ničemu.

    Soubor:
    1) má soubor příponu .xls, tak je
      a) buď uživatel spokojen že "ví že to je Excel" a nepotřebuje nic zjišťovat
      b) má sále pochyby ale pak je mu detekce dle přípony nanic
    
    2) soubor příponu .xls nemá a pak je mu opět detekce dle přípony nanic
    11.4.2009 15:57 hysterix
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Mate skoro pravdu :) Nicmene se obavam, ze odpoved je "zcela k nicemu" hlavne proto, ze pozadovana funkcnost je "zcela k nicemu" :) Jedinym spolehlivym testem je otevreni v excelu a lidkse posouzeni, zda "je to ono". Dokud vyrobce nevyda testovaci nastroj nebo nezdokumentuje formaty. Ja osobne bych opravdu nikdy nenechal stroj prohlasit excelovsky soubor bez extenze za excelovksy prave proto, ze prichazi ze sveta, kde extenze je povazovana za stejne dulezity atribut souboru jako jeho obsah.

    Ale vzato prisne logicky - at se vyjadri puvodni tazatel. Z jeho dotazu nevyplyva, zda detekce ms office souboru s extenzi .xls je dostacujici ci ne. Pokud opravdu ma soubory bez extenze a potrebuje z obsahu zjistit, zda spise excel, word, powerpoint, project, visio, ci jiny obskurni officovsky format, tak bych mu rozhodne doporucoval vydavat pripadne strojove rozhodnuti spise za doporuceni nez za verdikt.

    Ja bych osobne odmitl jit do strojovych predelavek souboru na zaklade detekce obsahu. Pokud to nema extenzi xls, neni to urceno pro otevirani excelem. Tecka. Neco tak nespolehliveho jako tahle pozadovana detekce pri existenci 10+ ruznych nezdokumentovanych formatu souboru jen pro excel by vedla hlavne ke vzniku trecich ploch. Az MS vyda SP18 pro Office 2008 pro Mac pozmenujici format, zacnou bit mne, misto aby bili magora, ktery posila soubory bez extenze.
    11.4.2009 16:36 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Mně hlavně NN připadá jak nějaký srandista, co čas od času jen posílá Naprosto Nesmyslné, případně Naprosto Nesouvisející nebo Naprosto Neužitečné posty. Nemohu si pomoct, ale většinou je to prostě nějaká blbost jak z jiného světa a ještě je vozNačkovaNá :(
    11.4.2009 18:06 JF | skóre: 23
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

    K tomu slouzi tlacitko Admin a napsat svoji stiznost tam:

    V tomto formuláři můžete formulovat svou stížnost ohledně příspěvku. Nejprve vyberte typ akce, kterou navrhujete provést s diskusí či příspěvkem. Potom do textového pole napište důvody, proč by měli admini provést vaši žádost, problém nemusí být patrný na první pohled. Odkaz na příspěvek bude přidán automaticky.

    • Offtopic diskuse použijte pro diskusi mimo záběr našeho portálu (včelařství, windows), která by měla být smazána.

     

    Mimochodem, myslim, ze jsem na konci teto diskuse napsal reseni, ktere 100% detekuje typ souboru.

    11.4.2009 19:24 hysterix
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Vasi jistotu vam zavidim. Kdyz uz, pouzil bych spise kombinace strings -e, protoze (pokud se nepletu) MSO2007 uz to ma jinak. Jistotu ale nebudete mit az do otevreni souboru clovekem.
    11.4.2009 20:34 l4m4
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Officové dokumenty se neřídí kvantovou mechanikou, takže při otevření dokumentu člověkem neprobíhá projekce na jeden ze stavů word/excel. Toto rozlišení existuje objektivně a office ho dokáže rozpoznat. A v tom případě ho dokáže rozpoznat i jiný program, i když to nemusí být jednoduché.

    Takže jaké otevření člověkem?

    Nebo snad člověk osobně interpretuje tu binární změť?

    Snažíš se mě trumfnout v nekonstruktivnosti příspěvků?
    12.4.2009 12:26 bhy | skóre: 35 | blog: bhyblog | brno
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    pravá otázka zní: jsou l4m4 a hysterix jedna a tatáž osoba?:)
    12.4.2009 20:00 l4m4
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Kdyby se ovšem officové dokumenty řídily kvantovou mechanikou, získali bychom zajímavé možnosti...

    Dokument je v nějakém stavu |d〉

    |d〉= a|w〉 + b|e〉

    kde a a b jsou komplexní čísla splňující

    aa* + bb* = 1

    a stavy |w〉 a |e〉 jsou bázové stavy dokumentu odpovídající Wordu a Excelu. Operátor příslušný pozorovatelé typ dokumentu pak napíšeme snadno:

    Ô = w|w〉〈w| + e|e〉〈e|

    Je evidentní, že vskutku

    Ô|w〉 = w|w〉,   Ô|e〉 = e|e〉

    kde w a e jsou vlastní hodnoty Ô, tedy Word a Excel.

    Otevření dokumentu v Officech provede měření O, tedy projekci na některý vlastní stav Ô, s pravděpodobnostmi po řadě aa* a bb*.

    To není tak zajímavé: jak predikuje hysterix, po otevření máme s jistotou Word či Excel.

    Nyní ovšem uvažme, že můžeme sestrojit jiné bázové stavy dokumentu takto (konstrukci je možno zevšeobecnit, takže funguje např. i po přidání PowerPointu, ale nezabíhejme zde do representací konečných grup):

    |s〉 = (|w〉 + |e〉)/√2,   |a〉 = (|w〉 - |e〉)/√2

    Napíšeme-li program, kterým uživatel měří namísto Ô pozorovatelnou

    Ŷ = s|s〉〈s| + a|a〉〈a|

    bude dokument po otevření v tomto programu buď ve stavu |s〉, nebo |a〉. To znamená, že při následném otevření v Officech dostaneme náhodně Word nebo Excel, každý s pravděpodobností

    (1/√2)² = ½

    Zde jsme ovšem předpokládali, že dokumenty jsou koherentní a nacházejí se v čistých stavech. Jde-li naproti tomu o nekoherentní blábol smatlaný nějakým prasetem, nachází se patrně ve stavu špinavém (smíšeném), což terorii poněkud komplikuje.
    12.4.2009 22:28 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Takže jsme žádné zajímavé možnosti nezískali a jsme tam kde jsme byli -- máme buď Word nebo Excel dokument.
    12.4.2009 22:42 l4m4
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Jen když ho uživatel otevře v officech.
    13.4.2009 01:17 hysterix
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

    Richard Feynman: V jednom údobí noviny psávaly, že teorii relativity rozumí jen dvanáct lidí. Nevěřím, že takový okamžik kdy nastal. Možná byla doba, kdy relativitě rozuměl jen jeden člověk, totiž ten jeden muž, kterého napadla, dříve než o ní napsal článek. Ale hned jak článek vydal, mnoho lidí teorii tak či onak pochopilo a jistě jich bylo více než dvanáct. Z druhé strany lze, myslím, celkem bezpečně říct, že kvantové mechanice nerozumí nikdo.

    13.4.2009 08:05 Ash | skóre: 53
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    "Když ho uživatel otevře v officech", nebo "jen když"?

    Jinak tedy dobré jak jste se od "Jak pomocí příkazu file (nebo třeba nějakého jiného) poznám excel soubor?" dostali k "Jak poznám že je Schrödingerova kočka mrtvá" :)
    13.4.2009 11:39 l4m4
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Podle toho, zda Ô komutuje s Hamiltoniánem. Pokud ne, tak jen když, případně tedy může i po otevření v programu, kterému odpovídá pozorovatelná komutující s Ô (nebo náhodou i jindy, ovšem s nulovou pravděpodobností). Pokud ano, tak může dokument po otevření v officech ve stavu Word a Excel vydržet, jak dlouho je libo.
    11.4.2009 12:08 l4m4
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    a) Odporuje to zadání, jelikož tazatel evidentně a několikrát zmiňuje detektci typu souboru podle obsahu. Jestli to tam nevidíš, asi ti není pomoci. Navíc analýza obsahuje je to jediné, co vůbec odpovídá pojmu detekce. Podívat se na koncovku není žádná detekce, to je možná tak způsob, jak zblbnout uživatele MS Windows ke spuštění nějakého trojana.

    b) Jak to souvisí s problémem?

    c) Irelevantní. Dotaz byl, jak lze rozlišit jednotlivé typy officových souborů podle obsahu.

    d) Irelevantní. Dotaz byl, jak lze rozlišit jednotlivé typy officových souborů podle obsahu.
    11.4.2009 16:00 hysterix
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Slovo irelevantni jste si ve slovniku dohledal zrejme az ted, jinak by vas aspon neco trklo v souvislosti s vasim prvnim postem v tomhle vlaknu.
    11.4.2009 18:44 l4m4
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Vždycky mě pobaví lidi, kteří začnou po dlouhé tangenciální diskusi, do níž sami přispěli hojnou měrou, někoho obviňovat z irelevance jeho příspěvků.

    Píšu-li irelevantní věci, tak na to neregaguj, ne. A když reaguješ, tak se v tom vezeš taky.
    10.4.2009 19:17 marbu | skóre: 31 | blog: hromada | Brno
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
    Zajímavé, mi to na nějakých starších souborech funguje (jiné nemám):
    $ file nejaky_excel_soubor
    nejaky_excel_soubor: CDF V2 Document, Little Endian, Os: Windows, Version 4.0, Code page: 1250, Author: Martin, Last Saved By: Martin, Name of Creating Application: Microsoft Excel, Create Time/Date: Wed Oct 12 17:57:22 2005, Security: 0

    Ale pokud to vyzkouším na souborech, co lezou z openoffice, tak už to excel nepozná. Možná by bylo zajímavé podívat se, jestli by na tuhle detekci nešla zneužít nějaká knihovna pro práci s formátem excelu, pokud další pokusy s magií kolem file selžou.
    There is no point in being so cool in a cold world.
    11.4.2009 15:14 JF | skóre: 23
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

    Stahni si tohle.

    www.penguin.cz/~fojtik/cole/cole.htm

    XLS je OLE archiv. Původně to dělal Jehovista Arturo Tena a asi se musel věnovat jiné činnosti.

    Je v tom exampl, který vylistuje vnitřek OLE archivu. A ty pak muzes vystup listu prohrabat sed em. Podle toho poznas, jaky dokument to je.

     

    int main(int argc, char ** argv)
    {
    COLEFS *OleFS;
    COLEDIR *Dir;
    COLERRNO colerrno;

      printf("<<<Test1>>> - display whole directory structure of ole archive\n");
      if(argc<=1)
             {
             printf("No args\nUssage: test1 filename");
             return;
             }
            
      printf("Opening OLE archive %s:\n",argv[1]);
      OleFS = cole_mount(argv[1], &colerrno);
      if(OleFS==NULL)
          {
          printf("Cannot mount OLE archive '%s'!\n",cole_error_str(colerrno));
          return;
          }

      Dir=cole_opendir_rootdir(OleFS,NULL);
      if(Dir)
          {
          cole_fprint_tree(Dir, stdout);
          cole_closedir(Dir,NULL);
          }

      if(OleFS) cole_umount(OleFS,NULL);
      return(0);
    }

    11.4.2009 15:24 JF | skóre: 23
    Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

    Jde to snadno sedem staci hledat  "Workbook" a "WorkDocument":

    test1 VZP2007verze2.xls
    <<<Test1>>> - display whole directory structure of ole archive
    Opening OLE archive VZP2007verze2.xls:
    FILE    4096 00000000-00000000 00000000-00000000 '\x05SummaryInformation'
    FILE   14524 00000000-00000000 00000000-00000000 '\x05DocumentSummaryInformation'
    FILE  187847 00000000-00000000 00000000-00000000 'Workbook'


    test1 "Ceník lino 08 maloodb.doc"
    <<<Test1>>> - display whole directory structure of ole archive
    Opening OLE archive Ceník lino 08 maloodb.doc:
    FILE   22067 00000000-00000000 00000000-00000000 'WordDocument'
    FILE    4096 00000000-00000000 00000000-00000000 '\x05DocumentSummaryInformation'
    FILE    4096 00000000-00000000 00000000-00000000 '\x05SummaryInformation'
    FILE   14255 00000000-00000000 00000000-00000000 '1Table'
    FILE     106 00000000-00000000 00000000-00000000 '\x01CompObj'
    FILE   25890 00000000-00000000 00000000-00000000 'Data'

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.