abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
dnes 13:30 | Zajímavý software

Byly uvolněny zdrojové kódy známé rogue-like hry DoomRL. Počátky hry jsou v roce 2002. Je napsána ve FreePascalu a zdrojový kód je nyní k dispozici na GitHubu pod licencí GNU GPL 2.0. Autor pracuje na nové hře Jupiter Hell, která je moderním nástupcem DoomRL a na jejíž vývoj shání peníze prostřednictvím Kickstarteru.

Blaazen | Komentářů: 0
dnes 13:15 | Pozvánky

Přijďte s námi oslavit vydání Fedory 25. Na programu budou přednášky o novinkách, diskuse, neřízený networking atd. Release Party se bude konat 16. prosince v prostorách společnosti Etnetera. Na party budou volně k dispozici také propagační materiály, nová DVD s Fedorou 25 a samozřejmě občerstvení. Přednášky budou probíhat v češtině. Pro více informací se můžete podívat na web MojeFedora.cz. Jen připomínám, že tentokrát jsme zavedli

… více »
frantisekz | Komentářů: 0
včera 16:38 | Komunita

Byly zveřejněny videozáznamy přednášek a workshopů z letošní konference OpenAlt konané 5. a 6. listopadu v Brně. K videozáznamům lze přistupovat ze stránky na SuperLectures nebo přes program konference, detaily o vybrané přednášce nebo workshopu a dále kliknutím na ikonku filmového pásu. Celkově bylo zpracováno 65 hodin z 89 přednášek a workshopů.

Ladislav Hagara | Komentářů: 0
včera 11:30 | Komunita

Bylo oznámeno, že bude proveden bezpečnostní audit zdrojových kódů open source softwaru pro implementaci virtuálních privátních sítí OpenVPN. Audit provede Matthew D. Green (blog), uznávaný kryptolog a profesor na Univerzitě Johnse Hopkinse. Auditována bude verze 2.4 (aktuálně RC 1, stabilní verze je 2.3.14). Audit bude financován společností Private Internet Access [reddit].

Ladislav Hagara | Komentářů: 4
včera 06:00 | Komunita

Na YouTube byl publikován Blender Institute Reel 2016, ani ne dvouminutový sestřih z filmů, které vznikly za posledních 10 let díky Blender Institutu. V institutu aktuálně pracují na novém filmu Agent 327. Dění kolem filmu lze sledovat na Blender Cloudu. Videoukázka Agenta 327 z června letošního roku na YouTube.

Ladislav Hagara | Komentářů: 0
včera 01:02 | Zajímavý článek

Minulý týden byly vydány verze 1.2.3 a 1.1.7 webového poštovního klienta Roundcube. V oznámení o vydání bylo zmíněno řešení bezpečnostního problému nalezeného společností RIPS a souvisejícího s voláním funkce mail() v PHP. Tento týden byly zveřejněny podrobnosti. Útočník mohl pomocí speciálně připraveného emailu spustit na serveru libovolný příkaz. Stejně, jak je popsáno v článku Exploit PHP’s mail() to get remote code execution z roku 2014.

Ladislav Hagara | Komentářů: 1
8.12. 16:00 | Nová verze

Byla vydána verze 0.98 svobodného nelineárního video editoru Pitivi. Z novinek lze zmínit například přizpůsobitelné klávesové zkratky. Videoukázka práce s nejnovější verzí Pitivi na YouTube.

Ladislav Hagara | Komentářů: 1
8.12. 15:00 | Zajímavý software

Stop motion je technika animace, při níž je reálný objekt mezi jednotlivými snímky ručně upravován a posouván o malé úseky, tak aby po spojení vyvolala animace dojem spojitosti. Jaký software lze pro stop motion použít na Linuxu? Článek na OMG! Ubuntu! představuje Heron Animation. Ten bohužel podporuje pouze webové kamery. Podpora digitálních zrcadlovek je začleněna například v programu qStopMotion.

Ladislav Hagara | Komentářů: 5
7.12. 21:21 | Nová verze Ladislav Hagara | Komentářů: 0
7.12. 11:44 | Zajímavý projekt

Na Indiegogo byla spuštěna kampaň na podporu herní mini konzole a multimediálního centra RetroEngine Sigma od Doyodo. Předobjednat ji lze již od 49 dolarů. Požadovaná částka 20 000 dolarů byla překonána již 6 krát. Majitelé mini konzole si budou moci zahrát hry pro Atari VCS 2600, Sega Genesis nebo NES. Předinstalováno bude multimediální centrum Kodi.

Ladislav Hagara | Komentářů: 2
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (7%)
 (5%)
 (3%)
Celkem 808 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: Detekce excel souboru pomocí file

10.4.2009 09:41 luk407 | skóre: 6
Detekce excel souboru pomocí file
Přečteno: 608×

Jak pomocí příkazu file (nebo třeba nějakého jiného) poznám excel soubor?

Jde o to, že výstup file u excel (MS Office) souboru je pouze  "Microsoft Office Document", ale tím pak nerozliším WORD a EXCEL, což potřebuji.

Možná bude stačit doplnit soubor /etc/magic, ale nevím jak.

Odpovědi

10.4.2009 12:32 bhy | skóre: 35 | blog: bhyblog | brno
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
no, nevím, jestli to někdo bude vědět z hlavy, doporučil bych prostudovat manuálovou stránku magic (man magic). snadné na rozlišení to asi nebude, protože by to už udělali:) (a viz též např. http://doc.nuxeo.org/5.1/books/nuxeo-book/html/mimetype.html)
10.4.2009 12:54 Filip Jirsák | skóre: 66 | blog: Fa & Bi
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Ono to asi půjde dost těžko, protože formát souborů MS Office je stejný, liší se jenom vnitřek. Takže když příkaz file používá pro rozlišení souborů jen signaturu hlavičky, těžko je rozliší. A bude hůř, všechny nové kancelářské formáty jsou XML v ZIPu, a těch formátů, které jsou "něco v ZIPu", je čím dál víc...
10.4.2009 16:02 NN
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

Podle pripony?

NN 

10.4.2009 16:21 l4m4
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
To ovšem pak není detekce, ale bezmezná důvěřivost...
10.4.2009 16:51 hysterix
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Nicmene vzhledem k tomu, z jakeho prostredi ten format pochazi, naprosto dostacujici.
10.4.2009 17:18 l4m4
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Prostě to nesplňuje zadání.

Co třeba takovéto situace: Omylem jsem skriptem zrušil koncovky u 250 ms-officových souborů a chci to napravit? Hloupý mail filtr filtruje soubory .xls a .doc, takže je při vkládání do mailu lidi přejmenovávají, a chtělo by je to automaticky zase pojmenovat správně.
10.4.2009 21:53 hysterix
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
a) Pokud nejste nositelem mnoha identit vcetne LukasVebr, tak o splneni zadani nerozhodujete. Rozhodne to neodporuje puvodnim podminkam dotazu.

b) Mam pro vas taky hadanku: co kdyz uzivatel nahradil kazdy osmy bajt logickym souctem sesteho a ctvrteho? No, co potom ? Ani to nemusite vkladat do mailu :)

Pokud chcete resit prasarny uzivatele strojovym hadanim, co kde prepsat, jste odsouzen k naproste agonii. Co odesilatel poslal, to prijemce obdrzi. Zbytek at si dohodnou treba potrubni postou.

P.S. pokud jste scriptem zrusil extenze 250 ms-officovych souboru a nemate zalohu, uvazujte o zmene profese.
11.4.2009 11:55 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
To vaše "splňuje zadání" je jak z nějakého vtipu o IT :) Odpověď je správná, ale zcela k ničemu.

Soubor:
1) má soubor příponu .xls, tak je
  a) buď uživatel spokojen že "ví že to je Excel" a nepotřebuje nic zjišťovat
  b) má sále pochyby ale pak je mu detekce dle přípony nanic

2) soubor příponu .xls nemá a pak je mu opět detekce dle přípony nanic
11.4.2009 15:57 hysterix
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Mate skoro pravdu :) Nicmene se obavam, ze odpoved je "zcela k nicemu" hlavne proto, ze pozadovana funkcnost je "zcela k nicemu" :) Jedinym spolehlivym testem je otevreni v excelu a lidkse posouzeni, zda "je to ono". Dokud vyrobce nevyda testovaci nastroj nebo nezdokumentuje formaty. Ja osobne bych opravdu nikdy nenechal stroj prohlasit excelovsky soubor bez extenze za excelovksy prave proto, ze prichazi ze sveta, kde extenze je povazovana za stejne dulezity atribut souboru jako jeho obsah.

Ale vzato prisne logicky - at se vyjadri puvodni tazatel. Z jeho dotazu nevyplyva, zda detekce ms office souboru s extenzi .xls je dostacujici ci ne. Pokud opravdu ma soubory bez extenze a potrebuje z obsahu zjistit, zda spise excel, word, powerpoint, project, visio, ci jiny obskurni officovsky format, tak bych mu rozhodne doporucoval vydavat pripadne strojove rozhodnuti spise za doporuceni nez za verdikt.

Ja bych osobne odmitl jit do strojovych predelavek souboru na zaklade detekce obsahu. Pokud to nema extenzi xls, neni to urceno pro otevirani excelem. Tecka. Neco tak nespolehliveho jako tahle pozadovana detekce pri existenci 10+ ruznych nezdokumentovanych formatu souboru jen pro excel by vedla hlavne ke vzniku trecich ploch. Az MS vyda SP18 pro Office 2008 pro Mac pozmenujici format, zacnou bit mne, misto aby bili magora, ktery posila soubory bez extenze.
11.4.2009 16:36 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Mně hlavně NN připadá jak nějaký srandista, co čas od času jen posílá Naprosto Nesmyslné, případně Naprosto Nesouvisející nebo Naprosto Neužitečné posty. Nemohu si pomoct, ale většinou je to prostě nějaká blbost jak z jiného světa a ještě je vozNačkovaNá :(
11.4.2009 18:06 JF | skóre: 23
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

K tomu slouzi tlacitko Admin a napsat svoji stiznost tam:

V tomto formuláři můžete formulovat svou stížnost ohledně příspěvku. Nejprve vyberte typ akce, kterou navrhujete provést s diskusí či příspěvkem. Potom do textového pole napište důvody, proč by měli admini provést vaši žádost, problém nemusí být patrný na první pohled. Odkaz na příspěvek bude přidán automaticky.

  • Offtopic diskuse použijte pro diskusi mimo záběr našeho portálu (včelařství, windows), která by měla být smazána.

 

Mimochodem, myslim, ze jsem na konci teto diskuse napsal reseni, ktere 100% detekuje typ souboru.

11.4.2009 19:24 hysterix
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Vasi jistotu vam zavidim. Kdyz uz, pouzil bych spise kombinace strings -e, protoze (pokud se nepletu) MSO2007 uz to ma jinak. Jistotu ale nebudete mit az do otevreni souboru clovekem.
11.4.2009 20:34 l4m4
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Officové dokumenty se neřídí kvantovou mechanikou, takže při otevření dokumentu člověkem neprobíhá projekce na jeden ze stavů word/excel. Toto rozlišení existuje objektivně a office ho dokáže rozpoznat. A v tom případě ho dokáže rozpoznat i jiný program, i když to nemusí být jednoduché.

Takže jaké otevření člověkem?

Nebo snad člověk osobně interpretuje tu binární změť?

Snažíš se mě trumfnout v nekonstruktivnosti příspěvků?
12.4.2009 12:26 bhy | skóre: 35 | blog: bhyblog | brno
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
pravá otázka zní: jsou l4m4 a hysterix jedna a tatáž osoba?:)
12.4.2009 20:00 l4m4
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Kdyby se ovšem officové dokumenty řídily kvantovou mechanikou, získali bychom zajímavé možnosti...

Dokument je v nějakém stavu |d〉

|d〉= a|w〉 + b|e〉

kde a a b jsou komplexní čísla splňující

aa* + bb* = 1

a stavy |w〉 a |e〉 jsou bázové stavy dokumentu odpovídající Wordu a Excelu. Operátor příslušný pozorovatelé typ dokumentu pak napíšeme snadno:

Ô = w|w〉〈w| + e|e〉〈e|

Je evidentní, že vskutku

Ô|w〉 = w|w〉,   Ô|e〉 = e|e〉

kde w a e jsou vlastní hodnoty Ô, tedy Word a Excel.

Otevření dokumentu v Officech provede měření O, tedy projekci na některý vlastní stav Ô, s pravděpodobnostmi po řadě aa* a bb*.

To není tak zajímavé: jak predikuje hysterix, po otevření máme s jistotou Word či Excel.

Nyní ovšem uvažme, že můžeme sestrojit jiné bázové stavy dokumentu takto (konstrukci je možno zevšeobecnit, takže funguje např. i po přidání PowerPointu, ale nezabíhejme zde do representací konečných grup):

|s〉 = (|w〉 + |e〉)/√2,   |a〉 = (|w〉 - |e〉)/√2

Napíšeme-li program, kterým uživatel měří namísto Ô pozorovatelnou

Ŷ = s|s〉〈s| + a|a〉〈a|

bude dokument po otevření v tomto programu buď ve stavu |s〉, nebo |a〉. To znamená, že při následném otevření v Officech dostaneme náhodně Word nebo Excel, každý s pravděpodobností

(1/√2)² = ½

Zde jsme ovšem předpokládali, že dokumenty jsou koherentní a nacházejí se v čistých stavech. Jde-li naproti tomu o nekoherentní blábol smatlaný nějakým prasetem, nachází se patrně ve stavu špinavém (smíšeném), což terorii poněkud komplikuje.
12.4.2009 22:28 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Takže jsme žádné zajímavé možnosti nezískali a jsme tam kde jsme byli -- máme buď Word nebo Excel dokument.
12.4.2009 22:42 l4m4
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Jen když ho uživatel otevře v officech.
13.4.2009 01:17 hysterix
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

Richard Feynman: V jednom údobí noviny psávaly, že teorii relativity rozumí jen dvanáct lidí. Nevěřím, že takový okamžik kdy nastal. Možná byla doba, kdy relativitě rozuměl jen jeden člověk, totiž ten jeden muž, kterého napadla, dříve než o ní napsal článek. Ale hned jak článek vydal, mnoho lidí teorii tak či onak pochopilo a jistě jich bylo více než dvanáct. Z druhé strany lze, myslím, celkem bezpečně říct, že kvantové mechanice nerozumí nikdo.

13.4.2009 08:05 Ash | skóre: 53
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
"Když ho uživatel otevře v officech", nebo "jen když"?

Jinak tedy dobré jak jste se od "Jak pomocí příkazu file (nebo třeba nějakého jiného) poznám excel soubor?" dostali k "Jak poznám že je Schrödingerova kočka mrtvá" :)
13.4.2009 11:39 l4m4
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Podle toho, zda Ô komutuje s Hamiltoniánem. Pokud ne, tak jen když, případně tedy může i po otevření v programu, kterému odpovídá pozorovatelná komutující s Ô (nebo náhodou i jindy, ovšem s nulovou pravděpodobností). Pokud ano, tak může dokument po otevření v officech ve stavu Word a Excel vydržet, jak dlouho je libo.
11.4.2009 12:08 l4m4
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
a) Odporuje to zadání, jelikož tazatel evidentně a několikrát zmiňuje detektci typu souboru podle obsahu. Jestli to tam nevidíš, asi ti není pomoci. Navíc analýza obsahuje je to jediné, co vůbec odpovídá pojmu detekce. Podívat se na koncovku není žádná detekce, to je možná tak způsob, jak zblbnout uživatele MS Windows ke spuštění nějakého trojana.

b) Jak to souvisí s problémem?

c) Irelevantní. Dotaz byl, jak lze rozlišit jednotlivé typy officových souborů podle obsahu.

d) Irelevantní. Dotaz byl, jak lze rozlišit jednotlivé typy officových souborů podle obsahu.
11.4.2009 16:00 hysterix
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Slovo irelevantni jste si ve slovniku dohledal zrejme az ted, jinak by vas aspon neco trklo v souvislosti s vasim prvnim postem v tomhle vlaknu.
11.4.2009 18:44 l4m4
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Vždycky mě pobaví lidi, kteří začnou po dlouhé tangenciální diskusi, do níž sami přispěli hojnou měrou, někoho obviňovat z irelevance jeho příspěvků.

Píšu-li irelevantní věci, tak na to neregaguj, ne. A když reaguješ, tak se v tom vezeš taky.
10.4.2009 19:17 marbu | skóre: 28 | blog: hromada | Brno
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file
Zajímavé, mi to na nějakých starších souborech funguje (jiné nemám):
$ file nejaky_excel_soubor
nejaky_excel_soubor: CDF V2 Document, Little Endian, Os: Windows, Version 4.0, Code page: 1250, Author: Martin, Last Saved By: Martin, Name of Creating Application: Microsoft Excel, Create Time/Date: Wed Oct 12 17:57:22 2005, Security: 0

Ale pokud to vyzkouším na souborech, co lezou z openoffice, tak už to excel nepozná. Možná by bylo zajímavé podívat se, jestli by na tuhle detekci nešla zneužít nějaká knihovna pro práci s formátem excelu, pokud další pokusy s magií kolem file selžou.
I think warning here is a bug. The biggest cloud service provider. There is no point in being so cool in a cold world.
11.4.2009 15:14 JF | skóre: 23
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

Stahni si tohle.

www.penguin.cz/~fojtik/cole/cole.htm

XLS je OLE archiv. Původně to dělal Jehovista Arturo Tena a asi se musel věnovat jiné činnosti.

Je v tom exampl, který vylistuje vnitřek OLE archivu. A ty pak muzes vystup listu prohrabat sed em. Podle toho poznas, jaky dokument to je.

 

int main(int argc, char ** argv)
{
COLEFS *OleFS;
COLEDIR *Dir;
COLERRNO colerrno;

  printf("<<<Test1>>> - display whole directory structure of ole archive\n");
  if(argc<=1)
         {
         printf("No args\nUssage: test1 filename");
         return;
         }
        
  printf("Opening OLE archive %s:\n",argv[1]);
  OleFS = cole_mount(argv[1], &colerrno);
  if(OleFS==NULL)
      {
      printf("Cannot mount OLE archive '%s'!\n",cole_error_str(colerrno));
      return;
      }

  Dir=cole_opendir_rootdir(OleFS,NULL);
  if(Dir)
      {
      cole_fprint_tree(Dir, stdout);
      cole_closedir(Dir,NULL);
      }

  if(OleFS) cole_umount(OleFS,NULL);
  return(0);
}

11.4.2009 15:24 JF | skóre: 23
Rozbalit Rozbalit vše Re: Detekce excel souboru pomocí file

Jde to snadno sedem staci hledat  "Workbook" a "WorkDocument":

test1 VZP2007verze2.xls
<<<Test1>>> - display whole directory structure of ole archive
Opening OLE archive VZP2007verze2.xls:
FILE    4096 00000000-00000000 00000000-00000000 '\x05SummaryInformation'
FILE   14524 00000000-00000000 00000000-00000000 '\x05DocumentSummaryInformation'
FILE  187847 00000000-00000000 00000000-00000000 'Workbook'


test1 "Ceník lino 08 maloodb.doc"
<<<Test1>>> - display whole directory structure of ole archive
Opening OLE archive Ceník lino 08 maloodb.doc:
FILE   22067 00000000-00000000 00000000-00000000 'WordDocument'
FILE    4096 00000000-00000000 00000000-00000000 '\x05DocumentSummaryInformation'
FILE    4096 00000000-00000000 00000000-00000000 '\x05SummaryInformation'
FILE   14255 00000000-00000000 00000000-00000000 '1Table'
FILE     106 00000000-00000000 00000000-00000000 '\x01CompObj'
FILE   25890 00000000-00000000 00000000-00000000 'Data'

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.