Portál AbcLinuxu, 10. května 2025 13:22

Dotaz: obrovský textový soubor - rozdělit bez otvírání

28.8.2011 16:14 Rum
obrovský textový soubor - rozdělit bez otvírání
Přečteno: 1132×
Odpovědět | Admin
Zdravím a prosím o tip na řešení následujícího problému.

Mám obrovský textový soubor o velikosti 3,3 GB. Jedná se o inbox z thunderbirdu. Tento soubor se v TB přestal zobrazovat, patrně právě z důvodu velikosti. Osvědčené postupy selhaly a tak hledám náhradní způsob. Napadlo mně ten soubor natvrdo rozdělit na třeba 5 menších souborů. Nehledím na to, že pravděpodobně příjdu o maily, které budou v místě zlomu (případně je spojím). Jde taková operace provést, aniž bych ten texťák otevíral? Otevřít se mi jej totiž v ničem nepovedlo (včetně vi) a největší naděje vkládám v nějaký linuxový nástroj, ale moc zběhlý v tom nejsem.

Abychom se tady zbytečně nezabývali tím, že schránku v TB je potřeba udržovat, podotýkám, že ten inbox není můj, jsem jen hasič požáru...

Díky

Řešení dotazu:


Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

Řešení 1× (Rum (tazatel))
Ondroid avatar 28.8.2011 16:16 Ondroid | skóre: 32 | blog: Hombre
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Odpovědět | | Sbalit | Link | Blokovat | Admin
split
28.8.2011 17:15 Ladislav Hagara | skóre: 105 | blog: Ride the Raven
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Odpovědět | | Sbalit | Link | Blokovat | Admin
Rozdělit lze samozřejmě pomocí příkazu split. Co ale zkusit v Thunderbirdu provést údržbu složek? Zkusit vyexportovat do něčeho jiného?
28.8.2011 20:39 Rum
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
...no, jak píšu na začátku, osvědčené postupy selhaly. V každém případě split vyzkouším, díky za tip.
28.8.2011 23:08 Rum
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
...hmm, tak sice vím, jak rozdělit soubor, ale TB je stejně nenačte :-( Nemá někdo nápad, co s tím? Mám teď 7 500MB souboru, o kterých TB tvrdí, že v nich není nic, Opravu jsem zkoušel, exporty importy taky...
28.8.2011 23:22 Kit
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Nevím to jistě, ale mám takové tušení, že by ten soubor mohl mít strukturu databáze SQLite nebo jakékoli jiné. V tom případě je jakékoli řezání nesmyslné a je potřeba ji otevřít tím správným nástrojem.

Co o tom souboru tvrdí utilita file?
Jendа avatar 28.8.2011 23:27 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Můj Thunderbird to má jako obří texťák, kde je jedna zpráva za druhou + jakýsi index .msf, což je prý exported SGML document text.
28.8.2011 23:45 Kit
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Jestli je to obří texťák, mohl by být ve formátu mbox. S tím by si mohl poradit třeba poštovní klient Mutt.
29.8.2011 09:53 Rum
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Příkaz file vypíše jen "data"

S tím Muttem nevím, jestli si poradím, ale zkusím to, nic jinéhop v tuto chvíli nevypadá aspoň trochu nadějně...
29.8.2011 14:36 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
I obyčejný less zvládne otevřít mnohagigový texťák (samozřejmě jen k prohlížení), pokud nechce člověk skákat na konec. Není problém se podívat, co ty soubory obsahují. Můžeš sem pak postnout ukázky a lze to řešit dál.

Pokud jsou to mboxy, data máš OK, dá se s tím pak pracovat dát.
29.8.2011 14:38 dustin | skóre: 63 | blog: dustin
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Jinak i vim je OK, pokud nemá texťák hodně dlouhé řádky (desítky MB) a když si dopředu vypneš zvýrazňování syntaxe, příp. historii změn.

Pokud to bude mbox, jsou nástroje na rozlámání na jednotlivé maily, s těmi si pak můžeš dělat cokoliv.
29.8.2011 14:31 Ash | skóre: 53
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Vzal bych první splitnutou část, uříznul bych na konci případnou poškozenou zprávu, a zkusil ho načíst a reindexovat.
29.8.2011 16:23 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Odpovědět | | Sbalit | Link | Blokovat | Admin
3,3G není zase až tak velký soubor a mělo by to jít bez problémů číst textákem - akorát to možná bude trvat doskákat třeba na konec.....

Ale nebude spíš problém s tím že tam došel nějakej virus ? Mě kdysi se to párkrát stalo že to pošták nechtěl přečíst - většinou byl na vině poslední mail který byl nějaký spam - virus a pod.... a stačilo ho v textáku odstranit a bylo to zase OK.

Takže skuste zjistit co je na konci souboru.

Jinak taky záleží na jakém FS to je zda není problém s velikostí .... 3G viz 32bit OS na FAT atd.....
29.8.2011 18:19 Rum
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
hmm, tak nevím, někde je bota, otevřu to v less a vidím jen zavináče a stříšky...
29.8.2011 19:20 Petr Šobáň | skóre: 80 | blog: soban | Olomouc
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
A to v celém souboru ?

Právě zda to není nějaký virus hrající si na přetečení zásobníku tak tam nacpal hromadu zavináčů :-)

A nebo nějaká chyba na FS (HDD) ?
30.8.2011 10:49 Jiří Lisický | skóre: 31 | blog: JIL_blog | Olomouc
Rozbalit Rozbalit vše Re: obrovský textový soubor - rozdělit bez otvírání
Asi to spíš budou stříšky a zavináče. Stříškou se zobrazuje nějaký control znak. Jako třeba Ctrl-L (formfeed, odstránkování) tam bude zobrazen jako ^L (hexa 0C).

No a ^@ (jako jeden znak) je binární nula, tedy hexa 00. Což je divné.

Zkus nám někde uložit třeba prvních 10kB souboru. Získáš je třeba pomocí

dd if=tvuj-soubor of=prvnich10k bs=1k count=10

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.