Portál AbcLinuxu, 12. května 2025 05:57

Dotaz: [C] Spojování textových souborů

19.3.2011 18:27 Igor
[C] Spojování textových souborů
Přečteno: 562×
Odpovědět | Admin
Dobrý den, Potřeboval bych si v C napsat prográmek, který mi z předem neurčeného počtu textových souborů vytvoří jeden výsledný soubor stylem, že na prvním řádku budou první řádky všech vstupních souborů na druhém řádku budou druhé řádky všech vstupních souborů a tak dál. Potřebuju aby mi četl vstupní parametry z příkazové rádky stylem, že jednotlivé vstupní soubory jsou odděleny mezerou a poslední soubor je vždy název výsledného souboru.

Vím, že předávání parametrů z řádky si zajistím parametry argc, argv. Z toho dostanu všechny potřebný vstupní data, ale pak už nevím jak dál. Dokážu to dát dohromady pouze pro první řádek nevím už jak se dostat na řádky další. Mám for cyklus, kde se postupně do ukazetele na FILE pomocí fopen() načtu první soubor, pak pomocí fgetc() první řádek a nakonec pomocí fputc() řádek uložím do výsledného souboru a to opakuju pro všechny vstupní soubory. Jenže takový algoritmus funguje jenom pro první řádky. Když jsem si udělal další nad tímhle for tak znova otevírám soubor jedna a funkce fgetc() už zase pracuje s prvním řádkem.

Prosím, jak v téhle fázi, donutím číst řádek další? Je vůbec tohle správný algoritmus?

Děkuji, za případné rady.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

19.3.2011 18:46 pakanek | skóre: 28 | Vyškov
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Odpovědět | | Sbalit | Link | Blokovat | Admin
Pomocí malloc si alokuj dynamicky pole ukazatelů na FILE. Při každém průchodu cyklem projdi celé pole a z každého souboru přečti jeden řádek.
Všechno dobré je pro něco zlé.
19.3.2011 18:47 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Odpovědět | | Sbalit | Link | Blokovat | Admin

Ty soubory nezavírejte a nechávejte je všechny otevřené. Postupně načtěte řádek ze všech souborů, pokud někde dostanete EOF, soubor vyřadíte a pokračujete dál. Opakujte tak dlouho, dokud vám zbývá aspoň jeden soubor. Vhodnou strukturou pro uchovávání seznamu souborů může být např. spojový seznam.

Problém by mohl nastat jen v případě, že by ten předem neurčený počet mohl být větší než limit na počet otevřených souborů (defaultně bývá 1024). Pak by bylo nutné buď limit zvýšit nebo soubory zavírat, pamatovat si pozice (ftell()) a obnovovat je (fseek()).

19.3.2011 19:24 Igor
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů

Děkuji všem za reakci. Dynamickému alokování paměti jsem se chtěl vyhnout, neb jsem to nikdy nepoužíval a moc toho o tom nevím. Co se týká zavírání souborů to zatím z lajdáctví ani nedělám. Vím, že je to špatně. Problém je v tom, že já při prúchodu for cyklem do ukazatele znovu načtu soubor a tím ho v podstatě znovu otevřu to vidím jako největší chybu. Dovolím si sem zaslat zdroják co jsem napsal. Přeci jen jsem začátečník a možná kdybychom se ba vili konkrétně dokázal bych spíš přijít k nějakýmu řešení.

#include 
#include 
#include 

int main(int argc, char *argv[])
{
FILE *fr, *fw;
int prepsat;
int c=0;
int i=1;

while(argc<3)                   //kontrola spravnosti vstupnich parametru
             {
             printf("Zadal jste nepripustne parametry pro spustení programu!");
             getchar();
             getchar();
             return 0;
             }

if ((fopen(argv[argc-1], "r"))!=0)            //ochrana proti prepsani jiz existujiciho souboru
   {      
      int prepsat;
      printf("Zadany vysledny soubor jiz existuje.\nPokud jej chcete prepstat portvrdte zadanim cisla 1");
      scanf("%d", &prepsat);
                     if (prepsat!=1)
                     {
                     return 0;
                     }
                     else{}
   } 
    else {}

fw=fopen(argv[argc-1], "w");  //otevreni vysledneho souboru pro zapis

for (i=1; i<(argc-1); i++)
    {
            
            
            if ((fr=fopen(argv[i], "r"))==NULL)
            {
               printf("Chyba v pri cteni souboru %s", argv[i]);
               getchar();
               getchar();
               return 0;
               }  
            /*else{*/
            
                while (((c=fgetc(fr))!='\n') && (c!=EOF))   //zapis do souboru
                {
                   fputc(c,fw);
                }
                
                
                



    }

  return 0;
}

Není to nijak odladěný, jde mi hlavně o tu myšlenku než o čistý kód s tím už bych si pohrál. Stačilo by tedy tohle nějak modifikovat, nebo je to celý hloupost? Děkuji za vaši ochotu.

19.3.2011 19:53 pakanek | skóre: 28 | Vyškov
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Dynamické alokaci paměti se nevyhneš, protože dopředu neznáš počet souborů. Přečti si nějakou učebnici jazyka C - Herout popř. Kernighan & Ritchie (volně EN online).
Všechno dobré je pro něco zlé.
19.3.2011 20:06 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Příloha:

Pokud se vám nechce do spojového seznamu, tak to můžete udělat třeba tak jako v příloze. Je to jen nástin, v praxi by bylo potřeba trochu dopracovat řešení chyb a rozmyslet si, jak má vypadat výstup, pokud nejsou vstupní soubory stejně dlouhé.

Pár poznámek k vašemu programu:

  1. Je-li větev else prázdná, nemusí tam vůbec být.
  2. Skončí-li program chybou, měl by vrátit nenulovou návratovou hodnotu.
  3. Pokud nepoužijete fflush(), nemáte jistotu, že se výzva na řádku 23 opravdu objeví na terminálu dřív, než se bude čekat na vstup od uživatele.
  4. Nechápu smysl getchar() po vypsání chyby (nemá-li smyslem být nesmyslné otravování uživatele).
  5. Unixové textové utilitky bývají používány ve skriptech, takže interaktivní chování je spíš nežádoucí. Místo dotazu, co dělat, když výstupní soubor existuje, je lepší zvolit si default a případně umožnit změnu přepínačem.
  6. Když pošlete výstup na standardní výstup, uživatel si ho může případně přesměrovat. Když ho natvrdo píšete do souboru, uživatel už ho na standardní výstup nedostane (triky typu /dev/stdout jsou nepřenositelné).
  7. Marně se snažím najít nějakou logiku ve vašem odsazování.
19.3.2011 19:39 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Odpovědět | | Sbalit | Link | Blokovat | Admin
K čemu to psát v C? Je spousta jiných jazyků, kde nasekáte méně chyb.
In Ada the typical infinite loop would normally be terminated by detonation.
19.3.2011 21:31 Radovan
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Odpovědět | | Sbalit | Link | Blokovat | Admin
Ale no tak, to ho chcete všichni od programování odradit? ;-)

Co takhle metoda KISS - Keep It Simple Stupid:
#include <stdio.h>

int main(int argc, char* argv[])
    {
    FILE *soubor; /* handle souboru */
    int i,        /* počítadlo souborů */
        c,        /* načtený znak */
        chyby=0;  /* počítadlo chyb */

    for (i=1;i<argc;++i)
        {
        /* byl-li zadán nějaký parametr, vezmeme jeden po druhém */
        if (!(soubor=fopen(argv[i],"r")))
           {
           /* soubor nelze otevřít, vypíšeme hlášení na stderr a přičteme chybu */
           fprintf(stderr,"Soubor \"%s\" nelze otevřít!\n",argv[i]);
           ++chyby;
           }
        else
           {
           /* soubor je otevřený, tak ho po znacích okopírujeme na stdout */
           while ((c=fgetc(soubor))!=EOF)
                 {
                 putchar(c);
                 }
           /* a potom hezky zavřeme */
           fclose(soubor);
           }
        }

    return chyby;
    }
Použití stejné jako u příkazu cat, program také vrací počet chyb který se dá vypsat echo $?

Michal Kubeček: k bodu 7 - má to odsazování sice trochu kostrbaté, ale řekl bych že to mělo být podobné jako u mě, narazil jsem na to v jedné staré knížce v ukázkovém programu v Algolu a připadá mi to takhle přehlednější.
19.3.2011 21:43 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
           /* soubor nelze otevřít, vypíšeme hlášení na stderr a přičteme chybu */
...
    return chyby;
Co se stane, když počet souborů, které nelze otevřít bude 256?

(btw, tazatel nechtěl "cat", ale chtěl vytisknout 1. řádek ze všech souborů, pak 2., ...)
In Ada the typical infinite loop would normally be terminated by detonation.
19.3.2011 22:03 Radovan
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Spíš co se stane, když počet souborů které nelze otevřít bude větší než INT_MAX? Zatím doufám že víc jak dvě miliardy chyb tam nenamrská :-D

...tazatel nechtěl "cat", ale chtěl vytisknout 1. řádek...

Sakra, tak tady vypadl řádek mě!
20.3.2011 13:36 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Doufání asi není úplně dobrá strategie :)

Každopádně aby se program nechoval podle očekávání, stačí těch problémů 256.
In Ada the typical infinite loop would normally be terminated by detonation.
19.3.2011 21:59 pakanek | skóre: 28 | Vyškov
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Tvůj program se však chová podobně jako příkaz cat. On chce seřadit všechny řádky ze všech souborů podle čísla řádku a pořadí souboru na vstupu. Následně všechny řádky se stejným číslem řádku zapsat jako jeden řádek do výstupního souboru. Asi něco na způsob příkazu comm. Buď musí všechny soubory otevřít naráz, nebo si pamatovat pozici v každém souboru. Tak jako tak tyto informace musí někde uchovat. A množství paměti k tomu potřebné zná až za běhu.
Všechno dobré je pro něco zlé.
19.3.2011 22:27 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Co takhle metoda KISS - Keep It Simple Stupid:

Simple jistě, o tom není sporu. Ale nemyslím si, že Stupid by mělo znamenat, že program bude dělat něco jiného, než co by dělat měl. :-)

má to odsazování sice trochu kostrbaté, ale řekl bych že to mělo být podobné jako u mě, narazil jsem na to v jedné staré knížce v ukázkovém programu v Algolu a připadá mi to takhle přehlednější.

Proti tomu, že je složená závorka až na dalším řádku, v zásadě nic nemám (i když sám dávám přednost tomu, aby byla na řádku s klíčovým slovem). Ale aby jednou byla pod řídícím klíčovým slovem, jednou o čtyři znaky vpravo a jednou o jedenáct, to ať se na mne nikdo nezlobí, to je prostě chaos. A to ani nemluvím o absurdním odsazení řádků 25-29.

19.3.2011 23:21 mato
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
mozno to chcelo byt "Keep it simple, stupid" :)

pouzivam rovnaky sposob (logiku) formatovania akorat ja odsadzujem defaultne \t = 8 miest. pri viacnasobnom "posunuti" sa kod cita tazsie; mne osobne vsak robi vacsi problem citat ked su odstavce formatovane prilis blizko seba.
19.3.2011 23:23 mato
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
chcel som napisat "rovnaky sposob ako ty" .. nejak mi to vypadlo v tej vete
20.3.2011 00:16 Radovan
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Jo pravda, ta čárka tam být měla, a navíc v tomhle případě to byl nějaký můj Stupid Read Error, asi jsem ospale zamžoural na nesprávném místě a blbě pochopil co vlastně ten program má dělat :-(

Takže ještě jednou ať to stojí za to:
#include <stdio.h>

#define MAX 1024

int main(int argc, char* argv[])
    {
    FILE *soubor[MAX+1];
    int i,c,ctenych=0,chyby=0;

    /* ohlídáme přípustný počet parametrů */
    if (argc>MAX+1)
       {
       /* když počet parametrů překročí limit */
       fprintf(stderr,"Tolik souborů nedokážu najednou otevřít!\n");
       return -1; /* program skončí chybou */
       }

    /* otevřeme soubory a všechny handle uložíme do pole */
    for (i=1;i<argc;++i)
        {
        if (!(soubor[i]=fopen(argv[i],"r")))
           {
           fprintf(stderr,"Soubor \"%s\" nelze otevřít!\n",argv[i]);
           ++chyby;
           }
        else
           {
           ++ctenych;
           }
        }

    /* zpracujeme je */
    while (ctenych)
          {
          /* pokud je otevřený aspoň jeden soubor */
          for (i=1;i<argc;++i)
              {
              /* projdeme celý seznam */
              if (soubor[i])
                 {
                 /* a když zrovna tenhle můžeme číst */
                 while ((c=fgetc(soubor[i]))!='\n' && c!=EOF)
                       {
                       /* vypíšeme ho na stdout */
                       putchar(c);
                       }
                 if (c==EOF)
                    {
                    /* pokud jsme narazili na konec souboru */
                    fclose(soubor[i]); /* zavřeme ho */
                    soubor[i]=NULL;    /* vynulujeme handle abysme ho nezkoušeli číst */
                    --ctenych;         /* a odečteme od počtu otevřených */
                    }
                 }
              }
          if (ctenych)
             {
             putchar('\n'); /* a pokud byl zobrazen nějaký znak odřádkujeme */
             }
          }

    return chyby;
    }
Když se chce vyhnout dynamické alokaci, tak si bude muset vystačit s omezeným počtem souborů. To mi připomnělo CONFIG.SYS, kde se psalo FILES=40 :-D

Rozházené to má místy fakt nesmyslně, holt ještě neví co dělá a hlavně proč to dělá, časem si snad najde svůj styl ;-) Já jsem třeba o dva sloupce odsazoval v Pascalu, ale v Céčku mi to prostě nestačilo, musel jsem tam dávat čtyři abych se v tom neztratil.

Ten příklad co jsem zmiňoval vypadal takhle nějak:
while něco
      begin
      příkaz
      příkaz
      end
20.3.2011 00:21 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Odhlédnu-li od nepodstatných drobností (jména proměnných, formátování, komentáře, návratová hodnota), liší se váš program od mého ještě něčím jiným než tím, že pole alokuje staticky? :-)
20.3.2011 00:37 Radovan
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Akorát tím že v případě neotevření nějakého souboru neskončí chybou, jen ho nahlásí a zpracuje ty ostatní co otevřít jdou. Jinak je to prakticky to samé v češtině :-D Ale opravit jsem se musel, ne? ;-)
20.3.2011 13:37 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Tenhle program pro změnu nekontroluje chyby při vstupu/výstupu. Pokud soubor nepůjde přečíst, tak ho zpracuje do půlky a skončí bez chyby. Obdobně při zápisu.
In Ada the typical infinite loop would normally be terminated by detonation.
20.3.2011 13:39 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Navíc se mi zdá že to nevytiskne řádky pod sebe ale za sebou.
In Ada the typical infinite loop would normally be terminated by detonation.
20.3.2011 13:55 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Pravda, toho jsem si ani nevšiml. Vzhledem k odlišně zapsané podmínce na řádku 42 se LF nezkopíruje.
20.3.2011 16:18 Radovan
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
... na prvním řádku budou první řádky všech vstupních souborů na druhém řádku budou druhé řádky všech vstupních souborů ...
Tentokrát jsem si to přečetl fakt důkladně :-D

Chyby V/V jsem neřešil, i když aspoň u toho zápisu by to chtělo. Ve spoustě učebnic se to také nedělá :-/
20.3.2011 16:40 Radovan
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Ale jinak pro vypisování řádků pod sebe stačí přidat jedno else:
                 if (c==EOF)
                    {
                    .....
                    }
                 else
                    {
                    putchar(c);
                    }
a vyhodit to if (ctenych) {...} aby tam nebyly řádky navíc.
19.3.2011 22:23 Igor
Rozbalit Rozbalit vše Re: [C] Spojování textových souborů
Odpovědět | | Sbalit | Link | Blokovat | Admin
Děkuji, všem za komentáře.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.