Portál AbcLinuxu, 12. května 2025 13:12

Dotaz: vyhladavanie

10.8.2011 20:21 marian34
vyhladavanie
Přečteno: 482×
Odpovědět | Admin
Zdravim,mam dva binarne subory.Potrebujem v nich vyhladat retazec zadanej dlzky(B),ktory sa nachadza v oboch suboroch.Je na to nejaky programik?
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

15.8.2011 16:08 NN
Rozbalit Rozbalit vše Re: vyhladavanie
Odpovědět | | Sbalit | Link | Blokovat | Admin
Mozna cmp ?

NN
15.8.2011 19:11 Radovan
Rozbalit Rozbalit vše Re: vyhladavanie
Odpovědět | | Sbalit | Link | Blokovat | Admin
PRINT "Hledani shody ve dvou souborech"
INPUT "Kolik bytu? ", delka
INPUT "1. soubor: ", soubor1$
INPUT "2. soubor: ", soubor2$
PRINT "Preruseni: Esc"
a$ = " "
b$ = " "

OPEN soubor1$ FOR BINARY AS #1
OPEN soubor2$ FOR BINARY AS #2

FOR i = 1 TO LOF(1) - delka + 1
  FOR j = 1 TO LOF(2) - delka + 1
    IF INKEY$ = CHR$(27) THEN GOTO konec
    GET #1, i, a$
    GET #2, j, b$
    IF a$ = b$ THEN
      pocet = 1
      FOR k = 1 TO delka - 1
        GET #1, i + k, a$
        GET #2, j + k, b$
        IF a$ = b$ THEN
          pocet = pocet + 1
        ELSE
          k = delka
        END IF
      NEXT k
      IF pocet = delka THEN
        PRINT i, j,
        FOR k = 0 TO delka - 1
          GET #1, i + k, a$
          PRINT a$;
        NEXT k
        PRINT
      END IF
    END IF
  NEXT j
NEXT i

CLOSE #2
CLOSE #1
konec: END
15.8.2011 21:15 NN
Rozbalit Rozbalit vše Re: vyhladavanie
To je v jakem jazyce ?

NN
Max avatar 15.8.2011 21:18 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: vyhladavanie
Podle tohoto : google -> "FOR i = 1 TO LOF" to vypadá na QBASIC.
Zdar Max
Měl jsem sen ... :(
16.8.2011 04:57 Radovan
Rozbalit Rozbalit vše Re: vyhladavanie
Přesně tak, trocha prehistorie v akci ;-) Většina programátorů v M$ prý na QBasicu začínala, tím by se dalo ledacos vysvětlit...
15.8.2011 22:35 rastos | skóre: 63 | blog: rastos
Rozbalit Rozbalit vše Re: vyhladavanie
Zafunguje ti to ak sa budú zhodovať 2 posebeidúce riadky?
16.8.2011 04:55 Radovan
Rozbalit Rozbalit vše Re: vyhladavanie
Bere to bajt po bajtu a porovnává každý s každým, takže zafunguje. Ale na výsledek si člověk trochu počká :-D
19.8.2011 21:14 marian34
Rozbalit Rozbalit vše Re: vyhladavanie
A ako to prosim Vas spustim?Cez DOSBox?
20.8.2011 08:32 Radovan
Rozbalit Rozbalit vše Re: vyhladavanie
V DOSBoxu to jede krásně, QBasic můžeš stáhnout odsud: ftp://ftp.microsoft.com/Products/Windows/Windows95/CDRomExtras/OtherUtilities/olddos.exe pokud máš platnou licenci na Win9x ;-) A nebo ze stovek jiných míst na netu.
Ale je to šíleně pomalé!
Jaký používáš systém? Že bych to spíš zkusil "portovat" do Céčka :-D
20.8.2011 11:53 marian34
Rozbalit Rozbalit vše Re: vyhladavanie
Ano,je to funkcne,ale pomale.Chcelo by to este spravit vystup do suboru.V Cecku to môze byt aj,aj.
20.8.2011 16:16 Radovan
Rozbalit Rozbalit vše Re: vyhladavanie
Tak teda v Céčku:
#include <stdio.h>
#include <stdlib.h>



int lof(FILE *soubor)
    {
    fseek(soubor,0,SEEK_END);
    return ftell(soubor);
    }



void nacti(FILE *soubor,char *text,int pocet)
     {
     int i;

     rewind(soubor);
     for (i=0;i<pocet;++i)
         text[i]=fgetc(soubor);
     text[i]='\0';
     }



int main(void)
    {
    int  i,j,c1,c2,f=0,shoda,delka,v1,v2,velikost1,velikost2;
    char nazev1[200],nazev2[200],*text1,*text2;
    FILE *soubor1,*soubor2;

    /* vstupni dialog */
    fprintf(stderr,"Hledani shody ve dvou binarnich souborech\n");
    fprintf(stderr,"Kolik bytu? ");
    scanf("%d",&delka);
    if (delka>0)
       {
       fprintf(stderr,"1. soubor: ");
       scanf("%s",nazev1);
       fprintf(stderr,"2. soubor: ");
       scanf("%s",nazev2);

       if ((soubor1=fopen(nazev1,"r")))
          {
          if ((velikost1=lof(soubor1)))
             {
             if ((soubor2=fopen(nazev2,"r")))
                {
                if ((velikost2=lof(soubor2)))
                   {
                   printf("\n%s\n\t%s\n",nazev1,nazev2);
                   /* alokace pameti */
                   text1=malloc(velikost1+1);
                   text2=malloc(velikost2+1);
                   v1=velikost1-delka+1;
                   v2=velikost2-delka+1;
                   if (!text1 || !text2)
                      {
                      fprintf(stderr,"Nedostatek pameti, pomale hledani!\n\a");
                      /* primo na disku */
                      for (rewind(soubor1),i=0;i<v1;++i)
                          {
                          c1=fgetc(soubor1);
                          for (rewind(soubor2),j=0;j<v2;++j)
                              {
                              c2=fgetc(soubor2);
                              if (c1==c2)
                                 {
                                 for (shoda=0;c1==c2 && shoda<delka;++shoda)
                                     {
                                     c1=fgetc(soubor1);
                                     c2=fgetc(soubor2);
                                     }
                                 if (shoda==delka)
                                    {
                                    ++f;
                                    fseek(soubor1,i,0);
                                    printf("%d\t%d\t",i,j);
                                    for (shoda=0;shoda<delka;++shoda)
                                        putchar(fgetc(soubor1));
                                    putchar('\n');
                                    }
                                 fseek(soubor1,i+1,0);
                                 fseek(soubor2,j+1,0);
                                 }
                              }
                          }
                      }
                   else
                      {
                      /* nacteni do pameti */
                      nacti(soubor1,text1,velikost1);
                      nacti(soubor2,text2,velikost2);
                      for (i=0;i<v1;++i)
                          for (j=0;j<v2;++j)
                              {
                              for (shoda=0;text1[i+shoda]==text2[j+shoda] && shoda<delka;++shoda);
                              if (shoda==delka)
                                 {
                                 ++f;
                                 printf("%d\t%d\t",i,j);
                                 for (shoda=0;shoda<delka;++shoda)
                                     putchar(text1[i+shoda]);
                                 putchar('\n');
                                 }
                              }
                      }
                   if (text1)
                      free(text1);
                   if (text2)
                      free(text2);
                   if (f)
                      printf("Nalezeno %d shodnych useku s delkou %d bytu.\n",f,delka);
                   else
                      printf("Nenalezena zadna shoda!\n");
                   }
                else
                   fprintf(stderr,"%s nic neobsahuje!\n\a",nazev2);
                fclose(soubor2);
                }
             else
                fprintf(stderr,"%s nelze cist!\n\a",nazev2);
             fclose(soubor1);
             }
          else
             fprintf(stderr,"%s nic neobsahuje!\n\a",nazev1);
          }
       else
          fprintf(stderr,"%s nelze cist!\n\a",nazev1);
       }

    return 0;
    }
Výstup do souboru si můžeš klidně přesměrovat pomocí >, chybová hlášení tam nebudou, jen samotné výsledky :)
20.8.2011 18:15 marian34
Rozbalit Rozbalit vše Re: vyhladavanie
Diky moc,no jaksi mi to nefacha.Po zadani suborov na porovnanie mi vzdy vyhodi

NELZE CIST!
20.8.2011 18:36 Radovan
Rozbalit Rozbalit vše Re: vyhladavanie
Zadáváš celé názvy tak jak jsou, malá/velká písmena a podobně? Tohle signalizuje že ten soubor nemohl otevřít.
Zkus je třeba zkopírovat do toho adresáře kde máš program s nějakými jednoduchými názvy, jako je s1 a s2, s tím by neměl být problém.
20.8.2011 19:05 marian34
Rozbalit Rozbalit vše Re: vyhladavanie
Fajn,uz to facha.
20.8.2011 06:09 Petr Gajdůšek | skóre: 13 | blog: Úlomky | Znojmo
Rozbalit Rozbalit vše Re: vyhladavanie
Odpovědět | | Sbalit | Link | Blokovat | Admin
pro bash:
commons() { # soubor1 (nejlépe ten menší), soubor2, délka
    grep -oF -f  \
    <( strings -n$3 $1 | while read l; do for ((i=0;i<${#l}-${#l}%$3;i++)); do echo ${l:i:$3}; done; done ) \
    <(strings -n$3 $2) | strings -n$3 | sort -u
}
použití:
$ commons /bin/grep /bin/bash  77
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
20.8.2011 07:01 Petr Gajdůšek | skóre: 13 | blog: Úlomky | Znojmo
Rozbalit Rozbalit vše Re: vyhladavanie
Bude to fungovat jenom pokud vyhledáváte textový řetězec. Bez změny to funguje jen pro 7bitové (ASCII) řetězce. Pro 8bitové kódování je nutné rozšířit volání strings o parametr -eS a aby fungoval grep, rourou převést na utf8 nebo nastavit proměnnou LANG=C, potom bude grep porovnávat binárně.

Podobně pokud je hledaný řetězec v souborech kódován v 16 nebo 32 bitech, viz man 1 strings.
20.8.2011 12:21 marian34
Rozbalit Rozbalit vše Re: vyhladavanie
Ok,ako to bude teda vyzerat pre binarne vyhladavanie?
20.8.2011 14:00 jadd | skóre: 34 | blog: Greenhorn
Rozbalit Rozbalit vše Re: vyhladavanie
Nevím jak tobě (nejsem programátor) ale myslím si že napověděli až dost. Jsou ale lidi co chtěj všechno zadarmo a to ještě k tomu hned aniž by ten kdo se jim snaží pomoci, vůbec věděl jestli i oni sami by vůbec někomu poradili natož taky zadarmo. Z takových lidí je mi na blití.
20.8.2011 14:28 marian34
Rozbalit Rozbalit vše Re: vyhladavanie
Kludne sa pozvracaj,mne to je jedno.Normalne tu kladiem otazky,na nikoho netlacim.Bud niekto chce odpovedat,alebo nie.Samozrejme som vdacny aj za nacrnutie riesenia,od ktoreho sa uz da odpichnut.No nevidim dôvod,aby som sa v tom este nepitval,pokial niecomu nerozumiem.A tvoje zadarmo si strc za klobuk,uz len tento pojem svedci o tom,v akych intenciach rozmyslas.
20.8.2011 14:48 jadd | skóre: 34 | blog: Greenhorn
Rozbalit Rozbalit vše Re: vyhladavanie
Dobrá, Omlouvám se asi jsem se v tobě spletl, mám dneska fakt špatnou náladu...
A tvoje zadarmo si strc za klobuk,uz len tento pojem svedci o tom,v akych intenciach rozmyslas.
Opak je pravdou.
20.8.2011 20:01 Petr Gajdůšek | skóre: 13 | blog: Úlomky | Znojmo
Rozbalit Rozbalit vše Re: vyhladavanie
Pro posloupnosti libovolných bajtů se to použít nedá. Tohle funguje jen pro hledání textových řetězců, respektive řetězců obsahující jen tisknutelné znaky. Omlouvám se tedy, můj příklad není řešením, které jsi hledal - nepochopil jsem totiž význam termínu "řetězce" v zadání, imho "posloupnost bajtů" by bylo přesnější vyjádření.

Pokud bys přece jen někdy potřeboval vyhledávat textové řetězce, tak je tenhle postup flexibilnější. S drobnými úpravami lze vyhledávat i řetězce, které jsou v binárních souborech nestejně reprezentované (8, 16, 32 bitů, little i bigendian) a v různé znakové sadě (použitím enca). To je neocenitelné např. při analýze binárních souborů vytvořených windows aplikacemi, ty běžně používají různá kódování i znakové sady. Tam by porovnávání bajt po bajtu bylo k ničemu.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.