abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:22 | Nová verze

    Open source softwarový stack ROCm (Wikipedie) pro vývoj AI a HPC na GPU od AMD byl vydán ve verzi 7.0.0. Přidána byla podpora AMD Instinct MI355X a MI350X.

    Ladislav Hagara | Komentářů: 0
    dnes 15:22 | Nová verze

    Byla vydána nová verze 258 správce systému a služeb systemd (GitHub).

    Ladislav Hagara | Komentářů: 1
    dnes 15:11 | Nová verze

    Byla vydána Java 25 / JDK 25. Nových vlastností (JEP - JDK Enhancement Proposal) je 18. Jedná se o LTS verzi.

    Ladislav Hagara | Komentářů: 0
    dnes 14:44 | Humor

    Věra Pohlová před 26 lety: „Tyhle aféry každého jenom otravují. Já bych všechny ty internety a počítače zakázala“. Jde o odpověď na anketní otázku deníku Metro vydaného 17. září 1999 na téma zneužití údajů o sporožirových účtech klientů České spořitelny.

    Ladislav Hagara | Komentářů: 1
    dnes 11:33 | Zajímavý článek Ladislav Hagara | Komentářů: 0
    včera 21:44 | Nová verze

    Byl vydán Mozilla Firefox 143.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově se Firefox při ukončování anonymního režimu zeptá, zda chcete smazat stažené soubory. Dialog pro povolení přístupu ke kameře zobrazuje náhled. Obzvláště užitečné při přepínání mezi více kamerami. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 143 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    včera 17:22 | Nová verze

    Byla vydána betaverze Fedora Linuxu 43 (ChangeSet), tj. poslední zastávka před vydáním finální verze, která je naplánována na úterý 21. října.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | Nová verze

    Multiplatformní emulátor terminálu Ghostty byl vydán ve verzi 1.2 (𝕏, Mastodon). Přehled novinek, vylepšení a nových efektů v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    včera 00:11 | Nová verze

    Byla vydána nová verze 4.5 (𝕏, Bluesky, Mastodon) multiplatformního open source herního enginu Godot (Wikipedie, GitHub). Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    15.9. 21:33 | Nová verze

    Byla vydána verze 3.0 (Mastodon) nástroje pro záznam a sdílení terminálových sezení asciinema (GitHub). S novou verzí formátu záznamu asciicast v3, podporou live streamingu a především kompletním přepisem z Pythonu do Rustu.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (44%)
     (78%)
     (0%)
     (0%)
     (11%)
     (11%)
     (22%)
     (0%)
     (22%)
    Celkem 9 hlasů
     Komentářů: 1, poslední dnes 13:49
    Rozcestník

    Dotaz: Case insensitive porovnani v C

    tomes.io avatar 21.9.2012 01:11 tomes.io | skóre: 12 | blog: tomesh
    Case insensitive porovnani v C
    Přečteno: 336×
    Ahoj,

    potrebuju porovnavat retezce bez ohledu na velikost pisma. Resp. hledam a porovnavam podretezce ve vetach. Vygooglil jsem si, ze asi nejlepsi reseni je prevest si vse bud na mala nebo velka pismena pomoci toupper()/tolower() a pak porovnat ( POSIXovou strcasecmp jsem zavrhl, protoze kontroluje cely string naraz, nevraci ukazatel na prvni vyskyt jako case sensitive strstr(), coz je mimoradna skoda).

    Jenze jsem se zcela nepochopitelne tezce zasekl na tom, jak uz zmensena/zvetsena pismena appendovat do nejakeho retezce, ktery bude dale porovnavan.

    V nize uvedene casti kodu je klicovy while (input[i]). Ten ma za ukol zmensit pismenko po pismenku a kazde pismenko pak postupne pridavat do pomocneho "tmpstr". Jenomze tam za boha nemuzu dostat jednotliva pismenka.

    Predpokladam, ze se pri prvni iteraci pismenko, ktere je v c[0] pripne do tmpstr[0]. To taky udela, jenze na dalsi mista v poli tmpstr[1...n] se nakopiruje cely radek nacteny ze vstupniho souboru, tedy CELY retezec obsazeny v poli "input" Absolutne nechapu proc, takhle se prece funkce strstr() (ale stejne se mi tady chova i strcpy()) chovat nema.

    Prikladne, kdyz je nacteny prvni radek, promenna input obsahuje retezec
    "Prvni"

    Tak hned prvni iterace while (input[i]) dosadi do tmpsrc[0] pismenko "p" do tmpsrc[1] dosadi "P", tmpsrc[2] "r" atd az tam vypise cely retezec z pole input.

    Jeste nikdy jsem na toto podivne chovani nenarazil. Nejdirv me napadlo, ze by se mohlo jedna o to, ze se predava cela adresa input[], jenze tady jde zkratka o prachobycejne pripinani jendotlivych pismenek... nechapu to a bydy velmi rad, kdyz mi to nekdo osvetli.

    Doufam, ze jsem vse napsal srozumitelne.
    while (fgets(input, 512 , fr) != NULL){
            
            int i = 0;
            line++;
            unsigned len = strlen(input);
            
           
            char tmpstr[len];
            tmpstr[0] = 0;        //pro poreby fce strcat, ktera appenduje od prvni nuly
            
            char c[1];
           
            
            while (input[i]){
      
              c[0] = input[i];
              if (isupper(*c)) c[0]=tolower(*c);   //pismenko se predela na male jeste bez problemu  
      
              strcat(tmpstr, c); //zde problem, spolu s konvertovanym pismenkem se pripne cely obsah input[];
              i++;
            }

    Řešení dotazu:


    Odpovědi

    21.9.2012 06:53 rastos | skóre: 63 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    c je deklarované ako char c[1]. Teda jednoprvkové pole charov. Neskôr s ním ale zaobchádzaš ako so stringom keď ho pošleš do strcat(). To ale robí galibu, pretože nie je "zero-terminated". Neskúmal som či sú v tom ešte aj nejaké iné problémy, ale keď už si zvolil tento prístup tak skús deklarovať c ako char c[]={0,0};

    Predsa len by som ale odporučil skúsiť nájsť nejaké iné riešenie, pretože niektoré znaky sa pri prevode na veľké/malé menia počet znakov (napr. nemecké ostré s), alebo niektoré znaky nie sú v jednom char-e pri multibyte-ovom kódovaní, atď ...
    tomes.io avatar 21.9.2012 10:57 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Tva deklarace
    char c[]={0,0};
    pomohla, ted uz to kopiruje korektne, diky.

    Ja bych taky rad nasel jine reseni, jenze hledal jsem dlouho a na zadne jsem neprisel, nez vse prevest na mala/velka pismenka a pak pouzit strstr(). Kdyby byla nejaka funkce jako strstrt() ale case insensitive, tak beru vsema deseti :)
    21.9.2012 11:14 rastos | skóre: 63 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Ak odignorujeme všetky problémy s multi-byte kodovaním a podobne tak môžeš aj hľadaný podreťazec aj prehľadávaný riadok previesť na uppercase cez strupr() a robiť strstr() na výsledku.

    Ak do úvahy pripadajú aj iné než ascii znaky, tak preveď text na wchar cez mbstowcs() a hľadaj pomocou wcsstr().
    21.9.2012 11:16 rastos | skóre: 63 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    ... po prevedení na uppercase cez towupper()
    21.9.2012 08:23 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    POSIXovou strcasecmp jsem zavrhl, protoze kontroluje cely string naraz, nevraci ukazatel na prvni vyskyt jako case sensitive strstr(), coz je mimoradna skoda

    Proč by měla vracet nějaký výskyt? Výskyt čeho? Tvrdíte, že chcete porovnat dva řetězce, a přesně to strcasecmp() dělá. Vrací vám výsledek toho porovnání. Oproti tomu strstr() je funkce pro vyhledání podřetězce, takže je celkem logické, že vrací pointer na první výskyt toho podřetězce; jen jaksi neporovnává…

    Zásadní problém je úplně jiný: ta funkce ignoruje locale, takže vám například veškerá slova začínající písmenem s diakritikou zařadí až za "z". Proto je vhodnější použít strcoll().

    Doufam, ze jsem vse napsal srozumitelne.

    Moc ne. Zkuste konkrétně a přesně napsat, co vlastně potřebujete. To, co jste napsal, má příliš mnoho možných výkladů. Pokud např. potřebujete zjistit první znak, kde se dva řetězce liší (s ohledem na aktuální locale a bez rozlišení malých a velkých písmen), můžete použít mbrtowc() na načítání znaků a pak porovnávat hodnoty, které vám vrátí towlower(). Konvertovat si celý řetězec je zbytečné a neefektivní.

    tomes.io avatar 21.9.2012 10:51 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    PSal jsem hned na zacatku,ze hledam podretezce, ne retezce. Proto jsem zavrhnul strcasecmp(). Uzivatel zada jaky podretezec, slovo, cast slova, pismenko,chce delat a muj program mu vypise kolikrat se zadany podretezec vyskytl naradku. Proto strstr(), funguje bezvadne, akorat je case sensitive...

    Jak mj program vypada je videt z tohoto vlakna kde jsem mel jiny dotaz:
    http://www.abclinuxu.cz/poradna/programovani/show/366089
    tomes.io avatar 21.9.2012 11:00 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Problem je v tom, ze ja potrebuju porovnat podretezce, tady i casti stringu, tudiz nemuzu pouzit ten posixovy porovnavac retezcu.

    ALe mozna... napada me jedna vec, snad kdybych si pomoci strtok() rozdeloval vety na slova (oddelovac by byla mezera) a pak porovnaval jeden token za druhym.
    21.9.2012 14:29 ::: | skóre: 14 | blog: e_lama
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    ja bych jenom upozornil ze ta implementace ma kvuli pouziti strcat uplne zbytecne kvadratickou slozitost. Priom by to slo udelat uplne jednoduse:
    while (input[i])
    {
            tmpstr[i] = tolower(input[i]);
            ++i;
    }
    tmpstr[i] = 0;
    
    dalsi vec je ze deklarace
    char tmpstr[len];
    
    vytvori pole dost velky na ulozeni retezce, ale ne ukoncujicy nuly

    totez:
    char c[1];
    
    proboha tam je tolik chyb ze bych to ani nespocital :-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.