abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 19:22 | Nová verze

    Wine bylo po roce vývoje od vydání verze 9.0 vydáno v nové stabilní verzi 10.0. Přehled novinek na GitLabu. Vypíchnuta je nová architektura ARM64EC a podpora High DPI škálování.

    Ladislav Hagara | Komentářů: 0
    dnes 16:11 | Zajímavý software

    Edvard Rejthar na blogu zaměstnanců CZ.NIC představil nástroj deduplidog pro odstranění duplicitních souborů.

    Ladislav Hagara | Komentářů: 3
    dnes 05:22 | IT novinky

    Společnost DeepSeek představila (𝕏) AI model DeepSeek-R1 (Hugging Face) srovnatelný s OpenAI o1 a uvolnila jej pod open source licencí MIT, tj. zdarma i pro komerční použití.

    Ladislav Hagara | Komentářů: 26
    včera 23:44 | Nová verze

    GKrellM (GNU Krell Monitors, Wikipedie), tj. grafická aplikace pro sledování systémů a různých událostí, byla po pěti a půl letech vydána v nové verzi 2.4.0. Přehled novinek na Gitea.

    Ladislav Hagara | Komentářů: 4
    včera 19:55 | Humor

    Americká první dáma Melania Trumpová vydala v předvečer manželovy inaugurace vlastní kryptoměnu. Jmenuje se $Melania. Donald Trump vydal vlastní kryptoměnu $Trump den před manželkou.

    Ladislav Hagara | Komentářů: 23
    včera 11:33 | Nová verze

    GNU Project Debugger aneb GDB byl vydán ve verzi 16.1. Podrobný přehled novinek v souboru NEWS.

    Ladislav Hagara | Komentářů: 0
    včera 03:00 | Nová verze

    Po 9 týdnech vývoje od vydání Linuxu 6.12 oznámil Linus Torvalds vydání Linuxu 6.13. Přehled novinek a vylepšení na LWN.net: první a druhá polovina začleňovacího okna a Linux Kernel Newbies. Odstraněn byl souborový systém ReiserFS.

    Ladislav Hagara | Komentářů: 0
    19.1. 16:11 | IT novinky

    19. ledna 2038 přeteče hodnota time_t na 32bitových systémech, na vyřešení problému roku 2038 (Y2K38) tedy zbývá 13 let. Např. Debian v uplynulém roce přešel na 64bitový čas. Bernhard Wiedemann z openSUSE sdílí chyby v sestavení rozšířeného softwaru.

    Fluttershy, yay! | Komentářů: 1
    19.1. 15:44 | Nová verze

    Byla vydána druhá opravná verze 21.2 v dubnu loňského roku vydané verze 21 multimediálního centra Kodi (dříve XBMC, Wikipedie) s kódovým označením Omega.

    Ladislav Hagara | Komentářů: 0
    19.1. 12:22 | IT novinky

    TikTok ve Spojených státech v sobotu večer místního času přerušil činnost. Uživatelé čínskou firmou vlastněné sociální sítě dostali zprávu, že aplikaci kvůli zákazu nelze používat. TikTok je momentálně nedostupný v obchodech s aplikacemi Google Play a App Store. Podle zákona přijatého loni a potvrzeného v pátek soudem měla platforma do dneška přerušit spojení se svou mateřskou společností ByteDance, která sídlí v Číně, nebo činnost v

    … více »
    Ladislav Hagara | Komentářů: 18
    Rozcestník

    Dotaz: Case insensitive porovnani v C

    tomes.io avatar 21.9.2012 01:11 tomes.io | skóre: 12 | blog: tomesh
    Case insensitive porovnani v C
    Přečteno: 327×
    Ahoj,

    potrebuju porovnavat retezce bez ohledu na velikost pisma. Resp. hledam a porovnavam podretezce ve vetach. Vygooglil jsem si, ze asi nejlepsi reseni je prevest si vse bud na mala nebo velka pismena pomoci toupper()/tolower() a pak porovnat ( POSIXovou strcasecmp jsem zavrhl, protoze kontroluje cely string naraz, nevraci ukazatel na prvni vyskyt jako case sensitive strstr(), coz je mimoradna skoda).

    Jenze jsem se zcela nepochopitelne tezce zasekl na tom, jak uz zmensena/zvetsena pismena appendovat do nejakeho retezce, ktery bude dale porovnavan.

    V nize uvedene casti kodu je klicovy while (input[i]). Ten ma za ukol zmensit pismenko po pismenku a kazde pismenko pak postupne pridavat do pomocneho "tmpstr". Jenomze tam za boha nemuzu dostat jednotliva pismenka.

    Predpokladam, ze se pri prvni iteraci pismenko, ktere je v c[0] pripne do tmpstr[0]. To taky udela, jenze na dalsi mista v poli tmpstr[1...n] se nakopiruje cely radek nacteny ze vstupniho souboru, tedy CELY retezec obsazeny v poli "input" Absolutne nechapu proc, takhle se prece funkce strstr() (ale stejne se mi tady chova i strcpy()) chovat nema.

    Prikladne, kdyz je nacteny prvni radek, promenna input obsahuje retezec
    "Prvni"

    Tak hned prvni iterace while (input[i]) dosadi do tmpsrc[0] pismenko "p" do tmpsrc[1] dosadi "P", tmpsrc[2] "r" atd az tam vypise cely retezec z pole input.

    Jeste nikdy jsem na toto podivne chovani nenarazil. Nejdirv me napadlo, ze by se mohlo jedna o to, ze se predava cela adresa input[], jenze tady jde zkratka o prachobycejne pripinani jendotlivych pismenek... nechapu to a bydy velmi rad, kdyz mi to nekdo osvetli.

    Doufam, ze jsem vse napsal srozumitelne.
    while (fgets(input, 512 , fr) != NULL){
            
            int i = 0;
            line++;
            unsigned len = strlen(input);
            
           
            char tmpstr[len];
            tmpstr[0] = 0;        //pro poreby fce strcat, ktera appenduje od prvni nuly
            
            char c[1];
           
            
            while (input[i]){
      
              c[0] = input[i];
              if (isupper(*c)) c[0]=tolower(*c);   //pismenko se predela na male jeste bez problemu  
      
              strcat(tmpstr, c); //zde problem, spolu s konvertovanym pismenkem se pripne cely obsah input[];
              i++;
            }

    Řešení dotazu:


    Odpovědi

    21.9.2012 06:53 rastos | skóre: 62 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    c je deklarované ako char c[1]. Teda jednoprvkové pole charov. Neskôr s ním ale zaobchádzaš ako so stringom keď ho pošleš do strcat(). To ale robí galibu, pretože nie je "zero-terminated". Neskúmal som či sú v tom ešte aj nejaké iné problémy, ale keď už si zvolil tento prístup tak skús deklarovať c ako char c[]={0,0};

    Predsa len by som ale odporučil skúsiť nájsť nejaké iné riešenie, pretože niektoré znaky sa pri prevode na veľké/malé menia počet znakov (napr. nemecké ostré s), alebo niektoré znaky nie sú v jednom char-e pri multibyte-ovom kódovaní, atď ...
    tomes.io avatar 21.9.2012 10:57 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Tva deklarace
    char c[]={0,0};
    pomohla, ted uz to kopiruje korektne, diky.

    Ja bych taky rad nasel jine reseni, jenze hledal jsem dlouho a na zadne jsem neprisel, nez vse prevest na mala/velka pismenka a pak pouzit strstr(). Kdyby byla nejaka funkce jako strstrt() ale case insensitive, tak beru vsema deseti :)
    21.9.2012 11:14 rastos | skóre: 62 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Ak odignorujeme všetky problémy s multi-byte kodovaním a podobne tak môžeš aj hľadaný podreťazec aj prehľadávaný riadok previesť na uppercase cez strupr() a robiť strstr() na výsledku.

    Ak do úvahy pripadajú aj iné než ascii znaky, tak preveď text na wchar cez mbstowcs() a hľadaj pomocou wcsstr().
    21.9.2012 11:16 rastos | skóre: 62 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    ... po prevedení na uppercase cez towupper()
    21.9.2012 08:23 Michal Kubeček | skóre: 72 | Luštěnice
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    POSIXovou strcasecmp jsem zavrhl, protoze kontroluje cely string naraz, nevraci ukazatel na prvni vyskyt jako case sensitive strstr(), coz je mimoradna skoda

    Proč by měla vracet nějaký výskyt? Výskyt čeho? Tvrdíte, že chcete porovnat dva řetězce, a přesně to strcasecmp() dělá. Vrací vám výsledek toho porovnání. Oproti tomu strstr() je funkce pro vyhledání podřetězce, takže je celkem logické, že vrací pointer na první výskyt toho podřetězce; jen jaksi neporovnává…

    Zásadní problém je úplně jiný: ta funkce ignoruje locale, takže vám například veškerá slova začínající písmenem s diakritikou zařadí až za "z". Proto je vhodnější použít strcoll().

    Doufam, ze jsem vse napsal srozumitelne.

    Moc ne. Zkuste konkrétně a přesně napsat, co vlastně potřebujete. To, co jste napsal, má příliš mnoho možných výkladů. Pokud např. potřebujete zjistit první znak, kde se dva řetězce liší (s ohledem na aktuální locale a bez rozlišení malých a velkých písmen), můžete použít mbrtowc() na načítání znaků a pak porovnávat hodnoty, které vám vrátí towlower(). Konvertovat si celý řetězec je zbytečné a neefektivní.

    tomes.io avatar 21.9.2012 10:51 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    PSal jsem hned na zacatku,ze hledam podretezce, ne retezce. Proto jsem zavrhnul strcasecmp(). Uzivatel zada jaky podretezec, slovo, cast slova, pismenko,chce delat a muj program mu vypise kolikrat se zadany podretezec vyskytl naradku. Proto strstr(), funguje bezvadne, akorat je case sensitive...

    Jak mj program vypada je videt z tohoto vlakna kde jsem mel jiny dotaz:
    http://www.abclinuxu.cz/poradna/programovani/show/366089
    tomes.io avatar 21.9.2012 11:00 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Problem je v tom, ze ja potrebuju porovnat podretezce, tady i casti stringu, tudiz nemuzu pouzit ten posixovy porovnavac retezcu.

    ALe mozna... napada me jedna vec, snad kdybych si pomoci strtok() rozdeloval vety na slova (oddelovac by byla mezera) a pak porovnaval jeden token za druhym.
    21.9.2012 14:29 ::: | skóre: 14 | blog: e_lama
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    ja bych jenom upozornil ze ta implementace ma kvuli pouziti strcat uplne zbytecne kvadratickou slozitost. Priom by to slo udelat uplne jednoduse:
    while (input[i])
    {
            tmpstr[i] = tolower(input[i]);
            ++i;
    }
    tmpstr[i] = 0;
    
    dalsi vec je ze deklarace
    char tmpstr[len];
    
    vytvori pole dost velky na ulozeni retezce, ale ne ukoncujicy nuly

    totez:
    char c[1];
    
    proboha tam je tolik chyb ze bych to ani nespocital :-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.