abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:33 | IT novinky

    Na blogu Raspberry Pi byla představena rozšiřující deska Raspberry Pi AI HAT+ 2 s akcelerátorem Hailo-10 a 8 GB RAM. Na rozdíl od předchozí Raspberry Pi AI HAT+ podporuje generativní AI. Cena desky je 130 dolarů.

    Ladislav Hagara | Komentářů: 2
    dnes 12:11 | Komunita

    Wikipedie slaví 25. výročí svého založení. Vznikla 15. ledna 2001 jako doplňkový projekt k dnes již neexistující encyklopedii Nupedia. Doména wikipedia.org byla zaregistrována 12. ledna 2001. Zítra proběhne v Praze Večer svobodné kultury, který pořádá spolek Wikimedia ČR.

    Ladislav Hagara | Komentářů: 0
    dnes 04:44 | Nová verze

    Po více než dvou letech od vydání předchozí verze 2.12 byla vydána nová stabilní verze 2.14 systémového zavaděče GNU GRUB (GRand Unified Bootloader, Wikipedie). Přehled novinek v souboru NEWS a v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    dnes 02:22 | Nová verze

    Google Chrome 144 byl prohlášen za stabilní. Nejnovější stabilní verze 144.0.7559.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 10 bezpečnostních chyb. Vylepšeny byly také nástroje pro vývojáře (YouTube).

    Ladislav Hagara | Komentářů: 2
    dnes 01:55 | Humor

    Microsoft zveřejnil zdrojový kód XAML Studia a uvolnil ho pod MIT licencí. XAML Studio je nástroj ze světa Windows, určený pro tvorbu uživatelského rozhraní aplikací pomocí XAML (Extensible Application Markup Language). Stalo se tak zhruba po osmi letech od prvního prohlášení Microsoftu, že se tento kód chystá zveřejnit.

    NUKE GAZA! 🎆 | Komentářů: 0
    dnes 01:44 | Zajímavý projekt

    TimeCapsule, 'časová kapsle', je jazykový model trénovaný výhradně na datech z určitých míst a časových období, aby se tak napodobila autentická slovní zásoba, způsob vyjadřování a názory dané doby. Na Hugging face jsou k dispozici modely natrénované na historických textech dostupných v oblasti Londýna mezi lety 1800 až 1875.

    NUKE GAZA! 🎆 | Komentářů: 4
    včera 17:55 | Nová verze

    Radicle byl vydán ve verzi 1.6.0 s kódovým jménem Amaryllis. Jedná se o distribuovanou alternativu k softwarům pro spolupráci jako např. GitLab.

    Ladislav Hagara | Komentářů: 0
    včera 13:22 | Upozornění

    Zemřel Scott Adams, tvůrce komiksových stripů Dilbert parodujících pracovní prostředí velké firmy.

    Ladislav Hagara | Komentářů: 3
    včera 13:00 | Nová verze

    Sdružení CZ.NIC vydalo novou verzi Knot Resolveru (6.1.0). Jedná se o první vydanou stabilní verzi 6, která je nyní oficiálně preferovanou a doporučovanou verzí, namísto předešlé verze 5. Více o Knot Resolveru 6 je možné se dočíst přímo v dokumentaci.

    VSladek | Komentářů: 3
    včera 01:22 | Nová verze

    Byl vydán Linux Mint 22.3 s kódovým jménem Zena. Podrobnosti v přehledu novinek a poznámkách k vydání. Vypíchnout lze, že nástroj Systémová hlášení (System Reports) získal mnoho nových funkcí a byl přejmenován na Informace o systému (System Information). Linux Mint 22.3 bude podporován do roku 2029.

    Ladislav Hagara | Komentářů: 1
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (5%)
     (0%)
     (8%)
     (19%)
     (3%)
     (6%)
     (3%)
     (11%)
     (44%)
    Celkem 443 hlasů
     Komentářů: 12, poslední včera 21:12
    Rozcestník

    Dotaz: Case insensitive porovnani v C

    tomes.io avatar 21.9.2012 01:11 tomes.io | skóre: 12 | blog: tomesh
    Case insensitive porovnani v C
    Přečteno: 361×
    Ahoj,

    potrebuju porovnavat retezce bez ohledu na velikost pisma. Resp. hledam a porovnavam podretezce ve vetach. Vygooglil jsem si, ze asi nejlepsi reseni je prevest si vse bud na mala nebo velka pismena pomoci toupper()/tolower() a pak porovnat ( POSIXovou strcasecmp jsem zavrhl, protoze kontroluje cely string naraz, nevraci ukazatel na prvni vyskyt jako case sensitive strstr(), coz je mimoradna skoda).

    Jenze jsem se zcela nepochopitelne tezce zasekl na tom, jak uz zmensena/zvetsena pismena appendovat do nejakeho retezce, ktery bude dale porovnavan.

    V nize uvedene casti kodu je klicovy while (input[i]). Ten ma za ukol zmensit pismenko po pismenku a kazde pismenko pak postupne pridavat do pomocneho "tmpstr". Jenomze tam za boha nemuzu dostat jednotliva pismenka.

    Predpokladam, ze se pri prvni iteraci pismenko, ktere je v c[0] pripne do tmpstr[0]. To taky udela, jenze na dalsi mista v poli tmpstr[1...n] se nakopiruje cely radek nacteny ze vstupniho souboru, tedy CELY retezec obsazeny v poli "input" Absolutne nechapu proc, takhle se prece funkce strstr() (ale stejne se mi tady chova i strcpy()) chovat nema.

    Prikladne, kdyz je nacteny prvni radek, promenna input obsahuje retezec
    "Prvni"

    Tak hned prvni iterace while (input[i]) dosadi do tmpsrc[0] pismenko "p" do tmpsrc[1] dosadi "P", tmpsrc[2] "r" atd az tam vypise cely retezec z pole input.

    Jeste nikdy jsem na toto podivne chovani nenarazil. Nejdirv me napadlo, ze by se mohlo jedna o to, ze se predava cela adresa input[], jenze tady jde zkratka o prachobycejne pripinani jendotlivych pismenek... nechapu to a bydy velmi rad, kdyz mi to nekdo osvetli.

    Doufam, ze jsem vse napsal srozumitelne.
    while (fgets(input, 512 , fr) != NULL){
            
            int i = 0;
            line++;
            unsigned len = strlen(input);
            
           
            char tmpstr[len];
            tmpstr[0] = 0;        //pro poreby fce strcat, ktera appenduje od prvni nuly
            
            char c[1];
           
            
            while (input[i]){
      
              c[0] = input[i];
              if (isupper(*c)) c[0]=tolower(*c);   //pismenko se predela na male jeste bez problemu  
      
              strcat(tmpstr, c); //zde problem, spolu s konvertovanym pismenkem se pripne cely obsah input[];
              i++;
            }

    Řešení dotazu:


    Odpovědi

    21.9.2012 06:53 rastos | skóre: 63 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    c je deklarované ako char c[1]. Teda jednoprvkové pole charov. Neskôr s ním ale zaobchádzaš ako so stringom keď ho pošleš do strcat(). To ale robí galibu, pretože nie je "zero-terminated". Neskúmal som či sú v tom ešte aj nejaké iné problémy, ale keď už si zvolil tento prístup tak skús deklarovať c ako char c[]={0,0};

    Predsa len by som ale odporučil skúsiť nájsť nejaké iné riešenie, pretože niektoré znaky sa pri prevode na veľké/malé menia počet znakov (napr. nemecké ostré s), alebo niektoré znaky nie sú v jednom char-e pri multibyte-ovom kódovaní, atď ...
    tomes.io avatar 21.9.2012 10:57 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Tva deklarace
    char c[]={0,0};
    pomohla, ted uz to kopiruje korektne, diky.

    Ja bych taky rad nasel jine reseni, jenze hledal jsem dlouho a na zadne jsem neprisel, nez vse prevest na mala/velka pismenka a pak pouzit strstr(). Kdyby byla nejaka funkce jako strstrt() ale case insensitive, tak beru vsema deseti :)
    21.9.2012 11:14 rastos | skóre: 63 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Ak odignorujeme všetky problémy s multi-byte kodovaním a podobne tak môžeš aj hľadaný podreťazec aj prehľadávaný riadok previesť na uppercase cez strupr() a robiť strstr() na výsledku.

    Ak do úvahy pripadajú aj iné než ascii znaky, tak preveď text na wchar cez mbstowcs() a hľadaj pomocou wcsstr().
    21.9.2012 11:16 rastos | skóre: 63 | blog: rastos
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    ... po prevedení na uppercase cez towupper()
    21.9.2012 08:23 Michal Kubeček | skóre: 71 | Luštěnice
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    POSIXovou strcasecmp jsem zavrhl, protoze kontroluje cely string naraz, nevraci ukazatel na prvni vyskyt jako case sensitive strstr(), coz je mimoradna skoda

    Proč by měla vracet nějaký výskyt? Výskyt čeho? Tvrdíte, že chcete porovnat dva řetězce, a přesně to strcasecmp() dělá. Vrací vám výsledek toho porovnání. Oproti tomu strstr() je funkce pro vyhledání podřetězce, takže je celkem logické, že vrací pointer na první výskyt toho podřetězce; jen jaksi neporovnává…

    Zásadní problém je úplně jiný: ta funkce ignoruje locale, takže vám například veškerá slova začínající písmenem s diakritikou zařadí až za "z". Proto je vhodnější použít strcoll().

    Doufam, ze jsem vse napsal srozumitelne.

    Moc ne. Zkuste konkrétně a přesně napsat, co vlastně potřebujete. To, co jste napsal, má příliš mnoho možných výkladů. Pokud např. potřebujete zjistit první znak, kde se dva řetězce liší (s ohledem na aktuální locale a bez rozlišení malých a velkých písmen), můžete použít mbrtowc() na načítání znaků a pak porovnávat hodnoty, které vám vrátí towlower(). Konvertovat si celý řetězec je zbytečné a neefektivní.

    tomes.io avatar 21.9.2012 10:51 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    PSal jsem hned na zacatku,ze hledam podretezce, ne retezce. Proto jsem zavrhnul strcasecmp(). Uzivatel zada jaky podretezec, slovo, cast slova, pismenko,chce delat a muj program mu vypise kolikrat se zadany podretezec vyskytl naradku. Proto strstr(), funguje bezvadne, akorat je case sensitive...

    Jak mj program vypada je videt z tohoto vlakna kde jsem mel jiny dotaz:
    http://www.abclinuxu.cz/poradna/programovani/show/366089
    tomes.io avatar 21.9.2012 11:00 tomes.io | skóre: 12 | blog: tomesh
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    Problem je v tom, ze ja potrebuju porovnat podretezce, tady i casti stringu, tudiz nemuzu pouzit ten posixovy porovnavac retezcu.

    ALe mozna... napada me jedna vec, snad kdybych si pomoci strtok() rozdeloval vety na slova (oddelovac by byla mezera) a pak porovnaval jeden token za druhym.
    21.9.2012 14:29 ::: | skóre: 14 | blog: e_lama
    Rozbalit Rozbalit vše Re: Case insensitive porovnani v C
    ja bych jenom upozornil ze ta implementace ma kvuli pouziti strcat uplne zbytecne kvadratickou slozitost. Priom by to slo udelat uplne jednoduse:
    while (input[i])
    {
            tmpstr[i] = tolower(input[i]);
            ++i;
    }
    tmpstr[i] = 0;
    
    dalsi vec je ze deklarace
    char tmpstr[len];
    
    vytvori pole dost velky na ulozeni retezce, ale ne ukoncujicy nuly

    totez:
    char c[1];
    
    proboha tam je tolik chyb ze bych to ani nespocital :-)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.