Portál AbcLinuxu, 8. května 2025 18:20

Dotaz: PHP: "očistenie" reťazca po base64_decode od špeciálnych znakov

3.6.2014 12:05 Peter
PHP: "očistenie" reťazca po base64_decode od špeciálnych znakov
Přečteno: 260×
Odpovědět | Admin
Dobrý deň vám prajem.

Mám 3 funkcie pre base64:
function base64_encode_urlsafe($Data) { return str_replace(array('+','/','='),array('-','_','.'),base64_encode(iconv('UTF-8','UTF-8//IGNORE',$Data))); }           
function base64_decode_urlsafe($Data) { return iconv('UTF-8','UTF-8//IGNORE',base64_decode(str_replace(array('-','_','.'),array('+','/','='),$Data),true)); }      
function base64_decode_recurse($Data)                                                                                                                              
  {                                                                                                                                                                
    $C=0;                                                                                                                                                          
    while(base64_encode_urlsafe(base64_decode_urlsafe($Data))===$Data)                                                                                             
      {                                                                                                                                                            
        $C++;                                                                                                                                                      
        if(($C>1 && strlen($Data)<=4) || ($C>50)) {  break; }                                                                                                      
        else { $Data=base64_decode_urlsafe($Data); }                                                                                                               
      }                                                                                                                                                            
    return $Data;                                                                                                                                                  
  }
V podstate prve dve sú urlsafe modifikácie a tá tretia robí nasledovné: aplikácia na strane klienta zakódováva dáta do base64 pomocou javascriptu, ale asi v jednom prípade zo sto sa stane, že reťazec zakóduje dvakrát - to znamená, že z reťazca "test" dostanem "ZEdWemRBPT0=", čiže potrebujem sa točiť dookola kým si myslím, že daný reťazec je zakódovaný do base64.

Problém je ale v testovaní či daný reťazec ešte je base64. Ako jediný použitelný test som našiel tento:
base64_encode_urlsafe(base64_decode_urlsafe($Data))===$Data
Ale aj tento má svoje muchy. Napríklad po base64_decode("test") dostanem toto: "��-" a existujú určité reťazce, ktoré znova po zakódovaní dostanú pôvodný výsledok, čiže test platí a return vyhodí práve ten nezmysel. S týmto som si poradil relatívne ľakho pomocou iconv, ktorý ten otáznik (čo je vlastne U+FFFD) odstráni a test už v tomto prípade neplatí.

A teraz sa dostávam k jadru môjho problému: var_dump(base64_decode("Bio=")) vyhodí: string(2) "*" a toto je problém, že táto hviezdička nie je normálna hviezdička, lebo keď urobím toto: var_dump("*") tak dostanem nasledovné: string(1) "*". Ono v podstate keď som ten string kopíroval tuto do textového editoru, tak som dostal string(2) "*", ale po zobrazení náhľadu stránky som už videl string(2) "?*" - dôležitý je tam ten otáznik pred hviezdičkou. Ale v textovom editore som to stále videl bez toho otáznika a keď som chcel ten "neviditelný" znak vymazať, tak som musel dvakrát stlačiť backspace.

A moja otázka znie - ako odstránim všetky špeciálne znaky z reťazca a vlastne ktoré to sú tie špeciálne znaky, lebo také znaky ako písmená s/bez diakritiky, číslice, /*-+="'!{}&€$...... chcem samozrejme zachovať.

Dúfam, že ste ma pochopili a vopred vám veľmi pekne ďakujem.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

3.6.2014 13:29 Lucius
Rozbalit Rozbalit vše Re: PHP: "očistenie" reťazca po base64_decode od špeciálnych znakov
Odpovědět | | Sbalit | Link | Blokovat | Admin
Asi hledas filtry

http://cz2.php.net/manual/en/filter.filters.sanitize.php

http://cz2.php.net/manual/en/function.filter-var.php
3.6.2014 14:05 Filip Jirsák
Rozbalit Rozbalit vše Re: PHP: "očistenie" reťazca po base64_decode od špeciálnych znakov
Odpovědět | | Sbalit | Link | Blokovat | Admin
Na otázku, které jsou to ty speciální znaky, si musíte odpovědět vy sám. Váš dotaz totiž ve stručnosti říká: „mám funkci, která mi někdy vyrábí platný výstup a někdy smetí. Potřebuju od sebe ten platný výstup a smetí rozpoznat.“ My ale nevíme, co je tím platným výstupem, takže vám nemůžeme poradit, jak jej poznat.

Celý váš problém má ale řešení, které je nesrovnatelně jednodušší než to, co v dotazu složitě popisujete. Opravte tu JavaScriptovou část aplikace, ať do base64 kóduje jenom jednou. Nic jiného vám stejně nepomůže, ať vymyslíte jakýkoli narovnák na vohejbák, pořád to nebude fungovat stoprocentně.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.