abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 04:44 | IT novinky

    Společnost Meta na dvoudenní konferenci Meta Connect 2025 představuje své novinky. První den byly představeny nové AI brýle: Ray-Ban Meta (Gen 2), sportovní Oakley Meta Vanguard a především Meta Ray-Ban Display s integrovaným displejem a EMG náramkem pro ovládání.

    Ladislav Hagara | Komentářů: 1
    dnes 01:11 | Nová verze

    Po půl roce vývoje od vydání verze 48 bylo vydáno GNOME 49 s kódovým názvem Brescia (Mastodon). S přehrávačem videí Showtime místo Totemu a prohlížečem dokumentů Papers místo Evince. Podrobný přehled novinek i s náhledy v poznámkách k vydání a v novinkách pro vývojáře.

    Ladislav Hagara | Komentářů: 2
    včera 16:22 | Nová verze

    Open source softwarový stack ROCm (Wikipedie) pro vývoj AI a HPC na GPU od AMD byl vydán ve verzi 7.0.0. Přidána byla podpora AMD Instinct MI355X a MI350X.

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | Nová verze

    Byla vydána nová verze 258 správce systému a služeb systemd (GitHub).

    Ladislav Hagara | Komentářů: 5
    včera 15:11 | Nová verze

    Byla vydána Java 25 / JDK 25. Nových vlastností (JEP - JDK Enhancement Proposal) je 18. Jedná se o LTS verzi.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | Humor

    Věra Pohlová před 26 lety: „Tyhle aféry každého jenom otravují. Já bych všechny ty internety a počítače zakázala“. Jde o odpověď na anketní otázku deníku Metro vydaného 17. září 1999 na téma zneužití údajů o sporožirových účtech klientů České spořitelny.

    Ladislav Hagara | Komentářů: 5
    včera 11:33 | Zajímavý článek Ladislav Hagara | Komentářů: 0
    16.9. 21:44 | Nová verze

    Byl vydán Mozilla Firefox 143.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Nově se Firefox při ukončování anonymního režimu zeptá, zda chcete smazat stažené soubory. Dialog pro povolení přístupu ke kameře zobrazuje náhled. Obzvláště užitečné při přepínání mezi více kamerami. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 143 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    16.9. 17:22 | Nová verze

    Byla vydána betaverze Fedora Linuxu 43 (ChangeSet), tj. poslední zastávka před vydáním finální verze, která je naplánována na úterý 21. října.

    Ladislav Hagara | Komentářů: 0
    16.9. 12:22 | Nová verze

    Multiplatformní emulátor terminálu Ghostty byl vydán ve verzi 1.2 (𝕏, Mastodon). Přehled novinek, vylepšení a nových efektů v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (48%)
     (57%)
     (0%)
     (5%)
     (14%)
     (5%)
     (14%)
     (5%)
     (10%)
    Celkem 21 hlasů
     Komentářů: 2, poslední dnes 09:57
    Rozcestník

    Dotaz: Odstránenie HTML tagov z textu pomocou PHP

    5.2.2007 13:24 Peter
    Odstránenie HTML tagov z textu pomocou PHP
    Přečteno: 581×
    Dobrý deň Vám prajem.

    Mám za úlohu napísať exportný program z eshopu do CSV (prakticky som pred dokončením) len sa trápim s poslednou vecou a síce popis produktu. Popis produktu je formátovaný pomocou HTML tagov (rôzne div-y, strong-y, ...) a ja potrebujem všetky tieto HTML tagy odstrániť aby mi zostal len čistý text a samozrejme to potrebujem zrobiť výlučne pomocou PHP (čiže žiadne sed, ...). Na www.php.cz som už hľadal, len som z toho nejaký nemúdry - vlastne by mi stačilo ma len naviesť na nejakú funkciu.

    Vopred ďakujem za všetky odpovede.

    Odpovědi

    5.2.2007 13:28 Andrej Herceg | skóre: 43
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    5.2.2007 13:37 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    OK - super - toto je ono, len mi tam ešte nejako zostali rôzne nbsp; (ako tu vlastne mám zapísať znak & :-)), \r, \t, ... a s tým čo?

    Ale aj tak - VRELÁ VĎAKA.
    5.2.2007 13:44 kaaja | skóre: 24 | blog: Sem tam něco | Podbořany, Praha
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    5.2.2007 15:25 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    OK - aj toto je super - ale ešte stále mi tam zostali nejaké "artefakty". Výsledný (terajší) export vyzerá takto. Prvý riadok je dobre, "druhý" je na figu a tretí je opäť dobre. Tento CSV je v UTF-8 a záznamy v riadkoch sú oddelené pomocou tabulátora.

    Ešte raz - vrelá vďaka - a kto mi pomôže tak ten keď bude v košiciach tak má u mňa pivo :-)
    5.2.2007 19:27 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Sorry, že otravujem - ale fakt to niekto nevie? (ja viem, že štandartne kto vie odpovie, ale aj tak)
    5.2.2007 19:39 Andrej Herceg | skóre: 43
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Z toho csv vôbec netuším ako to má vyzerať (a čo je tam zlé). Najlepšie by bolo dať nejaký naformátovaný (obsahujúci tie tagy a entity) dokument, ktorý treba zmeniť na plain text.

    PS: Jediné čo som si v tom csv všimol je, že sa s pôvodného html odstránila entita   a nedala sa za ňu náhrada (teda medzera).
    5.2.2007 20:00 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    No - problém je v tom, že

    Riadok csv-čka má vyzerať takto:
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    .
    .
    .

    Ibaže - PopisProduktu je v eshope formátovaný klasicky pomocou HTML (ja viem, že je to totálne nevalídne, ale to už nerobím ja :-)) a ja len vlastne z tohto HTML súboru potrebujem vytiahnúť čistý text - žiadne nové riadky, žiadne HTML tagy, ... len proste čistý súvislý (v jednom riadku) popis produktu

    Veľmi pekne ďakujem.
    5.2.2007 21:09 Sinuhet | skóre: 31
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    <?php
    
    	$str = file_get_contents('http://student.ics.upjs.sk/~supervisor/PopisProduktu.txt');
    	$str = trim(preg_replace('/[\s\xa0]+/', ' ', html_entity_decode(strip_tags($str))));
    
    	$str = iconv('windows-1250', 'utf-8', $str);
    
    	echo "$str\n";
    
    ?>
    5.2.2007 21:32 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Supeeeeeeer - toto je ono čo som hľadal.

    A že som taký smelý - čo vlastne toto (trim(preg_replace('/[\s\xa0]+/', ' ', html_entity_decode(strip_tags($str))));) robí? html_entity encode a strip_tags viem čo je, ale nejak sa neviem vysomáriť z trim, preg_replace a hlavne z /[\s\xa0]+/.

    Veľmi pekne ďakujem za pomoc.
    5.2.2007 22:16 Sinuhet | skóre: 31
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP

    trim, popis syntaxe regularnich vyrazu u preg_replace.

    preg_replace('/[\s\xa0]+/', ' ', $str) nahradi sekvence netisknutelnych znaku za jednu mezeru. Tvrda mezera (hexa A0 - asi prekonvertovane &nbsp;) se tam musi dodat zvlast, \s ji nezahrnuje (??).

    6.2.2007 06:37 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Hmmmmm - veľmi pekne ďakujem - zasa som o niečo múdrejší ;-)
    5.2.2007 19:54 R
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    No sice neviem, co s tym chces robit, ale na taketo veci sa pouziva strip_tags v kombinacii s trim, str_replace a strtr.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.