abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 15:00 | Zajímavý článek

    Byl publikován přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie) za uplynulé dva měsíce. Servo zvládne už i Gmail. Zakázány jsou příspěvky generované pomocí AI.

    Ladislav Hagara | Komentářů: 5
    9.5. 17:22 | Nová verze

    Raspberry Pi Connect, tj. oficiální služba Raspberry Pi pro vzdálený přístup k jednodeskovým počítačům Raspberry Pi z webového prohlížeče, byla vydána v nové verzi 2.5. Nejedná se už o beta verzi.

    Ladislav Hagara | Komentářů: 1
    9.5. 15:22 | Komunita

    Google zveřejnil seznam 1272 projektů (vývojářů) od 185 organizací přijatých do letošního, již jednadvacátého, Google Summer of Code. Plánovaným vylepšením v grafických a multimediálních aplikacích se věnuje článek na Libre Arts.

    Ladislav Hagara | Komentářů: 0
    8.5. 19:22 | Nová verze

    Byla vydána (𝕏) dubnová aktualizace aneb nová verze 1.100 editoru zdrojových kódů Visual Studio Code (Wikipedie). Přehled novinek i s náhledy a videi v poznámkách k vydání. Ve verzi 1.100 vyjde také VSCodium, tj. komunitní sestavení Visual Studia Code bez telemetrie a licenčních podmínek Microsoftu.

    Ladislav Hagara | Komentářů: 0
    8.5. 18:00 | Nová verze

    Open source platforma Home Assistant (Demo, GitHub, Wikipedie) pro monitorování a řízení inteligentní domácnosti byla vydána v nové verzi 2025.5.

    Ladislav Hagara | Komentářů: 0
    8.5. 01:22 | Nová verze Ladislav Hagara | Komentářů: 0
    8.5. 00:55 | Zajímavý projekt

    PyXL je koncept procesora, ktorý dokáže priamo spúštat Python kód bez nutnosti prekladu ci Micropythonu. Podľa testov autora je pri 100 MHz približne 30x rýchlejší pri riadeni GPIO nez Micropython na Pyboard taktovanej na 168 MHz.

    vlk | Komentářů: 0
    7.5. 19:44 | Nová verze

    Grafana (Wikipedie), tj. open source nástroj pro vizualizaci různých metrik a s ní související dotazování, upozorňování a lepší porozumění, byla vydána ve verzi 12.0. Přehled novinek v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    7.5. 17:33 | Nová verze

    Raspberry Pi OS, oficiální operační systém pro Raspberry Pi, byl vydán v nové verzi 2025-05-06. Přehled novinek v příspěvku na blogu Raspberry Pi a poznámkách k vydání. Pravděpodobně se jedná o poslední verzi postavenou na Debianu 12 Bookworm. Následující verze by již měla být postavena na Debianu 13 Trixie.

    Ladislav Hagara | Komentářů: 0
    7.5. 05:33 | Komunita

    Richard Stallman dnes v Liberci přednáší o svobodném softwaru a svobodě v digitální společnosti. Od 16:30 v aule budovy G na Technické univerzitě v Liberci. V anglickém jazyce s automaticky generovanými českými titulky. Vstup je zdarma i pro širokou veřejnost.

    Ladislav Hagara | Komentářů: 17
    Jaký filesystém primárně používáte?
     (57%)
     (1%)
     (8%)
     (22%)
     (4%)
     (2%)
     (3%)
     (1%)
     (1%)
     (3%)
    Celkem 579 hlasů
     Komentářů: 26, poslední 8.5. 09:58
    Rozcestník

    Dotaz: Odstránenie HTML tagov z textu pomocou PHP

    5.2.2007 13:24 Peter
    Odstránenie HTML tagov z textu pomocou PHP
    Přečteno: 576×
    Dobrý deň Vám prajem.

    Mám za úlohu napísať exportný program z eshopu do CSV (prakticky som pred dokončením) len sa trápim s poslednou vecou a síce popis produktu. Popis produktu je formátovaný pomocou HTML tagov (rôzne div-y, strong-y, ...) a ja potrebujem všetky tieto HTML tagy odstrániť aby mi zostal len čistý text a samozrejme to potrebujem zrobiť výlučne pomocou PHP (čiže žiadne sed, ...). Na www.php.cz som už hľadal, len som z toho nejaký nemúdry - vlastne by mi stačilo ma len naviesť na nejakú funkciu.

    Vopred ďakujem za všetky odpovede.

    Odpovědi

    5.2.2007 13:28 Andrej Herceg | skóre: 43
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    5.2.2007 13:37 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    OK - super - toto je ono, len mi tam ešte nejako zostali rôzne nbsp; (ako tu vlastne mám zapísať znak & :-)), \r, \t, ... a s tým čo?

    Ale aj tak - VRELÁ VĎAKA.
    5.2.2007 13:44 kaaja | skóre: 24 | blog: Sem tam něco | Podbořany, Praha
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    5.2.2007 15:25 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    OK - aj toto je super - ale ešte stále mi tam zostali nejaké "artefakty". Výsledný (terajší) export vyzerá takto. Prvý riadok je dobre, "druhý" je na figu a tretí je opäť dobre. Tento CSV je v UTF-8 a záznamy v riadkoch sú oddelené pomocou tabulátora.

    Ešte raz - vrelá vďaka - a kto mi pomôže tak ten keď bude v košiciach tak má u mňa pivo :-)
    5.2.2007 19:27 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Sorry, že otravujem - ale fakt to niekto nevie? (ja viem, že štandartne kto vie odpovie, ale aj tak)
    5.2.2007 19:39 Andrej Herceg | skóre: 43
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Z toho csv vôbec netuším ako to má vyzerať (a čo je tam zlé). Najlepšie by bolo dať nejaký naformátovaný (obsahujúci tie tagy a entity) dokument, ktorý treba zmeniť na plain text.

    PS: Jediné čo som si v tom csv všimol je, že sa s pôvodného html odstránila entita   a nedala sa za ňu náhrada (teda medzera).
    5.2.2007 20:00 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    No - problém je v tom, že

    Riadok csv-čka má vyzerať takto:
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    .
    .
    .

    Ibaže - PopisProduktu je v eshope formátovaný klasicky pomocou HTML (ja viem, že je to totálne nevalídne, ale to už nerobím ja :-)) a ja len vlastne z tohto HTML súboru potrebujem vytiahnúť čistý text - žiadne nové riadky, žiadne HTML tagy, ... len proste čistý súvislý (v jednom riadku) popis produktu

    Veľmi pekne ďakujem.
    5.2.2007 21:09 Sinuhet | skóre: 31
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    <?php
    
    	$str = file_get_contents('http://student.ics.upjs.sk/~supervisor/PopisProduktu.txt');
    	$str = trim(preg_replace('/[\s\xa0]+/', ' ', html_entity_decode(strip_tags($str))));
    
    	$str = iconv('windows-1250', 'utf-8', $str);
    
    	echo "$str\n";
    
    ?>
    5.2.2007 21:32 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Supeeeeeeer - toto je ono čo som hľadal.

    A že som taký smelý - čo vlastne toto (trim(preg_replace('/[\s\xa0]+/', ' ', html_entity_decode(strip_tags($str))));) robí? html_entity encode a strip_tags viem čo je, ale nejak sa neviem vysomáriť z trim, preg_replace a hlavne z /[\s\xa0]+/.

    Veľmi pekne ďakujem za pomoc.
    5.2.2007 22:16 Sinuhet | skóre: 31
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP

    trim, popis syntaxe regularnich vyrazu u preg_replace.

    preg_replace('/[\s\xa0]+/', ' ', $str) nahradi sekvence netisknutelnych znaku za jednu mezeru. Tvrda mezera (hexa A0 - asi prekonvertovane &nbsp;) se tam musi dodat zvlast, \s ji nezahrnuje (??).

    6.2.2007 06:37 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Hmmmmm - veľmi pekne ďakujem - zasa som o niečo múdrejší ;-)
    5.2.2007 19:54 R
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    No sice neviem, co s tym chces robit, ale na taketo veci sa pouziva strip_tags v kombinacii s trim, str_replace a strtr.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.