abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    26.12. 18:44 | Komunita

    Od soboty do úterý probíhá v Hamburku konference 39C3 (Chaos Communication Congress) věnovaná také počítačové bezpečnosti nebo hardwaru. Program (jiná verze) slibuje řadu zajímavých přednášek. Streamy a záznamy budou k dispozici na media.ccc.de.

    Ladislav Hagara | Komentářů: 0
    26.12. 13:22 | Zajímavý software

    Byl představen nový Xserver Phoenix, kompletně od nuly vyvíjený v programovacím jazyce Zig. Projekt Phoenix si klade za cíl být moderní alternativou k X.Org serveru.

    🇨🇽 | Komentářů: 7
    26.12. 13:11 | Nová verze

    XLibre Xserver byl 21. prosince vydán ve verzi 25.1.0, 'winter solstice release'. Od založení tohoto forku X.Org serveru se jedná o vůbec první novou minor verzi (inkrementovalo se to druhé číslo v číselném kódu verze).

    🇨🇽 | Komentářů: 0
    26.12. 03:33 | Nová verze

    Wayback byl vydán ve verzi 0.3. Wayback je "tak akorát Waylandu, aby fungoval Xwayland". Jedná se o kompatibilní vrstvu umožňující běh plnohodnotných X11 desktopových prostředí s využitím komponent z Waylandu. Cílem je nakonec nahradit klasický server X.Org, a tím snížit zátěž údržby aplikací X11.

    Ladislav Hagara | Komentářů: 0
    25.12. 14:44 | Nová verze

    Byla vydána verze 4.0.0 programovacího jazyka Ruby (Wikipedie). S Ruby Box a ZJIT. Ruby lze vyzkoušet na webové stránce TryRuby. U příležitosti 30. narozenin, první veřejná verze Ruby 0.95 byla oznámena 21. prosince 1995, proběhl redesign webových stránek.

    Ladislav Hagara | Komentářů: 0
    24.12. 02:11 | Komunita

    Všem čtenářkám a čtenářům AbcLinuxu krásné Vánoce.

    Ladislav Hagara | Komentářů: 30
    24.12. 02:00 | Nová verze

    Byla vydána nová verze 7.0 linuxové distribuce Parrot OS (Wikipedie). S kódovým názvem Echo. Jedná se o linuxovou distribuci založenou na Debianu a zaměřenou na penetrační testování, digitální forenzní analýzu, reverzní inženýrství, hacking, anonymitu nebo kryptografii. Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    23.12. 18:33 | Nová verze

    Vývojáři postmarketOS vydali verzi 25.12 tohoto před osmi lety představeného operačního systému pro chytré telefony vycházejícího z optimalizovaného a nakonfigurovaného Alpine Linuxu s vlastními balíčky. Přehled novinek v příspěvku na blogu. Na výběr jsou 4 uživatelská rozhraní: GNOME Shell on Mobile, KDE Plasma Mobile, Phosh a Sxmo.

    Ladislav Hagara | Komentářů: 0
    23.12. 13:55 | Nová verze

    Byla vydána nová verze 0.41.0 multimediálního přehrávače mpv (Wikipedie) vycházejícího z přehrávačů MPlayer a mplayer2. Přehled novinek, změn a oprav na GitHubu. Požadován je FFmpeg 6.1 nebo novější a také libplacebo 6.338.2 nebo novější.

    Ladislav Hagara | Komentářů: 0
    23.12. 12:44 | Nová verze

    Byla vydána nová verze 5.5 (novinky) skriptovacího jazyka Lua (Wikipedie). Po pěti a půl letech od vydání verze 5.4.

    Ladislav Hagara | Komentářů: 0
    Kdo vám letos nadělí dárek?
     (35%)
     (2%)
     (19%)
     (2%)
     (2%)
     (2%)
     (15%)
     (15%)
     (11%)
    Celkem 123 hlasů
     Komentářů: 18, poslední 24.12. 15:29
    Rozcestník

    Dotaz: Odstránenie HTML tagov z textu pomocou PHP

    5.2.2007 13:24 Peter
    Odstránenie HTML tagov z textu pomocou PHP
    Přečteno: 602×
    Dobrý deň Vám prajem.

    Mám za úlohu napísať exportný program z eshopu do CSV (prakticky som pred dokončením) len sa trápim s poslednou vecou a síce popis produktu. Popis produktu je formátovaný pomocou HTML tagov (rôzne div-y, strong-y, ...) a ja potrebujem všetky tieto HTML tagy odstrániť aby mi zostal len čistý text a samozrejme to potrebujem zrobiť výlučne pomocou PHP (čiže žiadne sed, ...). Na www.php.cz som už hľadal, len som z toho nejaký nemúdry - vlastne by mi stačilo ma len naviesť na nejakú funkciu.

    Vopred ďakujem za všetky odpovede.

    Odpovědi

    5.2.2007 13:28 Andrej Herceg | skóre: 43
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    5.2.2007 13:37 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    OK - super - toto je ono, len mi tam ešte nejako zostali rôzne nbsp; (ako tu vlastne mám zapísať znak & :-)), \r, \t, ... a s tým čo?

    Ale aj tak - VRELÁ VĎAKA.
    5.2.2007 13:44 kaaja | skóre: 24 | blog: Sem tam něco | Podbořany, Praha
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    5.2.2007 15:25 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    OK - aj toto je super - ale ešte stále mi tam zostali nejaké "artefakty". Výsledný (terajší) export vyzerá takto. Prvý riadok je dobre, "druhý" je na figu a tretí je opäť dobre. Tento CSV je v UTF-8 a záznamy v riadkoch sú oddelené pomocou tabulátora.

    Ešte raz - vrelá vďaka - a kto mi pomôže tak ten keď bude v košiciach tak má u mňa pivo :-)
    5.2.2007 19:27 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Sorry, že otravujem - ale fakt to niekto nevie? (ja viem, že štandartne kto vie odpovie, ale aj tak)
    5.2.2007 19:39 Andrej Herceg | skóre: 43
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Z toho csv vôbec netuším ako to má vyzerať (a čo je tam zlé). Najlepšie by bolo dať nejaký naformátovaný (obsahujúci tie tagy a entity) dokument, ktorý treba zmeniť na plain text.

    PS: Jediné čo som si v tom csv všimol je, že sa s pôvodného html odstránila entita   a nedala sa za ňu náhrada (teda medzera).
    5.2.2007 20:00 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    No - problém je v tom, že

    Riadok csv-čka má vyzerať takto:
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
    .
    .
    .

    Ibaže - PopisProduktu je v eshope formátovaný klasicky pomocou HTML (ja viem, že je to totálne nevalídne, ale to už nerobím ja :-)) a ja len vlastne z tohto HTML súboru potrebujem vytiahnúť čistý text - žiadne nové riadky, žiadne HTML tagy, ... len proste čistý súvislý (v jednom riadku) popis produktu

    Veľmi pekne ďakujem.
    5.2.2007 21:09 Sinuhet | skóre: 31
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    <?php
    
    	$str = file_get_contents('http://student.ics.upjs.sk/~supervisor/PopisProduktu.txt');
    	$str = trim(preg_replace('/[\s\xa0]+/', ' ', html_entity_decode(strip_tags($str))));
    
    	$str = iconv('windows-1250', 'utf-8', $str);
    
    	echo "$str\n";
    
    ?>
    5.2.2007 21:32 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Supeeeeeeer - toto je ono čo som hľadal.

    A že som taký smelý - čo vlastne toto (trim(preg_replace('/[\s\xa0]+/', ' ', html_entity_decode(strip_tags($str))));) robí? html_entity encode a strip_tags viem čo je, ale nejak sa neviem vysomáriť z trim, preg_replace a hlavne z /[\s\xa0]+/.

    Veľmi pekne ďakujem za pomoc.
    5.2.2007 22:16 Sinuhet | skóre: 31
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP

    trim, popis syntaxe regularnich vyrazu u preg_replace.

    preg_replace('/[\s\xa0]+/', ' ', $str) nahradi sekvence netisknutelnych znaku za jednu mezeru. Tvrda mezera (hexa A0 - asi prekonvertovane &nbsp;) se tam musi dodat zvlast, \s ji nezahrnuje (??).

    6.2.2007 06:37 Peter
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    Hmmmmm - veľmi pekne ďakujem - zasa som o niečo múdrejší ;-)
    5.2.2007 19:54 R
    Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
    No sice neviem, co s tym chces robit, ale na taketo veci sa pouziva strip_tags v kombinacii s trim, str_replace a strtr.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.