abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 16:00 | Nová verze

Byl vydán Mozilla Firefox 51.0. Z novinek lze upozornit například na upozorňování na přihlašování přes nešifrované spojení (HTTP), podporu pro přehrávání bezeztrátového formátu FLAC nebo podporu WebGL 2. Podrobné informace v poznámkách k vydání a na stránce věnované vývojářům. Řešeny jsou také bezpečnostní chyby.

Ladislav Hagara | Komentářů: 0
včera 17:25 | IT novinky

Do prodeje (Farnell) se dostal jednodeskový počítač Tinker Board (unboxing). Jedná se o konkurenci Raspberry Pi 3 od společnosti Asus. Porovnání (jpg) těchto počítačů například na CNXSoft. Cena Tinker Boardu je 55 £.

Ladislav Hagara | Komentářů: 13
včera 14:44 | Zajímavý projekt

Byla zveřejněna pravidla hackerské soutěže Pwn2Own 2017, jež proběhne od 15. do 17. března v rámci bezpečnostní konference CanSecWes ve Vancouveru. Soutěžit se bude o více než milion dolarů v pěti kategoriích. Letos se bude útočit i na Ubuntu. Jedná se již o 10. ročník této soutěže.

Ladislav Hagara | Komentářů: 2
včera 13:33 | Nová verze

Po sedmi měsících vývoje od vydání verze 5.7 byla vydána verze 5.8 (YouTube) toolkitu Qt. Z novinek lze zmínit například Qt Lite pro vestavěná zařízení. Nově jsou plně podporovány moduly Qt Wayland Compositor (YouTube) a Qt SCXML (YouTube). Současně byla vydána verze 4.2.1 integrovaného vývojového prostředí (IDE) Qt Creator.

Ladislav Hagara | Komentářů: 1
včera 11:52 | Pozvánky

Lednový Prague Containers Meetup se koná ve čtvrtek 26. ledna 2017 od 18:00 v Apiary, Pernerova 49, Praha 8. Přijďte se podívat na přednášky o Enterprise Kubernetes a Jenkins as a code.

little-drunk-jesus | Komentářů: 0
včera 11:40 | Pozvánky

Program letošního ročníku konference Prague PostgreSQL Developer Days, která se koná již 15. a 16. února 2017 na ČVUT FIT, Thákurova 9, Praha 6, byl dnes zveřejněn. Najdete ho na stránkách konference včetně anotací přednášek a školení. Registrace na konferenci bude otevřena zítra (24. ledna) v brzkých odpoledních hodinách.

TomasVondra | Komentářů: 0
22.1. 02:20 | Zajímavý článek

David Revoy, autor open source webového komiksu Pepper&Carrot nebo portrétu GNU/Linuxu, upozorňuje na svém blogu, že nový Inkscape 0.92 rozbíjí dokumenty vytvořené v předchozích verzích Inkscape. Problém by měl být vyřešen v Inkscape 0.92.2 [reddit].

Ladislav Hagara | Komentářů: 0
22.1. 02:02 | Komunita

Øyvind Kolås, hlavní vývojář grafických knihoven GEGL a babl, které využívá grafický program GIMP, žádá o podporu na Patreonu. Díky ní bude moci pracovat na vývoji na plný úvazek. Milník 1000 $, který by stačil na holé přežití, se již téměř podařilo vybrat, dalším cílem je dosažení 2500 $, které mu umožní běžně fungovat ve společnosti.

xkomczax | Komentářů: 12
21.1. 23:54 | Pozvánky

DevConf.cz 2017, již devátý ročník jedné z největších akcí zaměřených na Linux a open source ve střední Evropě, proběhne od pátku 27. ledna do neděle 29. ledna v prostorách Fakulty informačních technologií Vysokého učení technického v Brně. Na programu je celá řada zajímavých přednášek a workshopů. Letos je povinná registrace.

Ladislav Hagara | Komentářů: 0
21.1. 22:11 | Nová verze

Byla vydána verze 1.0.0 emulátoru terminálu Terminology postaveného nad EFL (Enlightenment Foundation Libraries). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (12%)
 (2%)
 (72%)
 (3%)
 (11%)
Celkem 393 hlasů
 Komentářů: 37, poslední dnes 12:21
Rozcestník
Reklama

Dotaz: Odstránenie HTML tagov z textu pomocou PHP

5.2.2007 13:24 Peter
Odstránenie HTML tagov z textu pomocou PHP
Přečteno: 518×
Dobrý deň Vám prajem.

Mám za úlohu napísať exportný program z eshopu do CSV (prakticky som pred dokončením) len sa trápim s poslednou vecou a síce popis produktu. Popis produktu je formátovaný pomocou HTML tagov (rôzne div-y, strong-y, ...) a ja potrebujem všetky tieto HTML tagy odstrániť aby mi zostal len čistý text a samozrejme to potrebujem zrobiť výlučne pomocou PHP (čiže žiadne sed, ...). Na www.php.cz som už hľadal, len som z toho nejaký nemúdry - vlastne by mi stačilo ma len naviesť na nejakú funkciu.

Vopred ďakujem za všetky odpovede.

Odpovědi

5.2.2007 13:28 Andrej Herceg | skóre: 43
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
5.2.2007 13:37 Peter
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
OK - super - toto je ono, len mi tam ešte nejako zostali rôzne nbsp; (ako tu vlastne mám zapísať znak & :-)), \r, \t, ... a s tým čo?

Ale aj tak - VRELÁ VĎAKA.
5.2.2007 13:44 kaaja | skóre: 23 | blog: Sem tam něco | Podbořany, Praha
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
5.2.2007 15:25 Peter
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
OK - aj toto je super - ale ešte stále mi tam zostali nejaké "artefakty". Výsledný (terajší) export vyzerá takto. Prvý riadok je dobre, "druhý" je na figu a tretí je opäť dobre. Tento CSV je v UTF-8 a záznamy v riadkoch sú oddelené pomocou tabulátora.

Ešte raz - vrelá vďaka - a kto mi pomôže tak ten keď bude v košiciach tak má u mňa pivo :-)
5.2.2007 19:27 Peter
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
Sorry, že otravujem - ale fakt to niekto nevie? (ja viem, že štandartne kto vie odpovie, ale aj tak)
5.2.2007 19:39 Andrej Herceg | skóre: 43
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
Z toho csv vôbec netuším ako to má vyzerať (a čo je tam zlé). Najlepšie by bolo dať nejaký naformátovaný (obsahujúci tie tagy a entity) dokument, ktorý treba zmeniť na plain text.

PS: Jediné čo som si v tom csv všimol je, že sa s pôvodného html odstránila entita   a nedala sa za ňu náhrada (teda medzera).
5.2.2007 20:00 Peter
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
No - problém je v tom, že

Riadok csv-čka má vyzerať takto:
NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
NazovProduktu tabulator PopisProduktu tabulator ZarucnaLehota tabulator PredajnaCena
.
.
.

Ibaže - PopisProduktu je v eshope formátovaný klasicky pomocou HTML (ja viem, že je to totálne nevalídne, ale to už nerobím ja :-)) a ja len vlastne z tohto HTML súboru potrebujem vytiahnúť čistý text - žiadne nové riadky, žiadne HTML tagy, ... len proste čistý súvislý (v jednom riadku) popis produktu

Veľmi pekne ďakujem.
5.2.2007 21:09 Sinuhet | skóre: 31
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
<?php

	$str = file_get_contents('http://student.ics.upjs.sk/~supervisor/PopisProduktu.txt');
	$str = trim(preg_replace('/[\s\xa0]+/', ' ', html_entity_decode(strip_tags($str))));

	$str = iconv('windows-1250', 'utf-8', $str);

	echo "$str\n";

?>
5.2.2007 21:32 Peter
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
Supeeeeeeer - toto je ono čo som hľadal.

A že som taký smelý - čo vlastne toto (trim(preg_replace('/[\s\xa0]+/', ' ', html_entity_decode(strip_tags($str))));) robí? html_entity encode a strip_tags viem čo je, ale nejak sa neviem vysomáriť z trim, preg_replace a hlavne z /[\s\xa0]+/.

Veľmi pekne ďakujem za pomoc.
5.2.2007 22:16 Sinuhet | skóre: 31
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP

trim, popis syntaxe regularnich vyrazu u preg_replace.

preg_replace('/[\s\xa0]+/', ' ', $str) nahradi sekvence netisknutelnych znaku za jednu mezeru. Tvrda mezera (hexa A0 - asi prekonvertovane &nbsp;) se tam musi dodat zvlast, \s ji nezahrnuje (??).

6.2.2007 06:37 Peter
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
Hmmmmm - veľmi pekne ďakujem - zasa som o niečo múdrejší ;-)
5.2.2007 19:54 R
Rozbalit Rozbalit vše Re: Odstránenie HTML tagov z textu pomocou PHP
No sice neviem, co s tym chces robit, ale na taketo veci sa pouziva strip_tags v kombinacii s trim, str_replace a strtr.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.