Portál AbcLinuxu, 12. května 2025 08:20

Dotaz: ako vypisat sled znaku z html?

12.2.2006 15:57 Stefan
ako vypisat sled znaku z html?
Přečteno: 94×
Odpovědět | Admin
Dobry den, chcel by som ziskat z html suboru vsetky podobne vyrazi ako ir_myfr000139587 alebo ir_sken000139587. Vlastne sa to vzdy zacina s ir_ potom naleduju 4 pismena a 9 cisel. Viem ze sa to da napisat v sed, no nechce my to fungovat. Dekuji za pomoc
Nástroje: Začni sledovat (2) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

12.2.2006 16:14 tweety
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Odpovědět | | Sbalit | Link | Blokovat | Admin
#grep -e ^(ir_)[a-z]{4}[0-9]{9} (soubor, venkterem chces hledat)
Snad jsem se neseknul... nemam to ted jak vyzkouset
12.2.2006 16:44 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Vzhledem k výskytu potenciálně problematických znaků bych celý ten regulární výraz dal raději do apostrofů. Kulaté závorky jsou tam zbytečné.
12.2.2006 16:49 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Vzhledem k výskytu potenciálně problematických znaků bych celý ten regulární výraz dal raději do apostrofů. Kulaté závorky jsou tam zbytečné.
12.2.2006 17:23 tweety
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
nj. Na ty apostrofy jsem zapomnel.
12.2.2006 19:23 Stefan
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Dekuji za radu, bohuzel to nefunguje. Nevypise my to absolutne nic i kdyz to tam je vic nez 500 krat.
12.2.2006 19:39 Michal Kubeček | skóre: 72 | Luštěnice
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Protože ten regulární výraz je psaný jako extended regular expression. Použijte egrep nebo 'grep -E'.
12.2.2006 20:09 Stefan
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
grep -e 'ir_[a-z]{4}[0-9]{9}' funguje, ale vypisuje cele riadky vyskytu. Ja by som to chcel dostat asi nasledovne:
ir_slsq000246105
ir_kncl000072612
ir_slsq000242558
David Watzke avatar 12.2.2006 20:16 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Potom zkus tohle:
sed 's: :\n:' ten_soubor.html | grep -e 'ir_[a-z]{4}[0-9]{9}'
“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
David Watzke avatar 12.2.2006 20:19 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Oprava:
sed 's: :\n:' ten_soubor.html | egrep 'ir_[a-z]{4}[0-9]{9}'
“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
12.2.2006 20:30 Stefan
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Dostavam to sami, nechci to sem nakopirovat vse ale vypada to asi takto:
src="/counter/c.gif?pt=list&it=SS&ir=ir_slsq000125635,ir_myfr000139587,ir_slsq000253313,
ir_slsq000236301,ir_kncl000228692,ir_kncl000212321,ir_kncl000266522,ir_slsq000243873,
ir_kncl000250537,ir_myfr000248489,ir_kncl000257495,ir_slsq000252238,ir_kncl000246602,ir_slsq000173336,
ir_kncl000159609,ir_kncl000262343,ir_slsq000117256,ir_slsq000236142,ir_slsq000236341,ir_kncl000150016,
ir_kncl000211704,ir_kncl000225454,ir_slsq000174661,ir_kncl000263016,ir_slsq000092331,ir_kncl000063707
David Watzke avatar 12.2.2006 20:36 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Tohle jsem potřeboval vidět...
sed -e 's#,# #g' -e 's#=# #g' \ # Takhle tam vyjmenuješ ty znaky kolem kterých to je
-e 's# #\n#g' ten_soubor.html | egrep 'ir_[a-z]{4}[0-9]{9}'
“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
David Watzke avatar 12.2.2006 20:26 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Jestli je to obalený nějakými HTML tagy (prostě těsne u < a >), tak snad pomůže
sed -e 's#># #g' -e 's#<# #g' -e 's# #\n#g' ten_soubor.html | \
egrep 'ir_[a-z]{4}[0-9]{9}'
“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
12.2.2006 20:59 Stefan
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Zabalene to je takto: href="/search?md5=28e5ec329d89603c654e3f448d5ae3bf&search_form=keyword&search_type=SS&inst_ref=ir_slsq000236301&submit_type=search"
David Watzke avatar 12.2.2006 21:13 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
V tom případě by mělo stačit to, co jsem psal výše s drobnou obměnou...
sed -e 's#,# #g' -e 's#=# #g' -e 's#&# #g' -e 's# #\n#g' \
ten_soubor.html | egrep 'ir_[a-z]{4}[0-9]{9}'
“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
12.2.2006 21:29 Stefan
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
Dekuji po pridani | uniq -d na konec prikazu je to dokonali.
David Watzke avatar 12.2.2006 21:32 David Watzke | skóre: 74 | blog: Blog... | Praha
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
To jsem rád :-)
“Being honest may not get you a lot of friends but it’ll always get you the right ones” ―John Lennon
Josef Kufner avatar 13.2.2006 01:47 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: ako vypisat sled znaku z html?
man grep
/^ *-o
Hello world ! Segmentation fault (core dumped)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.