Portál AbcLinuxu, 9. května 2025 00:35
man cokoliv co pracuje s regulárními výrazyMísto otazníku použít tečku. A jestli to mají být skutečně slova, tak ten výraz dát do \<...\>
sed 's/\<\|\>/\n/g' | sed -n '/^..x9..c$/p'
grep -o '\<..x9..c\>'
Tohle funguje, ale vypise to celou radku za tim slovem.Přesně tomu zamezí přepínač
-o
. Co to máš za verzi grepu?
$ grep --version grep (GNU grep) 2.5.1 Copyright 1988, 1992-1999, 2000, 2001 Free Software Foundation, Inc. This is free software; see the source for copying conditions. There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
cat test.txt | sed 's/\ /\ /g' | sed -n '/^..x9..c$/p'
awk '{ gsub(/\ /, "\n"); print }' | sed -n '/^..x9..c$/p'
Ten html kod se me nepodarilo sem zapsatNepodařilo se to kvůli zobáčkům?
#!/usr/bin/env python # -*- coding: iso-8859-2 import re html = u''' ID_CENINA=11392'>ČEZ</a></td><td class="tr">815,16</td> ... -0,52 ''' id = u'ČEZ' regexp = re.compile(id + r'.*?(\d+(?:,\d+)?)') print regexp.search(html).groups()[0]Vypíše
#!/usr/bin/env python # -*- coding: iso-8859-2 import re, urllib2 id = 'ČEZ' regexp = re.compile(r'ID_CENINA=\d+.*' + id + r'.*?(\d+(?:,\d+)?)', re.DOTALL) url = 'http://tech.autohlavka.com/extrakce.html' html = urllib2.urlopen(url).read() print regexp.search(html).groups()[0]vypíše opět 815,16 ale tentokrát to stáhne html z tvé stránky.
html = file('index.html').read()
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.