Portál AbcLinuxu, 11. listopadu 2025 14:02
#!/usr/bin/env python
import elementtree.ElementTree
def get_title(stream):
print stream
stream += '</a>'
tree = elementtree.ElementTree.fromstring(stream)
return tree.get('title')
try:
print get_title('<a title="nejaky titulok" >')
print get_title('<a title="nejaky titulok chybna" cast" >>')
except:
print 'Je tam nejaka chyba'
Funkce get_title() vrací titulek a když se to nepovede, tak vyhodí výjimku.
#!/usr/bin/perl
($/, $\) = ('>', "\n");
while (<>) {
print $ARGV unless m/\A[^<]*<(?:\w+(?:\s+\w+="[^"]*")*)|(?:\/\w+)>/;
}
pouzitie:
perl script.pl *.htmlvypise nazvy suborov s chybnymi elementami ten regex nie je 100%tny, pre html myslim postacuje
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.