Portál AbcLinuxu, 27. července 2025 00:21
#!/usr/bin/env python import elementtree.ElementTree def get_title(stream): print stream stream += '</a>' tree = elementtree.ElementTree.fromstring(stream) return tree.get('title') try: print get_title('<a title="nejaky titulok" >') print get_title('<a title="nejaky titulok chybna" cast" >>') except: print 'Je tam nejaka chyba'Funkce get_title() vrací titulek a když se to nepovede, tak vyhodí výjimku.
#!/usr/bin/perl ($/, $\) = ('>', "\n"); while (<>) { print $ARGV unless m/\A[^<]*<(?:\w+(?:\s+\w+="[^"]*")*)|(?:\/\w+)>/; }pouzitie:
perl script.pl *.htmlvypise nazvy suborov s chybnymi elementami ten regex nie je 100%tny, pre html myslim postacuje
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.