Ruská firma Operation Zero nabízí až $4 miliony za funkčí exploit komunikační platformy Telegram. Nabídku učinila na platformě X. Firma je známá prodejem exploitů ruské vládě a soukromým společnostem. Další informace na securityweek.com.
Po 9 týdnech vývoje od vydání Linuxu 6.13 oznámil Linus Torvalds vydání Linuxu 6.14. Proč až v pondělí? V neděli prostě zapomněl :-). Přehled novinek a vylepšení na LWN.net: první a druhá polovina začleňovacího okna a Linux Kernel Newbies.
Konference LinuxDays 2025 proběhne o víkendu 4. a 5. října v Praze v areálu ČVUT v Dejvicích na FIT.
Mapy.cz rostou a postupně přechází na Mapy.com. V plánu je vylepšení Map novými zahraničními uživateli.
Byl představen Raspberry Pi PoE+ Injector pro napájení Raspberry Pi po datovém síťovém kabelu (PoE). Cena je 25 dolarů.
Jakub Vrána napsal AI plugin sql-gemini pro nástroj pro správu databáze v jednom PHP souboru Adminer. Plugin dovoluje sestavovat SQL dotazy pomocí AI, konkrétně pomocí Google Gemini.
Na čem aktuálně pracují vývojáři GNOME a KDE Plasma? Pravidelný přehled novinek v Týden v GNOME a Týden v KDE Plasma.
Byla vydána nová verze 0.4.15 (𝕏) svobodného operačního systému ReactOS (Wikipedie), jehož cílem je kompletní binární kompatibilita s aplikacemi a ovladači pro Windows. Přehled novinek i s náhledy v oznámení o vydání.
Byl představen rpi-image-gen, tj. oficiální nástroj pro vytváření vlastních softwarových obrazů pro zařízení Raspberry Pi.
Byla vydána nová major verze 8.0, aktuálně 8.0.1, softwaru pro správu elektronických knih Calibre (Wikipedie). Přehled novinek v poznámkách k vydání. Vypíchnuta je lepší podpora Kobo KEPUB formátu nebo integrovaný lokálně běžící engine Piper pro převod textu na řeč používaný pro čtení nahlas (již od verze 7.18).
Ahojte vsichni.
Mam nekolik odkazu:
<a href="/dafuq/lol/1/">1</a>
<a href="/dafuq/lol/2/">2</a>
<a href="/dafuq/lol/3/">3</a>
<a href="/dafuq/lol/4/">...</a>
<a href="/dafuq/lol/8/">8</a>
<a href="/dafuq/lol/9/">9</a>
Potrebuju z nich dostat tu cislovku na konci odkazu (napr. <a href="/dafuq/lol/9/">9</a>) pomoci regularniho vyrazu. Jak to mam udelat? Regexy mi vubec, vubec nejdou. Predem diky za pomoc
Řešení dotazu:
Uz jsem to vyresil
<a href="/dafuq/[^/]*/([^/\"]*)/">[^<>/]*</a>
xmllint
. Ta umí parsovat HTML o něco lépe.
for $x in doc("input.html")//a return substring-before(substring-after($x/@href, 'lol/'), '/')Možná to nevypadá tak elegantně jako regexp, ale poradí si to i s více odkazy na řádku, zalomenými atributy, komentáři...
lynx -dump -listonly -nonumbers http://abclinuxu.cz/Na vytáhnutí odkazů z HTML to je velice praktické. Pak už ty regulární výrazy lze použít snadno.
Na parsování HTML bych doporučil nástroje k tomu určené a ne regulární výrazy.
$ vim get_a_href.py #! /usr/bin/env python # -*- coding: utf-8 -*- import sys from lxml.html import parse if (len(sys.argv) != 2): print "Usage: %s FILENAME or URL" % sys.argv[0] sys.exit() page = parse(sys.argv[1]) urls = page.xpath('//a/@href') for url in urls: print url $ chmod +x get_a_href.py
<html> <a href="/dafuq/lol/1/">1</a> <a href="/dafuq/lol/2/">2</a> <a href="/dafuq/lol/3/">3</a> <a href="/dafuq/lol/4/">4</a> <a href="/dafuq/lol/5/">5</a> <a href="/dafuq/lol/6/">6</a> <a href="/dafuq/lol/7/">7</a> <a href="/dafuq/lol/8/">8</a> <a href="/dafuq/lol/9/">9</a> </html>Lze všechny URL získat takto:
xpath -q -e '//a/@href' soubor.xmlVýsledek:
href="/dafuq/lol/1/" href="/dafuq/lol/2/" href="/dafuq/lol/3/" href="/dafuq/lol/4/" href="/dafuq/lol/5/" href="/dafuq/lol/6/" href="/dafuq/lol/7/" href="/dafuq/lol/8/" href="/dafuq/lol/9/"
/dafuq/lol/1/ /dafuq/lol/2/ /dafuq/lol/3/ /dafuq/lol/4/ /dafuq/lol/8/ /dafuq/lol/9/nebo
1, 2, 3, 4, 8, 9jinak než sedem? Obvykle používám xsltproc, což je na některé drobnosti zbytečně těžký kalibr. Na jednodušší věci momentálně používám program xqilla, ale úplně mi nesedí.
xpath
vyměnit volání metody toString
za getNodeValue
a případně dál upravit dle potřeby.
#!/usr/bin/perl -w use XML::XPath; $xpath = XML::XPath->new(ioref => \*STDIN); my $names = $xpath->find('//a/@href'); for my $node ($names->get_nodelist) { $_ = $node->getNodeValue; s|^.*/([^/]*)/$|$1|; print $_, "\n"; }A to je celé. Volby jsou pryč, vstupem je STDIN. Dělá to jen to, co chce tazatel, ale přímo z HTML.
Tiskni
Sdílej: