abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 03:33 | Bezpečnostní upozornění

    V dokumentově orientované databázi MongoDB byla nalezena a v upstreamu již opravena kritická bezpečností chyba CVE-2025-14847 aneb MongoBleed.

    Ladislav Hagara | Komentářů: 0
    včera 23:11 | IT novinky

    Při úklidu na Utažské univerzitě se ve skladovacích prostorách náhodou podařilo nalézt magnetickou pásku s kopií Unixu V4. Páska byla zaslána do počítačového muzea, kde se z pásky úspěšně podařilo extrahovat data a Unix spustit. Je to patrně jediný známý dochovaný exemplář tohoto 52 let starého Unixu, prvního vůbec programovaného v jazyce C.

    🇨🇽 | Komentářů: 0
    včera 15:55 | Komunita

    FFmpeg nechal kvůli porušení autorských práv odstranit z GitHubu jeden z repozitářů patřících čínské technologické firmě Rockchip. Důvodem bylo porušení LGPL ze strany Rockchipu. Rockchip byl FFmpegem na porušování LGPL upozorněn již téměř před dvěma roky.

    🇨🇽 | Komentářů: 5
    včera 15:44 | Zajímavý software

    K dispozici je nový CLI nástroj witr sloužící k analýze běžících procesů. Název je zkratkou slov why-is-this-running, 'proč tohle běží'. Klade si za cíl v 'jediném, lidsky čitelném, výstupu vysvětlit odkud daný spuštěný proces pochází, jak byl spuštěn a jaký řetězec systémů je zodpovědný za to, že tento proces právě teď běží'. Witr je napsán v jazyce Go.

    🇨🇽 | Komentářů: 0
    včera 15:33 | Zajímavý software

    Yazi je správce souborů běžící v terminálu. Napsán je v programovacím jazyce Rust. Podporuje asynchronní I/O operace. Vydán byl v nové verzi 25.12.29. Instalovat jej lze také ze Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    26.12. 18:44 | Komunita

    Od soboty do úterý probíhá v Hamburku konference 39C3 (Chaos Communication Congress) věnovaná také počítačové bezpečnosti nebo hardwaru. Program (jiná verze) slibuje řadu zajímavých přednášek. Streamy a záznamy budou k dispozici na media.ccc.de.

    Ladislav Hagara | Komentářů: 0
    26.12. 13:22 | Zajímavý software

    Byl představen nový Xserver Phoenix, kompletně od nuly vyvíjený v programovacím jazyce Zig. Projekt Phoenix si klade za cíl být moderní alternativou k X.Org serveru.

    🇨🇽 | Komentářů: 7
    26.12. 13:11 | Nová verze

    XLibre Xserver byl 21. prosince vydán ve verzi 25.1.0, 'winter solstice release'. Od založení tohoto forku X.Org serveru se jedná o vůbec první novou minor verzi (inkrementovalo se to druhé číslo v číselném kódu verze).

    🇨🇽 | Komentářů: 0
    26.12. 03:33 | Nová verze

    Wayback byl vydán ve verzi 0.3. Wayback je "tak akorát Waylandu, aby fungoval Xwayland". Jedná se o kompatibilní vrstvu umožňující běh plnohodnotných X11 desktopových prostředí s využitím komponent z Waylandu. Cílem je nakonec nahradit klasický server X.Org, a tím snížit zátěž údržby aplikací X11.

    Ladislav Hagara | Komentářů: 0
    25.12. 14:44 | Nová verze

    Byla vydána verze 4.0.0 programovacího jazyka Ruby (Wikipedie). S Ruby Box a ZJIT. Ruby lze vyzkoušet na webové stránce TryRuby. U příležitosti 30. narozenin, první veřejná verze Ruby 0.95 byla oznámena 21. prosince 1995, proběhl redesign webových stránek.

    Ladislav Hagara | Komentářů: 0
    Kdo vám letos nadělí dárek?
     (33%)
     (1%)
     (23%)
     (1%)
     (1%)
     (1%)
     (11%)
     (12%)
     (17%)
    Celkem 175 hlasů
     Komentářů: 18, poslední 24.12. 15:29
    Rozcestník

    Validace HTML v rámci testů

    15.12.2009 07:38 | Přečteno: 1380× | programování | Výběrový blog | poslední úprava: 15.12.2009 07:41

    Dělám na jedné webové aplikaci, u které bych chtěl kontrolovat HTML několika hlavních stránek, jestli jsem se někde neuklepl. Ruční validace se nehodí, protože vyžaduje čas a úsilí a tím pádem by šla dřív nebo později stranou: Pokud není řízení kvality automatizované, jako by nebylo.™ Vzpomněl jsem si, že validátor HTML5 poskytuje webové API.

    Aplikace je napsaná v Perlu s použitím Catalystu. Má jakous takous sadu automatických testů, takže se nabízelo v rámci testování překontrolovat i validitu:
    use utf8;
    use Test::Slow;
    use Test::More;
    use Catalyst::Test 'Foo';
    use LWP::UserAgent;
    
    sub is_valid {
        my $code = shift;
        my $ua = LWP::UserAgent->new;
        my $url = 'http://validator.nu/?out=gnu';
        my $response = $ua->post($url, Content_Type => 'text/html', Content => $code);
        return $response->as_string !~ /error/;
    }
    
    sub check_url {
        my $url = shift;
        my $content = get($url);
        return is_valid($content);
    }
    
    # TODO: Fails on redirected URLs
    ok check_url($_), "Page is valid: $_" for qw{
        /
        /foo/
        /foo/bar/
    };
    
    done_testing;
    Funguje to krásně. Test::Slow je můj vlastní výmysl, kterým odděluju „jednotkové“ (čti „rychlé“) testy od ostatních, abych mohl rychlejší testy spouštět častěji:
    package Test::Slow;
    
    use strict;
    use Test::More;
    
    BEGIN {
        plan(skip_all => 'Slow test.') if $ENV{QUICK_TEST};
    }
    
    1;
    
           

    Hodnocení: 100 %

            špatnédobré        

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    15.12.2009 07:49 retro
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Taky by to šlo přes http://validator.w3.cz/#validate-by-input a CURL. Neznám HTML5 validator.
    zoul avatar 15.12.2009 07:55 zoul | skóre: 43 | blog: | Boskovice
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Asi ano. (Z Chamurappiho jsem míval trochu osypky, ale věřím, že to myslí dobře :) Validator.nu je dobrý v tom, že umí výsledky vracet ve strojově zpracovatelném formátu. Zatím to nevyužívám ($response->as_string !~ /…/), ale výhledově bych chtěl, aby test mohl rovnou poukázat na chybu.
    15.12.2009 08:28 Jan Grmela | skóre: 45 | blog: Kilo šťávy z lachtana | Brno
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Díky! Něco takového jsem teď potřeboval. Zákazník si vymyslel, že chce ve fóru rich text editor a já už si představoval ty hrůzny s validováním HTML, co z toho polezou :-)

    P.S.: Ano, aplikace je v Catalystu
    hikikomori82 avatar 15.12.2009 08:49 hikikomori82 | skóre: 18 | blog: foobar | Košice
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    htmLawed
    16.12.2009 02:10 Jan Grmela | skóre: 45 | blog: Kilo šťávy z lachtana | Brno
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Dík, zkusím.
    Josef Kufner avatar 15.12.2009 09:56 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Díky. Dobrá inspirace. Na testování validity html jsem úplně zapomněl. Vlastně je to věc, která může pomoct odhalit i spoustu jiných problémů... třeba rozbitý strom z <li>, protože se porouchalo menu a podobně...
    Hello world ! Segmentation fault (core dumped)
    15.12.2009 10:59 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Jak je to rychlé? Nebylo by rychlejší použít lokální DTD / XML Schema validaci a některá zvláštní pravidla, které schéma neumí popsat prostě vynechat?
    zoul avatar 15.12.2009 12:07 zoul | skóre: 43 | blog: | Boskovice
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Pomalé testy pouštím jen před nahráváním nové verze na web, takže je to rychlé „dost“. Konkrétně šest vteřin na čtyři URL včetně režie Perlu a Catalystu. Místní validátor by byl určitě rychlejší, ale tohle je přenositelnější a nemusím se o nic starat. Pokud zrovna nejsem připojený k netu nebo vypadne Validator.nu, mám samozřejmě smůlu.
    15.12.2009 11:40 Andrej Herceg | skóre: 43
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Už dosť dlho používam Offline HTMLHelp.com Validator.

    Ak editor podporuje nastavenia pre chybové hlášky (prípadne dokáže spracovať chybové hlášky, ktoré vie spracovať aj Emacs), tak nie je problém potom skákať na riadok, v ktorom bola chyba... (napr. presne tak som to používal v editore Bluefish).
    15.12.2009 13:39 happy barney | skóre: 34 | blog: dont_worry_be_happy
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    a čo toto? len som našiel, neskúšal ... HTML::Validator
    15.12.2009 15:36 Radek Miček
    Rozbalit Rozbalit vše OT: Generování pouze validního HTML
    Bylo by hezké programovat v takovém jazyce, který by byl schopen prostřednictvím svého typového systému zaručit, že generované HTML je validní.
    zoul avatar 15.12.2009 16:05 zoul | skóre: 43 | blog: | Boskovice
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML
    K tomu by asi stačilo použít knihovnu. (Ačkoliv si zrovna neuvědomuju, jestli by všechny požadavky validity šly snadno ošetřit bez velkých opičáren v API.)
    15.12.2009 16:13 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML
    Na to stačí v nejhorším případě po každé úpravě stromu zavolat validátor. Čekám, že existující knihovny to mají řešeno chytřeji. Když jsem používal javovou dom4j, tak tam to fungovalo.
    15.12.2009 17:14 Radek Miček
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML
    Abych to upřesnil, myslel jsem, že by už kompilátor ověřoval validitu generovaného HTML, tj. jazyk nebo knihovna by neumožnila napsat kód generující nevalidní HTML.
    15.12.2009 18:14 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML

    V době překladu těžko, protože jedna z podmínek validity HTML je, že element a nesmí být vnořený. Jakmile budete mít v programu smyčku, neexistuje způsob, jak bez spuštění programu rozhodnout, zda program vloží odkaz do odkazu. To je problém principiální, nikoliv neschopnost programátorů.

    Pokud jde o knihovnu, tak za běhu je možné docílit toho, že se to nikdy nestane. Ale to už je za běhu. Jak jsem psal, třeba dom4j to umí. Objektu, přes který se buduje dokument se na počátku vrazí DTD a když aplikace zkusí porušit pravidla, tak dané volání knihovny selže.

    15.12.2009 20:34 Jirka P
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML
    Tenhle argument mi nějak nesedí - to pravidlo není principiálně odlišné od jiných (třeba že TABLE obsahuje THEAD, TBODY a TFOOT). Pokud byste udělal použitelný typový systém (v jakémkoli jazyce), který umí všechna pravidla HTML z DTD, tak by to šlo upravit na ta vnořená áčka IMHO lehce. Ale i to první by byl strašný nepoužitelný opruz.
    15.12.2009 21:08 Radek Miček | skóre: 23 | blog: radekm_blog
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML

    Já myslím, že by toho šlo dosáhnout i v běžných jazycích jako je třeba Java. Akorát bych potřeboval docela dost typů -- v podstatě bych do typů zakódoval stavový automat, tj, typy by byly stavy a funkce/metody přechody a jejich návratový typ by určoval cílový stav.

    15.12.2009 21:37 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML
    Praktický typový systém má konečné množství typů, tedy konečný automat, tedy regulární gramatika. Jenže (ořezané) HTML je bezkontextová.
    15.12.2009 22:11 Radek Miček | skóre: 23 | blog: radekm_blog
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML
    Ale já tu bezkontextovost nepotřebuji. Představte si, že chci třeba generovat do sebe zanořené divy, pak použiji třeba funkci create_div(obsah_divu) a ona mi vygeneruje jak otevírací, tak i uzavírací tag.
    15.12.2009 21:28 petr_p | skóre: 59 | blog: pb
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML
    Asi s A problém nebude, protože to je lokální dvou stavová záležitost, ale co taková jedinečnost identifikátorů (@id, @name). Na to asi CFL gramatika stačit nebude. Nebo uživatelsky zadefinované entity v lokálním DTD. Nejsem si jistý, že by to šlo. Sice se tvrdí, že HTML je CFL, ale na druhou stranu se hned dodává (nebo zapomíná dodat), že se tím myslí jazyk bez DTD a ostatních vychytávek. A nikde jsem gramatiku nebo důkaz neviděl.
    15.12.2009 22:02 Radek Miček | skóre: 23 | blog: radekm_blog
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML

    Máte pravdu, že jedinečnost id do typového systému budu kódovat dost těžko. Pokud bych chtěl zajít do extrému, tak mohu využít toho, že všechna slova lze očíslovat a čísla už v typovém systému reprezentovat mohu, takže by součástí typu muselo být i jaká id byla použita. Nicméně má to dost problémů.

    Další řešení je, že se id budou generovat automaticky -- nicméně, to už je podvod, protože to řeším za běhu.

    A třetím řešením je využít možnosti spouštět vlastní kód při běhu kompilátoru (pokud to jazyk podporuje), pak lze ověřit, zda-li id už nebylo použito.

    15.12.2009 20:44 Radek Miček | skóre: 23 | blog: radekm_blog
    Rozbalit Rozbalit vše Re: OT: Generování pouze validního HTML

    Přesněji mám na mysli něco jako WASH -- ten sice nezaručuje úplnou validitu nicméně s troškou snahy by se i to mohlo podařit.

    že element a nesmí být vnořený. Jakmile budete mít v programu smyčku, neexistuje způsob, jak bez spuštění programu rozhodnout

    Takový kód by se neměl vůbec přeložit. (Samozřejmě nevylučuji, že nastane situace, kdy program generuje validní kód a kompilátor ho odmítne, protože si tím není jistý. To je obecně nerozhodnutelné -- redukcí na halting problém.)

    Pro tento účel může být zajímavý jazyk OCamlDuce viz příklad.

    Jendа avatar 15.12.2009 18:22 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Pochopil jsem správně, že by to šlo udělat i lokálně pomocí tohoto?
    zoul avatar 15.12.2009 18:46 zoul | skóre: 43 | blog: | Boskovice
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Ano.
    Jendа avatar 15.12.2009 21:07 Jendа | skóre: 78 | blog: Jenda | JO70FB
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    A… proč se to tedy posílá nějaké cizí službě?
    zoul avatar 16.12.2009 07:18 zoul | skóre: 43 | blog: | Boskovice
    Rozbalit Rozbalit vše Re: Validace HTML v rámci testů
    Dobrá otázka :) (1) Na Validator.nu jsem si zvykl, když ještě ostatní validátory nepodporovaly HTML5. Když jsem teď začal přemýšlet nad validací, na místní validátory jsem úplně zapomněl. (2) Místní validátor je neperlová závislost, kterou bych musel udržovat na produkčním serveru a případně na všech mašinách, na kterých budu chtít aplikaci vyzkoušet. Momentálně jsou všechny závislosti řešitelné čistě přes CPAN – dokonce ani Apache nepotřebuju, a to je pěkné. (3) Chtěl jsem si vyzkoušet, jak rychle se dá napsat klient.

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.