Portál AbcLinuxu, 31. října 2025 04:04
 9.4.2018 22:46
Max             | skóre: 72
             | blog: Max_Devaine
        9.4.2018 22:46
Max             | skóre: 72
             | blog: Max_Devaine
            
         9.4.2018 23:37
Bedňa             | skóre: 34
             | blog: Žumpa
             | Horňany
        9.4.2018 23:37
Bedňa             | skóre: 34
             | blog: Žumpa
             | Horňany
        Existuje nějaké hotové řešení, které umožní uložit celou stránku do jednoho souboru nebo si to člověk musí napsat sám?Jinak se dívám, že na webu MAFF teď doporučují Save Page WE, který se snaží externí data do html souboru buď přímo includovat (např. v případě javascriptu nebo css) a binární data ukládá v javascriptu přes base64. Oproti MAFF je to downgrade, ale nějak to funguje.
Další možnost by bylo serverové řešení – takový webový archiv (něco jako archive.org) pro jednotlivce nebo skupinu lidíZkoušel jsi používat Archiveror? Btw taky umí ukládat lokálně do MHTML souboru, ale nefunguje to ve Firefoxu.
 9.4.2018 23:51
xkucf03             | skóre: 49
             | blog: xkucf03
        9.4.2018 23:51
xkucf03             | skóre: 49
             | blog: xkucf03
            
        Save Page WE, který se snaží externí data do html souboru buď přímo includovat (např. v případě javascriptu nebo css) a binární data ukládá v javascriptu přes base64. Oproti MAFF je to downgrade, ale nějak to funguje.
Dík, to vypadá dobře, vyzkouším…
 9.4.2018 23:56
limit_false             | skóre: 23
             | blog: limit_false
        9.4.2018 23:56
limit_false             | skóre: 23
             | blog: limit_false
            
         10.4.2018 00:28
xkucf03             | skóre: 49
             | blog: xkucf03
        10.4.2018 00:28
xkucf03             | skóre: 49
             | blog: xkucf03
            
        Tak jsem zjistil, že v Chromiu jde už pustit tisk i z příkazové řádky a lezou z toho (aspoň v případě Wikipedie) celkem slušné výsledky – např.
chromium-browser --incognito --headless --print-to-pdf="tisk.pdf" https://en.wikipedia.org/wiki/Balanced_audio
 10.4.2018 00:44
xkucf03             | skóre: 49
             | blog: xkucf03
        10.4.2018 00:44
xkucf03             | skóre: 49
             | blog: xkucf03
            
        A přes exiftool tam jdou přidat metadata. To vypadá dobře. Asi si na to udělám nějaký skript…
 10.4.2018 02:24
Josef Kufner             | skóre: 70
        10.4.2018 02:24
Josef Kufner             | skóre: 70
            
            
         10.4.2018 08:15
xkucf03             | skóre: 49
             | blog: xkucf03
        10.4.2018 08:15
xkucf03             | skóre: 49
             | blog: xkucf03
            
        Obrázky – schémata, grafy… Někdy by se hodilo plné rozlišení na stránce, ale do PDF se uloží jen náhled – člověk si pak musí velký obrázek uložit ručně bokem. Ty grafy bývají zase někdy generované JavaScripte (grrr) nebo jsou interaktivní – to se do PDF taky neuloží. Na to by byla dobrá ta proxy, která by dokázala zopakovat/nasimulovat tu HTTP komunikaci přesně tak, jaká byla v době ukládání – včetně třeba toho, že sis stáhl plné rozlišení obrázku – v archivu bys na něj pak taky mohl kliknout.
Problém by byly asi jen websockety a záměrná obfuskace ze strany toho webu.
 10.4.2018 11:58
Josef Kufner             | skóre: 70
        10.4.2018 11:58
Josef Kufner             | skóre: 70
            
            
         10.4.2018 15:05
limit_false             | skóre: 23
             | blog: limit_false
        10.4.2018 15:05
limit_false             | skóre: 23
             | blog: limit_false
            
         10.4.2018 10:50
Heron             | skóre: 53
             | blog: root_at_heron
             | Olomouc
        10.4.2018 10:50
Heron             | skóre: 53
             | blog: root_at_heron
             | Olomouc
        wget s parametry pro stažení všech potřebných souborů. Na normálních stránkách to funguje, na nenormálních stejně většinou žádná podstatná informace k archivaci není. To se potom ukládá deduplikovaně (unikátní soubory) do DB.
Pokud si chci nějakou stránku uložit i včetně vzhledu, tak buď tisk do PDF (ale některé stránky mají zmršený tiskový styl) a jako poslední možnost screenshot.
Když jsem nad tím na počátku přemýšlel, tak jsem měl v plánu to stahovat a ukládat rozumněji, ale potom mě přešla chuť. Byl by to tentýž boj jako s blokováním reklamy. A furt to upravovat pro další a ještě více zmršené stránky se mi prostě nechce. Takže wget, index to stáhne, textová informace tam je a na normálních stránkách to funguje dobře i včetně dalšího obsahu stránky.
O to víc si vážím projektů jako je youtube-dl, bez kterého bych se na některá videa ani nepodíval a jsem rád, že je baví to nestále opravovat při boji s větrnými mlýny v podobě neustálých změn na příslušných stránkách.
             10.4.2018 20:59
xsubway             | skóre: 13
             | blog: litera_scripta_manet
        10.4.2018 20:59
xsubway             | skóre: 13
             | blog: litera_scripta_manet
            
        Co ti tam chybí? Já používám Hg a obyčejné textové soubory, sem tam nějaký obrázek, PDF, uložená webová stránka atd. Hodně z toho jsou skripty – pak tomu dávám příponu .sh, aby mi editor zvýrazňoval syntaxi a na začátku mám:
#!/bin/bash exit 1;
tzn. je to hromada tématicky souvisejících příkazů, které nejsou určené k sekvenčnímu spouštění, a hlavně komentáře. Časem přidám možná nějaký WYSIWYM editor a možná indexovač/vyhledávač, ale zatím se v tom v pohodě vyznám i bez toho, stačí adresářová struktura a případně grep.
 12.4.2018 02:28
xsubway             | skóre: 13
             | blog: litera_scripta_manet
        12.4.2018 02:28
xsubway             | skóre: 13
             | blog: litera_scripta_manet
            
         Pokud bych potkal multiplatformní nástroj. Jednoduchý, přehledný, free s kvalitním vyhledáváním a filtry, tak je možné, že verzovací systém + org-mode opustím.
 Pokud bych potkal multiplatformní nástroj. Jednoduchý, přehledný, free s kvalitním vyhledáváním a filtry, tak je možné, že verzovací systém + org-mode opustím.
             11.4.2018 13:16
⧠ A = 0             | skóre: 11
             | blog: Technokratovo_zrcadlo
             | Helsinki
        11.4.2018 13:16
⧠ A = 0             | skóre: 11
             | blog: Technokratovo_zrcadlo
             | Helsinki
        Stránku lze sice uložit přes Ctrl+S, ale to vytvoří i podadresář a hromadu souborů.Tohle používám. Úplně nevidim, v čem je takový problém s více soubory, ale nešlo by to případně zkonvertovat do mht nebo takněčeho?
 11.4.2018 14:49
|🇵🇸             | skóre: 93
             | blog:
        11.4.2018 14:49
|🇵🇸             | skóre: 93
             | blog: 
            
         11.4.2018 17:09
xkucf03             | skóre: 49
             | blog: xkucf03
        11.4.2018 17:09
xkucf03             | skóre: 49
             | blog: xkucf03
            
        MHT = MIME Encapsulation of Aggregate HTML Documents tzn. totéž jako např. multipart e-mail s přílohami.
 11.4.2018 17:42
|🇵🇸             | skóre: 93
             | blog:
        11.4.2018 17:42
|🇵🇸             | skóre: 93
             | blog: 
            
         11.4.2018 20:26
otasomil             | skóre: 39
             | blog: puppylinux
        11.4.2018 20:26
otasomil             | skóre: 39
             | blog: puppylinux
            
         11.4.2018 21:09
|🇵🇸             | skóre: 93
             | blog:
        11.4.2018 21:09
|🇵🇸             | skóre: 93
             | blog: 
            
         11.4.2018 21:31
xkucf03             | skóre: 49
             | blog: xkucf03
        11.4.2018 21:31
xkucf03             | skóre: 49
             | blog: xkucf03
            
        BTW: ještě by bylo zajímavé mít nějakou nezávislou autoritu, která by stránku stáhla, zabalila do jednoho souboru a ten elektronicky podepsala – a tím potvrdila, že v tom čase byl na dané URL daný obsah.
 12.4.2018 10:51
Bystroushaak             | skóre: 36
             | blog: Bystroushaakův blog
             | Praha
        12.4.2018 10:51
Bystroushaak             | skóre: 36
             | blog: Bystroushaakův blog
             | Praha
        CTRL+s.
            Osobně ukládám stránky do webarchive
Škoda, že Webarchiv některé stránky rozbije a udělá z nich nevalidní XHTML, takže se v prohlížeči zobrazí jen chybová hláška…
 15.4.2018 21:57
Bedňa             | skóre: 34
             | blog: Žumpa
             | Horňany
        15.4.2018 21:57
Bedňa             | skóre: 34
             | blog: Žumpa
             | Horňany
        
        Tiskni
            
                Sdílej:
                 
                 
                 
                 
                 
                 
            
    
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.