Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Přihlášení | Registrace

napište » Zprávičky

Qt Creator 18

dnes 15:22 | Nová verze

Byla vydána nová verze 18 integrovaného vývojového prostředí (IDE) Qt Creator. S podporou Development Containers. Podrobný přehled novinek v changelogu.

Ladislav Hagara | Komentářů: 0

Cursor 2.0

dnes 12:55 | Nová verze

Cursor (Wikipedie) od společnosti Anysphere byl vydán ve verzi 2.0. Jedná se o multiplatformní proprietární editor kódů s podporou AI (vibe coding).

Ladislav Hagara | Komentářů: 1

Google Chrome 142

dnes 02:55 | Nová verze

Google Chrome 142 byl prohlášen za stabilní. Nejnovější stabilní verze 142.0.7444.59 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 20 bezpečnostních chyb. Za nejvážnější z nich bylo vyplaceno 50 000 dolarů. Vylepšeny byly také nástroje pro vývojáře.

Ladislav Hagara | Komentářů: 0

Java edice Minecraftu bude bez obfuskace

dnes 01:22 | IT novinky

Pro moddery Minecraftu: Java edice Minecraftu bude bez obfuskace.

Ladislav Hagara | Komentářů: 0

Národní identitní autorita, tedy NIA ID, MeG a eOP jsou nedostupné

včera 17:00 | Upozornění

Národní identitní autorita, tedy NIA ID, MeG a eOP jsou nedostupné. Na nápravě se pracuje [𝕏].

Ladislav Hagara | Komentářů: 8

Nvidia je první firmou, jejíž tržní hodnota dosáhla 5 bilionů dolarů

včera 16:44 | IT novinky

Americký výrobce čipů Nvidia se stal první firmou na světě, jejíž tržní hodnota dosáhla pěti bilionů USD (104,5 bilionu Kč). Nvidia stojí v čele světového trhu s čipy pro umělou inteligenci (AI) a výrazně těží z prudkého růstu zájmu o tuto technologii. Nvidia již byla první firmou, která překonala hranici čtyř bilionů USD, a to letos v červenci.

Ladislav Hagara | Komentářů: 6

Red Hat bude podporovat a distribuovat toolkit NVIDIA CUDA

včera 14:11 | Komunita

Po Canonicalu a SUSE oznámil také Red Hat, že bude podporovat a distribuovat toolkit NVIDIA CUDA (Wikipedie).

Ladislav Hagara | Komentářů: 2

TrueNAS 25.10 Goldeye

včera 13:55 | Nová verze

TrueNAS (Wikipedie), tj. open source storage platforma postavená na Linuxu, byl vydán ve verzi 25.10 Goldeye. Přináší NVMe over Fabric (NVMe-oF) nebo OpenZFS 2.3.4.

Ladislav Hagara | Komentářů: 0

OpenIndiana 2025.10

včera 13:33 | Nová verze

Byla vydána OpenIndiana 2025.10. Unixový operační systém OpenIndiana (Wikipedie) vychází z OpenSolarisu (Wikipedie).

Ladislav Hagara | Komentářů: 0

89 % zranitelností IT infrastruktury v českých školách je kritických

včera 13:22 | Zajímavý článek

České základní a střední školy čelí alarmujícímu stavu kybernetické bezpečnosti. Až 89 % identifikovaných zranitelností v IT infrastruktuře vzdělávacích institucí dosahuje kritické úrovně, což znamená, že útočníci mohou vzdáleně převzít kontrolu nad klíčovými systémy. Školy navíc často provozují zastaralé technologie, i roky nechávají zařízení bez potřebných aktualizací softwaru a používají k nim pouze výchozí, všeobecně známá

… více »

Ladislav Hagara | Komentářů: 16

Centrum | Napsat | Starší

navrhněte » Anketa

Jaké řešení používáte k vývoji / práci?

Github (36%)

Gitlab (48%)

Atlassian (19%)

Bitbucket (19%)

Gitea (23%)

Mercurial (17%)

jen git (21%)

jen svn (17%)

Jiné (uvedu v diskusi) (17%)

Celkem 284 hlasů

Komentářů: 14, poslední 14.10. 09:04

Rozcestník

AbcLinuxu

HDmag.cz

xkucf03 - xkucf03

blog.Frantovo.cz
SQL-Výuka.cz
SQL-DK

Aktuální zápisy

? Archív

? Oblíbené stránky

? Současný desktop

? Navigace

Nej blogů na AbcLinuxu

Nejčtenější za poslední měsíc

Nejkomentovanější za poslední měsíc

AbcLinuxu:/ Blogy / xkucf03 / WWW / Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Štítky: ATD, databáze, disk, funkce, GUI, OCR, osobní, PDF, prohlížeče, proxy, server, sítě, skript, SQLite, stroj, tom, vzhled, www

Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

9.4.2018 22:38 | Přečteno: 5480× | WWW | Výběrový blog | poslední úprava: 9.4.2018 22:52

Co používáte, když si chcete nějakou stránku archivovat na disk? Dříve fungovalo dobře MAFF, ale to už v aktuálních verzích Firefoxu není podporované. UnMHT taky ne.

Stránku lze sice uložit přes Ctrl+S, ale to vytvoří i podadresář a hromadu souborů.

Taky jde stránku „vytisknout“ do PDF, ale to většinou naruší vzhled a špatně se s tím pracuje. Funkce „Pořídit snímek stránky“ sice zachová věrně vzhled, ale zase je to bitmapa, takže je to jednak velké a jednak z toho už nejde dostat zpět text (leda přes OCR :-D).

Existuje nějaké hotové řešení, které umožní uložit celou stránku do jednoho souboru nebo si to člověk musí napsat sám?

Mohla by to být třeba HTTP proxy, která by zachytila vše, co přes ni projde (takže i různé AJAXy, videa atd.) a výsledek uložila do souboru (třeba sqlite databáze) a prohlížení by pak probíhalo tak, že by se spustil HTTP server (resp. proxy z pohledu prohlížeče) a ten by přehrával dříve zaznamenanou komunikaci. K tomu by stačil nějaký skript, který nahodí proxy nad daným archivním souborem a spustí prohlížeč v anonymním režimu s parametrem této proxy a adresou dané stránky.

Další možnost by bylo serverové řešení – takový webový archiv (něco jako archive.org) pro jednotlivce nebo skupinu lidí – pamatoval by si zaznamenanou komunikaci a uměl ji přehrávat. Šlo by se tam třeba i vracet v čase. Ve formě User-Agenta, HTTP hlavičky nebo spíš jména/hesla¹ k proxy serveru by s tím serverem šlo komunikovat a předat mu parametr, k jakému datu stránku chci. Prohlíželo by se to asi nějakým dedikovaným upraveným prohlížečem s potřebnými doplňky (jako GUI pro stroj času). Na serveru by šla dobře dělat deduplikace. Z tohoto serveru by si pak šlo i uložit jednotlivou stránku do souboru jako sqlite databázi pro osobní použití nebo archivaci na nějaké offline médium mimo dosah proxy serveru.

Na tom proxy serveru by šlo i vyhledávat – a vzhledem k tomu, že by do toho ten jednotlivec nebo lépe skupina lidí nakrmila jen obsah, který je zajímá, tak by to dávalo hodnotné výsledky. Takový server bych rád sdílel např. s uživateli Ábíčka, členy Brmlabu a jiných podobných komunit.

Tak kdyby se někdo nudil, můžete to naprogramovat :-)

(osobně bych se do toho pustil, ale mám už rozdělaných tolik věcí, že musím teď spíš dotáhnout něco z nich než rozjíždět další projekt…)

_{[1] např. kdybych se k proxy serveru hlásil jako franta.2016-04-08, tak bych dostával stav stránek kolem tohoto data, nebo nejbližší dostupnou verzi – a to jméno by automaticky nastavil doplněk v prohlížeči, já bych jen v GUI zvolil požadované datum}

Hodnocení: 100 %

špatné • dobré

Anketa

Archivujete si věci z webu k sobě (na disk)?

ne, na tom webu to přece bude i příště, ne? (13 %)

ne, věřím, že to někdo zkopíroval a zveřejní jinde (8 %)

ne, spoléhám na archive.org a cache vyhledávačů atd. (34 %)

ne, nemám na to nyní čas (8 %)

ano, do MAFF nebo podobného jednosouborového formátu (26 %)

ano, jako HTML a haldu souborů v adresáři (34 %)

ano, do nějakého sofistikovanějšího systému (2 %)

ano, ale texty si ručně vykopíruji do TXT, obrázky uložím po jednom atd. (19 %)

Celkem 53 hlasů

Anketa

Vedete si osobní Wiki, znalostní bázi, systematické poznámky?

ne (8 %)

ne, ale měl bych, chci… (19 %)

ano, používám Zim, CherryTree nebo něco podobného (36 %)

ano, používám webovou wiki (19 %)

ano, používám verzovací systém (hg, git, …) (10 %)

všechny poznámky dávám veřejně na svůj web/blog (3 %)

ano, nějaké jiné řešení (27 %)

Celkem 59 hlasů

Tiskni Sdílej:

Komentáře

Nástroje: Začni sledovat (2) ? , Tisk

Vložit další komentář

9.4.2018 22:46 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Kdysi jsem myslím používal httrack, ale v dnešní době to nemá smysl.
Zdar Max

Měl jsem sen ... :(

9.4.2018 22:56 marbu | skóre: 31 | blog: hromada | Brno
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Hlasoval bych za: ne, ale dřív jsem archivoval věci do MAFF, ale nemám nyní čas si MAFF plugin napsat pro aktuální Firefox a zatím to nikdo jiný neudělal.

There is no point in being so cool in a cold world.

9.4.2018 23:37 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Spolieham na archive.org, poznámky si píšem na KU webe.

KERNEL ULTRAS video channel >>>

9.4.2018 23:39 marbu | skóre: 31 | blog: hromada | Brno
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Existuje nějaké hotové řešení, které umožní uložit celou stránku do jednoho souboru nebo si to člověk musí napsat sám?

Jinak se dívám, že na webu MAFF teď doporučují Save Page WE, který se snaží externí data do html souboru buď přímo includovat (např. v případě javascriptu nebo css) a binární data ukládá v javascriptu přes base64. Oproti MAFF je to downgrade, ale nějak to funguje.

Další možnost by bylo serverové řešení – takový webový archiv (něco jako archive.org) pro jednotlivce nebo skupinu lidí

Zkoušel jsi používat Archiveror? Btw taky umí ukládat lokálně do MHTML souboru, ale nefunguje to ve Firefoxu.

There is no point in being so cool in a cold world.

9.4.2018 23:51 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Save Page WE, který se snaží externí data do html souboru buď přímo includovat (např. v případě javascriptu nebo css) a binární data ukládá v javascriptu přes base64. Oproti MAFF je to downgrade, ale nějak to funguje.

Dík, to vypadá dobře, vyzkouším…

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

9.4.2018 23:56 limit_false | skóre: 23 | blog: limit_false
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Wkhtmltopdf. Ma to spoustu moznosti napr. na velikost stranky apod, akorat balicek nema pache, aby zachoval linky v pdf. Na to je to potreba skompilovat s patchovanym Qt (myslim ze nekde se da stahnout i staticka binarka, alespon nekdy to slo).

Jinak print to pdf z chrome zachovava i linky.

When people want prime order group, give them prime order group.

10.4.2018 00:28 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Tak jsem zjistil, že v Chromiu jde už pustit tisk i z příkazové řádky a lezou z toho (aspoň v případě Wikipedie) celkem slušné výsledky – např.

chromium-browser --incognito --headless --print-to-pdf="tisk.pdf" https://en.wikipedia.org/wiki/Balanced_audio

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

10.4.2018 00:44 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

A přes exiftool tam jdou přidat metadata. To vypadá dobře. Asi si na to udělám nějaký skript…

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

10.4.2018 02:24 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Pokud jde o textové stránky, tak používám tisk do PDF. Na videa youtube-dl. To ostatní nemá smysl ukládat, neboť to pak stejně moc nefunguje.

Hello world ! Segmentation fault (core dumped)

10.4.2018 08:15 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Obrázky – schémata, grafy… Někdy by se hodilo plné rozlišení na stránce, ale do PDF se uloží jen náhled – člověk si pak musí velký obrázek uložit ručně bokem. Ty grafy bývají zase někdy generované JavaScripte (grrr) nebo jsou interaktivní – to se do PDF taky neuloží. Na to by byla dobrá ta proxy, která by dokázala zopakovat/nasimulovat tu HTTP komunikaci přesně tak, jaká byla v době ukládání – včetně třeba toho, že sis stáhl plné rozlišení obrázku – v archivu bys na něj pak taky mohl kliknout.

Problém by byly asi jen websockety a záměrná obfuskace ze strany toho webu.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

10.4.2018 11:58 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Pokud jsou grafy jen vygenerované, tak se to uloží. Pokud to je vykreslené pomocí Javascriptu jako SVG, tak to v PDF zůstane vektorové. Tedy alespoň v Chromiu. Interaktivita je samozřejmě pryč.

Hello world ! Segmentation fault (core dumped)

10.4.2018 15:05 limit_false | skóre: 23 | blog: limit_false
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

PDF podporuje ukladani vektorove grafiky, i kdyz nekdy je celkem slozite nastroje presvedcit, aby to udelali.

Podobne PDF podporuje lossless kompresi obrazku.

Ad interaktivni vystup - myslim, ze na tohle se chrome/chromium hodil. Minimalne jsem si 100% jisty, ze z toho lze dostat i stranky vygenerovane z ruznych zabaksriptich hruz (v inspectoru pomoci copy outer|inner html).

When people want prime order group, give them prime order group.

10.4.2018 08:08 Gggy
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Používam moderný operačný systém Android kde webview priamo obsahuje funkciu uložiť do mht.

10.4.2018 10:50 Heron | skóre: 53 | blog: root_at_heron | Olomouc
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Mám skript na automatické stahování stránek co se objeví v mojí rss čtečce. Nic sofistikovaného, jen wget s parametry pro stažení všech potřebných souborů. Na normálních stránkách to funguje, na nenormálních stejně většinou žádná podstatná informace k archivaci není. To se potom ukládá deduplikovaně (unikátní soubory) do DB.

Pokud si chci nějakou stránku uložit i včetně vzhledu, tak buď tisk do PDF (ale některé stránky mají zmršený tiskový styl) a jako poslední možnost screenshot.

Když jsem nad tím na počátku přemýšlel, tak jsem měl v plánu to stahovat a ukládat rozumněji, ale potom mě přešla chuť. Byl by to tentýž boj jako s blokováním reklamy. A furt to upravovat pro další a ještě více zmršené stránky se mi prostě nechce. Takže wget, index to stáhne, textová informace tam je a na normálních stránkách to funguje dobře i včetně dalšího obsahu stránky.

O to víc si vážím projektů jako je youtube-dl, bez kterého bych se na některá videa ani nepodíval a jsem rád, že je baví to nestále opravovat při boji s větrnými mlýny v podobě neustálých změn na příslušných stránkách.

Heron

10.4.2018 16:21 woas
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

na ukladanie www stranok pouzivam bookmarks a ked je tam nieco zaujimave, tak si to zapisem do personalnej wiki, na co uz dlho pouzivam jedno html - Woas - wiki-on-a-stick (https://sourceforge.net/projects/woas/). Mam porobene pluginy aj na zvyraznovanie syntaxu, akordov a ine. Je to podobne ako Tiddlywiki.

Problem zacina byt novsou verziou FF od 57, ktory ma problem aj cez plugin zapisovat na disk. Nechce sa mi prechadzat na nieco ine, lebo uz toho tam mam dost. Mozno je este zaujimave https://laverna.cc/ alebo velmi jednoduche androidove Rýchly zápisník s prepojenim na dropbox.

Potom som objavil este mdwiki (github), no to treba editovat zvlast editorom, ale inak je to pekne efektne. Este som sa trochu pohral a stranky mozu byt kryptovane cez JS.

Inak na to, co pises, si viem predstavit nejaky python skript s ukladanim stranok. Robil som preposielanie http z jednej stranky cez tento python web server. Len by to bolo treba upravit, aby to bol ako proxy a este aj ukladalo to stranky.

10.4.2018 20:59 xsubway | skóre: 13 | blog: litera_scripta_manet
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Tak u té druhé ankety jsem zaškrtl hned tři možnosti, protože bych rád používal nějaké řešení, které by mi vyhovovalo a zároveň už používám kombinaci Hg a org-mode což zatím není úplně to pravé ...

10.4.2018 21:21 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Poznámky, znalostní báze

Co ti tam chybí? Já používám Hg a obyčejné textové soubory, sem tam nějaký obrázek, PDF, uložená webová stránka atd. Hodně z toho jsou skripty – pak tomu dávám příponu .sh, aby mi editor zvýrazňoval syntaxi a na začátku mám:

#!/bin/bash
exit 1;

tzn. je to hromada tématicky souvisejících příkazů, které nejsou určené k sekvenčnímu spouštění, a hlavně komentáře. Časem přidám možná nějaký WYSIWYM editor a možná indexovač/vyhledávač, ale zatím se v tom v pohodě vyznám i bez toho, stačí adresářová struktura a případně grep.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

12.4.2018 02:28 xsubway | skóre: 13 | blog: litera_scripta_manet
Rozbalit Rozbalit vše Re: Poznámky, znalostní báze

Na jednu stranu mi nic nechybí. Ty dva nástroje pravděpodobně pokrývají všechno co pravě potřebuji. To co mi nevyhovuje, je právě nějaké konečné doladění, na které stále nemám čas :-)

Pokud bych potkal multiplatformní nástroj. Jednoduchý, přehledný, free s kvalitním vyhledáváním a filtry, tak je možné, že verzovací systém + org-mode opustím.

11.4.2018 11:01 kuba77 | skóre: 15 | blog: kuba77
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Pro uložení stránek (textu z nich) na později když to jde, tak použiju Pocket, na disk si stránky neukládám. Díky Pocketu si pak můžu daný článek jednoduše přečíst na čtečce. Občas si uložím nějaké video z YouTube pomocí ClipGrab nebo FreeRapidDownloader, párkrát se mi totiž stalo, že jsem se chtěl k nějakému videu na YT vrátit a bylo najednou smazané nebo soukromé.

11.4.2018 11:30 stenxp | skóre: 4
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Dělám to podobně, akorát místo pocketu používám selfhosted https://wallabag.org pluginy do prohlížečů to má a na androidu to má apku...

11.4.2018 12:08 bobass
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Řešení je Evernote (a jemu podobné)

11.4.2018 13:16 ⧠ A = 0 | skóre: 11 | blog: Technokratovo_zrcadlo | Helsinki
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

wget

Nevolte zmrdy.

11.4.2018 14:18 kralyk z abclinuxu | skóre: 29 | blog:
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Stránku lze sice uložit přes Ctrl+S, ale to vytvoří i podadresář a hromadu souborů.

Tohle používám. Úplně nevidim, v čem je takový problém s více soubory, ale nešlo by to případně zkonvertovat do mht nebo takněčeho?

SPD vůbec není proruská

11.4.2018 14:49 |🇵🇸 | skóre: 93 | blog:
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

MHT je to samé, akorát to má ta externí data vložená do sebe (IIRC přes CDATA).

🇵🇸 ✊ Touch grass ✊ 🇺🇦 ✊ ani boha, ani pána

11.4.2018 17:09 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

MHT = MIME Encapsulation of Aggregate HTML Documents tzn. totéž jako např. multipart e-mail s přílohami.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

11.4.2018 17:42 |🇵🇸 | skóre: 93 | blog:
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

MHT před cca 10 lety, co bylo v řadě produktů Microsoftu, obsahovalo inline balast. Ručně jsem nějaké exporty čistil.

🇵🇸 ✊ Touch grass ✊ 🇺🇦 ✊ ani boha, ani pána

11.4.2018 20:26 otasomil | skóre: 39 | blog: puppylinux
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Zdravim
No vetsinou si do vlastni wiki zkopiruju potrebny zajimavy obsah z webovky. Pokud se s tim nechci moc parat tak davam tisk do souboru - tedy do pdf - dava dobre vysledky, lze si z pdfka zkopirovat text pro pozdejsi potrebu. Jednoduche, a prakticke reseni zachovavajici maximalni podobu s original strankou.

K čemu hudba, která nevede k extázi... Stop MDMA !!! I spam umí být roztomilý

11.4.2018 21:09 |🇵🇸 | skóre: 93 | blog:
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Co tu nezaznělo, dělám si snímky stránek (nebo částí diskuzí, jak je to běžné např. na 4chanu) – jako obrázky. Nejde v tom sice fulltextově vyhledávat, ale zachovává to původní podobu stránky.

Dřív jsem na to měl rozšíření ve Firefoxu, dnes je obdobná funkce součástí instalace.

🇵🇸 ✊ Touch grass ✊ 🇺🇦 ✊ ani boha, ani pána

11.4.2018 21:31 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

BTW: ještě by bylo zajímavé mít nějakou nezávislou autoritu, která by stránku stáhla, zabalila do jednoho souboru a ten elektronicky podepsala – a tím potvrdila, že v tom čase byl na dané URL daný obsah.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

11.4.2018 23:14 Odin
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

wget --mirror ... ?

12.4.2018 07:21 tydýt
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

12.4.2018 10:51 Bystroushaak | skóre: 36 | blog: Bystroushaakův blog | Praha
Rozbalit Rozbalit vše Re: Ukládání celých WWW stránek na disk (MAFF, MHT, proxy?)

Odpovědět | Sbalit | Link | Blokovat | Admin

Osobně ukládám stránky do webarchive, aby je měli přístupné i ostatní. U těch co to nejde je výjimečně uložím na disk klasickým CTRL+s.

blog.rfox.eu | DREAMLAND

12.4.2018 20:33 xkucf03 | skóre: 49 | blog: xkucf03
Rozbalit Rozbalit vše Archive.org a XHTML

Osobně ukládám stránky do webarchive

Škoda, že Webarchiv některé stránky rozbije a udělá z nich nevalidní XHTML, takže se v prohlížeči zobrazí jen chybová hláška…

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

15.4.2018 21:57 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Archive.org a XHTML

Pozerám že fakt XHTML, tak to sa divím že to ešte niekto používa, keďže podpora v priehliadačoch vždy stála za kulové a je to našťastie za nami.

KERNEL ULTRAS video channel >>>

Založit nové vlákno • Nahoru

Píšeme jinde

ISSN 1214-1267 www.czech-server.cz

Redakce | Inzerce | Podmínky použití | Osobní údaje