abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 19:11 | Zajímavý projekt

    Vývojáři Ubuntu představili projekt Myna, tj. iniciativu zaměřenou na přidání funkce převodu řeči na text do prostředí desktopu Ubuntu. Dle plánu již v Ubuntu 26.10.

    Ladislav Hagara | Komentářů: 0
    dnes 18:33 | Zajímavý software

    Společnost Epic Games představila nový open source systém pro správu verzí Lore navržený pro "bezprecedentní škálovatelnost dat i týmů a optimalizovaný pro projekty, včetně her a zábavy, které kombinují kód s velkými binárními soubory, aby uspokojil potřeby vývojářů i umělců". Zdrojové kódy jsou k dispozici na GitHubu pod licencí MIT.

    Ladislav Hagara | Komentářů: 0
    dnes 15:33 | IT novinky

    Úřad pro ochranu hospodářské soutěže (ÚOHS) provedl v říjnu 2024 místní šetření u společnosti Seznam.cz. Úřad prověřoval důvodné podezření na možné protisoutěžní jednání, konkrétně zneužití dominantního postavení. Krajský soud v Brně v květnu 2025 konstatoval, že toto šetření bylo nezákonné. Nejvyšší správní soud (NSS) včera rozhodl, že šetření bylo provedeno v souladu se zákonem. Krajský soud bude muset případ posoudit znovu.

    Ladislav Hagara | Komentářů: 0
    dnes 12:22 | IT novinky

    Byl představen skládací telefon Commodore Callback 8020. Ani hloupý, ani chytrý. Pro fanoušky Commodore a digitálního minimalismu. Bez webového prohlížeče a sociálních sítí. S předinstalovaným WhatsAppem. S operačním systémem Sailfish OS.

    Ladislav Hagara | Komentářů: 1
    dnes 08:22 | Bezpečnostní upozornění

    V OpenBSD byla objevena 27 let stará chyba v ppp pomocí níž lze vzdáleně obejít autentifikaci. Chyba byla nahlášena 12.6. a 14.6. byla opravena. Bližší info v článku A 27-Year-Old Authentication Bypass in OpenBSD's PPP Stack.

    Max | Komentářů: 6
    dnes 05:22 | Zajímavý článek

    Odpověď Evropské komise (pdf) k evropské občanské iniciativě Stop Destroying Videogames, jež je součástí hnutí Stop Killing Games: "Komise se domnívá, že v této fázi nemůže navrhnout právní povinnost zachovat hratelnost videoher poté, co přestaly být poskytovány komerčně. Důvodem jsou i stávající práva duševního vlastnictví. Podle autorského práva EU mají nositelé práv výlučná práva ke svým výtvorům. Kromě autorských práv mohou být

    … více »
    Ladislav Hagara | Komentářů: 8
    včera 16:11 | Nová verze

    Byl vydán Mozilla Firefox 152.0. Přehled novinek v poznámkách k vydání a poznámkách k vydání pro vývojáře. Řešeny jsou rovněž bezpečnostní chyby. Nový Firefox 152 bude brzy k dispozici také na Flathubu a Snapcraftu.

    Ladislav Hagara | Komentářů: 1
    včera 14:11 | Nová verze

    Desktopové prostředí KDE Plasma bylo vydáno ve verzi 6.7 (Mastodon). Přehled novinek i s videi a se snímky obrazovek v oficiálním oznámení. Podrobný přehled v seznamu změn.

    Ladislav Hagara | Komentářů: 21
    včera 11:44 | Komunita

    Hříčka xsnow, která na ploše spustí sněžení, je protestware. Pokud jste v Rusku (LANG=ru), zobrazuje ukrajinské vlajky.

    Ladislav Hagara | Komentářů: 35
    včera 11:11 | Nová verze

    UBports, nadace a komunita kolem Ubuntu pro telefony a tablety Ubuntu Touch, vydala beta verzi Ubuntu Touch 24.04-2.0. Nová verze již počítá s výřezy pro fotoaparát (notch) a zaoblenými rohy displeje. Webový prohlížeče Morph přešel z Chromia 87 na Chromium 134. Do shellu Lomiri byl přidán editor snímků obrazovky.

    Ladislav Hagara | Komentářů: 0
    Které desktopové prostředí na Linuxu používáte?
     (11%)
     (8%)
     (2%)
     (16%)
     (31%)
     (3%)
     (6%)
     (3%)
     (16%)
     (26%)
    Celkem 1926 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník


    Dotaz: jake se mapuje web?

    6.8.2008 22:29 krnoha | skóre: 10 | blog: prizpevy
    jake se mapuje web?
    Přečteno: 458×

    Máme WWW server, běží už dlouho a nevíme, co všecko na něm je. V zásadě HTML stránky, ale taky PHP aplikace, různé věci od různých autorů z různých dob. Jsou toho tisíce souborů. Potřebujeme to nějak zmapovat. Představoval bych si něco jako jako robota, který by začal na jednom URL toho webu, šel by po odkazech a tak by našel množinu vystavených URL a jak se mezi sebou odkazujou. Kdyby byl chytřejší, mohl by třeba i hádat, které URL dohromady dávají jednu prezentaci a které URL je v té prezentaci počáteční. Úplně sám by to jistě nezvládnul, musela by to být interaktivní aplikace. Nevíte o nějakých nástrojích na tohle téma?

    Odpovědi

    7.8.2008 14:25 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
    Rozbalit Rozbalit vše Re: jake se mapuje web?
    Proč to dělat tak složitě? Pokud máte k serveru přístup, tak find / -iname '*.html' -or -iname '*.php' -or ... najde všechny zajímavé soubory a jejich umístění. Navíc soubory pod jedním adresářem budou velmi pravděpodobně patřit do jedné prezentace.
    When your hammer is C++, everything begins to look like a thumb.
    7.8.2008 14:55 krnoha | skóre: 10 | blog: prizpevy
    Rozbalit Rozbalit vše Re: jake se mapuje web?

    Současně ale potřebuju získat představu o tom, jak se soubory volají mezi sebou a zejména které nejsou volány vůbec a lze je tedy zrušit. U PHP souborů může tag <A> být generován, takže nějakým grepováním ho nenajdu. Prohledávat HTML soubory poskytované webserverem po síti bude taky trochu práce, ale aspoň víme, že je to HTML. Některé stránky jsou přístupné jenom z intranetu a některé odevšad, takže spuštěním prohledávače z různých míst internetu dostaneme různé mapy webu. Takže proto tak složitě.

    7.8.2008 16:32 Andrej Herceg | skóre: 43
    Rozbalit Rozbalit vše Re: jake se mapuje web?
    Problém je aj to, že na niektoré stránky sa môže dať dostať len po prihlásení, prípadne sa tá stránka vygeneruje až po odoslaní nejakých údajov (cez formulár)... Takže bez ručného prehľadávania to aj tak asi nepôjde.
    7.8.2008 15:58 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: jake se mapuje web?
    Představoval bych si něco jako jako robota, který by začal na jednom URL toho webu, šel by po odkazech a tak by našel množinu vystavených URL a jak se mezi sebou odkazujou.
    Tohle zvládne i wget, na to nepotřebujete žádného specializovaného robota.
    8.8.2008 11:31 krnoha | skóre: 10 | blog: prizpevy
    Rozbalit Rozbalit vše Re: jake se mapuje web?

    Pythonský program, který bude volat wget, prohlídne si co dostal, zatřídí si to do asociaticního pole a jde na další. Ano to je jasný. Jenom že nějak tiše doufám, že už je to vyřešeno i s vyzkoušenými heuristikami na shlukování "souborů" do "prezentací", s vykoumaným zobrazením výsledků a tak podobně.

    8.8.2008 11:56 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: jake se mapuje web?
    Vyřešeno to už je, a řeší to samotný wget, bez Pythonu. Podívejte se na parametry --recursive, --level, --mirror, --accpet, --reject, --domains, --exclude-domains, --span-hosts, --include-directories, --exclude-directories, --no-parent, --page-requisites.
    8.8.2008 14:15 krnoha | skóre: 10 | blog: prizpevy
    Rozbalit Rozbalit vše Re: jake se mapuje web?

    wget mi to stáhne, ale kdo to za mě přečte?

    8.8.2008 14:36 Filip Jirsák | skóre: 67 | blog: Fa & Bi
    Rozbalit Rozbalit vše Re: jake se mapuje web?
    Obávám se, že program, který by to za vás přečetl, neexistuje. Ale v původním dotazu není nic o tom, že byste to měl číst – tam je jenom dotaz na to, jak udělat zrcadlo několika webů. Vy tam sice píšete něco o prezentaci a startovací stránce, ale i ta prezentace bude umístěna pod jedním doménovým jménem a pravděpodobně v jednom adresáři. Takže ono rozdělení na prezentace pak znamená jen od sebe oddělit příslušné adresáře – a v tom vám žádný interaktivní program nepomůže, to uděláte nejrychleji ručně.
    7.8.2008 18:01 Messa | skóre: 39 | blog: Messa
    Rozbalit Rozbalit vše Re: jake se mapuje web?
    lol :) Zajímalo by mě, co jste zač :-)

    Podíval bych se do konfigurace www serveru (tzn. Apache nebo co tam běží), které virtualhosty tam jsou a kde mají document root, popř. odkud je ještě možnost spouštět další skripty.

    Já osobně bych to ale prostě vypnul a sledoval, co komu začne chybět (protože předpokládám, že to je obsah, za který vám nikdo neplatí, neboť jinak byste v tom neměli takový bordel nebo by vám do toho bordelu nic nebylo). Třeba to celé už pár běželo úplně zbytečně :-) (Stejně tak si lze prohlédnout accesslogy webserveru.)
    8.8.2008 11:43 krnoha | skóre: 10 | blog: prizpevy
    Rozbalit Rozbalit vše Re: jake se mapuje web?

    Jsme akademická instituce, nic na kšeft. Tenhle web tady běží od roku 95, různí lidé na něj něco přidávali, prostě dostali prostor a do něj dali, co si napsali v nějakém editoru. Server zakládali vědci, byl koncipován velmi promyšleně, proto tak dlouho vydržel. Ale teď už je obsah neudržovatelný. Tím není řečeno, že se má zahodit - stránky je nutné zkonvertovat do vhodného nového systému. Analýza obsahu je IMHO nutná.

    8.8.2008 11:19 Tom.š Ze.le.in | skóre: 21 | blog: tz
    Rozbalit Rozbalit vše Re: jake se mapuje web?
    Jedna možnost: google, site:yoursite.cz možná najde co je dostupné a prolinkované

    Možná půjde použít Metis, i když s ním nemám nejlepší zkušenosti. Možná i wget.

    Ale jak psali přede mnou, je dost pravděpodobné že řešíte špatný problém, a každé řešení bude pochybné.
    8.8.2008 11:25 Tom.š Ze.le.in | skóre: 21 | blog: tz
    Rozbalit Rozbalit vše [OT] pro jazykově-mytologické puristy
    A ano, vím že Metis byla ona, ne on :)
    8.8.2008 12:06 krnoha | skóre: 10 | blog: prizpevy
    Rozbalit Rozbalit vše Re: jake se mapuje web?

    Ten Metis vypadá zajímavě. Dík, zkusím to. Poslední verze je z roku 03. Asi řešíme teď problém, který byl hromadný na přelomu století.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.