abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 20:00 | Komunita

    Byly zpracovány a na YouTube zveřejněny videozáznamy z konference LinuxDays 2025.

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | IT novinky

    Na konferenci LinuxDays 2025 byl oficiálně představen nový router Turris Omnia NG.

    Ladislav Hagara | Komentářů: 13
    včera 05:22 | Komunita

    Přímý přenos (YouTube) z konference LinuxDays 2025, jež probíhá tento víkend v Praze v prostorách FIT ČVUT. Na programu je spousta zajímavých přednášek.

    Ladislav Hagara | Komentářů: 9
    3.10. 22:44 | IT novinky

    V únoru loňského roku Úřad pro ochranu osobních údajů pravomocně uložil společnosti Avast Software pokutu 351 mil. Kč za porušení GDPR. Městský soud v Praze tuto pokutu na úterním jednání zrušil. Potvrdil ale, že společnost Avast porušila zákon, když skrze svůj zdarma dostupný antivirový program sledovala, které weby jeho uživatelé navštěvují, a tyto informace předávala dceřiné společnosti Jumpshot. Úřad pro ochranu osobních údajů

    … více »
    Ladislav Hagara | Komentářů: 3
    3.10. 19:00 | Nová verze

    Google Chrome 141 byl prohlášen za stabilní. Nejnovější stabilní verze 141.0.7390.54 přináší řadu novinek z hlediska uživatelů i vývojářů. Podrobný přehled v poznámkách k vydání. Opraveno bylo 21 bezpečnostních chyb. Za nejvážnější z nich (Heap buffer overflow in WebGPU) bylo vyplaceno 25 000 dolarů. Vylepšeny byly také nástroje pro vývojáře.

    Ladislav Hagara | Komentářů: 0
    3.10. 17:11 | Upozornění

    eDoklady mají kvůli vysoké zátěži technické potíže. Ministerstvo vnitra doporučuje vzít si sebou klasický občanský průkaz nebo pas.

    Ladislav Hagara | Komentářů: 7
    3.10. 17:00 | Komunita

    Novým prezidentem Free Software Foundation (FSF) se stal Ian Kelling.

    Ladislav Hagara | Komentářů: 1
    3.10. 14:33 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za září (YouTube).

    Ladislav Hagara | Komentářů: 0
    3.10. 12:33 | Upozornění

    Vyšla kniha Počítačové programy a autorské právo. Podle internetových stránek nakladatelství je v knize "Významný prostor věnován otevřenému a svobodnému softwaru, jeho licencím, důsledkům jejich porušení a rizikům „nakažení“ proprietárního kódu režimem open source."

    javokajifeng | Komentářů: 0
    3.10. 01:11 | Bezpečnostní upozornění

    Red Hat řeší bezpečnostní incident, při kterém došlo k neoprávněnému přístupu do GitLab instance používané svým konzultačním týmem.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (38%)
     (45%)
     (15%)
     (17%)
     (20%)
     (15%)
     (17%)
     (16%)
     (15%)
    Celkem 175 hlasů
     Komentářů: 12, poslední včera 20:35
    Rozcestník

    Privoxy - 2 (pozměňování obsahu)

    4. 6. 2007 | Jiří Poláček | Sítě | 9324×

    Druhý nášup informací o Privoxy se zaměřuje na samotný obsah webových stránek načítaných do našeho prohlížeče – pokud se nám cokoliv znelíbí nejenom na stránce samotné, ale též v hlavičkách protokolu HTTP, tak si to prostě změníme. Podívejme se, jak na to.

    Pozměňování obsahu stránek na základě sady definovaných pravidel

    Toto je silná zbraň Privoxy, kterou ovšem pořádně využijí jen ti, kterým nejsou cizí regulární výrazy. Do souborů s filtry lze zapsat klasické nahrazovací příkazy typu s/najdi/nahraď/, sdružovat je do skupin jakožto pojmenované filtry a následně aplikovat na obsah vybraných stránek v souboru s akcemi. Vše nejlépe osvětlí příklady – autoři Privoxy nabízí například následující primitivní filtr k odstranění značek HTML pro blikající a jezdící text:

    FILTER: html-annoyances
    s-</?(blink|marquee).*>--sigU

    V souboru s akcemi jej nyní můžeme použít:

    {+filter{html-annoyances}}
    /

    Začátek filtru je indikován klíčovým slovem FILTER na začátku řádku, za dvojtečkou následuje název filtru, na který se potom lze odvolávat v souboru s akcemi (zapisuje se do složených závorek za volání akce filter). Lomítko jako vzorek vyhovuje všem doménám, filtr z příkladu se tedy bude aplikovat na veškerý načítaný webový obsah.

    Jak již příklad ukazuje, oddělovacím znakem v nahrazovacím příkazu může být i jiný znak než lomítko (kterých je v HTML požehnaně), za posledním oddělovacím znakem mohou následovat modifikátory s následujícím významem:

    • i – nerozlišovat velikost písmen.
    • s – uchopení celého obsahu webové stránky jako jednořádkového řetězce.
    • g – nahrazení všech výskytů vyhovujících vzorku.
    • U – vypnutí hledání nejdelší shody vzorku v řetězci (ungreedy matching).
    • T – zamezení vyhodnocování zpětných odkazů (backreferences) v substitucích.

    Více se s regulárními výrazy můžete seznámit například na českém webu www.regularnivyrazy.info.

    Jiný příklad – další jednoduchý filtr nabízený tvůrci Privoxy - mění veškerý výskyt slova Microsoft na MicroSuck:

    FILTER: fun
    s/microsoft(?!.com)/MicroSuck/ig

    I takovýto filtr by se dal aplikovat na širokou škálu webových stránek. Autoři Privoxy nám však nabízejí mnohem více mnohem užitečnějších filtrů, z nichž ty nejzajímavější má smysl zmínit:

    • js-annoyances – zamezení obtíží s javascriptem typu pevná velikost vyskakovacího okna, skrývání cíle odkazů ve stavové liště apod.
    • refresh-tags – zamezení automatickému obnovování stránky.
    • banners-by-size – odhalování reklamních obrázků na základě typických velikostí obrázků.
    • tiny-textforms – zvětšení příliš malých textových polí na stránce.
    • jumping-windows – zamezení oknům samovolně měnit velikost a přesouvat se.
    • quicktime-kioskmode – dovolí ukládat videa ve formátu Quicktime.

    Nejlepší na pozměňování obsahu stránek však je možnost napsat si filtr vlastní. Osobně například používám takovýto filtr pro automatické přihlašování se k některým webovým službám:

    FILTER: prihlaseni
    s/name="username" *value=""/name="username" value="muj_login"/
    s/name="password"/name="password" value="moje_heslo"/
    s%</body>%<script type="text/javascript">document.forms\[0\].submit();</script></body>%i

    Kromě toho, že do patřičných formulářových polí doplní jméno a heslo, navíc na konec stránky přidá skript pro automatické odeslání formuláře. Výborné je, že toto automatické přihlašování funguje i na stránkách, kde si kontrolují „referery“.

    Ostatní akce proxy-serveru

    Akce block a filter se zajisté uplatní nejvíce, Privoxy však použitelných akcí nabízí mnohem více. Většinu z nich popisuje následující přehled, který jsem pro lepší přehlednost seskupil do několika celků. Akce označené hvězdičkou jsou dostupné až od verze Privoxy 3.0.5.

    Nakládání s hlavičkami http

    add-header{název: hodnota}
    Přidává specifikovanou hlavičku, aniž by byla kontrolována její správnost.
    crunch-client-header{řetězec}, crunch-server-header{řetězec} *
    Smaže každou hlavičku zasílanou klientem či serverem, která obsahuje specifikovaný řetězec.
    force-text-mode *
    V případě chybějící hlavičky „Content-Type“ nastaví typ obsahu na čistý text.
    hide-accept-language{jazyk} *

    Nahradí hlavičku preferovaných jazyků klienta na specifikovaný jazyk; pokud se uvede klíčové slůvko block, bude hlavička smazána. Znám uživatele, kteří si v prohlížeči nastavují preferovaný jazyk na angličtinu jen proto, aby jim Google nevyhledával na českých stránkách – následující dva řádky v Privoxy to elegantně pořeší:

    {+hide-accept-language{en,cs}}
    .google.cz
    
    hide-referer{block|forge|http://nejaka.adresa.cz}
    Modifikuje hlavičku udávající, ze které stránky přichází uživatelův požadavek; hodnota block ji zcela smaže, forge nastaví jméno dotazované serveru, jiný řetězec se zašle tak, jak byl specifikován.
    hide-user-agent{typ-prohlížeče}
    Změní identitu prohlížeče na daný řetězec; lze se tak maskovat vůči vybraným serverům, typicky internetovému bankovnictví. Alternativně – při serverovém nasazení Privoxy – můžeme zvyšovat podíl svého oblíbeného prohlížeče v návštěvnostech stránek, ať si uživatelé našeho proxy-serveru používají, co chtějí ;-).

    Nakládání s obrázky

    handle-as-image
    Definovaná URL budou chápána jako obrázek – využívá se ve spojitosti s blokováním obrázku, aby se místo webové stránky informující o blokování zobrazilo to, co definuje akce set-image-blocker, obvykle neutrální obrázek.
    set-image-blocker{blank|pattern|URL}
    Specifikuje, co se má zobrazit namísto obrázků blokovaných sekvencí příkazů {+block +handle-as-image}; hodnota blank zašle průhledný obrázek velikosti 1×1; pattern vyústí v šedobílou šachovnici; jiný řetězec specifikuje adresu, odkud se má načítat náhradní obrázek.
    inspect-jpegs *
    Prohledává hlavičky obrázků ve formátu JPEG pro chybné komentářové bloky a opravuje je.
    deanimate-gifs{first|last}
    Redukuje animované obrázky ve formátu GIF na první či poslední snímek.

    Správa cookies

    prevent-keeping-cookies, session-cookies-only
    Zajistí smazání cookies v případě restartu webového prohlížeče, čímž se stanou cookies určené pro ukládání profilů uživatelů bezpředmětné, nebrání to však přihlašování se k běžným webovým službám.
    crunch-outgoing-cookies, crunch-incoming-cookies
    Zabraňuje webovému serveru ve čtení/zapisování cookies.
    send-wafer{název=hodnota}
    umožňuje přidat libovolnou cookie
    send-vanilla-wafer
    Zasílá webovým serverům, od nichž je některá cookie zadržena ve „vězení“ (tj. uložena v souboru specifikovaném volbou jarfile), speciální cookie se sdělením „nepřijímám cookies, které mi zasíláte, a rád bych, abyste mě přestali sledovat“.

    Nejrůznější vychytávky

    filter-client-headers, filter-server-headers *
    Ve výchozím nastavení se filtry uplatňují pouze na obsah načítané stránky, tyto akce rozšiřují platnost filtrů také na hlavičky zasílané klientem či serverem.
    prevent-compression
    Zabraňuje webovému serveru zasílat data komprimovaná, neboť na taková nelze uplatnit některé filtry.
    redirect{adresa} *

    Přesvědčí prohlížeč, že požadovaný dokument se nachází na specifikované adrese a že by si jej měl načíst odtud. Pokud se nám například znelíbí logo jednoho vyhledávače, můžeme si pomoci následovně:

    {+redirect{http://www.tucniak.sk/images/tucniak.gif}}
    www.google.cz/intl/en_com/images/logo_plain.png
    

    Vyhledávač Google s pozměněným logem a preferencí anglického jazyka

    fast-redirects{check-decoded-url|simple-check}
    Formátuje odkazy na stránce na poslední platnou adresu – hodí se pro servery, které veškeré odkazy konstruují přes přesměrovávací skripty; tj. například z adresy http://nejaka­.domena/skrip­t?cil=http://ci­lova.domena „vyzobne“ http://cilova­.domena.
    handle-as-empty-document *
    Uplatní se u blokovaných stránek, když se namísto webové stránky s informací o blokování zašle prázdný dokument. Hodí se pro blokování souborů, které nejsou ani webovou stránkou ani obrázkem, tj. například javascripty v externích souborech, styly apod.

    V souvislosti s pozměňováním obsahu je dobré také znát jednu volbu ze základního konfiguračního souboru – buffer-limit. Definuje maximální velikost paměti (v kilobajtech) pro filtrování obsahu, výchozí velikost je 4 MB. Pokud načítaný dokument přesáhne tuto velikost, další filtrování se již na zbytku dokumentu neprovádí.

    Příště

    V závěrečném díle povídání o Privoxy bude představeno webové rozhraní a vysvětleno řízení přístupu na základě IP adres.

           

    Hodnocení: 100 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.