abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 17:00 | IT novinky

    Společnost Seznam.cz spouští konverzační nástroj založený na umělé inteligenci Seznam Asistent. Asistent využívá vlastní jazykový model SeLLMa a dočasně i komerční modely od OpenAI provozované v evropských datacentrech prostřednictvím Microsoft Azure. Dlouhodobým cílem Seznamu je provozovat Asistenta výhradně na interních jazykových modelech a ve vlastních datových centrech.

    Ladislav Hagara | Komentářů: 2
    dnes 11:55 | Zajímavý software

    Software LibrePods osvobozuje bezdrátová sluchátka AirPods z ekosystému Applu. Exkluzivní funkce AirPods umožňuje využívat na Androidu a Linuxu. Díky zdokumentování proprietárního protokolu AAP (Apple Accessory Protocol).

    Ladislav Hagara | Komentářů: 0
    dnes 05:00 | Nová verze

    Byl vydán AlmaLinux OS 10.1 s kódovým názvem Heliotrope Lion. S podporou Btrfs. Podrobnosti v poznámkách k vydání.

    Ladislav Hagara | Komentářů: 0
    dnes 04:33 | Komunita

    Placená služba prohledávání zprostředkovatelů dat a automatického odstraňování uniklých osobních údajů Mozilla Monitor Plus bude 17. prosince ukončena. Bezplatná monitorovací služba Mozilla Monitor bude i nadále poskytovat okamžitá upozornění a podrobné pokyny k omezení rizik úniku dat. Služba Mozilla Monitor Plus byla představena v únoru loňského roku.

    Ladislav Hagara | Komentářů: 0
    včera 22:44 | Nová verze

    Waydroid (Wikipedie, GitHub) byl vydán v nové verzi 1.6.0. Waydroid umožňuje spouštět aplikace pro Android na běžných linuxových distribucích. Běhové prostředí vychází z LineageOS.

    Ladislav Hagara | Komentářů: 3
    včera 15:44 | Nová verze

    Příspěvek na blogu Raspberry Pi představuje novou kompletně přepracovanou verzi 2.0 aplikace Raspberry Pi Imager (YouTube) pro stažení, nakonfigurování a zapsání obrazu operačního systému pro Raspberry Pi na SD kartu. Z novinek lze vypíchnout volitelnou konfiguraci Raspberry Pi Connect.

    Ladislav Hagara | Komentářů: 3
    včera 11:22 | Nová verze

    Memtest86+ (Wikipedie), svobodný nástroj pro kontrolu operační paměti, byl vydán ve verzi 8.00. Přináší podporu nejnovějších procesorů Intel a AMD nebo také tmavý režim.

    Ladislav Hagara | Komentářů: 0
    včera 10:55 | Nová verze

    Programovací jazyk Racket (Wikipedie), tj. jazyk z rodiny jazyků Lisp a potomek jazyka Scheme, byl vydán v nové major verzi 9.0. Hlavní novinku jsou paralelní vlákna (Parallel Threads).

    Ladislav Hagara | Komentářů: 0
    včera 10:11 | Komunita

    Před šesti týdny bylo oznámeno, že Qualcomm kupuje Arduino. Minulý týden byly na stránkách Arduina aktualizovány podmínky používání a zásady ochrany osobních údajů. Objevily se obavy, že by otevřená povaha Arduina mohla být ohrožena. Arduino ubezpečuje, že se nic nemění a například omezení reverzního inženýrství v podmínkách používání se týká pouze SaaS cloudové aplikace.

    Ladislav Hagara | Komentářů: 0
    23.11. 13:33 | Bezpečnostní upozornění

    Knihovna libpng, tj. oficiální referenční knihovna grafického formátu PNG (Portable Network Graphics), byla vydána ve verzi 1.6.51. Opraveny jsou 4 bezpečnostní chyby obsaženy ve verzích 1.6.0 (vydána 14. února 2013) až 1.6.50. Nejvážnější z chyb CVE-2025-65018 může vést ke spuštění libovolného kódu.

    Ladislav Hagara | Komentářů: 12
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (46%)
     (19%)
     (18%)
     (22%)
     (15%)
     (23%)
     (16%)
     (17%)
    Celkem 399 hlasů
     Komentářů: 17, poslední 19.11. 21:57
    Rozcestník

    Privoxy - 2 (pozměňování obsahu)

    4. 6. 2007 | Jiří Poláček | Sítě | 9354×

    Druhý nášup informací o Privoxy se zaměřuje na samotný obsah webových stránek načítaných do našeho prohlížeče – pokud se nám cokoliv znelíbí nejenom na stránce samotné, ale též v hlavičkách protokolu HTTP, tak si to prostě změníme. Podívejme se, jak na to.

    Pozměňování obsahu stránek na základě sady definovaných pravidel

    Toto je silná zbraň Privoxy, kterou ovšem pořádně využijí jen ti, kterým nejsou cizí regulární výrazy. Do souborů s filtry lze zapsat klasické nahrazovací příkazy typu s/najdi/nahraď/, sdružovat je do skupin jakožto pojmenované filtry a následně aplikovat na obsah vybraných stránek v souboru s akcemi. Vše nejlépe osvětlí příklady – autoři Privoxy nabízí například následující primitivní filtr k odstranění značek HTML pro blikající a jezdící text:

    FILTER: html-annoyances
    s-</?(blink|marquee).*>--sigU

    V souboru s akcemi jej nyní můžeme použít:

    {+filter{html-annoyances}}
    /

    Začátek filtru je indikován klíčovým slovem FILTER na začátku řádku, za dvojtečkou následuje název filtru, na který se potom lze odvolávat v souboru s akcemi (zapisuje se do složených závorek za volání akce filter). Lomítko jako vzorek vyhovuje všem doménám, filtr z příkladu se tedy bude aplikovat na veškerý načítaný webový obsah.

    Jak již příklad ukazuje, oddělovacím znakem v nahrazovacím příkazu může být i jiný znak než lomítko (kterých je v HTML požehnaně), za posledním oddělovacím znakem mohou následovat modifikátory s následujícím významem:

    • i – nerozlišovat velikost písmen.
    • s – uchopení celého obsahu webové stránky jako jednořádkového řetězce.
    • g – nahrazení všech výskytů vyhovujících vzorku.
    • U – vypnutí hledání nejdelší shody vzorku v řetězci (ungreedy matching).
    • T – zamezení vyhodnocování zpětných odkazů (backreferences) v substitucích.

    Více se s regulárními výrazy můžete seznámit například na českém webu www.regularnivyrazy.info.

    Jiný příklad – další jednoduchý filtr nabízený tvůrci Privoxy - mění veškerý výskyt slova Microsoft na MicroSuck:

    FILTER: fun
    s/microsoft(?!.com)/MicroSuck/ig

    I takovýto filtr by se dal aplikovat na širokou škálu webových stránek. Autoři Privoxy nám však nabízejí mnohem více mnohem užitečnějších filtrů, z nichž ty nejzajímavější má smysl zmínit:

    • js-annoyances – zamezení obtíží s javascriptem typu pevná velikost vyskakovacího okna, skrývání cíle odkazů ve stavové liště apod.
    • refresh-tags – zamezení automatickému obnovování stránky.
    • banners-by-size – odhalování reklamních obrázků na základě typických velikostí obrázků.
    • tiny-textforms – zvětšení příliš malých textových polí na stránce.
    • jumping-windows – zamezení oknům samovolně měnit velikost a přesouvat se.
    • quicktime-kioskmode – dovolí ukládat videa ve formátu Quicktime.

    Nejlepší na pozměňování obsahu stránek však je možnost napsat si filtr vlastní. Osobně například používám takovýto filtr pro automatické přihlašování se k některým webovým službám:

    FILTER: prihlaseni
    s/name="username" *value=""/name="username" value="muj_login"/
    s/name="password"/name="password" value="moje_heslo"/
    s%</body>%<script type="text/javascript">document.forms\[0\].submit();</script></body>%i

    Kromě toho, že do patřičných formulářových polí doplní jméno a heslo, navíc na konec stránky přidá skript pro automatické odeslání formuláře. Výborné je, že toto automatické přihlašování funguje i na stránkách, kde si kontrolují „referery“.

    Ostatní akce proxy-serveru

    Akce block a filter se zajisté uplatní nejvíce, Privoxy však použitelných akcí nabízí mnohem více. Většinu z nich popisuje následující přehled, který jsem pro lepší přehlednost seskupil do několika celků. Akce označené hvězdičkou jsou dostupné až od verze Privoxy 3.0.5.

    Nakládání s hlavičkami http

    add-header{název: hodnota}
    Přidává specifikovanou hlavičku, aniž by byla kontrolována její správnost.
    crunch-client-header{řetězec}, crunch-server-header{řetězec} *
    Smaže každou hlavičku zasílanou klientem či serverem, která obsahuje specifikovaný řetězec.
    force-text-mode *
    V případě chybějící hlavičky „Content-Type“ nastaví typ obsahu na čistý text.
    hide-accept-language{jazyk} *

    Nahradí hlavičku preferovaných jazyků klienta na specifikovaný jazyk; pokud se uvede klíčové slůvko block, bude hlavička smazána. Znám uživatele, kteří si v prohlížeči nastavují preferovaný jazyk na angličtinu jen proto, aby jim Google nevyhledával na českých stránkách – následující dva řádky v Privoxy to elegantně pořeší:

    {+hide-accept-language{en,cs}}
    .google.cz
    
    hide-referer{block|forge|http://nejaka.adresa.cz}
    Modifikuje hlavičku udávající, ze které stránky přichází uživatelův požadavek; hodnota block ji zcela smaže, forge nastaví jméno dotazované serveru, jiný řetězec se zašle tak, jak byl specifikován.
    hide-user-agent{typ-prohlížeče}
    Změní identitu prohlížeče na daný řetězec; lze se tak maskovat vůči vybraným serverům, typicky internetovému bankovnictví. Alternativně – při serverovém nasazení Privoxy – můžeme zvyšovat podíl svého oblíbeného prohlížeče v návštěvnostech stránek, ať si uživatelé našeho proxy-serveru používají, co chtějí ;-).

    Nakládání s obrázky

    handle-as-image
    Definovaná URL budou chápána jako obrázek – využívá se ve spojitosti s blokováním obrázku, aby se místo webové stránky informující o blokování zobrazilo to, co definuje akce set-image-blocker, obvykle neutrální obrázek.
    set-image-blocker{blank|pattern|URL}
    Specifikuje, co se má zobrazit namísto obrázků blokovaných sekvencí příkazů {+block +handle-as-image}; hodnota blank zašle průhledný obrázek velikosti 1×1; pattern vyústí v šedobílou šachovnici; jiný řetězec specifikuje adresu, odkud se má načítat náhradní obrázek.
    inspect-jpegs *
    Prohledává hlavičky obrázků ve formátu JPEG pro chybné komentářové bloky a opravuje je.
    deanimate-gifs{first|last}
    Redukuje animované obrázky ve formátu GIF na první či poslední snímek.

    Správa cookies

    prevent-keeping-cookies, session-cookies-only
    Zajistí smazání cookies v případě restartu webového prohlížeče, čímž se stanou cookies určené pro ukládání profilů uživatelů bezpředmětné, nebrání to však přihlašování se k běžným webovým službám.
    crunch-outgoing-cookies, crunch-incoming-cookies
    Zabraňuje webovému serveru ve čtení/zapisování cookies.
    send-wafer{název=hodnota}
    umožňuje přidat libovolnou cookie
    send-vanilla-wafer
    Zasílá webovým serverům, od nichž je některá cookie zadržena ve „vězení“ (tj. uložena v souboru specifikovaném volbou jarfile), speciální cookie se sdělením „nepřijímám cookies, které mi zasíláte, a rád bych, abyste mě přestali sledovat“.

    Nejrůznější vychytávky

    filter-client-headers, filter-server-headers *
    Ve výchozím nastavení se filtry uplatňují pouze na obsah načítané stránky, tyto akce rozšiřují platnost filtrů také na hlavičky zasílané klientem či serverem.
    prevent-compression
    Zabraňuje webovému serveru zasílat data komprimovaná, neboť na taková nelze uplatnit některé filtry.
    redirect{adresa} *

    Přesvědčí prohlížeč, že požadovaný dokument se nachází na specifikované adrese a že by si jej měl načíst odtud. Pokud se nám například znelíbí logo jednoho vyhledávače, můžeme si pomoci následovně:

    {+redirect{http://www.tucniak.sk/images/tucniak.gif}}
    www.google.cz/intl/en_com/images/logo_plain.png
    

    Vyhledávač Google s pozměněným logem a preferencí anglického jazyka

    fast-redirects{check-decoded-url|simple-check}
    Formátuje odkazy na stránce na poslední platnou adresu – hodí se pro servery, které veškeré odkazy konstruují přes přesměrovávací skripty; tj. například z adresy http://nejaka­.domena/skrip­t?cil=http://ci­lova.domena „vyzobne“ http://cilova­.domena.
    handle-as-empty-document *
    Uplatní se u blokovaných stránek, když se namísto webové stránky s informací o blokování zašle prázdný dokument. Hodí se pro blokování souborů, které nejsou ani webovou stránkou ani obrázkem, tj. například javascripty v externích souborech, styly apod.

    V souvislosti s pozměňováním obsahu je dobré také znát jednu volbu ze základního konfiguračního souboru – buffer-limit. Definuje maximální velikost paměti (v kilobajtech) pro filtrování obsahu, výchozí velikost je 4 MB. Pokud načítaný dokument přesáhne tuto velikost, další filtrování se již na zbytku dokumentu neprovádí.

    Příště

    V závěrečném díle povídání o Privoxy bude představeno webové rozhraní a vysvětleno řízení přístupu na základě IP adres.

           

    Hodnocení: 100 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.