abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 15:22 | IT novinky

    Masivní výpadek elektrického proudu zasáhl velkou část České republiky. Hasiči vyjížděli k většímu počtu lidí uvězněných ve výtazích. Výpadek se týkal zejména severozápadu republiky, dotkl se také Prahy, Středočeského nebo Královéhradeckého kraje. Ochromen byl provoz pražské MHD, linky metra se už podařilo obnovit. Výpadek proudu postihl osm rozvoden přenosové soustavy, pět z nich je nyní opět v provozu. Příčina problémů je však stále neznámá. Po 16. hodině zasedne Ústřední krizový štáb.

    Ladislav Hagara | Komentářů: 7
    dnes 02:33 | Nová verze

    Po více než roce vývoje od vydání verze 5.40 byla vydána nová stabilní verze 5.42 programovacího jazyka Perl (Wikipedie). Do vývoje se zapojilo 64 vývojářů. Změněno bylo přibližně 280 tisíc řádků v 1 500 souborech. Přehled novinek a změn v podrobném seznamu.

    Ladislav Hagara | Komentářů: 2
    dnes 01:33 | Nová verze

    Byla vydána nová stabilní verze 7.5 webového prohlížeče Vivaldi (Wikipedie). Postavena je na Chromiu 138. Přehled novinek i s náhledy v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    včera 16:33 | Zajímavý software

    Sniffnet je multiplatformní aplikace pro sledování internetového provozu. Ke stažení pro Windows, macOS i Linux. Jedná se o open source software. Zdrojové kódy v programovacím jazyce Rust jsou k dispozici na GitHubu. Vývoj je finančně podporován NLnet Foundation.

    Ladislav Hagara | Komentářů: 0
    včera 12:33 | Nová verze

    Byl vydán Debian Installer Trixie RC 2, tj. druhá RC verze instalátoru Debianu 13 s kódovým názvem Trixie.

    Ladislav Hagara | Komentářů: 0
    včera 03:33 | Komunita

    Na čem pracují vývojáři webového prohlížeče Ladybird (GitHub)? Byl publikován přehled vývoje za červen (YouTube).

    Ladislav Hagara | Komentářů: 0
    včera 02:33 | Nová verze

    Libreboot (Wikipedie) – svobodný firmware nahrazující proprietární BIOSy, distribuce Corebootu s pravidly pro proprietární bloby – byl vydán ve verzi 25.06 "Luminous Lemon". Přidána byla podpora desek Acer Q45T-AM a Dell Precision T1700 SFF a MT. Současně byl ve verzi 25.06 "Onerous Olive" vydán také Canoeboot, tj. fork Librebootu s ještě přísnějšími pravidly.

    Ladislav Hagara | Komentářů: 0
    včera 01:33 | Komunita

    Licence GNU GPLv3 o víkendu oslavila 18 let. Oficiálně vyšla 29. června 2007. Při té příležitosti Richard E. Fontana a Bradley M. Kuhn restartovali, oživili a znovu spustili projekt Copyleft-Next s cílem prodiskutovat a navrhnout novou licenci.

    Ladislav Hagara | Komentářů: 0
    2.7. 16:55 | Nová verze

    Svobodný nemocniční informační systém GNU Health Hospital Information System (HIS) (Wikipedie) byl vydán ve verzi 5.0 (Mastodon).

    Ladislav Hagara | Komentářů: 0
    2.7. 16:22 | Komunita

    Open source mapová a navigační aplikace OsmAnd (OpenStreetMap Automated Navigation Directions, Wikipedie, GitHub) oslavila 15 let.

    Ladislav Hagara | Komentářů: 1
    Jaký je váš oblíbený skriptovací jazyk?
     (59%)
     (28%)
     (7%)
     (2%)
     (0%)
     (1%)
     (3%)
    Celkem 352 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    RSS a Atom: agregácia webového obsahu - I

    6. 6. 2005 | Stanislav Valasek | Programování | 7050×

    V tejto časti dvojdielneho seriálu sa zoznámime všeobecne s agregáciou, existujúcimi formátmi, ich porovnaním a možnosťami zobrazenia. Článok na záver obsahuje postup pridania RSS kanálu do HTML stránky.

    Čo je to agregácia

    Agregácia/syndikácia webového obsahu je založená na myšlienke uverejňovania zmien na webovom potrále v špeciálnom formáte. Na zobrazenie tohoto formátu existuje množstvo programov, či skriptov, ktoré zmeny umožnia zobraziť či už v samostatnom programe, vložené v nejakej aplikácií, alebo ako súčasť HTML stránky.

    Ako to celé funguje

    Všeobecne sa dá povedať, že autor web stránok vytvorí jeden alebo viac xml súborov, pridá na ne z web stránok odkazy a následne ich podľa potreby aktualizuje. Programy/skripty načítavajúce tieto xml súbory dokážu zistiť, či boli aktualizované, a zvýraznene zobrazia nové položky v nich.

    Formáty používaných súborov

    Keďže web agregácia je relatívne mladá vec a pri jej vzniku stáli viaceré firmy alebo jednotlivci, vzniklo množstvo "oficiálnych" formátov.

    Asi najjednoduchšie to je s popísaním formátu Atom. Ten vznikol na základe nejednotnosti a rôznorodosti množstva vznikajúcich formátov. Je však relatívne mladý a aktuálne prebieha jeho štandardizácia v IETF.

    Formát, alebo skôr skratka, ktorá priniesla toľko zmätku, je RSS. Skratka z toho dôvodu, že názov RSS bol v priebehu času používaný pre viac druhov protokolov, ako napríklad Rich Site Summary, neskôr Really Simple Syndication a následne RDF Site Summary a bol vyvíjaných viacerými vývojármi.

    A aby sme si v tom spravili poriadok, tu je zoznam formátov, aj s odporúčaním, ktorý kedy použiť:

    Verzia Vlastník Výhody Odporúčanie
    RSS 0.90 Netscape Zastaralý po vzniku 1.0 Nepoužívať
    RSS 0.91 Vytvorený Netscapom, prebraný do UserLand. Veĺmi jednoduchý, oficiálne zastaralý po vzniku verzie 2.0, ale stále veľmi populárny. Použite na jednoduchú syndikáciu. V prípade potreby väčšej komplexnosti zaručuje jednoduchú migráciu na verziu 2.0.
    RSS 0.92, 0.93 a 0.94 UserLand Obsahujú bohatšie metadata ako 0.91. Zastarali po vzniku verzie 2.0. Použite verziu 2.0.
    RSS 1.0 RSS-DEV Working Group Založený na RDF, rozšíriteľný pomocou modulov, nekontrolovaný jediným výrobcom. Stabilné jadro, aktívny vývoj modulov. Použite pre aplikácie založené na RDF, ak potrebujete RDF špecifické moduly.
    RSS 2.0 UserLand Rozšíriteľný pomocou modulov, ponúka ľahkú migráciu z vetiev 0.9x. Stabilné jadro, aktívny vývoj modulov. Použite pre rôzne účely, na syndikáciu s bohatými metadátami.
    Atom Internet Engineering Task Force (IETF). Momentálne vstúpil do fáze štandardizácie v IETF. Odporúčané je počkať na finálnu verziu špecifikácie.

    Aktuálne najpoužívanejší formát podľa syndic8 je RSS 2.0 nasledovaný verziami 0.91 a 1.0 s rovnomerne rozdeleným podielom.

    Veľmi sľubne sa vyvíja formát Atom, ktorý si kladie vyššie ciele a okrem zjednotenia formátu agregácie sa snaží zjednotiť aj formát na získanie/objavenie RSS súborov na internete a pripája k tomu formát na uverejňovanie blog zápisov. Blogy postihlo niečo podobné ako webovú syndikáciu a aktuálne existuje na posielanie nového blog zápisu viacero formátov, napríklad Blogger API alebo LiveJournal XML-RPC Klient/Server Protokol, ale to je na samostatný článok. Atom si kladie za cieľ zjednotiť a nahradiť tieto protokoly.

    Následne pri popise tvorby RSS súboru budem používať iba RSS 2.0 formát, ale jeho upravenie na inú verziu by nemalo byť náročné.

    Zobrazenie kanálov

    Na web stránkach sa odkazy na RSS feedy dajú nájsť naprieklad vo forme nasledujúcich ikoniek:

    Prípadne vo forme odkazu s názvom RSS, RDF alebo Atom.

    Programov na zobrazovanie RSS existuje nepreberné množstvo. Či už priamo vo webových prehliadačoch, ako napríklad vo Firefoxe zabudované prehliadanie:

    Pridanie RSS vo Firefoxe

    alebo pomocou rôznych pluginov prípadne samostatných konzolových alebo grafických programov. Dobrú prácu odvádzajú: na MS Windowse RssReader, pre GNOME Liferea, Straw alebo prenositeľný v Jave napísaný RssOwl. Pokiaľ chcete vyčerpávajúci zoznam programov na zobrazovanie RSS, tak navštívte Open directory.

    Pridanie titulkov z iného webu na HTML stránku prostredníctvom RSS

    Chcete mať na svojej stránke aktuálny zoznam nových článkov z vášho obľúbeného servera? Ak máte stránky spravené pomocou JSP alebo PHP, tak nie je nič ľahšie. Celá operácia sa skladá z:

    • Nájdenia vhodného skriptu pársujúceho RSS súbor.
    • Kontroly, či si rozumie s poskytovanou verziou RSS.
    • Vhodného vloženia výstupov zo skriptu do vašej stránky.

    A ako vypadá výsledok? Takto je možné zobraziť zápisy z blogu v ABCLinuxu. Viem že do dokonalosti tomu chýba veľa, ale svoj účel to plní.

    Nemá význam menovať konkrétne skripty, existuje ich nepreberné množstvo a každý si určite vyberie taký, aký potrebuje. Kľúčové slová do googlu sú: "php rss parser" alebo "jsp rss parser".

    V podstate každý skript má metódu na načítanie a parsovanie RSS súboru do nejakého objektu a následne poskytuje metódy na sprístupnenie:

    • nadpisu
    • odkazu a
    • popisu

    pre celú stránku a konkrétnu položku. Pre vyššie zmienený výstup blogu som použil skript RSSReader a v samotnom HTML kóde to vypadá nasledovne:

    <?php
       // Include the file that does all the work
       include("./php/rssreader.php");
    
       // This is the URL to the actual RSS feed. 
       // Change this value if you want to show a different feed.
       $url="http://www.abclinuxu.cz/auto/blog/sloboda.rss";
    
       // Create an instance of the rssFeed object, 
       // passing it the URL of the feed
       $rss=new rssFeed($url);
    
       // If there was an error getting the data
       if($rss->error){
          // Show the error
          print "<h1>Chyba:</h1>\n<p><strong>$rss->error</strong></p>";
       }else{<br />
    
          // Otherwise, we have the data, so we call the parse method
          $rss->parse();
    
          print "<h1>Môj Blog: ";
          $rss->showHeading(span);
          print "</h1>\n";
    
          // Display the image if there is one
          $rss->showImage("left");
    
          // If the RSS feed provides a link
          if($rss->link){
             // Display it
             print '<p>Tento blog je vedený na serveri 
                    <a href="http://www.abclinuxu.cz" 
                    title="AbcLinuxu">www.AbcLinuxu.cz</a> na stránke ';
             $rss->showLink();
             print "</p>\n";
          }
    
          // Display the description
          $rss->showDescription();
    
          // Show the news stories
          $rss->showStories();
       }
    ?>
    

    Záver

    Webová agregácia ponúka flexibilnú možnosť, ako agregovať poskytovaný obsah viacerých webov do jednej stránky. Jednotný značkovací jazyk umožňuje ľahké zobrazenie týchto zmien v množstve koncových aplikácií. Veľmi sľubne sa rozvíja formát Atom, v ktorom už dnes veľa stránok svoj obsah poskytuje, a má veľké šance odstrániť zmätok, ktorý vznikol zavedením množstva vyššie uvedených formátov.

    V ďalšej časti nájdete popis samotnej štruktúry xml súboru, postup ako vytvoriť a zvalidovať RSS súbor, skripty zjednodušujúce prácu a generátor RSS súboru pre pohodlných. A tiež odpovede na otázky z diskusie, samozrejme ak nejaké budú :-).

           

    Hodnocení: 74 %

            špatnédobré        

    Nástroje: Tisk bez diskuse

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    Komentáře

    Vložit další komentář

    Věroš avatar 6.6.2005 00:41 Věroš | skóre: 24 | blog: Co není v hlavě | 49.29 s.š., 16.54. v.d.
    Rozbalit Rozbalit vše Dotaz do dalšího dílu
    Pěkný přehled RSS formátů, díky.

    Stálo by za to ještě zmínit RSS Validator (i když to asi bude v dalším díle - při vytváříme vlastní RSS feed).

    A teď ten dotaz: Zkoušel někdo používat Lifereu proti idnes? V průběhu dne několikrát totiž jeden článek i několikrát mění, takže potom je dotyčný článek ve čtečce několikrát. Ocenil bych možnost upravit Lifereu tak, aby při update článku pouze znovu zvedla vlaječku u starého článku (a upravila popis položky). Dá se to rozchodit pomocí filtrů nebo budu muset zasahovat do zdrojáku?
    Školím Ansible
    6.6.2005 23:20 Stanislav Valasek | skóre: 23 | blog: sloboda
    Rozbalit Rozbalit vše Re: Dotaz do dalšího dílu
    RSS validátory aj štruktúra RSS 2.0 bude v druhom diely.

    O spomínanom nastavení v Liferea neviem :-(
    patička?
    11.6.2005 18:27 MoB
    Rozbalit Rozbalit vše Re: Dotaz do dalšího dílu
    Ona vůbec kvalita (?) RSS exportů na iDNES je námět na samostatnou sérii článků. Nebo ne, škoda práce. Stačí napsat "práce na pytel".
    Věroš avatar 12.6.2005 21:35 Věroš | skóre: 24 | blog: Co není v hlavě | 49.29 s.š., 16.54. v.d.
    Rozbalit Rozbalit vše IDnes (ugly hack)
    Ugly Hack. Do filtru v Liferea napsat:

    /bin/sed 's!<link>\(.*\)</link>!&<guid isPermaLink="true">\1</guid>!'

    Lepší by to bylo pomocí nějakého XSLT, ale sed je mnohonásobně rychlejší :-)
    Školím Ansible

    Založit nové vláknoNahoru

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.