abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 11:44 | Zajímavý článek

Arsenij Zinčenko v zápisku sdílí technické poznámky o tom, co je to „klíčenka“ (keyring) v Linuxu a v desktopovém prostředí, jak to souvisí se Secret Service a D-Bus, včetně příkladů. Význam těchto služeb spočívá v uložení a následném poskytování autentizačních údajů.

Fluttershy, yay! | Komentářů: 0
7.12. 01:44 | Nová verze

V únoru 2014 bylo hlasováním rozhodnuto, že výchozím init systémem v Debianu je systemd. V listopadu stejného roku bylo hlasováním rozhodnuto, že o podpoře dalších init systémů v Debianu není celoprojektové hlasování nutné. Po pěti letech už ale hlasování o init systémech a systemd nutné je. Vybírá se z 8 možností. Výsledek hlasování bude zveřejněn po 27. prosinci.

Ladislav Hagara | Komentářů: 27
7.12. 00:11 | Zajímavý článek

David Revoy, autor open source webového komiksu Pepper&Carrot, se rozhodl, že svůj komiks vydá také knižně a ve vlastní režii. Komiks již knižně vyšel ve francouzštině ve vydavatelství Glénat. David Revoy jej vydá v angličtině a použije pouze svobodný software. O své zkušenosti se dělí ve dvou příspěvcích na svém blogu. Z plánovaných dvou týdnů práce se staly dva měsíce. Vydání před Vánocemi se nestihne. Kontrolní výtisk má příliš jasné barvy, obrázky v knihách od Glénatu vypadají mnohem lépe, …

Ladislav Hagara | Komentářů: 1
6.12. 20:44 | IT novinky

Mezinárodní konsorcium W3C (World Wide Web Consortium) vydalo verzi 1.0 základní specifikace WebAssembly a po HTML, CSS a JavaScriptu prohlásilo WebAssembly za čtvrtý oficiální jazyk pro web.

Ladislav Hagara | Komentářů: 14
6.12. 13:33 | Komunita

Hlasování o obrázku v okně O Inkscapu 1.0 pokračuje druhým kolem. Ze 124 obrázků postoupilo do finálního hlasování 5 s nejvíce hlasy. Výsledek hlasování bude zveřejněn po jeho ukončení, tj. po 15. prosinci.

Ladislav Hagara | Komentářů: 8
6.12. 02:11 | IT novinky

Společnost Purism představila mobilní telefon Librem 5 USA. Jedná se o telefon Librem 5 vyráběný v USA. Předobjednat jej lze za 1 999 dolarů. Librem 5 lze předobjednat za 699 dolarů.

Ladislav Hagara | Komentářů: 37
5.12. 22:22 | Nová verze

Příspěvek na blogu organizace Electronic Frontier Foundation (EFF) informuje, že Certbot, tj. oficiální klient certifikační autority Let’s Encrypt, dospěl do nové stabilní verze 1.0. Oficiálně tak byla ukončena beta fáze jeho vývoje. Certbot byl představen v květnu 2016.

Ladislav Hagara | Komentářů: 0
5.12. 15:55 | Zajímavý software

Mozilla vydala novou verzi 0.6 svobodného softwaru DeepSpeech pro převod řeči na text. Přehled novinek v příspěvku na blogu Mozilla Hacks.

Ladislav Hagara | Komentářů: 4
4.12. 17:33 | Zajímavý projekt

Dnes měl na YouTube premiéru krátký sci-fi film SKYWATCH. Colin Levy na něm strávil téměř 6 let. Pro vytvoření 3D grafiky byl vybrán Blender. Film byl z části financován z kampaně na Kickstarteru.

Ladislav Hagara | Komentářů: 3
4.12. 05:55 | Zajímavý software

Netflix uvolnil framework pro datovou vědu Metaflow jako open source. Zdrojové kódy jsou k dispozici na GitHubu pod licencí Apache 2.0.

Ladislav Hagara | Komentářů: 44
Jaké hodinky nosíte (nejčastěji)?
 (23%)
 (6%)
 (17%)
 (54%)
Celkem 520 hlasů
 Komentářů: 135, poslední 6.12. 20:54
Rozcestník

www.AutoDoc.Cz

RSS a Atom: agregácia webového obsahu - I

6. 6. 2005 | Stanislav Valasek | Programování | 6608×

V tejto časti dvojdielneho seriálu sa zoznámime všeobecne s agregáciou, existujúcimi formátmi, ich porovnaním a možnosťami zobrazenia. Článok na záver obsahuje postup pridania RSS kanálu do HTML stránky.

Čo je to agregácia

Agregácia/syndikácia webového obsahu je založená na myšlienke uverejňovania zmien na webovom potrále v špeciálnom formáte. Na zobrazenie tohoto formátu existuje množstvo programov, či skriptov, ktoré zmeny umožnia zobraziť či už v samostatnom programe, vložené v nejakej aplikácií, alebo ako súčasť HTML stránky.

Ako to celé funguje

Všeobecne sa dá povedať, že autor web stránok vytvorí jeden alebo viac xml súborov, pridá na ne z web stránok odkazy a následne ich podľa potreby aktualizuje. Programy/skripty načítavajúce tieto xml súbory dokážu zistiť, či boli aktualizované, a zvýraznene zobrazia nové položky v nich.

Formáty používaných súborov

Keďže web agregácia je relatívne mladá vec a pri jej vzniku stáli viaceré firmy alebo jednotlivci, vzniklo množstvo "oficiálnych" formátov.

Asi najjednoduchšie to je s popísaním formátu Atom. Ten vznikol na základe nejednotnosti a rôznorodosti množstva vznikajúcich formátov. Je však relatívne mladý a aktuálne prebieha jeho štandardizácia v IETF.

Formát, alebo skôr skratka, ktorá priniesla toľko zmätku, je RSS. Skratka z toho dôvodu, že názov RSS bol v priebehu času používaný pre viac druhov protokolov, ako napríklad Rich Site Summary, neskôr Really Simple Syndication a následne RDF Site Summary a bol vyvíjaných viacerými vývojármi.

A aby sme si v tom spravili poriadok, tu je zoznam formátov, aj s odporúčaním, ktorý kedy použiť:

Verzia Vlastník Výhody Odporúčanie
RSS 0.90 Netscape Zastaralý po vzniku 1.0 Nepoužívať
RSS 0.91 Vytvorený Netscapom, prebraný do UserLand. Veĺmi jednoduchý, oficiálne zastaralý po vzniku verzie 2.0, ale stále veľmi populárny. Použite na jednoduchú syndikáciu. V prípade potreby väčšej komplexnosti zaručuje jednoduchú migráciu na verziu 2.0.
RSS 0.92, 0.93 a 0.94 UserLand Obsahujú bohatšie metadata ako 0.91. Zastarali po vzniku verzie 2.0. Použite verziu 2.0.
RSS 1.0 RSS-DEV Working Group Založený na RDF, rozšíriteľný pomocou modulov, nekontrolovaný jediným výrobcom. Stabilné jadro, aktívny vývoj modulov. Použite pre aplikácie založené na RDF, ak potrebujete RDF špecifické moduly.
RSS 2.0 UserLand Rozšíriteľný pomocou modulov, ponúka ľahkú migráciu z vetiev 0.9x. Stabilné jadro, aktívny vývoj modulov. Použite pre rôzne účely, na syndikáciu s bohatými metadátami.
Atom Internet Engineering Task Force (IETF). Momentálne vstúpil do fáze štandardizácie v IETF. Odporúčané je počkať na finálnu verziu špecifikácie.

Aktuálne najpoužívanejší formát podľa syndic8 je RSS 2.0 nasledovaný verziami 0.91 a 1.0 s rovnomerne rozdeleným podielom.

Veľmi sľubne sa vyvíja formát Atom, ktorý si kladie vyššie ciele a okrem zjednotenia formátu agregácie sa snaží zjednotiť aj formát na získanie/objavenie RSS súborov na internete a pripája k tomu formát na uverejňovanie blog zápisov. Blogy postihlo niečo podobné ako webovú syndikáciu a aktuálne existuje na posielanie nového blog zápisu viacero formátov, napríklad Blogger API alebo LiveJournal XML-RPC Klient/Server Protokol, ale to je na samostatný článok. Atom si kladie za cieľ zjednotiť a nahradiť tieto protokoly.

Následne pri popise tvorby RSS súboru budem používať iba RSS 2.0 formát, ale jeho upravenie na inú verziu by nemalo byť náročné.

Zobrazenie kanálov

Na web stránkach sa odkazy na RSS feedy dajú nájsť naprieklad vo forme nasledujúcich ikoniek:

Prípadne vo forme odkazu s názvom RSS, RDF alebo Atom.

Programov na zobrazovanie RSS existuje nepreberné množstvo. Či už priamo vo webových prehliadačoch, ako napríklad vo Firefoxe zabudované prehliadanie:

Pridanie RSS vo Firefoxe

alebo pomocou rôznych pluginov prípadne samostatných konzolových alebo grafických programov. Dobrú prácu odvádzajú: na MS Windowse RssReader, pre GNOME Liferea, Straw alebo prenositeľný v Jave napísaný RssOwl. Pokiaľ chcete vyčerpávajúci zoznam programov na zobrazovanie RSS, tak navštívte Open directory.

Pridanie titulkov z iného webu na HTML stránku prostredníctvom RSS

Chcete mať na svojej stránke aktuálny zoznam nových článkov z vášho obľúbeného servera? Ak máte stránky spravené pomocou JSP alebo PHP, tak nie je nič ľahšie. Celá operácia sa skladá z:

  • Nájdenia vhodného skriptu pársujúceho RSS súbor.
  • Kontroly, či si rozumie s poskytovanou verziou RSS.
  • Vhodného vloženia výstupov zo skriptu do vašej stránky.

A ako vypadá výsledok? Takto je možné zobraziť zápisy z blogu v ABCLinuxu. Viem že do dokonalosti tomu chýba veľa, ale svoj účel to plní.

Nemá význam menovať konkrétne skripty, existuje ich nepreberné množstvo a každý si určite vyberie taký, aký potrebuje. Kľúčové slová do googlu sú: "php rss parser" alebo "jsp rss parser".

V podstate každý skript má metódu na načítanie a parsovanie RSS súboru do nejakého objektu a následne poskytuje metódy na sprístupnenie:

  • nadpisu
  • odkazu a
  • popisu

pre celú stránku a konkrétnu položku. Pre vyššie zmienený výstup blogu som použil skript RSSReader a v samotnom HTML kóde to vypadá nasledovne:

<?php
   // Include the file that does all the work
   include("./php/rssreader.php");

   // This is the URL to the actual RSS feed. 
   // Change this value if you want to show a different feed.
   $url="http://www.abclinuxu.cz/auto/blog/sloboda.rss";

   // Create an instance of the rssFeed object, 
   // passing it the URL of the feed
   $rss=new rssFeed($url);

   // If there was an error getting the data
   if($rss->error){
      // Show the error
      print "<h1>Chyba:</h1>\n<p><strong>$rss->error</strong></p>";
   }else{<br />

      // Otherwise, we have the data, so we call the parse method
      $rss->parse();

      print "<h1>Môj Blog: ";
      $rss->showHeading(span);
      print "</h1>\n";

      // Display the image if there is one
      $rss->showImage("left");

      // If the RSS feed provides a link
      if($rss->link){
         // Display it
         print '<p>Tento blog je vedený na serveri 
                <a href="http://www.abclinuxu.cz" 
                title="AbcLinuxu">www.AbcLinuxu.cz</a> na stránke ';
         $rss->showLink();
         print "</p>\n";
      }

      // Display the description
      $rss->showDescription();

      // Show the news stories
      $rss->showStories();
   }
?>

Záver

Webová agregácia ponúka flexibilnú možnosť, ako agregovať poskytovaný obsah viacerých webov do jednej stránky. Jednotný značkovací jazyk umožňuje ľahké zobrazenie týchto zmien v množstve koncových aplikácií. Veľmi sľubne sa rozvíja formát Atom, v ktorom už dnes veľa stránok svoj obsah poskytuje, a má veľké šance odstrániť zmätok, ktorý vznikol zavedením množstva vyššie uvedených formátov.

V ďalšej časti nájdete popis samotnej štruktúry xml súboru, postup ako vytvoriť a zvalidovať RSS súbor, skripty zjednodušujúce prácu a generátor RSS súboru pre pohodlných. A tiež odpovede na otázky z diskusie, samozrejme ak nejaké budú :-).

       

Hodnocení: 74 %

        špatnédobré        

Nástroje: Tisk bez diskuse

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Vložit další komentář

Věroš avatar 6.6.2005 00:41 Věroš | skóre: 24 | blog: Co není v hlavě | 49.29 s.š., 16.54. v.d.
Rozbalit Rozbalit vše Dotaz do dalšího dílu
Pěkný přehled RSS formátů, díky.

Stálo by za to ještě zmínit RSS Validator (i když to asi bude v dalším díle - při vytváříme vlastní RSS feed).

A teď ten dotaz: Zkoušel někdo používat Lifereu proti idnes? V průběhu dne několikrát totiž jeden článek i několikrát mění, takže potom je dotyčný článek ve čtečce několikrát. Ocenil bych možnost upravit Lifereu tak, aby při update článku pouze znovu zvedla vlaječku u starého článku (a upravila popis položky). Dá se to rozchodit pomocí filtrů nebo budu muset zasahovat do zdrojáku?
Školím Ansible
6.6.2005 23:20 Stanislav Valasek | skóre: 23 | blog: sloboda
Rozbalit Rozbalit vše Re: Dotaz do dalšího dílu
RSS validátory aj štruktúra RSS 2.0 bude v druhom diely.

O spomínanom nastavení v Liferea neviem :-(
patička?
11.6.2005 18:27 MoB
Rozbalit Rozbalit vše Re: Dotaz do dalšího dílu
Ona vůbec kvalita (?) RSS exportů na iDNES je námět na samostatnou sérii článků. Nebo ne, škoda práce. Stačí napsat "práce na pytel".
Věroš avatar 12.6.2005 21:35 Věroš | skóre: 24 | blog: Co není v hlavě | 49.29 s.š., 16.54. v.d.
Rozbalit Rozbalit vše IDnes (ugly hack)
Ugly Hack. Do filtru v Liferea napsat:

/bin/sed 's!<link>\(.*\)</link>!&<guid isPermaLink="true">\1</guid>!'

Lepší by to bylo pomocí nějakého XSLT, ale sed je mnohonásobně rychlejší :-)
Školím Ansible

Založit nové vláknoNahoru

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.