abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 12:44 | IT novinky

    Evropská komise zahájila tři vyšetřování týkající se cloudových platforem Amazon Web Services (AWS) a Microsoft Azure. Evropská exekutiva, která plní také funkci unijního antimonopolního orgánu, chce mimo jiné určit, zda jsou americké společnosti Microsoft a Amazon v cloudových službách takzvanými gatekeepery, tedy hráči, kteří významně ovlivňují provoz internetu a musí dle nařízení o digitálních trzích (DMA) na společném trhu

    … více »
    Ladislav Hagara | Komentářů: 0
    dnes 12:33 | IT novinky

    Společnost Meta Platforms vyhrála ostře sledovaný spor o akvizici sítě pro sdílení fotografií Instagram a komunikační aplikace WhatsApp. Podle amerického soudu firma jejich převzetím neporušila antimonopolní zákon, protože si tak nemonopolizovala trh sociálních sítí. Žalobu na Metu podala před pěti lety americká Federální obchodní komise (FTC). FTC argumentovala, že Meta, tehdy známá jako Facebook, koupila tyto dvě společnosti v letech 2012 a 2014 proto, aby s nimi nemusela soutěžit.

    Ladislav Hagara | Komentářů: 0
    dnes 05:11 | IT novinky

    Home Assistant včera představil svůj nejnovější oficiální hardware: Home Assistant Connect ZBT-2 pro připojení zařízení na sítích Zigbee nebo Thread.

    Ladislav Hagara | Komentářů: 5
    včera 19:44 | Nová verze

    Byla vydána verze 9.1 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a informačním videu.

    Ladislav Hagara | Komentářů: 1
    včera 17:44 | IT novinky

    Byl aktualizován seznam 500 nejvýkonnějších superpočítačů na světě TOP500. Nejvýkonnějším superpočítačem zůstává El Capitan od HPE (Cray) s výkonem 1,809 exaFLOPS. Druhý Frontier má výkon 1,353 exaFLOPS. Třetí Aurora má výkon 1,012 exaFLOPS. Nejvýkonnější superpočítač v Evropě JUPITER Booster s výkonem 1,000 exaFLOPS je na čtvrtém místě. Nejvýkonnější český superpočítač C24 klesl na 192. místo. Karolina, GPU partition klesla na 224. místo a Karolina, CPU partition na 450. místo. Další přehledy a statistiky na stránkách projektu.

    Ladislav Hagara | Komentářů: 10
    včera 17:22 | IT novinky

    Microsoft představil Azure Cobalt 200, tj. svůj vlastní SoC (System-on-Chip) postavený na ARM a optimalizovaný pro cloud.

    Ladislav Hagara | Komentářů: 0
    včera 12:00 | IT novinky

    Co způsobilo včerejší nejhorší výpadek Cloudflare od roku 2019? Nebyl to kybernetický útok. Vše začalo změnou oprávnění v jednom z databázových systémů a pokračovalo vygenerováním problém způsobujícího konfiguračního souboru a jeho distribucí na všechny počítače Cloudflare. Podrobně v příspěvku na blogu Cloudflare.

    Ladislav Hagara | Komentářů: 3
    18.11. 23:44 | Nová verze

    Byla vydána (Mastodon, 𝕏) první RC verze GIMPu 3.2. Přehled novinek v oznámení o vydání. Podrobně v souboru NEWS na GitLabu.

    Ladislav Hagara | Komentářů: 0
    18.11. 23:22 | Komunita

    Eugen Rochko, zakladatel Mastodonu, tj. sociální sítě, která není na prodej, oznámil, že po téměř 10 letech odstupuje z pozice CEO a převádí vlastnictví ochranné známky a dalších aktiv na neziskovou organizaci Mastodon.

    Ladislav Hagara | Komentářů: 0
    18.11. 19:44 | Nová verze

    Byla vydána nová major verze 5.0 svobodného 3D softwaru Blender. Přehled novinek i s náhledy a videi v obsáhlých poznámkách k vydání. Videopředstavení na YouTube.

    Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (35%)
     (46%)
     (19%)
     (18%)
     (23%)
     (15%)
     (23%)
     (15%)
     (17%)
    Celkem 372 hlasů
     Komentářů: 17, poslední včera 21:57
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: Jak parsovat text podle formátování textu

    20.3.2015 13:13 Michal
    Jak parsovat text podle formátování textu
    Přečteno: 292×
    Ahoj,

    narazil jsem na potřebu parsovat text podle formátování. Tedy abych z něj dokázal zmizet například poznámky psané kurzívou. Vůbec netuším kde začít hledat řešení. Díky moc za tipy.

    Odpovědi

    Josef Kufner avatar 20.3.2015 13:19 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Pokud máš text označkovaný například v HTML, můžeš ho pomocí Tidy vyčistit a převést na XHTML, což je podmnožina XML. Pak můžeš použít XPath, XSLT a vůbec všechny tyto více či méně šílené nástroje.

    Pokud text máš v ručně formátovaném plain textu nebo čemkoliv jiném, koukni na Pandoc. Umí kopec různých markupů a formátů. Tím to převedeš na XHTML a pak viz předchozí odstavec.
    Hello world ! Segmentation fault (core dumped)
    20.3.2015 19:56 Michal
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Dík za tipy. Omrknu je a kdyžtak sem napíšu jestli jsem něco našel. Pokud by se mi podařilo nějak rozložit text do toho XHTML, tak bych měl asi vyhráno.
    pavlix avatar 20.3.2015 20:05 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Před časem jsem to dělal v pythonu a byla to otázka nějakého parametru, že to má umět číst i HTML. Nebudu psát, který modul, nejsem si už jistý.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    pavlix avatar 20.3.2015 18:32 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Co přesně máš namysli tím textem? Čistý text kurzívu nemá a formátovaný text se ukládá ve stovkách různých formátů.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    20.3.2015 19:47 Michal
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Jedná se o text formátovaný v .doc souborech. Tedy jej lze uložit do čehokoli. Aktuální formát tedy není zajímavý.
    pavlix avatar 20.3.2015 20:06 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Pak bych šel buď do nějakého třeba pythoního modulu, co to umí přímo, nebo přes RTF, který bude docela blízký, generované HTML půjde, ale bude to asi strašný bordel.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    Josef Kufner avatar 20.3.2015 21:38 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Bordel nevadí, s tím si Tidy poradí. Dokonce má přímo volbu na odstraňování bordelu z Wordu.
    Hello world ! Segmentation fault (core dumped)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.