abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 18:33 | IT novinky

    Nové verze AI modelů. Společnost OpenAI představila GPT‑5.5. Společnost DeepSeek představila DeepSeek V4.

    Ladislav Hagara | Komentářů: 0
    včera 15:33 | Zajímavý článek

    Nová čísla časopisů od nakladatelství Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 164 (pdf) a Hello World 29 (pdf).

    Ladislav Hagara | Komentářů: 0
    včera 04:44 | Komunita

    Bylo oznámeno, že webový prohlížeč Opera GX zaměřený na hráče počítačových her je už také na Flathubu and Snapcraftu.

    Ladislav Hagara | Komentářů: 0
    23.4. 23:11 | IT novinky

    Akcionáři americké mediální společnosti Warner Bros. Discovery dnes schválili převzetí firmy konkurentem Paramount Skydance za zhruba 110 miliard dolarů (téměř 2,3 bilionu Kč). Firmy se na spojení dohodly v únoru. O část společnosti Warner Bros. Discovery dříve usilovala rovněž streamovací platforma Netflix, se svou nabídkou však neuspěla. Transakci ještě budou schvalovat regulační orgány, a to nejen ve Spojených státech, ale také

    … více »
    Ladislav Hagara | Komentářů: 0
    23.4. 22:33 | Nová verze

    Canonical vydal (email, blog, YouTube) Ubuntu 26.04 LTS Resolute Raccoon. Přehled novinek v poznámkách k vydání. Vydány byly také oficiální deriváty Edubuntu, Kubuntu, Lubuntu, Ubuntu Budgie, Ubuntu Cinnamon, Ubuntu Kylin, Ubuntu Studio, Ubuntu Unity a Xubuntu. Jedná se o 11. vydání s dlouhodobou podporou (LTS).

    Ladislav Hagara | Komentářů: 2
    23.4. 11:55 | Nová verze

    V programovacím jazyce Go naprogramovaná webová aplikace pro spolupráci na zdrojových kódech pomocí gitu Gitea (Wikipedie) byla vydána v nové verzi 1.26.0. Přehled novinek v příspěvku na blogu.

    Ladislav Hagara | Komentářů: 0
    23.4. 04:44 | Pozvánky

    Ve středu 29. dubna 2026 se v pražské kanceláři SUSE v Karlíně uskuteční 7. Mobile Linux Hackday, komunitní setkání zaměřené na Linux na mobilních zařízeních, kernelový vývoj i uživatelský prostor. Akce proběhne od 10:00 do večerních hodin. Hackday je určen všem zájemcům o praktickou práci s Linuxem na telefonech. Zaměří se na vývoj aplikací v userspace, například bankovní aplikace, zpracování obrazu z kamery nebo práci s NFC, i na úpravy

    … více »
    lkocman | Komentářů: 1
    22.4. 21:55 | Nová verze

    LilyPond (Wikipedie) , tj. multiplatformní svobodný software určený pro sazbu notových zápisů, byl vydán ve verzi 2.26.0. Přehled novinek v aktualizované dokumentaci.

    Ladislav Hagara | Komentářů: 0
    22.4. 20:33 | Nová verze

    Byla vydána nová verze 11.0.0 otevřeného emulátoru procesorů a virtualizačního nástroje QEMU (Wikipedie). Přispělo 237 vývojářů. Provedeno bylo více než 2 500 commitů. Přehled úprav a nových vlastností v seznamu změn.

    Ladislav Hagara | Komentářů: 0
    22.4. 13:33 | IT novinky

    Společnost SpaceX amerického miliardáře Elona Muska oznámila, že si zajistila opci buď na akvizici startupu Cursor za 60 miliard dolarů (přes 1,2 bilionu Kč) do konce letošního roku, nebo na zaplacení deseti miliard dolarů za nové partnerství s touto firmou zabývající se generováním kódů. SpaceX se dále prosazuje na lukrativním trhu s vývojářskými nástroji pro umělou inteligenci (AI). Cursor, startup zabývající se prodejem modelů AI pro

    … více »
    Ladislav Hagara | Komentářů: 2
    Které desktopové prostředí na Linuxu používáte?
     (14%)
     (8%)
     (2%)
     (13%)
     (31%)
     (3%)
     (6%)
     (2%)
     (15%)
     (25%)
    Celkem 1408 hlasů
     Komentářů: 30, poslední 3.4. 20:20
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: Jak parsovat text podle formátování textu

    20.3.2015 13:13 Michal
    Jak parsovat text podle formátování textu
    Přečteno: 303×
    Ahoj,

    narazil jsem na potřebu parsovat text podle formátování. Tedy abych z něj dokázal zmizet například poznámky psané kurzívou. Vůbec netuším kde začít hledat řešení. Díky moc za tipy.

    Odpovědi

    Josef Kufner avatar 20.3.2015 13:19 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Pokud máš text označkovaný například v HTML, můžeš ho pomocí Tidy vyčistit a převést na XHTML, což je podmnožina XML. Pak můžeš použít XPath, XSLT a vůbec všechny tyto více či méně šílené nástroje.

    Pokud text máš v ručně formátovaném plain textu nebo čemkoliv jiném, koukni na Pandoc. Umí kopec různých markupů a formátů. Tím to převedeš na XHTML a pak viz předchozí odstavec.
    Hello world ! Segmentation fault (core dumped)
    20.3.2015 19:56 Michal
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Dík za tipy. Omrknu je a kdyžtak sem napíšu jestli jsem něco našel. Pokud by se mi podařilo nějak rozložit text do toho XHTML, tak bych měl asi vyhráno.
    pavlix avatar 20.3.2015 20:05 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Před časem jsem to dělal v pythonu a byla to otázka nějakého parametru, že to má umět číst i HTML. Nebudu psát, který modul, nejsem si už jistý.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    pavlix avatar 20.3.2015 18:32 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Co přesně máš namysli tím textem? Čistý text kurzívu nemá a formátovaný text se ukládá ve stovkách různých formátů.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    20.3.2015 19:47 Michal
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Jedná se o text formátovaný v .doc souborech. Tedy jej lze uložit do čehokoli. Aktuální formát tedy není zajímavý.
    pavlix avatar 20.3.2015 20:06 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Pak bych šel buď do nějakého třeba pythoního modulu, co to umí přímo, nebo přes RTF, který bude docela blízký, generované HTML půjde, ale bude to asi strašný bordel.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    Josef Kufner avatar 20.3.2015 21:38 Josef Kufner | skóre: 70
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Bordel nevadí, s tím si Tidy poradí. Dokonce má přímo volbu na odstraňování bordelu z Wordu.
    Hello world ! Segmentation fault (core dumped)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.