abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×

dnes 15:44 | Komunita

Projekt LiMux skončil. Mnichov se vrací k Windows. Rada města na svém včerejším zasedání schválila migraci všech počítačů na Windows 10 do roku 2020.

Ladislav Hagara | Komentářů: 8
dnes 08:00 | Pozvánky

V Praze dnes probíhá konference Internet a Technologie 17.2 pořádaná sdružením CZ.NIC. Sledovat ji lze online. K dispozici je také archiv předchozích konferencí. Sdružení nedávno vydalo bezpečnostní pexeso. Ke stažení jako pdf pod licencí CC BY-NC-SA.

Ladislav Hagara | Komentářů: 0
dnes 07:22 | Nová verze

Byla vydána verze 10.2 a krátce na to opravná verze 10.2.1 open source alternativy GitHubu, tj. softwarového nástroje s webovým rozhraním umožňujícího spolupráci na zdrojových kódech, GitLab (Wikipedie). Představení nových vlastností v příspěvku na blogu a na YouTube.

Ladislav Hagara | Komentářů: 13
dnes 06:22 | Pozvánky

V úterý 28. listopadu se v Brně koná již 4. přednáškový večer Ruby Stories. Těšit se můžete na témata jako TDD, hybridní mobilní aplikace či programování v Elixiru. Více informací na Facebooku nebo se rovnou registruj na Eventbrite. Na místě bude zdarma drink a lehké občerstvení, tak dorazte.

ondrej-zadnik | Komentářů: 0
dnes 06:11 | Pozvánky

V úterý 28. 11. 2017 bude další Prague Containers Meetup. DC/OS a Mesos vás provede Mesosphere's Developer Advocate Matt Jarvis.

little-drunk-jesus | Komentářů: 0
včera 14:44 | Komunita

Mozilla.cz informuje, že Firefox bude možná upozorňovat na úniky vašich hesel. V Mozille prototypují upozorňování na únik informací o vašem účtu, pokud se na seznamu Have I been pwned? objeví služba, ke které máte ve Firefoxu uložené přihlašovací údaje. Informace se objevila v pravidelném newsletteru o vývoji Firefoxu.

Ladislav Hagara | Komentářů: 6
včera 00:22 | Bezpečnostní upozornění

Společnost ZONER informuje o bezpečnostním incidentu, při kterém došlo ke zcizení a zveřejnění části přihlašovacích údajů zákazníků k elektronické poště a webhostingu CZECHIA.COM.

Ladislav Hagara | Komentářů: 1
22.11. 23:44 | Nová verze

Byla vydána nová stabilní verze 1.13 (1.13.1008.32) webového prohlížeče Vivaldi (Wikipedie). Z novinek vývojáři zdůrazňují možnost zobrazení otevřených i uzavřených listů pomocí ikonky Okno na postranní liště a vylepšené stahování (YouTube). Nejnovější Vivaldi je postaveno na Chromiu 62.0.3202.97.

Ladislav Hagara | Komentářů: 9
22.11. 20:55 | Nová verze

Byla vydána verze 2017.3 dnes již průběžně aktualizované linuxové distribuce navržené pro digitální forenzní analýzu a penetrační testování Kali Linux. Aktualizovat systém lze pomocí příkazů "apt update; apt dist-upgrade; reboot". Z novinek lze zmínit 4 nové nástroje: InSpy, CherryTree, Sublist3r a OSRFramework.

Ladislav Hagara | Komentářů: 1
22.11. 01:55 | Bezpečnostní upozornění

Společnost Uber potvrdila bezpečnostní incident a únik dat v roce 2016. Unikly údaje o 57 milionech cestujících (jména, emailové adresy a čísla mobilních telefonů) a 600 tisících řidičích (navíc čísla řidičských průkazů).

Ladislav Hagara | Komentářů: 1
Jak se vás potenciálně dotkne trend odstraňování analogového audio konektoru typu 3,5mm jack z „chytrých telefonů“?
 (9%)
 (1%)
 (1%)
 (1%)
 (75%)
 (14%)
Celkem 763 hlasů
 Komentářů: 37, poslední 21.11. 15:21
    Rozcestník
    Štítky: není přiřazen žádný štítek

    Dotaz: Jak parsovat text podle formátování textu

    20.3.2015 13:13 Michal
    Jak parsovat text podle formátování textu
    Přečteno: 230×
    Ahoj,

    narazil jsem na potřebu parsovat text podle formátování. Tedy abych z něj dokázal zmizet například poznámky psané kurzívou. Vůbec netuším kde začít hledat řešení. Díky moc za tipy.

    Odpovědi

    Josef Kufner avatar 20.3.2015 13:19 Josef Kufner | skóre: 67
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Pokud máš text označkovaný například v HTML, můžeš ho pomocí Tidy vyčistit a převést na XHTML, což je podmnožina XML. Pak můžeš použít XPath, XSLT a vůbec všechny tyto více či méně šílené nástroje.

    Pokud text máš v ručně formátovaném plain textu nebo čemkoliv jiném, koukni na Pandoc. Umí kopec různých markupů a formátů. Tím to převedeš na XHTML a pak viz předchozí odstavec.
    Hello world ! Segmentation fault (core dumped)
    20.3.2015 19:56 Michal
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Dík za tipy. Omrknu je a kdyžtak sem napíšu jestli jsem něco našel. Pokud by se mi podařilo nějak rozložit text do toho XHTML, tak bych měl asi vyhráno.
    pavlix avatar 20.3.2015 20:05 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Před časem jsem to dělal v pythonu a byla to otázka nějakého parametru, že to má umět číst i HTML. Nebudu psát, který modul, nejsem si už jistý.
    pavlix avatar 20.3.2015 18:32 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Co přesně máš namysli tím textem? Čistý text kurzívu nemá a formátovaný text se ukládá ve stovkách různých formátů.
    20.3.2015 19:47 Michal
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Jedná se o text formátovaný v .doc souborech. Tedy jej lze uložit do čehokoli. Aktuální formát tedy není zajímavý.
    pavlix avatar 20.3.2015 20:06 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Pak bych šel buď do nějakého třeba pythoního modulu, co to umí přímo, nebo přes RTF, který bude docela blízký, generované HTML půjde, ale bude to asi strašný bordel.
    Josef Kufner avatar 20.3.2015 21:38 Josef Kufner | skóre: 67
    Rozbalit Rozbalit vše Re: Jak parsovat text podle formátování textu
    Bordel nevadí, s tím si Tidy poradí. Dokonce má přímo volbu na odstraňování bordelu z Wordu.
    Hello world ! Segmentation fault (core dumped)

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.