abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 19:55 | IT novinky

    Společnost Meta ve spolupráci se společností Oakley oznámila řadu chytrých brýlí Oakley. První Oakley Meta HSTN si lze předobjednat za 499 dolarů.

    Ladislav Hagara | Komentářů: 0
    včera 16:11 | IT novinky

    Ministerstvo průmyslu a obchodu (MPO) vyjádřilo podporu předložení projektu AI Gigafactory CZ, který do veřejné konzultace Evropské komise zaslala společnost České Radiokomunikace (CRA) v rámci iniciativy Project AIGF CZ. Jde o významný krok k rozvoji výpočetní infrastruktury pro umělou inteligenci (AI), která je prioritou resortu. Projekt je v souladu s cíli Národní strategie umělé inteligence ČR 2030 a je již součástí návrhu

    … více »
    Ladislav Hagara | Komentářů: 11
    včera 13:11 | Zajímavý článek

    Nové číslo časopisu Raspberry Pi zdarma ke čtení: Raspberry Pi Official Magazine 154 (pdf). S podtitulem Automatizace domácnosti.

    Ladislav Hagara | Komentářů: 0
    včera 12:22 | IT novinky

    Americký prezident Donald Trump podepsal exekutivní příkaz, který prodlužuje lhůtu pro prodej amerických aktiv aplikace TikTok vlastněné čínskou společností ByteDance do amerických rukou o dalších 90 dnů. Americký Kongres loni v dubnu kvůli bezpečnostním obavám přijal zákon, podle kterého měl vstoupit v platnost zákaz sítě TikTok v USA v případě, že se prodej neuskuteční do 19. ledna. Trump však v lednu lhůtu pro prodej prodloužil o 75 dnů. V dubnu pak přikročil k prodloužení o dalších 75 dnů, lhůta tak měla vypršet dnešním dnem.

    Ladislav Hagara | Komentářů: 1
    včera 12:11 | IT novinky

    Microsoft hodlá zrušit další tisíce pracovních míst, a to především v obchodních odděleních. Předchozí kolo propouštění se uskutečnilo v květnu a dotklo se 6000 zaměstnanců. Vedení firmy již dříve upozornilo, že vzhledem k rozsáhlým investicím do umělé inteligence (AI) se bude snažit omezovat výdaje v jiných oblastech.

    Ladislav Hagara | Komentářů: 5
    19.6. 18:44 | IT novinky

    Společnost Murena ve spolupráci se společností Qwant představila vyhledávač Murena Find. Ve výchozím nastavení bude používán v mobilním operačním systému /e/OS a v Murena Workspace.

    Ladislav Hagara | Komentářů: 0
    19.6. 13:00 | IT novinky

    V mobilní aplikaci Facebooku se lze nově přihlašovat pomocí Passkeys.

    Ladislav Hagara | Komentářů: 3
    19.6. 12:44 | IT novinky

    Společnost Midjourney představila vlastní generátor videí pomocí umělé inteligence (AI) V1 Video Model.

    Ladislav Hagara | Komentářů: 0
    18.6. 23:22 | Nová verze

    Editor kódu Zed (Wikipedie) má nově v sobě integrovaný debugger. Podporuje Rust, C/C++, JavaScript, Go, Python a pomocí rozšíření i další programovací jazyky.

    Ladislav Hagara | Komentářů: 7
    18.6. 22:22 | Zajímavý článek

    Byl publikován aktuální přehled vývoje renderovacího jádra webového prohlížeče Servo (Wikipedie). Servo mimo jiné nově zvládne animované GIFy.

    Ladislav Hagara | Komentářů: 1
    Jaký je váš oblíbený skriptovací jazyk?
     (57%)
     (29%)
     (7%)
     (2%)
     (0%)
     (1%)
     (3%)
    Celkem 289 hlasů
     Komentářů: 16, poslední 8.6. 21:05
    Rozcestník

    Dotaz: Konverze ruznych textovych formatu do jednoho

    polo23 avatar 29.2.2012 19:26 polo23 | skóre: 28 | blog: polo23
    Konverze ruznych textovych formatu do jednoho
    Přečteno: 586×
    Ahoj,
    potreboval bych poradit jak zkonvertovat hromadu textovych souboru do jenoho druhu formatu napr. ASCII nebo UTF8.

    Tady je sezna typu formatu souboru co potrebuju zkonvertovat. Chtel jsem pouzit iconv ale ten chce zadat vzdy alepson vstupni typ formatu.
    ASCII C++ program text
    ASCII C++ program text
    ASCII text
    ASCII text
    ASCII text, with escape sequences
    ASCII text, with CRLF line terminators
    ASCII text, with CRLF line terminators
    ASCII text, with CRLF, LF line terminators
    ASCII text
    ISO-8859 text
    ISO-8859 text
    ASCII text
    ASCII text, with CRLF line terminators, with escape sequences
    ASCII text, with CRLF line terminators
    ASCII text
    ASCII text, with CRLF line terminators
    ASCII C program text
    Non-ISO extended-ASCII English text, with CRLF line terminators
    ASCII text
    ASCII text
    ISO-8859 English text
    ISO-8859 English text
    ASCII English text
    ASCII English text
    ISO-8859 text, with CRLF line terminators
    ASCII text, with escape sequences
    ASCII text
    ASCII text
    ASCII text
    ASCII text
    ASCII English text
    ASCII text, with CRLF line terminators
    ASCII text, with CRLF line terminators
    ASCII text, with CRLF line terminators
    ASCII text, with CRLF line terminators
    ASCII English text, with CRLF line terminators
    Non-ISO extended-ASCII text
    ASCII English text, with CRLF line terminators
    UTF-8 Unicode English text
    ASCII English text
    ASCII text
    ASCII English text
    data
    ASCII Pascal program text
    ASCII Pascal program text
    ASCII text
    ASCII English text
    ASCII English text
    UTF-8 Unicode C program text
    UTF-8 Unicode text
    ASCII text, with CRLF line terminators
    ASCII text, with CRLF line terminators
    ASCII text
    ASCII C++ program text
    ASCII C++ program text
    ASCII text
    ASCII text
    ASCII text
    ASCII text
    Non-ISO extended-ASCII text, with LF, NEL line terminators
    MMDF mailbox
    ASCII text, with CRLF line terminators
    Non-ISO extended-ASCII text, with CRLF, NEL line terminators
    ASCII assembler program text, with CRLF, CR line terminators
    ASCII Pascal program text, with CRLF line terminators
    Non-ISO extended-ASCII English text
    Non-ISO extended-ASCII English text
    Non-ISO extended-ASCII text
    HTML document text
    Non-ISO extended-ASCII text
    ISO-8859 English text
    Non-ISO extended-ASCII English text
    ASCII text
    directory

    Odpovědi

    29.2.2012 19:42 l4m4
    Rozbalit Rozbalit vše Re: Konverze ruznych textovych formatu do jednoho
    Potíž jsou ty Non-ISO extended-ASCII, protože mohou být naprosto cokoli. Zkusil bych enca, zda ti je detekuje správně.

    Některé formáty budeš muset převést speciálně jiným programem, např. ten mailbox nebo HTML, pokud chceš na konci jen text (ale zase vesměs obsahují kódování, ve kterém jsou).

    Převod do ASCII není definován. Nevím, jak převedeš do ASCII třeba tohle:

    http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt
    polo23 avatar 29.2.2012 21:37 polo23 | skóre: 28 | blog: polo23
    Rozbalit Rozbalit vše Re: Konverze ruznych textovych formatu do jednoho
    Ta enca je nerozpoznala... Ma problem s rozpoznavanim i dalsich formatu... Nemusi to byt ASCII ale treba to UTF8. Proste neco co bezny txt prohlizec otevre.
    pavlix avatar 1.3.2012 09:54 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Konverze ruznych textovych formatu do jednoho
    Ma problem s rozpoznavanim i dalsich formatu...
    To se jí vůbec nedivím.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.
    polo23 avatar 29.2.2012 21:38 polo23 | skóre: 28 | blog: polo23
    Rozbalit Rozbalit vše Re: Konverze ruznych textovych formatu do jednoho
    Jeste me napada otrocina otevirat to rucne treba v gedit a ukladat to v ASCII:) Ale do toho se mi nechce.
    29.2.2012 23:45 l4m4
    Rozbalit Rozbalit vše Re: Konverze ruznych textovych formatu do jednoho
    Pokud ti stačí jakkoli zmršit ne-ASCII znaky, tak je prostě odstraň:

    tr -d -c '[\001-\177]'

    Požadavek konverze do UTF-8 a požadavek modifikace souboru, aby neobsahoval ne-ASCII znaky jsou velmi odlišné a musejí se odlišně řešit. Není jedno, co z toho se má provést.
    1.3.2012 05:50 ahuska
    Rozbalit Rozbalit vše Re: Konverze ruznych textovych formatu do jednoho
    man konwert viz any/cs a crlf
    pavlix avatar 1.3.2012 10:03 pavlix | skóre: 54 | blog: pavlix
    Rozbalit Rozbalit vše Re: Konverze ruznych textovych formatu do jednoho
    Rozhodnutí jestli konvertovat do ASCII nebo UTF-8 je docela zásadní. ASCII je zároveň i znakovou sadou, která je podmnožinou znakové sady Unicode (kóduje se mimojiné jako UTF-8).

    Unicode je univerzální v tom, že dneska můžeš redefinovat všechna běžná ḱódování předefinovat jako (často neúplná) kódování znakové sady Unicode. Takže třeba kódování českého textu do ASCII je nutně ztrátové, zatímco překódování prakticky čehokoli do UTF-8 je bezztrátové.
    Já už tu vlastně ani nejsem. Abclinuxu umřelo.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.