Portál AbcLinuxu, 30. dubna 2025 15:13

Konverze z Openoffice do ASCII (ISO Latin 2)

7.2.2005 23:23 | Přečteno: 2106× | poslední úprava: 1.3.2005 14:55

Hodi se hlavne do Midnighta, kde staci nasledujici skriptik asociovat s priponou sxw (jako root: F9, Command, Edit extension file, System Wide). Akorat je potreba mit v terminalu spravne nastaveny font pro Latin 2.

Updated:

#!/bin/bash

SCRIPT='
{
        if( !( /<text:p/ ) )
                next
        $0 = gensub( /<([^>]+)>/, "", "g" )
        print
}'

unzip -p "$1" content.xml | cstocs utf8 il2 - | awk "$SCRIPT" | grep -v ^$

       

Hodnocení: -

zatím nehodnoceno
        špatnédobré        

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Nástroje: Začni sledovat (2) ?Zašle upozornění na váš email při vložení nového komentáře. , Tisk

Vložit další komentář

13.2.2005 09:16 phax7 | skóre: 34 | blog: PhaX_blog
Rozbalit Rozbalit vše syntax error
Odpovědět | Sbalit | Link | Blokovat | Admin
Zdravím,

moc se mi líbí nápad prohlížet text z OO.org bez jeho spuštění takto pohodlně. Ale skriptík mi vyhazuje následující chybu:
$ sxw2txt anketa.sxw 
awk: cmd. line:3:         if( !( /<([^>]+)>/, "", "g" )
awk: cmd. line:3:                           ^ syntax error
Nevíte co s tím? Mám Slackware 9.1 a doinstaloval jsem pouze Cstocs (http://ftp.ccc.uba.ar/download/pub/linux/debian/pool/main/c/cstocs/), jinak vše distribuční.
cat ~/bin/sxw2txt 
#!/bin/bash

SCRIPT='
{
        if( !( /<([^>]+)>/, "", "g" )
        print
}'

unzip -p "$1" content.xml | cstocs utf8 il2 - | awk "$SCRIPT"
20.2.2005 21:32 Jiri Bajer | skóre: 34 | blog: Sarimuv koutek | Praha
Rozbalit Rozbalit vše Re: syntax error
Moc se omlouvam, vloudila se mi sem nejaka pracovni verze skriptu. Aktualni funkcni verze vznikne tak, ze se do nasledujiciho kusu kodu prida znak < tesne pred retezec text v radku s if. Proc to pisu tak slozite? Protoze me redakcni system tvrdi, ze jde o nepovolenou znacku a nechce se mi cekat s odpovedi, nez to Leos fixne. ;-)
#!/bin/bash

SCRIPT='
{
        if( !( /text:p/ ) )
                next
        $0 = gensub( /<([^>]+)>/, "", "g" )
        print
}'

unzip -p "$1" content.xml | cstocs utf8 il2 - | awk "$SCRIPT"
21.2.2005 06:51 Leoš Literák | skóre: 74 | blog: LL | Praha
Rozbalit Rozbalit vše Re: syntax error
To neni chyba, ale vlastnost. Proste vkladas HTML kod, takze je treba jej vkladat validne. Znacka PRE je jen HTML znacka, jedine jeji specialni chovani je jiny zpusob zobrazovani radkovani a bilych znaku. Pokud jde o < a podobne znaky, na ne nema zadny zvlastni vliv. Ty stale musite zadavat jako &lt;.

I kdyz je mozne, ze tu kontrolu udelam vice user friendly a nepovolenym znackam zmenim mensitka a vetsitka na entity, takze se zobrazi jako <script>. Spousta lidi HTML nezna a nechape tento pozadavek.

PS. kdyz mas chyby ve svem zapisu, tak je IMHO lepsi opravit chybu primo v zapisu. Zapisy jejich autor muze editovat.
Zakladatel tohoto portálu. Twitter, LinkedIn, blog, StackOverflow
1.3.2005 14:57 Jiri Bajer | skóre: 34 | blog: Sarimuv koutek | Praha
Rozbalit Rozbalit vše Re: syntax error
Aha, me tam chybel ten strednik - ten zbytek me napadl a bez stredniku se mi to nikdy neprelozilo na 1 znak... HTML teoreticky znam, ale prakticky nepouzivam.
21.2.2005 22:42 phax7 | skóre: 34 | blog: PhaX_blog
Rozbalit Rozbalit vše Re: syntax error
Už to funguje díky moc... i když mám 1,5Ghz CPU tak pouštět OO.org je někdy běs:( snad bude v. 2 lepší.

A ještě tak kdyby skriptík vynechával prázdné řádky bylo by to best;)
1.3.2005 14:44 Jiri Bajer | skóre: 34 | blog: Sarimuv koutek | Praha
Rozbalit Rozbalit vše Re: syntax error
Napovim oklikou: Pro odstranovani komentaru z konfiguraku pouzivam tohle:

cat FILE | grep -v \# | grep -v ^$
1.3.2005 21:11 phax7 | skóre: 34 | blog: PhaX_blog
Rozbalit Rozbalit vše Re: syntax error
To je na mě asi moc oklikou:)

Vím že sxw soubor je normální zipko a tam jsou xml - ale jak zařídit když mám prázdný řádek v OO.org aby byl i v text. výstupu... netuším, ještě nápovědu prosím:)
13.3.2005 11:42 Jiri Bajer | skóre: 34 | blog: Sarimuv koutek | Praha
Rozbalit Rozbalit vše Re: syntax error
Updatnul jsem skript v hlavicce blogu (posledni grep) tak, aby se prazdne radky komplet vynechavaly. Mozna lepsi reseni je misto toho grepu tam dat cat -s, ktery redukuje pocet prazdnych radek za sebou na jednu (puvodni grep likvidoval vsechny prazdne radky). Snad to takhle bude stacit... ;-)
13.3.2005 11:44 Jiri Bajer | skóre: 34 | blog: Sarimuv koutek | Praha
Rozbalit Rozbalit vše Re: syntax error
Mozna by ale taky jeste slo pridat pred print dalsi podminku, ktera bude testovat neprazdnost retezce. Zkus a dej vedet, co vypada nejlip.
jose17 avatar 13.3.2005 23:49 jose17 | skóre: 44 | blog: Joseho_blog | Bratislava
Rozbalit Rozbalit vše Re: syntax error
neda mi to, aby som neprispel aj svojim riesenim, ktore pre ~/.mc/bindings znie:

View=%view unzip -p %f content.xml | o3totxt | cstocs utf8 il2 -
Ja vim, on vi, ty nano!
30.3.2005 11:25 Jiri Bajer | skóre: 34 | blog: Sarimuv koutek | Praha
Rozbalit Rozbalit vše Re: syntax error
Super, dik za odkaz!

Založit nové vláknoNahoru

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.