TeX – 6 (fonty) (diskuse)

Předělat si celou metriku je bohužel zřejmě jediný způsob, jak opravit chyby v kerningových párech. Narazil jsem na to u páru "fZ" ve fontu Bookman, který potřebuji a používám; nikoho asi nenapadlo, že by někdo tak bizarní kombinaci používal, a tak je kerning špatně. Optimální by bylo, kdyby se dal kerning doplnit přímo do TeXu, tak jako se dají doplnit dělení slov pomocí \hyphenation, ale nenašel jsem, jak toho dosáhnout.

27.11.2013 08:04 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Pokud používáte XeTeX, funguje tam tohle:

   \XeTeXinterchartokenstate=1
   \newXeTeXintercharclass\JrTClass
   \newXeTeXintercharclass\JrVClass
   \newXeTeXintercharclass\JrEaccClass
   \newXeTeXintercharclass\JrAaccClass
   \XeTeXcharclass`T = \JrTClass
   \XeTeXcharclass`V = \JrVClass
   \XeTeXcharclass`ě = \JrEaccClass
   \XeTeXcharclass`ä = \JrAaccClass
   \XeTeXinterchartoks\JrVClass\JrEaccClass={\kern-0.08em }
   \XeTeXinterchartoks\JrTClass\JrEaccClass={\kern-0.08em }
   \XeTeXinterchartoks\JrVClass\JrAaccClass={\kern-0.08em }

Konkrétně takhle si upravuji kerning mezi "Tě", "Vě" a "Vä" v Adobe Garamond Pro...

27.11.2013 14:33 Tomáš Pecina
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

To je zajímavé, neměl jsem tušení, že XeTeX takové věci umí... Bohužel, není pro něj zatím udělaný pdfTeX, takže mi to nepomůže.

27.11.2013 17:19 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Moment, z XeTeXu přece leze ve výchozím stavu PDF automaticky. Nebo jde ještě o něco jiného?

27.11.2013 17:32 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

PS: pokud by šlo o hyperlinky, eplain by měl podporovat i XeTeX, mám pocit, že jsem to před časem někde používal a fungovalo to. A rejstříky jsem si vyřešil vlastním kratičkým makrem:

\def\bookmark#1#2{\special{pdf: out #1 << /Title (#2) /Dest [ @thispage /XYZ null @ypos null ] >>}}
\def\topbookmark#1#2{\special{pdf: out #1 << /Title (#2) /Dest [ @thispage /XYZ null null null ] >>}}

\bookmark odkazuje na aktuální pozici, \topbookmark na vršek stránky.

27.11.2013 20:34 xkucf03 | skóre: 50 | blog: xkucf03
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Postupem času jsem si vytvořil vzorový soubor pro LaTeX a výsledkem je dobré PDF, které má odkazy, PDF obsah, nějaká ta metadata a hlavně český text, ve kterém se dá vyhledávat a taky se dá to PDF převést na prostý text, aniž by se zmršil (háčky někde bokem nebo úplné nesmysly). Tak kvůli tomu se mi moc nechce přecházet jinam...

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

27.11.2013 20:46 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

No já psal o plainu, mám pocit, že Tomáš Pecina (je-li to tento Tomáš Pecina) píše v něm. XeLaTeX má, pokud vím, odlišnosti minimální, dané hlavně jinou prací s fonty a tím, že jede standardně v UTF-8.

Já osobně používám TeX jen na sázení eBooků, protože mě irituje zlom ve čtečkách (nemluvě o problematických poznámkách pod čarou apod.), takže si to vysázím v TeXu na formát 8x10cm a čtu si to na PocketBooku v PDF. Narozdíl od Kindla umí PocketBook používat i rejstříky v PDF, takže funguje i rychlé přeskočení na konkrétní kapitolu apod. Původně jsem používal XeLaTeX, ale poté, co se mi po upgradu TeXLive totálně rozpadl formát (asi jsem LaTeXu moc hrabal do vnitřností) jsem pokorně přešel na plain...

27.11.2013 23:39 Tomáš Pecina
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Ano, jsem to já. Mně plain víceméně stačí (nic složitějšího než toto nebo toto generovat nepotřebuji), ale nedaří se mi najít způsob, jak spojit vlastnosti pdfTeXu (hyperlinky, barvy, vlastnosti dokumentu atp.) a možnost používat běžné fonty, nejen speciální TeXové. Jedna možnost by byla přejít na XeLaTeX, což se mi ale výrazně nechce.

28.11.2013 00:37 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Příloha:

test.pdf (12602 bytů)

Nojo, ale já furt nevím, co je za problém s tím XeTeXem. :-)

Podívejte se do přílohy, máte tam odkazy, máte tam barvy a celé jsem to udělal jen s jedním linknutím souboru eplain.tex (a to jen kvůli jednoduché práci s odkazy, jejichž definice by z toho šla taky vyzobat):

\input eplain.tex
\enablehyperlinks

\font\foofont="DejaVu Serif" at 12pt
\foofont

Tohle je text

Tohle je \special{color push rgb 1 0 0}červený text\special{color pop}

Tohle je \special{color push rgb 0 1 0}zelená adresa \href{mailto:pokus@test.cz}{pokus@test.cz}\special{color pop}

Tohle je \special{color push rgb .5 .5 .5}\href{http://www.abclinuxu.cz}{šedý odkaz}\special{color pop}

\medskip

A ještě modrá čára:

\medskip

\special{color push rgb 0 0 1}\hrule height 0.5mm\special{color pop}

\bye

Pak už stačilo jen xetex test.tex a vypadlo z toho PDFko.

Jako ne že bych vám chtěl XeTeX nějak nutit, jen že sám píšete, že chcete pracovat s obecnými fonty, což právě XeTeX umí a můžete klidně zůstat u plainu...

28.11.2013 00:57 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Jo - ještě vlastnosti dokumentu:

\special{pdf: docinfo << /Author (Honza Jaroš) >>}
\special{pdf: docinfo << /Title (Testovací dokument) >>}

Popis těhle speciálních příkazů pro PDF najdete v manuálech pro Dvipdfm. Třeba tady. Nejsou to jen metadata, i další možnosti ohledně hyperlinků, barev atd...

28.11.2013 18:13 Tomáš Pecina
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

To zřejmě bude to pravé. Teď jsem trochu testoval docinfo, jestli není potřeba konverse na UTF-16BE jako v pdfTeXu, ale zdá se, že ne, takže mi už nechybí ke spokojenosti nic. Díky za tip!

28.11.2013 20:03 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Rádo se stalo. Zvlášť když je to pro tenhle účel... :-)

28.11.2013 12:58 xkucf03 | skóre: 50 | blog: xkucf03
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Přílohy:

latex-pokus.pdf (88403 bytů)
latex-pokus.txt (1898 bytů)
latex-pokus.tex (2764 bytů)

Jenže když ten test.pdf převedu na text pomocí pdftotext tak z toho vznikne tohle:

Tohle
Tohle
Tohle
Tohle

je
je
je
je

text
červený text
zelená adresa pokus@test.cz
šedý odkaz

A ještě modrá čára:

1

Ale když převedu svoje PDF z LaTeXu do TXT, tak je ten výstup mnohem lepší.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

28.11.2013 13:07 xkucf03 | skóre: 50 | blog: xkucf03
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

mj. to má vliv na vyhledávání v dokumentu – např. Okular není schopný najít „Tohle je“ nebo „je text“, i když „červený text“ najde. V mém dokumentu najde i „červená, zelená, modrá“ nebo „a další odkaz“.

Ono to vypadá, že řeším prkotiny, ale když pak máš nějakou dokumentaci a máš v ní něco najít, tak tohle je dost znát. Další věc je indexování v různých CMS nebo i na webu a fulltextové vyhledávání (nějaké sofistikovanější, než jen že dokument obsahuje určitá slova) nebo třeba zobrazování náhledů a úryvků.

Neříkám, že LaTeX je dokonalý nebo že to v jiném *TeXu nejde, ale zatím jsem se k uspokojivým výsledkům dopracoval v LaTeXu, tak u něj zůstávám.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

28.11.2013 13:13 xkucf03 | skóre: 50 | blog: xkucf03
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Špatné je, že nenajde „sit amet“ tam, kde došlo k řádkovému zlomu.

Dá se s tím něco dělat při sazbě do PDF? Nebo je potřeba to nějak vyřešit na úrovni prohlížeče?

Tohle je např. problém, když v dokumentaci hledáš nějaký_ukrutně_dlouhý_parametr a on je v tabulce a zalomil se na víc řádků – nenajdeš ho ani v tom PDF z LaTeXu.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

28.11.2013 13:30 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Příloha:

test.pdf (12949 bytů)

Tohohle jsem si všiml v Evince a myslel jsem, že je to problém prohlížeče. Stačilo přepsat první řádek na něco, co nezačíná slovy "Tohle je" a najednou to bylo OK (viz příloha). Tak nevím, jestli to dělá TeX nebo Evince/Okular. Jiný prohlížeč tu momentálně nemám a instalovat si kvůli tomu Adobe Reader se mi nechce...

Každopádně totéž mi dělal s (téměř) tím samým zdrojem i pdfTeX.

28.11.2013 13:45 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Tak jsem si do VirtualBoxu nacpal jedenáctkový Adobe Reader a tam normálně funguje kopírování textu i vyhledávání. Takže to vypadá spíš na to, že se Evince (či spíš nějaká knihovna na práci s PDF, když to dělá i Okular) snaží být příliš chytré a detekuje to jako tabulku. TeX samotný v tom bude nevinně.

28.11.2013 13:49 Petr Olsak
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Přílohy:

testik.tex (2099 bytů)
testik.pdf (29513 bytů)
testik.txt (1890 bytů)

Jenže když ten test.pdf převedu na text pomocí pdftotext tak z toho vznikne tohle: ...
Ale když převedu svoje PDF z LaTeXu do TXT, tak je ten výstup mnohem lepší.

Nezáleží na tom, zda je použit pdfTeX/XeTeX, LaTeX nebo plain. Záleží na tom, jak se sejde ta sazba. Program pdftotext se snaží domýšlet některé věci. Například, když vidí mezery pod sebou, dochází k domněnce, že to je vícesloupcová sazba, a čte to po sloupcích. Když má řádky dost blízko u sebe, naopak to napere na jediný řádek. Přesněji řečeno to není vlastnost pdftotext, ale knihovny poppler, která je vybavena touto inteligencí.

Váš příklad jsem přeznačkoval do plainu a uvádím to zde taky jako přílohu. (Povšimněte si, že hlavička je výrazně kratší než ta LaTeXová.) Protože byly řádky dost blízko u sebe, poppler to nyní nacpal do jediného řádku a dokonce zrušil rozdělené slovo. V tuto chvíli se správně domníval, že to je rozdělené slovo, ale jindy se může domnívat nesprávně. Je to alchymie, jejíž důvod je ten, že v době realizované sazby už jsou informace o logickém členění dokumentu (odstavce, sloupce ve vícelsoupcové sazbě, nerozdělená slova) ztraceny a ten sowtware se může akorát pokusit si něco domyslet.

28.11.2013 14:20 Honza Jaroš | skóre: 6 | blog: moje_strana_plotu | Bohnice
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Přílohy:

test-lowriter-dejavu.pdf (11694 bytů)
test-lowriter-times.pdf (20237 bytů)

Přesně tak. Viz ukázky v příloze, které jsem pro změnu exportoval z LibreOffice Writeru. Kupodivu stačí i jen použít jiné písmo a export do textu se začne chovat jinak - s Times New Roman to poppler čte po řádcích, s DejaVu Serif po sloupcích. Alespoň tedy v Evince 2.32.0 pod aktuálním Gentoo...

28.11.2013 16:52 xkucf03 | skóre: 50 | blog: xkucf03
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Pěkné, jsem rád, že to funguje :-) Kdysi jsem viděl nějaké odstrašující příklady (už nevím, jaký *TeX to byl), kde nešlo v PDF ani vyhledávat česká slova, protože háčky a čárky byly někde bokem. Tak jsem se radši držel té své šablony v LaTeXu, kde to funguje.

Mám rád, když se lidé přou, znamená to, že vědí, co dělají, a že mají směr. Frantovo.cz, SQL-DK, Relational pipes

28.11.2013 10:36 olsak | skóre: 29
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

... Tomáš Pecina (je-li to tento Tomáš Pecina) ...

Právnické texty jsou typická ukázka, ve které lze plně využít výhody TeXu. Měl jsem několik zakázek od takových těch nakladatelství, která pro právníky neustále znovu a znovu tisknou novelizované verze zákonů. Zdroje dostávají z jakéhosi úřadu, kde je sbírka zákonů, ve wordu. Dokázali z toho vlastním softwarem extrahovat text a základní značkování. Na mě pak bylo vytvořit makra, aby to tím prohnali a měli ty knihy hotové. Když projdete regály v knihkupectví s touto právničinou, těžko poznáte, které knížky byly dělané v TeXu...

Já jsem v souvislosti s tím ty právnické texty začal trochu více číst a nyní třeba dělám předsedu legislativní komise senátu ČVUT. Ale to je už jiný příběh...

28.11.2013 13:03 Tomáš Pecina
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Právnické texty jsou typická ukázka, ve které lze plně využít výhody TeXu.

Ano, podání typu trestní odvolání mi teď trvá zlomek času: předpokládá to samozřejmě vytvořit si knihovny maker s osobními údaji klientů, adresami soudů a dalších institucí atd., ale ty se pak už jen recyklují a aktualisují.

27.11.2013 21:01 Nicky726 | skóre: 56 | blog: Nicky726
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

Mám to podobně, akorát v XeLaTeXu. Důvod přechodu bylo tuším zejména snazší řešení vyhledávatelné/kopírovatelné češtiny v PDFku.

Enjoy the detours. There you’ll find the things more important than what you want. (Hunter x Hunter)

27.11.2013 15:52 michal.h21
Rozbalit Rozbalit vše Re: TeX – 6 (fonty)

A v luaTeXu jde využít feature file. ale funguje to jenom pro OpenType fonty, třeba TeX Gyre Bonum je založený na Bookmanu.