Microsoft v příspěvku na svém blogu věnovaném open source oznámil, že textové adventury Zork I, Zork II a Zork III (Wikipedie) jsou oficiálně open source pod licencí MIT.
První prosincový týden proběhne SUSE Hack Week 25. Zaměstnanci SUSE mohou věnovat svůj pracovní čas libovolným open source projektům, například přidání AI agenta do Bugzilly, implementaci SSH v programovacím jazyce Zig nebo portaci klasických her na Linux. Připojit se může kdokoli.
Google oznámil, že Quick Share na Androidu funguje s AirDropem na iOS. Zatím na telefonech Pixel 10. Uživatelé tak mohou snadno přenášet soubory z telefonů s Androidem na iPhony a obráceně.
Byla vydána nová verze 8.5 (8.5.0) skriptovacího jazyka PHP používaného zejména k vývoji dynamických webových stránek. Přináší řadu novinek a vylepšení (URI Extension, Pipe Operator, Clone With, …). Vydána byla také příručka pro přechod z předchozích verzí.
Evropská komise zahájila tři vyšetřování týkající se cloudových platforem Amazon Web Services (AWS) a Microsoft Azure. Evropská exekutiva, která plní také funkci unijního antimonopolního orgánu, chce mimo jiné určit, zda jsou americké společnosti Microsoft a Amazon v cloudových službách takzvanými gatekeepery, tedy hráči, kteří významně ovlivňují provoz internetu a musí dle nařízení o digitálních trzích (DMA) na společném trhu
… více »Společnost Meta Platforms vyhrála ostře sledovaný spor o akvizici sítě pro sdílení fotografií Instagram a komunikační aplikace WhatsApp. Podle amerického soudu firma jejich převzetím neporušila antimonopolní zákon, protože si tak nemonopolizovala trh sociálních sítí. Žalobu na Metu podala před pěti lety americká Federální obchodní komise (FTC). FTC argumentovala, že Meta, tehdy známá jako Facebook, koupila tyto dvě společnosti v letech 2012 a 2014 proto, aby s nimi nemusela soutěžit.
Home Assistant včera představil svůj nejnovější oficiální hardware: Home Assistant Connect ZBT-2 pro připojení zařízení na sítích Zigbee nebo Thread.
Byla vydána verze 9.1 open source virtualizační platformy Proxmox VE (Proxmox Virtual Environment, Wikipedie) založené na Debianu. Přehled novinek v poznámkách k vydání a informačním videu.
Byl aktualizován seznam 500 nejvýkonnějších superpočítačů na světě TOP500. Nejvýkonnějším superpočítačem zůstává El Capitan od HPE (Cray) s výkonem 1,809 exaFLOPS. Druhý Frontier má výkon 1,353 exaFLOPS. Třetí Aurora má výkon 1,012 exaFLOPS. Nejvýkonnější superpočítač v Evropě JUPITER Booster s výkonem 1,000 exaFLOPS je na čtvrtém místě. Nejvýkonnější český superpočítač C24 klesl na 192. místo. Karolina, GPU partition klesla na 224. místo a Karolina, CPU partition na 450. místo. Další přehledy a statistiky na stránkách projektu.
Microsoft představil Azure Cobalt 200, tj. svůj vlastní SoC (System-on-Chip) postavený na ARM a optimalizovaný pro cloud.
maj tam nějakou trial verzi hele tak to mužeš zkusit ale asi ti to nepojede :O :O
Odporučil by som znížiť rozlíšenie skenovania, ak nie sú zdrojové súbory k dispozícii.Předpokládanám, že jsi to radil především kvůli tomu, aby se tečky slily, jinak je to pouze cesta, jak ztratit další procento obrazové informace. Správná cesta je získat co nejlepší sken, a pak laborovat s postprocessingem.
Len rozlíšenie bude musieť byť ešte menšie nech na tom nepohorí OCRJe to cesta, ale nikoliv nezbytně nutná. Během postprocessingu se to dá vyřešit filtrem co rozmázne skvrny podle barvy tím pádem lze cíleně „slít” pouze ty tečky. Pak už si s tím OCR poradí. Největší blbost je, tyhle materiály skenovat černobíle, nebo ve stupních šedi. Nejrychlejší je to mastit foťákem.
Vetsina originalu byla tisknuta 24 jehlickovymi tiskarnami, novejsi laserovkou, nektere jsou fotokopie. S kvalitou scanu fakt problem neni, zabyvam se tim uz snad 2 roky. Jde o software. Abbyy je kralem, predtim se jeste pouzivala Recognita. Zadny opensource se kvalitou OCR k temto nepriblizil.
To mozna puvodni tazatel. Jak poznamenava Alesuv prispevek DjVu ma nejake vychytavky navic, hlavne velikost je zajimava. Vysledek ukladame:
djvutool, a přes volbu algoritmu a dalších parametrů mohu výsledek dost výrazně ovlivnit.
V minulosti jsem používal i zmíněné balíky pro win prostředí. Podle mne už dávno zastaraly. V linuxovém prostředí je výborný nástroj pro zpracování PDF, který podporuje i OCR Master PDF Editor, který využívá právě tesseract. Dokonce má i nějakou podporu učení.
Já toho moc nevyužívám. Stránky na které pouštím OCR to většinou neopotřebují. Přeci jenom těch textů není zas tolik. Jen sem tam nějaká knížka. Ale jak jsem napsal, 20 let zkušeností.
Ovšem ten hlavním důvod, proč je na tohle DjVu lepší než PDF je ten, že lze do souboru vložit kontrolní součty všech vrstev, podepsané důvěryhodným certifikátem, takže je prakticky vyloučeno dodatečné zfixlování obrazové informace.Zatímco v PDF můžete podepsat verzi dokumentu důvěryhodným certifikátem, pak přidat novou verzi s textovou vrstvou (novou verzi můžete případně také podepsat). A pak můžete přidávat další verze s úpravami textové vrstvy. Takže je prakticky vyloučeno dodatečné zfixlování obrazové informace. V čem je tedy rozdíl oproti DjVu?
Zatímco v PDF můžete podepsat verzi dokumentu důvěryhodným certifikátem, pak přidat novou verzi s textovou vrstvou (novou verzi můžete případně také podepsat). A pak můžete přidávat další verze s úpravami textové vrstvy.Přiznám se, že zrovna tomuto moc nerozumím. Vím jak vypadá PDF a není mi jasné proč by měla být verzována zrovna textová vrstva, která má za cíl usnadnit vyhledání informace v obrazové vrstvě. Z DjVu dokumentu nikdy nelze vyrobit dokument, který by bylo možné zaměnit s originálem. To v prvé řadě. Je technicky nemožné, z něj vytáhnout obrazovou vrstvu a dodatečně do ní vlepit něco jiného. Což u PDF neplatí. A pokud to PDF bude falšovat osoba s přístupem k důvěryhodnému certifikátu, neodhalíte nic. DjVu formát navíc umožňuje vlepit i originální sken v jpeg2000. Prakticky se to ale nedělá. Prohlížeče s tím nepočítají a výsledný soubor by byl moc velký, takže např. archive.org udržuje originální skeny v tomhle formátu v samostatných archivech.
Tiskni
Sdílej: