Portál AbcLinuxu, 8. května 2025 03:23
V bitmapových obrázcích bývají často ukrytá užitečná data, která jsou ovšem běžně nepřístupná. V článku Full-textové prohledávání komiksů a jiných obrázků (dostupné přes Tor) autor prakticky ukazuje, jak si postahovat komiksy a rozpoznat v nich text pomocí OCR nástroje Tesseract. Následně Ghostscriptem vkládá všechny komiksy do jednoho velkého PDF, ve kterém jde vyhledávat text (který byl původně jen shlukem grafických bodů v bitmapách). Uvedený postup lze použít i k užitečnějším věcem, jako např. indexování nestrukturovaných dat na disku.
Tiskni
Sdílej:
Hm, to abych si udělal nějaké automatické proxování do .onion, protože kdo to má furt ručně přepínat.My tedy používáme dva prohlížeče nebo samostatné virtuálky, ale můžeš si na to udělat PAC soubor, který ti bude vybírat proxy podle domény - je to vlastně jen kousek javaskriptu...
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.