KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Tento díl představí jeden ze základních pilířů KDE 4 – Nepomuk. Jedná se o inovativní otevřený standard pro sémantický desktop. Co umí nebo má umět? Automaticky a/nebo interaktivně shromažďovat metadata pro indexaci a vyhledávání. A co to k čertu znamená? Čtěte dál…

Obsah

Úvodem

Nepomuk je velice těžko uchopitelná technologie. Začněme tedy zeširoka. Kdysi dávno se jedna skupina chytrých pánů – a nebylo náhodou, že to bylo na mezinárodní konferenci věnované sémantickému webu v Galway v Irsku – rozhodla přenést sémantiku z prostředí webu na desktop. A na světě byl semanticdesktop.org. Výzkumný projekt sponzorovaný Evropskou unií, do něhož se zapojilo několik desítek firem – mimo jiné i známá jména jako SAP, HP nebo IBM. Jenže důvodem, proč to vše zmiňuji v článku o KDE 4, je, že se do tohoto projektu rovněž zapojila společnost Mandriva, která sponzorovala vývoj implementace Nepomuk pro KDE 4. Nepomuk je specifikace a API pro sémantický desktop vytvořený onou skupinou – součástí projektu je totiž i referenční opensource implementace v Javě. Mandriva, tedy konkrétně Sebastian Trueg, onu specifikaci implementovala do prostředí KDE 4.

Nicméně z předchozího odstavce není pořád jasné, co to k čertu ten Nepomuk vlastně je. Je to KDE knihovna, která je určena k zaznamenávání a prohledávání sémantických dat na desktopu. A sémantickými daty rozumíme rozličné informace (a proto se to tak těžko vysvětluje), jako jsou metadata multimediálních souborů, obsah textových souborů, odkud byl stažený ten který soubor, kdo vám kdy poslal soubor jako zprávu a tak podobně. Důležité jsou dva prvky – zaznamenávání a vyhledávání, bez nichž by to celé bylo k ničemu.

Zdroje dat pro Nepomuk jsou v zásadě tři – jednak uživatelské zadání, jako třeba ruční tagování souborů v Dolphinu. Dále pak automatické indexování obsahu souborů pomocí Strigi. A nakonec automatické indexování akcí, například příchozích emailů.

Ontologie

Nepomuk ovšem není pouze knihovna, ale i sada takzvaných ontologií, což jsou v podstatě definice různých typů sémantických dat. Výhodou je, že jsou poměrně modulární, takže třeba nexif – Nepomuk Exif Ontology je podtřída nfo:Image. Celé to je poměrně spletité a složité, včetně speciálního definičního jazyka NRL. Ten není, velice překvapivě, postaven nad XML, ale používá speciální formát podobný JSON. Podobnou věc používá i Tracker z GNOME a celé to by mělo být nakonec zaštítěno freedesktop.org.

Pro běžného uživatele je to nezajímavé a od této chvíle se budu slovu ontologie vyhýbat.

Backendy

Pro pochopení skutečnosti, proč nebyl Nepomuk do současnosti příliš použitelný, je bohužel nutno znát několik technických detailů. Ale nebude jich mnoho, a některým se pro jistotu vyhneme docela.

Vzhledem k tomu, že myšlenka sémantického desktopu byla vytvořena lidmi kolem sémantického webu, není velké překvapení, že použili stejné technologie, jejichž přehled je na w3c.org. Základem pro to všechno je RDF – Resource Description Framework – XML formát vytvořený pro popis dat. Ve světě opensource jej využívá zejména skupina produktů z mozilla.org. Pro tvorbu dotazů nad těmito daty (zaznamenávání a vyhledávání, vzpomínáte?) byl definován jazyk SPARQL, který implementuje Qt knihovna Soprano. Samotná knihovna je pouze dotazovací vrstvou, o ukládání dat se stará backend.

V průběhu vývoje KDE 4 existovaly tři různé backendy – Redland, Sesame2 a Virtuoso. A každý trpí (respektive trpěl) problémem. Redland, napsaný v C++, byl původně výchozím backendem, nicméně ve 4.4 je označen jako pateticky pomalý a vývojáři jej doporučují nepoužívat. Daleko lepší variantou je Sesame2, který implementuje různé optimalizace a je tak svižnější než Redland. Vaz mu u spousty uživatelů a distributorů láme fakt, že je napsaný v Javě.

Tím třetím vzadu je Virtuoso, psaný v C++, který kombinuje výhody obou – C++ a vysoký výkon. Což je, uznávám, poměrně neobvyklá věta. S Javou se na desktopu obvykle spojuje jiné slovo než rychlost. Důvodem je, že Sesame2 implementuje řadu různých chytrých optimalizací, které jeho kolega Redland nemá, takže je přes deficit virtuálního stroje rychlejší.

Pro KDE 4.4 se Sebastian Trueg snažil mít Virtuoso jako výchozí backend. Ten totiž umlčí jednak uživatele, kterým nevyhovuje fakt, že Nepomuk spotřebuje 100 % výkonu jejich procesoru a za druhé ty, kteří nechtějí mít jako nezbytnou závislost celou JVM. Ve verzi 4.3.77 je už nemožné bez backendu Virtuoso Nepomuk provozovat, takže předchozí odstavce znamenají jenom historické ohlédnutí.

Drobná rada na závěr, při změně backendu nezapomeňte nejprve nainstalovat nový, poté restartujte Nepomuk a až poté odinstalujte starý.

Instalace a konfigurace

Přes spoustu řečí jsme se nakonec dostali k tomu, jak ten Nepomuk vlastně použít. Měl by být povolen v ovládacím centru KDE

Důležité je, aby běžela služba NepomukStorage, protože bez ní Nepomuk nebude mít kam ukládat svoje data. V případě, že vám služba neběží a neobjevilo se žádné varovné okno, je možné službu spustit ručně:

Používáme Nepomuk

Z uživatelského hlediska je Nepomuk čistě abstraktní věc – neexistuje žádná aplikace tohoto jména. Nepomuk je prostě knihovna pro práci se sémantickými daty, takže je na konkrétních aplikacích, zda a jak jej budou používat. Nejpřímočařejší způsob, jak jej používat, je ruční tagování v Dolphinu:

S prohledáváním je to v současnosti horší. Asi nejjednodušší způsob je použít KIO protokol nepomuksearch:/ z libovolného KDE programu, který je podporuje. Existuje i integrace s Krunnerem, ale neexistence rozumného grafického rozhraní je pro desktopovou technologii docela smrtící. Na druhé straně dojde v KDE 4.4 ke zjednodušení dotazovacího API, což by mohlo tvorbě takové aplikace pomoci. Nicméně stále zbývá spousta práce ohledně integrace Nepomuku do ostatních aplikací.

Dotazy je možné pokládat na příkazové řádce pomocí programu sopranocmd.

Vývojáři Nepomuku nicméně pracují na vyhledávacím rozhraní pro Dolphin, které by mělo být součástí 4.5. Ostatní novinky Nepomuku, které jsou očekávány do 4.5, ale jsou začleněny v Mandriva Linux 2010.

Nepomuk a Strigi

Až do teď jsem se o vůbec nezmínil o automatickém indexeru Strigi. Ten se ze samostatného projektu stal součástí Nepomuku, čímž také došlo k určitému zmatení v pojmech. „Staré“ Strigi byl samostatný program používající knihovnu clucene, kdežto to nové běží jako služba Nepomuku a metadata ukládá do backendu Soprano, stejně jako zbytek Nepomuku. Konfigurace je na stejném místě v konfiguračním centru a stav lze zjistit před D-BUS:

Indexování samotné je poměrně nenáročné – Strigi například neběží, pokud je systém napájen z baterií anebo provádí mnoho IO. Původní stesky ohledně jeho náročnosti jsou minulostí a jdou vesměs na vrub backendu Redland, který byl pravou příčinou velkého vytížení procesoru. Kamenem úrazu linuxových indexovacích služeb je tak pouze jedna věc – jak sledovat změny v již zaindexovaném systému. Jedním z důvodů je i to, že podpora pro takové sledování změn není napříč unixy nic moc, včetně Linuxu.

První dostupné rozhraní bylo dnotify v řadě 2.4, které se vyznačovalo poměrně nepřátelským API a použitím. V jádře 2.6.13 bylo zavedeno rozhraní inotify, které zlepšuje API, nicméně má poměrně omezený počet sledovacích bodů (8000, i když byla tato hodnota v poslední době zvýšena) a písmenko i v jádře naznačuje, že je zaměřeno především na inody. Navíc vznikly i dva pokusy, jak zakrýt rozdíly mezi unixovými rozhraními – File Alternation Monitor a Gamin. Nepomuk má speciální službu upozorňující na změny v souborech, ale ta používá KDE API, tudíž se změny zapsané KDE aplikacemi projeví okamžitě, ostatní až se zpožděním.

Světlem na konci tunelu (které se v současnosti nezdá být světlometem protijedoucího vlaku) je, alespoň pro uživatele Linuxu, nové API fanotify v jádře 2.6.31. To obrušuje rohy stávajících rozhraní a navíc se na obzoru rýsuje zajímavá možnost, že může být změněný obsah souboru rovnou zaindexován.

Buď jak buď, současným problémem použivání Strigi je fakt, že periodicky reindexuje celý disk, což je velice rušivá a náročná operace.

Závěrem

Nepomuk se postupně proměnil ze systému, jehož jediná interakce s uživatelem byla spotřebování veškerého času procesoru, na solidní základ pro ostatní aplikace. Jediný vážnější problém je indexace souborů (respektive sledování změn), což je naštěstí nepovinná část. Plánovaná těsnější integrace s Akonadi dodá Nepomuku to, co zatím nemá – to je typický příklad použití. Příště se tedy podíváme na Akonadi.

Diskuse k tomuto článku

Stále netuším, k čomu to je dobré (a nečudujem sa, že sa to ľudom nepáči, keďže ani tvorcovia nedokážu zrozumiteľne vysvetliť, na čo je to dobré). ;)

Nezapisujem si napr. to, kedy som bol v lese a ako dlho som tam bol, kedy som bol vysypať smeti, čo som pozeral v TV, ..., takže netuším, prečo by som si v počítači mal udržiavať podobne "dôležité" údaje.

14.1.2010 01:05 AraxoN | skóre: 47 | blog: slon_v_porcelane | Košice
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Možno je to úplne geniálne a chce to len ďalší čas, kým to nadobudne nejaké praktické využitie. Niečo ako keď nám na Matematickej analýze II. vysvetľovali Z-transformáciu a všetci sme si klopkali na čelo, že na čo nám to asi bude. No a potom prišla Teoretická elektrotechnika II. a ejhľa - ten "nezmysel" sa veľmi dobre hodí na prechodové javy. (Ak som to doplietol tak ma nebite - už je to 10 rokov, čo som tieto vedomosti nechal z hlavy vyšumieť).

14.1.2010 11:51 Hynek (Pichi) Vychodil | skóre: 43 | blog: Pichi | Brno
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To byla Laplaceova transformace (to je ta s tím p). Z-transformace je na diskrétní jevy, to ve elektrotechnice moc neužiješ.

XML je zbytečný, pomalý, nešikovný balast, znovu vynalézané kolo a ještě ke všemu šišaté, těžké a kýčovitě pomalované.

14.1.2010 22:40 moira | skóre: 30 | blog: nesmysly
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Já myslím že užije (číslicové filtry).

Překladač ti nikdy neřekne: "budeme kamarádi"

14.1.2010 11:56 thingie | skóre: 8
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

„Je to nesmírně užitečné (ale už jsem to zapomněl)“ :-)

Růžové lži.

14.1.2010 13:56 belisarivs | skóre: 22 | blog: Psychobláboly
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ono je spousta nesmirne uzitecnych veci, ktere presto v hlave nenosis. Co je na tom divneho?

IRC is just multiplayer notepad.

15.1.2010 15:21 pakanek | skóre: 28 | Vyškov
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Mozek se snaží zapomínat nepotřebné, tedy neužitečné věci. To je na tom úsměvné.

Všechno dobré je pro něco zlé.

15.1.2010 17:02 Marek Bernát | skóre: 17 | blog: Arcadia
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Neviem ako cudzie mozgy, ale ten môj sa snaží zabudnúť úplne všetko :-)

physics.stackexchange.com -- Q&A stránky o fyzike v štýle StackOverflow.

15.1.2010 20:03 default | skóre: 22 | Madrid
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To se nevylučuje. :-D

14.1.2010 01:18 JoHnY2
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Je to v podstate twitter pro vsechny desktopovy aplikace (vykecavaj se mu co zrovna delaj a co zjistily) nad kterym jde delat velmi zajimavy dotazy.

Nejvetsi problem KDE4 obecne spociva v tom, ze backend a frontend vznikal a vznika ve stejnou chvili. Jak chcete po programatorech aby pouzivali backend, kdyz je o 3 milestony pozadu za jejich frontendem a API vypada jako emental.

14.1.2010 01:20 JoHnY2
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Pokud jsem kdysi davno funkci nepomuku pochopil spatne tak me nebijte a napiste nejak lidsky co je to za zvire.

14.1.2010 10:01 nikdo
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Obecný framework pro zprávu metadat.

14.1.2010 12:58 xyz
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Není nad hřejivé lidské slovo...

14.1.2010 15:09 muhehe
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

ze by neco jako plumber v operacnim systemu plan9 ?!

14.1.2010 10:12 Lord
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Kdyby k tomu byl dodělaný frontend, tak to slouží jako prohledávač obsahu hdd. Nejen jako fulltextový, ale i strukturovaná data. A tím, že to má metadata uložená ve své db, tak je to pekelně rychlý. Pokud chcete vidět funkční implementaci, tak se podívejte na Spotlight od Apple. :-)

15.1.2010 20:31 Espinosa | skóre: 24 | blog: Espblog | London
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Nemusíte se dívat tak daleko. Linux má už dlouho spolehlivého indexera a vyhledávače - Beagle. Alespoň co se kontetového indexování týče.

14.1.2010 10:35 Let_Me_Be | skóre: 20 | blog: cat /proc/idea/current | Brno
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Hlavni vec co tahle technologie (ne konkretne tyto programy a jejich aktualni stav) umoznuje je vyhledavani a prochazeni podle pribuznosti.

Napriklad si muzes nechat vyhledat soubor: "ktery mi poslal karel emailem minuly mesic". Nebo si pri kliknuti na fotku nechas najit jine fotky, ktere si odfotil v danem meste, nebo na kterych je dana osoba.

Linked in profil - Můj web - Nemůžete vyhrát hádku s blbcem. Nejdřív vás stáhne na svoji úroveň a pak ubije zkušenostmi.

14.1.2010 11:05 jehovista
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Problem je ale v tom, ze vyjmenovane ukony se daji velmi snadno(a radove rychleji) vyresit beznou tabulkovou databazi(pravda, ontologie take vyuzivaji v backendu beznou databazi, ale stavi do cesty dalsi(a to pekne tlustou) vrstvu). Nejvetsi problem semantickych technologii dneska je podle me nalezeni vhodnych pripadu pro demonstraci jeho prinosu a ospravedlneni miliardovych nakladu na vyvoj technologii.

14.1.2010 11:17 Let_Me_Be | skóre: 20 | blog: cat /proc/idea/current | Brno
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

No, IMHO presne tvuj prispevek vyjadruje ten hlavni problem. Nemuzes mit demonstrace bez technologie. Semanticke technologie a presun metadat k samotnym datum je proste dalsi krok ve vyhledavani. Od prohledavani souboru k desktop search (coz je v podstate to same, jenom diky pluginum umis koukat dovnitr nekterych souboru) k semantickemu desktopu.

Ty priklady ktere jsem dal jsou jeste dost jednoduche, ale napriklad "soubory ktere jsem dostal pres internet (IM, Email) od kolegu z prace" je uz dotaz ktery nemas sanci beznym vyhledavanim realizovat, protoze nemas ani metadata ani jejich vztahy (hlavne pokud jde o nejakou nestandardni situaci - napriklad vic zamestnani).

Linked in profil - Můj web - Nemůžete vyhrát hádku s blbcem. Nejdřív vás stáhne na svoji úroveň a pak ubije zkušenostmi.

14.1.2010 14:07 jehovista
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Porad ale nepotrebuju ontologii na to, abych tyto vztahy popsal. Staci obycejna relacni databaze a SQL jazyk. Problem je akorat v tom, ze nemuzu naraz pristupovat ke vsem datum, ktera se me tykaji. Tohle ale nevyresi ontologie, ale proste ustanoveni standardu pro zapis a uchovavani takovych dat. Ja vidim vyhodu v tom, ze se pak daji dotazy zapisovat prirozenejsi formou, oddelenou od fyzickeho ulozeni dat. Porad ale clovek musi znat ten SPARQL a to se neda chtit po beznem uzivateli(zvlast kdyz na slozitejsi dotazy potrebuje chapat ruzne abstraktni pojmy jako blank node apod.) No a pokud jde o popsani struktury dat ontologii, tak tam vidim spis zadrhele, nez prinosy. Staci aby mi nejaka aplikace dovolila do databaze pridat udaj, ktery zpusobi, ze pak bude nekonzistentni. Nevim, jak funguje zrovna nepomuk, ale kdyby se mela konzistence kontrolovat pri kazdem pridani axiomu, tak by to asi bylo dost vypocetne narocne.

14.1.2010 13:08 BrainLess
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

No v podstate je to hloupym zpusoben vytvorena snaha o chytrou vyhledavaci sluzbu. Proc pisi hloupym ? No na to co to ma umet se mi zda kolem velke mnozstvi kodu. Sveho casu jsem se snazil uvest v zivot moji ideu. Pridat ke kzademu souboru na filesystemu 2 atributy (typ souboru a skupina do ktere patri). Potom by muselo existovat kernel api kter by pres nejky frontovaci mechanismus umoznovalo aplikaci hooknout se na dany typ souboru. Takze kdyz by clovek spustil grep mohl by rici ze chce hledat pouze v "textovych souborech" nebo naopak ze zrovna chci grepat "bin/so". Mohl by povesit na event vytovreni "jpegu" skript ktery ho resizen popripade movne do archivu apod. Vyhoda oproti te silenosti s nazvem nepomuk, jasna neni to zavisle na KDE ale na kernelu + sade userspace utilit/procesu.

Problém nepomuku (a některých dalších hvězdných technologií KDE4) je, že tím plašili od dob, kdy 4.0 nebyla ani beta. Tenkrát nebylo asi ještě nic naimplementováno, tak se vše zdálo slibné, elegantní a revoluční.

Pak bylo dlouho ticho po pěšině. Kolem 4.2 se začaly ozývat hlasy že snad už jako jo (něco to dělá), ale přitom ještě ne (nefunkční backend, bordel v architektuře).

Dnes je na obzoru 4.4 a do dnešního dne není k dispozici ani normální use case (mimo prohledávání RSS přes command line či co), není k tomu normální dokumentace a článek sám zasazuje použitelnou technologii do verze 4.5, nebo reálněji 4.6.

A to jsou, přátelé, již tři roky od původního představení s mažoretkami. Já vím, že nová technologie potřebuje vývoj, ale proč to nechápou distributoři a cpou to lidem pod nos defaultně zapnuté celé ty 3 roky?!

In Ada the typical infinite loop would normally be terminated by detonation.

14.1.2010 07:12 Marián Kyral | skóre: 29 | blog: Sem_Tam | Frýdek-Místek
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Mám dojem, že kromě dolphinu to funguje i v gwenview. Alespoň tagování a vyhledávání fotek.

14.1.2010 08:06 Rezza | skóre: 25 | blog: rezza | Brno
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ver mi, ze distributori jsou z toho taky smutni ;-)

Redland je lepsi vubec nepoustet, Sesame2 je Java - obri problem ve Fedore - vse se musi buildit ze zdrojaku a dokazat to u Sesame neni sranda. Mary Ellen Foster na tom ted dela a klobouk dolu - dari se (coz mi pripomina, ze jsem ji slibil par review na ty miliony zavislosti). Virtuoso neni taky vyhra, aspon co se tyce balickovani - je to kompletni SQL server, celkem pekny bumbrlicek, nastesti se da celkem rozkouskovat. Kazdopadne uz se tesim, technologie je to vskutku zajimava, dela na tom celkem dost lidi a hlavne - platime si to! Nepamatuji si cisla, ale miliony euro z EU to jsou :D

14.1.2010 09:43 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

a hlavne - platime si to! Nepamatuji si cisla, ale miliony euro z EU to jsou :D

11.500.000 EUR - pro hnidopichy podotýkám, že většina peněz šla jinam, než do KDE implementace ;-)

When your hammer is C++, everything begins to look like a thumb.

14.1.2010 10:40 Let_Me_Be | skóre: 20 | blog: cat /proc/idea/current | Brno
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

IMHO do KDE implementace z techto penez neslo nic. Resp. do zadne konkretni implementace s vyjimkou te ukazkove.

Linked in profil - Můj web - Nemůžete vyhrát hádku s blbcem. Nejdřív vás stáhne na svoji úroveň a pak ubije zkušenostmi.

14.1.2010 11:15 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Nevím, jak to v takových grantových projektech EU chodí, ale Mandriva je uvedená na stránce přispěvatelů. Z toho usuzuji, že mohla nějaký grant dostat.

When your hammer is C++, everything begins to look like a thumb.

14.1.2010 10:07 nikdo
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

KDE4 není KDE4.0 či KDE4.4. Až to bude hotové a připravené pro usery, tak to bude. Což bude dle mého soudu kolem 4.6. Proč jste tak nedočkavý? Chci vše a chci to teď? Říká se tomu inkrementální vývoj, pokud vím.

Proč něco cpou distributoři se ptejte distributorů. Například OpenSUSE má vše kolem nepomuku v 11.2 v defaultu vypnuté, protože to není připravené pro uživatele. Jakou distribuci používáte vy?

14.1.2010 12:28 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Proč jste tak nedočkavý? Chci vše a chci to teď?

Ani ne. Ale jsou i lepší příklady, kde se inkrementální vývoj zvládl líp. Tady se totiž nenabaluje end user funkcionalita, ale nabalujou se mezivrstvy, a end user věci přijdou na řadu až jako poslední. Tenhle syndrom se opakuje i u některých dalších částí KDE.

Nejdřív nemáme uživatelům vůbec co ukázat, pak něco máme ale nefunguje to, takže to uživatelé ignorují, pak už mámě něco, co ukážeme, ale dělá to něco úplně jiného, než uživatelé čekají, protože jsme na začátku ani neřekli co to přesně je.

Například OpenSUSE má vše kolem nepomuku v 11.2 v defaultu vypnuté, protože to není připravené pro uživatele

Tím myslíte nezakompilované? Přál bych si, aby to tak zůstalo, ale viz 1 2.

Navíc spousta dister se tím neřídí a kompilují úplně všechno. A pokud to zakompilujete tak default v kde 4.3 je že po startu kde se strigi vrhne mlsně na procesor.

In Ada the typical infinite loop would normally be terminated by detonation.

14.1.2010 16:51 Jirka
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Az to bude fungovat, tak to prejmenujou na KDE 5.

14.1.2010 21:15 loki
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

vadi mi, ze vsichni distribuce jedou na kde4. ktere je co si budem povidat stejne derave uplne vsude jinde, nejen v nepomuku (ktery se da vypnout). plnohodnotnou nahradou kde3 proste nejsou (chybi must-have featury a misto toho se dela na nice-to-have). osobne jedu stale na ubuntu 8.04 s kde3.

jo a neverim, ze by distributori tak nadsene prechazeli na kde4, kdyby jim pred temi roky rekli 'dejte jako default tuhle sragoru, co bude furt padat, bude nekompletni a mooozna za 4 roky to bude k pouzivani'. skutecne si myslim, ze i distributori nalitli na kde4 hype a jak to bude hned hotove a super.

TO mi vadi.

Najvacsim problemom cohokolvek, co si autori otituluju ako "semanticky" su kvalitne data. No a najkvalitnejsie data stale dokaze vytvarat iba clovek. Vacsina ludi je od prirody lenivych. Takze cele to "semanticke" cokolvek potom nema vyznam. Samozrejme sa najdu ludia, ktori maju velmi radi poriadok a taguju az sa im z klavesnice pari. Podla mna rovnaku funkcnost je tiez mozne dosiahnut veeelkym objemom dat mensej kvality. Toto vyuziva napr. google, facebook a ich odoberatelia dat:)

14.1.2010 13:28 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Řekl bych, že ještě existuje třetí činitel, který ovlivňuje kvalitu vyhledávání, a to je ontologická databáze. Jednu poměrně dobrou má člověk ve své hlavě. S kvalitně definovanou ontologií je možné i z mála vstupních značek mnohé vydedukovat, protože skrze ontologii vypadnou nemožná nebo nepravděpodobná řešení. Problém kvalitní ontologické databáze ale je, že se musí průběžně doplňovat s tím, jak vznikají nové pojmy a události. Možná že všeobjímající ontologie a veeelky objem dat mensej kvality limitně splývají, máme-li výkonný odvozovací aparát.

14.1.2010 13:43 Mazarik
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Otazka, ktoru som v mojom komentari nacrtol je, kto to bude udrzovat a vyplnovat? Uz som zaznamenal par pokusov o nieco taketo a dokonca som sa na jednom zaujimavom ciastocne zucastnil a vzdy to skoncilo na chuti ludi to doplnovat. Ci uz by mala byt ta chut motivovana financne alebo nie.

14.1.2010 13:58 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Však lidi k tomu nesmíš pustit. S nima jsou akorát problémy...

Hello world ! Segmentation fault (core dumped)

14.1.2010 14:05 Mazarik
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ako napisal petr_p, tak najlepsiu ontologiu ma clovek v hlave. A ani najlepsia indexacia Vam nezaradi napr. odkaz na oblubeny "blogisek o konoch" alebo "ten fajn film o upiroch" do skatulky (tagy, adresare, ontologie...) "fajn blogisky" alebo "filmy o upiroch" bez toho, aby ste to tam nenastavili, neurobili na to pravidlo ako a kam to zaradovat. No a bez spravnych pravidiel a dat je ten program len indexator a nie " magicka semanticka vec", pretoze Vam nedokaze ani len naznacit nejake doporucenie, kde by ste mali este hladat nieco podobne alebo toto je podobne tomu co hladam, ktore este nie je zaindexovane.

14.1.2010 14:14 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ještě zapomínáš na možnost, že by se ta magická sémantická věc učila. Tedy ze začátku by to bylo celkem hloupé indexovátko, ale dávalo by si dohromady související věci. Jakmile by nasbírané souvislosti dosáhly kritické meze, bylo by to schopné bez problému odpovídat i na tak záludné dotazy jako jsi napsal.

Hlavně je nutné se vykašlat na uživatele a neočekávat od něj nic víc, než že bude něco chtít. Ta hvězdička v adresním řádku Firefoxu nebo u mailech v gmailu je tak na hranici maximální náročnosti.

Hello world ! Segmentation fault (core dumped)

14.1.2010 14:17 Mazarik
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Tak ako pisete by som to tiez robil, ale prakticky pokus jednoho doktoranta dokazal, ze dnes na to este nie je technika pripravena a musite tvorit rucne pravidla, inak to bude len hlupe indexovatko. Ked uz hovorime o tom Firefoxe velmi by ma zaujimal fakt, kolko ludi skutocne pouziva tagy pre zalozky pridane vo verzii 3, ktore s touto debatou troska suvisia.

14.1.2010 14:25 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Hm, řekl bych, že výkonu na to už máme dost. Asi by to muselo trošku hádat a nedokázalo to najít všecko perfektně, ale už jen propojení fulltextu a "inteligentního" tagování by mohlo mít značný přínos.

Btw, vyprodukoval ten doktorand o svém pokusu nějaký článek?

Hello world ! Segmentation fault (core dumped)

14.1.2010 14:39 Mazarik
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Uz to bohuzial nefunguje uio ale dokazalo to odpovedat aj na tie otazky, ktore su tam uvedene. Je to spojenie semantickeho webu a prirodzeneho jazyka. Pre dalsie info kontaktujte toho cloveka, ktory je uvedeny vpravo hore.

14.1.2010 15:03 Josef Kufner | skóre: 70
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Tohle je čtyři roky staré (ale díky za odkaz), za tu dobu se ledascos už změnilo, takže určitě má smysl nad tím uvažovat znovu.

Přirozený jazyk bych do tohole však nemotal, je to docela komplikovaná věc. Stačilo by jen něco jako dělá Wolfram Alpha – dostane to pár pojmů a ty to zkusí nějak interpretovat. Pokud by se tyhle pojmy potkaly s tagy, případně se fulltextem dohledaly další tagy, nemuselo by to být výkonově nijak náročné a přitom by to mohlo být schopné dát dohromady vcelku zajímavé výsledky.

Hello world ! Segmentation fault (core dumped)

14.1.2010 19:21 Marek Bernát | skóre: 17 | blog: Arcadia
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To je síce všetko pekné, ale stále je to skôr na úrovni zbožného priania, než fungujúceho programu ;-) A čo sa zmenilo za posledné 4 roky? Ľudia sa už každou možnou formou A.I. zaoberajú 50 rokov a zatiaľ sa kvalitatívne nezmenilo prakticky nič. Len všetci stále hovoria, že veľké objavy sú už za rohom (zrejme aby dostali peniaze na ďalší výskum). Až prídeš s funkčnou implementáciou, tak ti uverím; dovtedy to budú len kecy ;-)

physics.stackexchange.com -- Q&A stránky o fyzike v štýle StackOverflow.

14.1.2010 19:24 Marek Bernát | skóre: 17 | blog: Arcadia
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

A Wolfram Alpha je pekná ukážka toho, čo hovorím. Veľa hypu, výsledok prakticky nulový. Ten systém vidí súvislosti len tam, kde mu ich vložili tvorcovia. Presne ako hovoril kolega vyššie: základom sú ontológie, ktoré má človek v hlave. Dostať ich do programu je vysoko netriviálna úloha.

physics.stackexchange.com -- Q&A stránky o fyzike v štýle StackOverflow.

14.1.2010 20:23 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Dostať ich do programu je vysoko netriviálna úloha.

ja bych byl trochu optimista... napr. u nas se dela na FCA... vicemene, je to docela propracovana teorie, existuji k ni (nove) i velice efektivni algoritmy... ted jenom, aby se nasel nekdo, komu se to bude chtet implementovat do nejakeho search enginu...

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

14.1.2010 23:38 Marek Bernát | skóre: 17 | blog: Arcadia
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Tak to ja som silný skeptik, ale budem držať palce :-)

physics.stackexchange.com -- Q&A stránky o fyzike v štýle StackOverflow.

15.1.2010 01:21 deda.jabko | skóre: 23 | blog: blog co se jmenuje "každý den jinak" | za new york city dvakrát doleva a pak už se doptáte
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

obecne, ohledne moznosti data-miningu jsem taky vcelku skepticky... (napr. jak se tu objevuji teorie, ze podle toho jak kdo jezdi metrem, stat pozna, ze nejaky clovek je podezrely... jsou podle me docela blbost)

ale v pripade zindexovani souboru na jednom desktopu bych to tak cerne nevidel...

Asi před rokem se dostali hackeři na servry Debianu a ukradli jim zdrojové kódy.

15.1.2010 01:42 Let_Me_Be | skóre: 20 | blog: cat /proc/idea/current | Brno
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To jsou ciste statisticke metody a ano obcas se najdou velmi podivne korelace.

Linked in profil - Můj web - Nemůžete vyhrát hádku s blbcem. Nejdřív vás stáhne na svoji úroveň a pak ubije zkušenostmi.

14.1.2010 14:28 Andrej Herceg | skóre: 43
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ked uz hovorime o tom Firefoxe velmi by ma zaujimal fakt, kolko ludi skutocne pouziva tagy pre zalozky pridane vo verzii 3, ktore s touto debatou troska suvisia.

Ja ich používam, ale len občas, keďže ich reálne využitie je minimálne. Síce sa ukladajú, ale rozumne použiť sa nedajú (rozšírenie TagSifter aspoň trochu umožňovalo ich využitie, ale ani to už nefunguje a ani ručné zostavenie záložky pre places nefunguje, pretože vývojári Firefox asi nemajú záujem sprístupniť tú funkčnosť).

14.1.2010 14:34 Mazarik
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

mozete v nich predsa vyhladavat v adresovom riadku alebo nie? mate najake cislo bugu z bugzilla.mozilla.org pre toto? celkom by ma to zaujimalo..

14.1.2010 15:07 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Přesně tak to používám. Dřív jsem třídil záložky do stromu. Když to začalo být neúnosné, přišly značky, takže každé záložce přidám několik značek a pak podle nich vyhledávám, protože si fakt nepamatuji, jak se která záložka jmenovala nebo z kterého serveru pochází.

14.1.2010 15:12 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Tak mě napadlo, že ábíčkové značky, co jsou nad články, by měl redakční systém strkat do /html/head/meta[@name="keywords"] a webový prohlížeč by je mohl odtamtud použít.

17.1.2010 18:26 twg
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

HandyTag? Má nějaké mouchy, ale umožňuje využít keywords.

Firefox podle mých pozorování k záložce ukládá pouze meta "description", v tomto popisu však nevyhledává.

18.1.2010 11:03 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To je jedno, jde o systémový přístup, který může využít kdokoliv.

18.1.2010 12:13 twg
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Jasně, je to jistě dobrý přístup (a vypadá to, že Abíčko už "štítky" do meta "keywords" dává). Psal jsem jen k možnostem využití těchto "popisků". Firefox to nevyužívá (asi), to rozšíření využití umožňuje.

14.1.2010 14:55 default | skóre: 22 | Madrid
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

velmi by ma zaujimal fakt, kolko ludi skutocne pouziva tagy pre zalozky pridane vo verzii 3

Já nepoužívám ani ty záložky. :-D

14.1.2010 14:57 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Pokud budeme odlišovat uživatelská data (= co uživateli leze do počítače) a ontologii, tak ontologii stačí „udělat jednou“ (a pak centrálně aktualizovat). Že to bude trvat dlouho? Jistě. Ontologickou databázi, co máte v hlavě stavíte od svého narození. Počítačové implementace samozřejmě vyžadují neskutečné množství práce a pak se licencují za odpovídající neskutečnou cenu.

Pokud jde o tvorbu uživatelských dat (= značkování syrových dat, identifikace údajů), tak určité věci zvládne automat (hlavičky e-mailu), o určité věci se může pokusit (rozpoznávání předmětů na obrázcích), určité věci musí najít a označit uživatel (nejlépe již autor souboru, nikoliv jeho příjemce).

Spoustu věcí lze zautomatizovat, ale dokud je potřeba člověk a ten to odmítá, tak o to asi nestojí a můžeme ho z našeho ideálního světa odstranit.

V okamžiku, kdy uživatel nebude na identifikaci potřeba, protože automaty dokážou vše identifikovat a ontologická databáze zařadit a učící systémy najít v nových datech vzory a aktualizovat jimi ontologickou databázi, tak líný uživatel ztratí potřebu se sémanticky strojů ptát, protože stroje vyřeší vše za něj, protože bude lépe informovány než člověk (doporučuji od Clarka Proti pádu noci). Takže ať na to koukám tak nebo tak, tak pasivní člověk je z hlediska „centrálního mozku lidstva“ nezajímavý, neperspektivní a tudíž vaše otázka postrádá smysl ;)

14.1.2010 15:15 Mazarik
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Zaujimava uvaha. Ja som vsak lenivy a predsa si chcem nechat navrhnut nieco podobne tomu, co mam teraz. Viem napr. o sluzbe, ktora Vam doporuci podobnu knihu, o sluzbe, ktora Vam doporuci podobnu hudbu(napr. lastfm), ale stale to musi nikto otagovavat. Kto to podla Vas bude robit? Tvorcovia dat? Kolko roznych takych tagovacich systemov existuje? Ja byt tvorca dat, tak sa na to vykaslem a necham to na niekom inom. Podla mna je pokrok zalozeny na lenivosti, takze v tomto vidim najvacsi problem.

14.1.2010 16:48 Kvakor
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ano, myslím, že práve to je největší problém sémantického desktopu - jen malé množství dat je "přirozeně otagované", takže ten zbytek buďto musí uživatel otagovat ručně. Pokud je uživatel pečlivý a pořádkumilovný*, tak si vše otaguje, jenže podobní uživatelé mají v datech pořádek a věci hledají spíše vyjímečně (leda že to jejich práce vyžaduje). Naopak uživatel-lenoch, který by vyhledávání využil velmi často, protože má v datech chaos a neví, co kde je, se na tagování vykašle, takže stejně nic nenajde.

*Aneb pro plné využití sémantického desktopu nemusíte mít obsedantně-kompulsivní poruchu osobnosti, ale pomáhá to

15.1.2010 09:17 nikdo
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

sémantický desktop != tagování, to byste to značně redukoval.

18.1.2010 11:00 Peto_MiG
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Najväčší problém tagovania je nestálosť softvéru. Človek si napríklad prácne udržuje katalóg CD/DVD, aby po pár rokoch zistil, že softvér, ktorý nakŕmil dátami, sa prestal vyvíjať.

Podobne tagovanie fotiek - kedysi som chvíľu mal snahu ukladať metadáta ku fotkám v GQView, aby som čoskoro zistil, že vývoj programu viazne. Teraz sa všade pchá ten mono bastl F-spot, ale dokedy mu to vydrží?

Takže metadáta áno, ale tak, aby boli platformne a softvérovo nezávislé, a z čo najväčšej časti automatické.

18.1.2010 17:44 Andrej Herceg | skóre: 43
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Program Geeqie by mal vedieť využívať metadáta GQView.

Mě by zajímalo, jestli také vývojáři přemýšlí nad zabezpečením těchto technologií. Takhle když by se Vám do krásně zaindexovaného počítače někdo naboural, zjistí ještě více informací o Vašem soukromí, než doposud, bez indexace... Máte o tom někdo zprávy?

15.1.2010 08:14 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To se patrně bude řešit až PAK, kolem verze 4.20.x

In Ada the typical infinite loop would normally be terminated by detonation.

15.1.2010 08:49 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Takhle když by se Vám do krásně zaindexovaného počítače někdo naboural,

tak si tam může dělat co chce, index neindex.

When your hammer is C++, everything begins to look like a thumb.

15.1.2010 09:20 Ash | skóre: 53
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

takže ontologie jsou vlastně k ničemu?

15.1.2010 12:18 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Jako bezpečnostní technologie zcela jistě ;-)

When your hammer is C++, everything begins to look like a thumb.

15.1.2010 15:43 Ash | skóre: 53
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Takže jsme se vlastně nic nového nedozvěděli a stále platí původní tvrzení, že pokud se někdo nabourá do počítače jehož uživatel pod vidinou lepší a ještě lepší budoucnosti ruku v ruce s nástroji k tomu určenými pěkně taguje a indexuje každou blbost na svém hardisku, tak pak je snažší se o něm leccos dozvědět.

Pomiňme možnost že pokud se tam někdo nabourá a uživatel NEpoužívá ontologií, tak může po nocích postupně zkopírovat všechna jeho data a prostřednictvím sociálního inženýrství od něj získat i věci které díky NEpoužívání ontologií na disk nezaznamenal, a postupně se třeba i po letech dopracovat k podobným výsledkům JAKO kdyby uživatel býval byl ongologie používal... :S

17.1.2010 14:17 belisarivs | skóre: 22 | blog: Psychobláboly
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Tuhle logiku jsem nepobral.

Uzivatel pouziva semanticky desktop pro _sve_ pohodli. To, ze se mu tam nekdo naboura je zalezitost neceho uplne jineho.

To bys taky mohl rici, ze uzivatel, ktery pouziva GUI a heslo kratsi nez milion znaku zjednodusuje utocnikovi zjistovani informaci o sve osobe.

IRC is just multiplayer notepad.

18.1.2010 18:03 Ash | skóre: 53
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Odpověď vizte níže, trochu jsem se tam do vás opřel. Vzhledem k tomu, že sám říkáte že nabourání je záležitost něčeho jiného se ptám, proč tedy diskutujete mimo téma? Proč říkáte obecně známou pravdu že "když se tam někdo nabourá je to problém"? To ví každý, ne?

Otázka zněla, zda je nějaká zvláštní pozornost věnována zabezpečení citlivých dat (která jsou produkována touto technologií) pro případ, že se k nim dostane někdo nepovolaný.

Obecně známou technologií pro ochranu dat, ke kterým se dostane někdo nepovolaný, je jejich šifrování. Lidé šifrují data právě proto, aby "až se tam někdo dostane" to "nebyl tak velký problém" ne "NEmohl si s nimi dělat co chce."

Jsou metadata a index šifrované? Je uděláno něco pro to aby šly snadno šifrovat, bez ohledu na to v jakém stavu je zbytek systému?

15.1.2010 21:13 Raduz | skóre: 5
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Můžu vědět, jakým logickým pochodem jsi došel ná základě téhle odpovědi k úvaze "takže ontologie jsou vlastně k ničemu?"? To je jako usoudit, že je lepší nevést evidenci ve skladu, protože pokud se k ní dostane zloděj, bude přesně vědět k jakému regálu a do které police jít, aby ukradl předmět o který mu jde. Ovšem evidence se nevede kvůli zlodějům, ale pro lepší přehled právoplatného majitele skladu.

Touhle logikou bys si mohl snadno odvodit i to, že je lepší úplně zrušit počítače, protože v deseti krabicích papírových dokumentů dole ve sklepě se nevyzná nikdo a už vůbec je rychle neodnese, zatímco při útěku s počítačem v podpaždí zloděj snadno a rychle získá vše na jednom místě.

18.1.2010 08:26 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Děkuji, sám bych to nedokázal vyjádřit lépe.

When your hammer is C++, everything begins to look like a thumb.

18.1.2010 17:57 Ash | skóre: 53
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Logika je následující:

otázka zněla, jestli si lidé (vývojáři) uvědomují, že případný útočník "zjistí ještě více informací o Vašem soukromí, než doposud, bez indexace", a zdali jsou ty technologie nějak zabezpečené.

Osobně bych čekal odpověď ano (uvědomují) a zabezpečení je například šifroavný index, nebo je index a metadata umístěn tak, že jej lze snadno zabezpečit jinými prostředky, nebo odpověť ne (neuvědomjí) a žádné extra za bezpeční není, vše je v plaintextu.

Asi je jasné, že když mám (nekryptovaném) disku stopadesát dvd s filmy a mezi tím nějaké informace, které díky tagování a indexování a ontologiím začnou dávat smysl nejen mě, ale i cizím lidem, stálo by za to tato metadata nějak zabezpečit, a kryptovat kvůli tomu celý disk je minimálně diskutabilní a tak podobně.

"Odpověď" (dá-li se to tak nazvat) Michala Vyskočila se sice netýkala vůbec otázky (sic!), ale naznačil, zcela mimo dotaz, že zabezpečování této technologie (např. metainformací) "nemá smysl", protože případný útočník si tam "může dělat co chce, index neindex".

Nevím co tím chtěl kolega říct, vzhledem k tomu že jsem jeho odpověď považoval za mírně hloupou, jsem mu stejně hloupě odpověděl, že když tam útočník může dělat co chce, tak nejspíš je schopen stejně dobře zmapovat a "dát do souvislostí" data na disku a to tak, že k tomu žádné tagování, indexování a ontologie nejspíš nepotřebuje, takže jsou tedy ontologie k ničemu...?

Sám za sebe odpovídám že to není pravda, indexováním, tagováním a aplikací ontologií (což všechno zahrnuje třeba i přidáváním časových značek různým událostem, ukládání těchto informací, zjednodušení hledání těch správných souvislostí mezi jinak roztroušenými daty) opravdu je užitečné, a to nejen oprávněným uživatelům, ale i případným útočníkům, a proto by tyto technologie měly zahrnovat nějakou formu zabezpeční.

To, že "když se tam dostane útočník je to problém" jak naznačil kolega nijak nepopírám, to snad ví i malé dítě. Reaguji tedy pouze na to, jestli mu použití ontologíí KDYŽ UŽ SE TAM DOSTANE bude k něčemu užitečné, a jestli by mu přístup k ním měl být stížen (za sebe odpovídám ano, ano).

19.1.2010 15:52 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Asi je jasné, že když mám (nekryptovaném) disku stopadesát dvd s filmy a mezi tím nějaké informace, které díky tagování a indexování a ontologiím začnou dávat smysl nejen mě, ale i cizím lidem, stálo by za to tato metadata nějak zabezpečit, a kryptovat kvůli tomu celý disk je minimálně diskutabilní a tak podobně.

Majitel zašifruje index a nechá otevřená zdrojová data (sto padesát DVD). Útočník se zmocní disku a nechá si zdrojová data zaindexovat vlastním nástrojem.

Najděme deset rozdílů mezi majitelovým zašifrovaným indexem a útočníkovým nově spočítaným indexem.

19.1.2010 15:59 Andrej Herceg | skóre: 43
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Napr. čas kedy tie filmy pozeral, čítal email, s kým a kedy si písal...

19.1.2010 17:53 Ash | skóre: 53
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Právě že nejde jen o prostoduché indexování, ale za umožnění tagování (informace dodaná uživatelem), časových značek (zpětně nelze znovuvytvořit). Kdyby to bylo tak jednoduché jak naznačujete, tak samozřejmě rozdíl je pouze v tom, že ukrást megový index a pětiterabajtový obsah je cca pět terabajtů dat :D

19.1.2010 19:36 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Pravda, na temporální logiku jsem zapomněl. Ale klasické statické značky patří do metadat souboru. Do indexu až následně. Třeba abych si mohl dovolit ztratit index, zkoušet konkurenční sémantické stroje nebo soubor i s metadaty někomu poslat. Vůbec mě nenapadlo, že by někdo krmil index a nevěnoval pozornost samotným souborům.

19.1.2010 20:53 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Nepomuk to tak dělá, samozřejmě, protože xattr asi není dost sexy.

In Ada the typical infinite loop would normally be terminated by detonation.

19.1.2010 21:37 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Dík za info. Píšu si do diáře o hned po naučit se portugalsky.

Ale příliš optimistický nejsem, z wgetu mě s xattr vyhodili. I když Micah Cowan odstupil, takže bych mohl zákeřně převzít správu a svůj patch si povolit sám :D

20.1.2010 07:05 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

z wgetu mě s xattr vyhodili

Link?

In Ada the typical infinite loop would normally be terminated by detonation.

20.1.2010 09:36 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

gmane.comp.web.wget.general: Extended attribute support

Celá pravda je ta, že Micah měl vizi wgetu jako nástroje pro frontové stahování s možností pozastavit a obnovit činnost, na to potřeboval dostat do wgetu jakousi databázi relací, kam by se všechno ukládalo. A mně řekl, že není starost wgetu spolupracovat, ať se ostatní aplikace naučí jeho databázi a metadata si tahají odtamtud. Na to jsme se trochu pohádali, protože takový wgetocentrický pohled jsem nestrávil.

Teď když Micah odstoupil, tak přiznal, že celý (součástí bylo roztrhat wget na drobné nástroje, které si budou data předávat rourami) to je natolik šílené, že by se to muselo udělat jako úplně nový nezávislý wget 2.

Jinak já ten patch pořád udržuji a na svém desktopu používám, takže jestli je zájem, není problém jej nasadit na poslední verzi wgetu.

20.1.2010 03:18 Semo | skóre: 45 | blog: Semo
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Nepomuk to tak dělá...

To znamena, ze uklada do suborov alebo iba pre seba do DB? Preco sa vlastne nerozmohli xattrs, ked univerzalnym sposobom pridavaju metadata ku lubovolnemu suboru?

If you hold a Unix shell up to your ear, you can you hear the C.

20.1.2010 07:04 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Pro sebe.

Asi ze stejného důvodu proč se nerozmohly ACL.

In Ada the typical infinite loop would normally be terminated by detonation.

15.1.2010 09:51 honyczek
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

to jo, ale nemusí tam najít nic tak závažnýho. v případě indexování chování uživatele to je jeste nebezpečnější, než si přečíst historii v prohlížeči. prostě se tak může dozvědět o uživateli mnohem víc... stejně jako na facebooku :-!

15.1.2010 14:18 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Nesrovnával bych to s facebookem, tam uživatelé vystavují data dobrovolně - investovat do speciální ochrany Nepomuk indexu je zbytečné, když ten největší problém je skutečnost, že se do počítače někdo naboural.

When your hammer is C++, everything begins to look like a thumb.

15.1.2010 15:45 Ash | skóre: 53
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ale tady se snad srovnávají dva případy:

předpoklad: do počítače uživatele se někdo naboural (předpoklad, s tím prosím nehýbejte jinak mluvíte o koze a my o voze a odporuje to jakékoliv logice)

a) první možnost: uživatel indexuje a taguje

b) druhá možnost: uživatel neindexuje a netaguje

18.1.2010 08:27 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Asi nejlépe můj postoj shrnul Raduz.

When your hammer is C++, everything begins to look like a thumb.

18.1.2010 18:11 Ash | skóre: 53
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To mi přípomímá to Bushovo "nějvětší příčinou kriminality jsou kriminálníci" nebo jak to bylo :)

Myslím že šifrovat data na disku pro případ průniku je zbytečné, protože největším problémem je, že se do počítače někdo naboural.
-- Michal V.

=:-O

19.1.2010 09:05 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Na webu existuje hezká věc s názvem hypertext, díky které není třeba psát komentáře cizích lidí znova. To je vysoce náročná práce náchylná k chybám. A chyby pak vyvolávají dojem, že mi vkládáte do úst/klávesnice něco, co jsem nikdy neřekl/nenapsal.

Zkusím to raději sám, když dovolíte

Myslím, že šifrovat data na disku investovat do speciální ochrany Nepomuk indexu pro případ průniku je zbytečné, protože největším problémem je fakt, že se do počítače někdo naboural, tudíž je nejlepší investovat do zabezpečení celého systému.
-- skutečný Michal V.

Pokusím se to naposledy napsat tak stručně a jasně, jak jenom umím. Extra ochrana Nepomuk indexu je k ničemu, bezpečnější je mít chráněná všechna data.

When your hammer is C++, everything begins to look like a thumb.

19.1.2010 09:53 Ash | skóre: 53
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Mně připadá, že prostě data generovaná Nepomukem nepovažujete za citlivé data, a z toho vychází celá tato vaše teze.

Někdo zase nepovažuje za citlivá data hesla, takže je ukládá v plaintextu, a investuje do ochrany systému. Nemá problém, dokud se mu do systému někdo nabourá. Pak je otázka, zda stále bude hesla považovat za necitlivá data, nebo svůj názor změní.

Takže pokud nejste přesvědčen o citlivosti těch dat, logicky je budete chránit stejně důkladně, jako spamy ve vašem inboxu, své empétrojky a fotky vaší kočky.

Nic proti tomu.

15.1.2010 20:01 Espinosa | skóre: 24 | blog: Espblog | London
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

> Takhle když by se Vám do krásně zaindexovaného počítače někdo naboural, zjistí ještě více informací o Vašem > soukromí, než doposud, bez indexace

Pokud se vám někdo do počítače nabourá, je uplně jedno jestli je naindexovaný nebo ne. Pokud není, útočník si ho lehce naindexuje sám. U mě trvá indexace uživatelského adresáře < 10min (řádově gigabite relevantních dokumentů).

Disk musí být šifrovaný, jinak máte smůlu. Sni strigi ani Beagle neindexuje zašifrované soubory (ODT, DOC,..) jen jejich jména (stejně jako locate).

15.1.2010 21:31 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Pokud se vám někdo do počítače nabourá, je uplně jedno jestli je naindexovaný nebo ne. Pokud není, útočník si ho lehce naindexuje sám.

Bezpečnostními problémy s indexovacími službami se to v historii jen hemží. Program locate se dal znásilnit k odhalení nepřístupných souborů. Existuje známá metodika zvaná Google hacking. Ani neočekávám že strigi bude v něčem lepší.

Navíc nepomuk není jen o indexovaní. Někdo tu vykřikoval, že nepomuku budou postupně všechny aplikace bonzovat co uživatel dělá. Budou k dispozici informace "tento soubor přišel mailem tehdy a tehdy od toho a toho", atd. To je spousta privátních informací k ochraně.

Konečně, jednoho slunného dne nějakou skopovou hlavu napadne, že by ta sémantická data mohli uživatelé SDÍLET...

Disk musí být šifrovaný, jinak máte smůlu.

To může a nemusí pomoct, indexer bude muset mít stále přístup k původním datům, aby něco zaindexoval.

In Ada the typical infinite loop would normally be terminated by detonation.

16.1.2010 15:30 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Zcela neočekávaně tento problém již řeší stávající „hloupé“ statistické (obvykle relační) databáze, které mají vypracované způsoby různého stupně utajení dat, zamlžování odpovědí nebo odmítnutí vrátit příliš úzkou odpověď.

16.1.2010 20:38 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To asi nebude v tomto případě moc použitelné.

Dotaz: Chci soubory s tagem "dovolená".

Odpověď: Je jich asi 60%.

In Ada the typical infinite loop would normally be terminated by detonation.

17.1.2010 14:51 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Trochu představivosti: Za prvé sémantické databáze neobsahují obsah souborů z dovolené, takže cizinec by maximálně tak dostal seznam názvů souborů. Za druhé tak, jako jakákoliv víceuživatelská databáze obsahuje řízení přístupu, tak sémantické umí odepřít výsledek pocházející z cizích dat (za příklad si vezměte perlový příznak tainted nebo selinuxové kategorie a systém Bel-La Padula) nebo týkající se cizích dat (například jako systém odmítne vrátit výsledek, který „nesouvisí“ s tazatelem). Samozřejmě, že to je výkonnostní penalizace, ale tak to je všude. Na konec může a (z počátku asi bude) každý uživatel mít vlastní sémantickou databázi.

17.1.2010 15:53 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Já znám tu teorii kolem. Ale funguje tohle v nepomuku? (Jak?) Byla to jedna z otázek na KDE team, ale bez odpovědi.

Bel

Bell

In Ada the typical infinite loop would normally be terminated by detonation.

17.1.2010 16:38 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Co já vím? Já to nepoužívám :)

18.1.2010 08:38 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Za druhé tak, jako jakákoliv víceuživatelská databáze obsahuje řízení přístupu

A to přesně Nepomuk není - indexuje to pouze a výhradně data jednoho uživatele. Jediné, co jsem našel ohledně sdílení je nápad push tag clouds on the web. Ale to je pořád sdílení na úrovni dat, nikoli možnost dotazování se na uživatelově počítači.

When your hammer is C++, everything begins to look like a thumb.

18.1.2010 11:05 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Takže problém se redukuje na problém uživatelských účtů a přístupu k souboru s databází. Pak nechápu, co je tu za problém.

18.1.2010 11:15 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

GOTO 10

In Ada the typical infinite loop would normally be terminated by detonation.

18.1.2010 17:25 petr_p | skóre: 59 | blog: pb
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Nerozumím. Buďto k databázi má přístup jen jeden uživatel, pak problém není z definice, nebo se sdílí, ale pak jsem možná řešení naznačil, přičemž bylo poukázáno, že ve skutečnosti se nesdílí, tudíž problém opět neexistuje.

Pokud máte problém s tím, že si uživatel vědomě zaindexuje citlivá data, citlivá data uklidí a někdo mu vykrade index, tak to je problém uživatele, že si nechal zaindexovat něco, co nechtěl, potažmo stupidita indexovací služby, že jí není možné vysvětlit, která data nemá indexovat.

18.1.2010 18:56 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Buďto k databázi má přístup jen jeden uživatel, pak problém není z definice

A to zase ne, jelikož i uživatel může mít pro různé programy různá práva k souborům; dejme tomu že prohlížeč webu nebude mít přístup k dokumentům, ale z nějakého úchylného důvodu bude mít přístup k indexeru, takže se bude moct dovědět co máte za soubory.

Neříkám, že taková zranitelnost existuje, nebo že by nešla jednoduše ošetřit. Říkám, že indexer a sémantická databáze k tomu je další kanál kterým můžou proudit data a jen budoucnost ukáže, jestli tím k nějakému problému dojde nebo ne.

přičemž bylo poukázáno, že ve skutečnosti se nesdílí

Jasně, ale zároveň si myslím, že to jednou k takovému požadavku dojde a pak děj se vůle boží.

tak to je problém uživatele, že si nechal zaindexovat něco, co nechtěl, potažmo stupidita indexovací služby, že jí není možné vysvětlit, která data nemá indexovat

Viděl bych to na kombinaci obojího, jednak bezpečnost toho zmetka zatím opravdu asi nikdo neřešil a jednak neexistuje v tomto směru žádná osvěta. Po spuštění je default indexovat všechno co mu přijde pod ruku a pokud se po něm nepídíte, tak vypínač nenajdete.

In Ada the typical infinite loop would normally be terminated by detonation.

18.1.2010 18:54 Espinosa | skóre: 24 | blog: Espblog | London
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Můžete uvést nějaký konkrétní příklad jak to může být nebezpečné? Že bych se třeba začal bát.

Indexer (file crawler) jednoduše vidí to co vidí aktuálně přihlášený uživatel pod kterým je spuštěn, o nic víc o nic míň. Každý uživatel má svého démona a ten mu indexuje jeho domácí adresář, soubory indexu jsou uložené v ~/.beagle a k souborům indexu má přístup zase jen ten jediný uživatel, takhle je to přednastavené. Uživatelé naindexovaná data nijak nesdílí. Běh indexeru pod rootem je silně nedoporučován. Pokud se vám někdo nabourá do účtu,

V praxi přináší indexer tam maximálně nebezpečí, že odhalí nějaký "zapomenutý" soubor. Například P-čko o kterém jste ani netušili, že ho tam máte, protože vás nenapadlo prohledat jeden starý zapadalý adresář ze studentských let, a co čert nechtěl, přítelkyně se napotvoru překlepla se ve slově "karma" na "kama" a indexer to pravostranně automaticky rozšířil a našel "kamasutra" :)

To je jen takový malý demonstrativní příklad. Já vím, stačilo mít oddělené uživatele a neprozradit svoje heslo, ale to není realistický předpoklad pro domácí laptop.

>> Disk musí být šifrovaný, jinak máte smůlu. > To může a nemusí pomoct, indexer bude muset mít stále přístup k původním datům, aby něco zaindexoval.

Soubory indexu jsou samozřejmě na tom zašifrovaném disku :) Takže kdo se dostane k indexu, dostane se i k samotným datům, takže je to jedno. Předpokládal jsem standardní situaci: zašifrovaný /home a soury indenxu v /home/user/.beagle (.strigi či .kde/nepomuk/strigi).

18.1.2010 19:45 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Jak jsem říkal, pokud se na to díváte s granularitou jednoho UID, tak je to zatím "v pohodě" (takhle se na to asi dívají tvůrci), pokud zvýšíte granularitu nebo dostanete nápad sdílet (k obojímuž spějeme) tak začnete mít problém a to jak bez šifrování tak s.

přítelkyně se napotvoru překlepla se ve slově "karma" na "kama" a indexer to pravostranně automaticky rozšířil a našel "kamasutra"

Tady by asi zabrala ta výše zmíněná MLS/PI databáze: pokud byste porno označil jako důvěrné, tak by Vám bez příslušné úrovně přístupu databáze řekla že v tom adresáři jsou fotky zahradního nábytku.

In Ada the typical infinite loop would normally be terminated by detonation.

Jiné jazykové přehmaty bych nechal být, ale tohle mi nedá - suverénně nejhloupější (a stále nevykořenitelnou) překladatelskou chybou posledních dvaceti let je anglické "pathetic" překládat jako "patetický". To snad autora při psaní muselo trknout, že "pateticky pomalý" je asi docela hloupost. Anglické "pathetic" znamená především ubohý. Je to tedy tedy žalostně pomalé, zoufale pomalé, ne "pateticky pomalé".

16.1.2010 23:49 Vlastimil Ott | skóre: 66 | blog: Plastique | Opava
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Přidávám všudypřítomné inženýry... :-/

Práce: Liberix, o.p.s. | Blog: OpensourceBlog.cz | Online kurz Zlatý WordPress

17.1.2010 01:52 J. M. | skóre: 23 | blog: JMblog
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

A manažery. :-)

Za mých mladých let na Linuxu ještě byli správci oken a správci souborů, dnes to je souborový manažer, okenní manažer, manažer nastavení... A to v lepším případě. V horším pak manager.

17.1.2010 02:12 Marek Bernát | skóre: 17 | blog: Arcadia
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ja nejak ale nevidím problém. Zrejme to nie je prvé a ani posledné cudzie slovo, ktoré sa stalo natívnym. Navyše tu nejde ani len o gramatiku ale o prachobyčajnú slovnú zásobu, ktorá sa celkom zrejme musí meniť s tým, jak sa mení svet. Chápem isté obavy o to, aby jazyk nezdegeneroval, ale tie sú vcelku nemiestne, pretože už sa tak dávno stalo :-) Jazyk je proste živý a pravopis nemôže byť ničím iným ako pokusom o zachytenie jeho štruktúry v jednom konkrétnom čase. Možno by nebolo od veci, keby bol pravopis verzovaný, tak ako softvér. Potom by sa dalo rozlišovať medzi ľuďmi ako Vy, ktorí používajú stabilnú verziu z roku 1980 a ľuďmi na bleeding edge :-P

physics.stackexchange.com -- Q&A stránky o fyzike v štýle StackOverflow.

17.1.2010 03:01 J. M. | skóre: 23 | blog: JMblog
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Nejde jen o prachobyčejnou slovní zásobu, ale právě i o tu gramatiku. Stavbu výrazů. Slovosled. Mezi výrazy "souborový manažer" a "správce souborů" je rozdíl nejen ve slově manažer. To druhé je česky, to první je czengličtina, která vznikla prostě tím, že si hloupější člověk neuvědomil, že v angličtině se k dosažení daného významu často staví za sebou slova jinak než je to obvyklé (nikoli nutné, ale obvyklé a přirozené) v češtině, a prostě okopíroval ta slova jak jdou za sebou v originálu. I s tím manažerem.

Angličtina prostě naklade podstatná jména za sebou (např. slovo "window" a "manager"), čeština k tomu používá skloňování. Zatímco v češtině se říká třeba "produkce masa", v angličtině se běžně říká "meat production". To je naštěstí tak starodávný, známý a zavedený pojem, že snad nehrozí, že nějaký frikulín to začne z anglických textů kopírovat do czengličtiny jako "masová produkce". (Mimochodem, stejnou chybu, ale naruby, zase dělají Češi při překladech do angličtiny - se svojí počeštělou anglickou hatmatilkou pak třeba Knize džunglí říkají "Book of Jungle" místo originálního "Jungle Book". Aspoň však nemají tu drzost svoji hloupost či neznalost vydávat za "bleeding edge angličtinu současnosti".)

To jsou hlubší rozdíly než nějaké jedno nové počeštělé slovíčko. To je prostě nepochopení jemnějších rozdílů mezi dvěma jazyky, neznalost toho, jak čeština funguje, často vůbec neuvědomování si toho, že angličtina a čeština jsou dva rozdílné jazyky.

17.1.2010 03:14 Marek Bernát | skóre: 17 | blog: Arcadia
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

A čo keď to bude czenglish? To je akože argument proti? Vy si asi neuvedomujete, že angličtina je celkom náhodná spleť saxonštiny, staroangličtiny, francúzštiny, latinčiny a ja neviem čoho ešte a rovnako tak všetky ostatné európske moderné jazyky. Tisíce rokov sa nám tu vyvíjajú a výrazy a tvary sa prelievajú z jedného do druhého. Prečo zrazu musíte mať nad tým absolútnu kontrolu a všetok vývoj zastaviť? Nemám rád túto totalitu, čo nám tu vzniká na všetkých úrovniach :-( Keby to zaviedli pred 2000 rokmi, tak tu dnes máme len gréčtinu a latinčinu, starogermánčinu, keltštinu a nejakú protoslovančinu a nič viac. Desiatky jazykov by vôbec nevznikli. Ste schopný aspoň toto pochopiť? Že pri Vašom dôslednom trvaní na nemennej gramatike by ani žiadna čeština, o ktorej zachovaní tu teraz diskutujete, nevznikla? :-)

physics.stackexchange.com -- Q&A stránky o fyzike v štýle StackOverflow.

17.1.2010 04:42 J. M. | skóre: 23 | blog: JMblog
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

To je velmi relativistický, až nihilistický přístup k věcem, kterým se dá omluvit úplně všechno. Můžu si vynalézt vlastní zpotvořenou hatmatilku se třemi chybami v každém slově a veškeré protesty odpálkovávat tím, že neuznávám jazykovou totalitu, že to je přirozený vývoj.

Ale tohle není přirozený vývoj. Mrzáckou czengličtinou se v naší zemi nemluví. Drtivá většina lidí tady stále mluví česky. Zmrzačenou czengličtinu používá jenom určitá velmi malá skupinka lidí. Malá skupinka lidí neurčuje to, jak se vyvine jazyk pro 99 procent ostatních lidí (když pomineme třeba pár výjimečných literátů, kteří jazyk obohatili o několik nových slov). Budoucí normou se nestane to, co používá jedno procento lidí. A žádný jazyk není po stránce gramatiky, slovosledu, větné stavby a staletých vnitřních zákonitostí od základu překopán během několika let. Čeština nevznikla během pěti let. To za prvé.

Za druhé se nejedná o běžný jazykový projev, ale z velké části překlady z angličtiny. A opět, vývoj jazyka není dán tím, jak někdo nějaký text nešikovně přeloží z jiného jazyka. Jazyk se vyvíjí tím, že je používán, je jím mluveno a psáno. Ani autoři těch překladů sami nemluví až tak, jak zní ty jejich překlady. Takový jazyk nepoužívají v mluveném nebo psaném projevu, kde něco říkají sami ze své hlavy. To jsou z velké části prostě jenom překladatelské neobratnosti a chyby, nikoli živý, reálný, skutečný, existující, používaný jazyk.

Často si pak člověk z těch neumělých překladů dokáže doslova zrekonstruovat originál, i když jej nečetl. Pěkný příklad jsou fanouškovské blogísky, kde autorky překládají články z cizí řeči:

"20letý říká: Jde to oběma způsoby. Nejsme žádní bratři, ale jednovaječná dvojčata. To dělá rozdíl. Byl to pro nás tvrdě pracující rok. Ale máme dobrý čas a to nás dělá šťastnými. Naše babička? Nikdy nebyla na žádném našem koncertě, věřím."

Ne, toto opravdu není přirozený vývoj jazyka. Ani autorka toho překladu není tak blbá, aby v běžném životě takhle mluvila (ani největší exoti neříkají "nikdy tam nebyla, věřím" nebo "to dělá rozdíl"). Jenom prostě neumí překládat.

A nastolené téma tady skutečně je překlad z cizího jazyka a chyby v něm. Takže abych se vrátil k tomu jedinému, co jsem měl původně na srdci (a mrzí mě, že se to téma tak strašně rozrostlo k úplně jiným věcem), je to totéž, jako když v českém překladu člověk vidí spojení "pateticky pomalý". Taky ani nemusí vidět originál, aby viděl, z čeho ta překladatelská chyba (slova ve dvou jazycích stejně vypadající, ale s odlišným významem) vznikla.

17.1.2010 08:17 pht | skóre: 48 | blog: pht
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Evitentně to není jen problém blogísků ;)

Paměť nemohla být "read".

Při zavedení povolit přihlášení.

In Ada the typical infinite loop would normally be terminated by detonation.

17.1.2010 10:01 Marek Bernát | skóre: 17 | blog: Arcadia
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Ja nič neospravedlňujem. Len Vám hovorím, že takéto kombinácie nie sú v jazykoch nič nové. Nevzniklo to príchodom internetu, ale deje sa to odkedy jazyky existujú. Ja sa pochopiteľne nebavím o rysoch jazyka, ktoré používa 1% obyvateľov (medzi ktoré patria prekladateľské chyby). Také sa pochopiteľne neuchytia. Ale keď už nejakú gramatickú chybu používa väčšina národa (a slovo manažer namiesto správa určite medzi takéto slova patrí), tak trvanie na gramaticky správnom tvare je choré. Gramatika má IMHO odrážať živý jazyk a nie nejaký jazyk idealistický spred 100 rokov. Stále hovoríte o logike jazyka, ktorá sa nesmie narúšať. To si skutočne myslíte, že niečo také existuje? Že jazyk spontánne sa vyvíjajúci bol schopný dosiahnuť formy, ktorá je matematiky presná až natoľko, aby sa dalo hovoriť o logike? Nechcite ma rozosmiať. Keby niečo také existovalo, tak by nebol problém s automatizovanými prekladmi (ktorý očividne je). Vám ide celkom proste a jednoducho o trvaní na nejakých ad-hoc pravidlách, lebo Vám pripadá, že sú dané odniekiaľ zhora a popisujú dokonalý Boží jazyk. Pritom to nie je nič iné ako neúplný popis jazyka živého v nejakom čase spred x storočí + drobné vylepšenia.

physics.stackexchange.com -- Q&A stránky o fyzike v štýle StackOverflow.

10.2.2010 09:07 m;)
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

18.1.2010 08:40 Michal Vyskočil | skóre: 60 | blog: miblog | Praha
Rozbalit Rozbalit vše Re: KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Beru si vaše připomínky k srdci.

When your hammer is C++, everything begins to look like a thumb.

KDE 4.4: Nepomuk – žrout CPU, nebo technologie budoucnosti?

Obsah

Úvodem

Ontologie

Backendy

Instalace a konfigurace

Používáme Nepomuk

Nepomuk a Strigi

Závěrem

Seriál KDE 4.4 (dílů: 3)

Související články

Odkazy a zdroje

Další články z této rubriky

Diskuse k tomuto článku