Portál AbcLinuxu, 4. května 2025 17:32
Tento díl představí jeden ze základních pilířů KDE 4 – Nepomuk. Jedná se o inovativní otevřený standard pro sémantický desktop. Co umí nebo má umět? Automaticky a/nebo interaktivně shromažďovat metadata pro indexaci a vyhledávání. A co to k čertu znamená? Čtěte dál…
Nepomuk je velice těžko uchopitelná technologie. Začněme tedy zeširoka. Kdysi dávno se jedna skupina chytrých pánů – a nebylo náhodou, že to bylo na mezinárodní konferenci věnované sémantickému webu v Galway v Irsku – rozhodla přenést sémantiku z prostředí webu na desktop. A na světě byl semanticdesktop.org. Výzkumný projekt sponzorovaný Evropskou unií, do něhož se zapojilo několik desítek firem – mimo jiné i známá jména jako SAP, HP nebo IBM. Jenže důvodem, proč to vše zmiňuji v článku o KDE 4, je, že se do tohoto projektu rovněž zapojila společnost Mandriva, která sponzorovala vývoj implementace Nepomuk pro KDE 4. Nepomuk je specifikace a API pro sémantický desktop vytvořený onou skupinou – součástí projektu je totiž i referenční opensource implementace v Javě. Mandriva, tedy konkrétně Sebastian Trueg, onu specifikaci implementovala do prostředí KDE 4.
Nicméně z předchozího odstavce není pořád jasné, co to k čertu ten Nepomuk vlastně je. Je to KDE knihovna, která je určena k zaznamenávání a prohledávání sémantických dat na desktopu. A sémantickými daty rozumíme rozličné informace (a proto se to tak těžko vysvětluje), jako jsou metadata multimediálních souborů, obsah textových souborů, odkud byl stažený ten který soubor, kdo vám kdy poslal soubor jako zprávu a tak podobně. Důležité jsou dva prvky – zaznamenávání a vyhledávání, bez nichž by to celé bylo k ničemu.
Zdroje dat pro Nepomuk jsou v zásadě tři – jednak uživatelské zadání, jako třeba ruční tagování souborů v Dolphinu. Dále pak automatické indexování obsahu souborů pomocí Strigi. A nakonec automatické indexování akcí, například příchozích emailů.
Nepomuk ovšem není pouze knihovna, ale i sada takzvaných ontologií, což jsou v podstatě definice různých typů sémantických dat. Výhodou je, že jsou poměrně modulární, takže třeba nexif – Nepomuk Exif Ontology je podtřída nfo:Image. Celé to je poměrně spletité a složité, včetně speciálního definičního jazyka NRL. Ten není, velice překvapivě, postaven nad XML, ale používá speciální formát podobný JSON. Podobnou věc používá i Tracker z GNOME a celé to by mělo být nakonec zaštítěno freedesktop.org.
Pro běžného uživatele je to nezajímavé a od této chvíle se budu slovu ontologie vyhýbat.
Pro pochopení skutečnosti, proč nebyl Nepomuk do současnosti příliš použitelný, je bohužel nutno znát několik technických detailů. Ale nebude jich mnoho, a některým se pro jistotu vyhneme docela.
Vzhledem k tomu, že myšlenka sémantického desktopu byla vytvořena lidmi kolem sémantického webu, není velké překvapení, že použili stejné technologie, jejichž přehled je na w3c.org. Základem pro to všechno je RDF – Resource Description Framework – XML formát vytvořený pro popis dat. Ve světě opensource jej využívá zejména skupina produktů z mozilla.org. Pro tvorbu dotazů nad těmito daty (zaznamenávání a vyhledávání, vzpomínáte?) byl definován jazyk SPARQL, který implementuje Qt knihovna Soprano. Samotná knihovna je pouze dotazovací vrstvou, o ukládání dat se stará backend.
V průběhu vývoje KDE 4 existovaly tři různé backendy – Redland, Sesame2 a Virtuoso. A každý trpí (respektive trpěl) problémem. Redland, napsaný v C++, byl původně výchozím backendem, nicméně ve 4.4 je označen jako pateticky pomalý a vývojáři jej doporučují nepoužívat. Daleko lepší variantou je Sesame2, který implementuje různé optimalizace a je tak svižnější než Redland. Vaz mu u spousty uživatelů a distributorů láme fakt, že je napsaný v Javě.
Tím třetím vzadu je Virtuoso, psaný v C++, který kombinuje výhody obou – C++ a vysoký výkon. Což je, uznávám, poměrně neobvyklá věta. S Javou se na desktopu obvykle spojuje jiné slovo než rychlost. Důvodem je, že Sesame2 implementuje řadu různých chytrých optimalizací, které jeho kolega Redland nemá, takže je přes deficit virtuálního stroje rychlejší.
Pro KDE 4.4 se Sebastian Trueg snažil mít Virtuoso jako výchozí backend. Ten totiž umlčí jednak uživatele, kterým nevyhovuje fakt, že Nepomuk spotřebuje 100 % výkonu jejich procesoru a za druhé ty, kteří nechtějí mít jako nezbytnou závislost celou JVM. Ve verzi 4.3.77 je už nemožné bez backendu Virtuoso Nepomuk provozovat, takže předchozí odstavce znamenají jenom historické ohlédnutí.
Drobná rada na závěr, při změně backendu nezapomeňte nejprve nainstalovat nový, poté restartujte Nepomuk a až poté odinstalujte starý.
Přes spoustu řečí jsme se nakonec dostali k tomu, jak ten Nepomuk vlastně použít. Měl by být povolen v ovládacím centru KDE
Nebo můžete pro zjištění stavu použít D-BUS:
$ qdbus org.kde.NepomukServer /nepomukserver isNepomukEnabled true $ qdbus org.kde.NepomukStorage /nepomukstorage usedSopranoBackend virtuosobackend
Důležité je, aby běžela služba NepomukStorage, protože bez ní Nepomuk nebude mít kam ukládat svoje data. V případě, že vám služba neběží a neobjevilo se žádné varovné okno, je možné službu spustit ručně:
nepomukservicestub nepomukstorage
A dozvědět se, v čem je problém.
Z uživatelského hlediska je Nepomuk čistě abstraktní věc – neexistuje žádná aplikace tohoto jména. Nepomuk je prostě knihovna pro práci se sémantickými daty, takže je na konkrétních aplikacích, zda a jak jej budou používat. Nejpřímočařejší způsob, jak jej používat, je ruční tagování v Dolphinu:
S prohledáváním je to v současnosti horší. Asi nejjednodušší způsob je použít KIO protokol nepomuksearch:/
z libovolného KDE programu, který je podporuje. Existuje i integrace s Krunnerem, ale neexistence rozumného grafického rozhraní je pro desktopovou technologii docela smrtící. Na druhé straně dojde v KDE 4.4 ke zjednodušení dotazovacího API, což by mohlo tvorbě takové aplikace pomoci. Nicméně stále zbývá spousta práce ohledně integrace Nepomuku do ostatních aplikací.
Dotazy je možné pokládat na příkazové řádce pomocí programu sopranocmd
.
$ sopranocmd --dbus org.kde.NepomukStorage \ --model main list "" "" "<nepomuk:/kde44>" <file:///home/mvyskocil/bordel/kde44> <http://www.semanticdesktop.org/ontologies/2007/08/15/nao#hasTag> <nepomuk:/kde44> <urn:nepomuk:local:089a81bb-b5fe-4e61-b95e-c4668318f3ba> Total Results: 1 Execution time: 00:00:00.2
Vývojáři Nepomuku nicméně pracují na vyhledávacím rozhraní pro Dolphin, které by mělo být součástí 4.5. Ostatní novinky Nepomuku, které jsou očekávány do 4.5, ale jsou začleněny v Mandriva Linux 2010.
Až do teď jsem se o vůbec nezmínil o automatickém indexeru Strigi. Ten se ze samostatného projektu stal součástí Nepomuku, čímž také došlo k určitému zmatení v pojmech. „Staré“ Strigi byl samostatný program používající knihovnu clucene, kdežto to nové běží jako služba Nepomuku a metadata ukládá do backendu Soprano, stejně jako zbytek Nepomuku. Konfigurace je na stejném místě v konfiguračním centru a stav lze zjistit před D-BUS:
$ qdbus org.kde.NepomukServer /nepomukserver isStrigiEnabled false
Indexování samotné je poměrně nenáročné – Strigi například neběží, pokud je systém napájen z baterií anebo provádí mnoho IO. Původní stesky ohledně jeho náročnosti jsou minulostí a jdou vesměs na vrub backendu Redland, který byl pravou příčinou velkého vytížení procesoru. Kamenem úrazu linuxových indexovacích služeb je tak pouze jedna věc – jak sledovat změny v již zaindexovaném systému. Jedním z důvodů je i to, že podpora pro takové sledování změn není napříč unixy nic moc, včetně Linuxu.
První dostupné rozhraní bylo dnotify
v řadě 2.4, které se vyznačovalo poměrně nepřátelským API a použitím. V jádře 2.6.13 bylo zavedeno rozhraní inotify
, které zlepšuje API, nicméně má poměrně omezený počet sledovacích bodů (8000, i když byla tato hodnota v poslední době zvýšena) a písmenko i v jádře naznačuje, že je zaměřeno především na inody. Navíc vznikly i dva pokusy, jak zakrýt rozdíly mezi unixovými rozhraními – File Alternation Monitor a Gamin. Nepomuk má speciální službu upozorňující na změny v souborech, ale ta používá KDE API, tudíž se změny zapsané KDE aplikacemi projeví okamžitě, ostatní až se zpožděním.
Světlem na konci tunelu (které se v současnosti nezdá být světlometem protijedoucího vlaku) je, alespoň pro uživatele Linuxu, nové API fanotify v jádře 2.6.31. To obrušuje rohy stávajících rozhraní a navíc se na obzoru rýsuje zajímavá možnost, že může být změněný obsah souboru rovnou zaindexován.
Buď jak buď, současným problémem použivání Strigi je fakt, že periodicky reindexuje celý disk, což je velice rušivá a náročná operace.
Nepomuk se postupně proměnil ze systému, jehož jediná interakce s uživatelem byla spotřebování veškerého času procesoru, na solidní základ pro ostatní aplikace. Jediný vážnější problém je indexace souborů (respektive sledování změn), což je naštěstí nepovinná část. Plánovaná těsnější integrace s Akonadi dodá Nepomuku to, co zatím nemá – to je typický příklad použití. Příště se tedy podíváme na Akonadi.
Neviem ako cudzie mozgy, ale ten môj sa snaží zabudnúť úplne všetko
Tím třetím vzadu je Virtuoso, psaný v C++, který kombinuje výhody obou – C++ a vysoký výkon. Což je, uznávám, poměrně neobvyklá věta. S Javou se na desktopu obvykle spojuje jiné slovo než rychlost. Důvodem je, že Sesame2 implementuje řadu různých chytrých optimalizací, které jeho kolega Redland nemá, takže je přes deficit virtuálního stroje rychlejší.Nemá náhodou místo C++ a vysoký výkon tedy být napsáno JAVA a vysoký výkon ? Něják mi to takhle jak to je nedává smysl.
výhody C++např. správu paměti a ochrany mezí
a hlavne - platime si to! Nepamatuji si cisla, ale miliony euro z EU to jsou :D11.500.000 EUR - pro hnidopichy podotýkám, že většina peněz šla jinam, než do KDE implementace
Proč jste tak nedočkavý? Chci vše a chci to teď?Ani ne. Ale jsou i lepší příklady, kde se inkrementální vývoj zvládl líp. Tady se totiž nenabaluje end user funkcionalita, ale nabalujou se mezivrstvy, a end user věci přijdou na řadu až jako poslední. Tenhle syndrom se opakuje i u některých dalších částí KDE. Nejdřív nemáme uživatelům vůbec co ukázat, pak něco máme ale nefunguje to, takže to uživatelé ignorují, pak už mámě něco, co ukážeme, ale dělá to něco úplně jiného, než uživatelé čekají, protože jsme na začátku ani neřekli co to přesně je.
Například OpenSUSE má vše kolem nepomuku v 11.2 v defaultu vypnuté, protože to není připravené pro uživateleTím myslíte nezakompilované? Přál bych si, aby to tak zůstalo, ale viz 1 2. Navíc spousta dister se tím neřídí a kompilují úplně všechno. A pokud to zakompilujete tak default v kde 4.3 je že po startu kde se strigi vrhne mlsně na procesor.
Tak to jsme mininálně dva. Já jsem za takové návody opravdu vděčný, protože bez toho je ovládání KDE4 někdy opravdu "pokus-omyl"...
veeelky objem dat mensej kvalitylimitně splývají, máme-li výkonný odvozovací aparát.
To je síce všetko pekné, ale stále je to skôr na úrovni zbožného priania, než fungujúceho programu A čo sa zmenilo za posledné 4 roky? Ľudia sa už každou možnou formou A.I. zaoberajú 50 rokov a zatiaľ sa kvalitatívne nezmenilo prakticky nič. Len všetci stále hovoria, že veľké objavy sú už za rohom (zrejme aby dostali peniaze na ďalší výskum). Až prídeš s funkčnou implementáciou, tak ti uverím; dovtedy to budú len kecy
A Wolfram Alpha je pekná ukážka toho, čo hovorím. Veľa hypu, výsledok prakticky nulový. Ten systém vidí súvislosti len tam, kde mu ich vložili tvorcovia. Presne ako hovoril kolega vyššie: základom sú ontológie, ktoré má človek v hlave. Dostať ich do programu je vysoko netriviálna úloha.
Dostať ich do programu je vysoko netriviálna úloha.ja bych byl trochu optimista... napr. u nas se dela na FCA... vicemene, je to docela propracovana teorie, existuji k ni (nove) i velice efektivni algoritmy... ted jenom, aby se nasel nekdo, komu se to bude chtet implementovat do nejakeho search enginu...
Tak to ja som silný skeptik, ale budem držať palce
Ked uz hovorime o tom Firefoxe velmi by ma zaujimal fakt, kolko ludi skutocne pouziva tagy pre zalozky pridane vo verzii 3, ktore s touto debatou troska suvisia.Ja ich používam, ale len občas, keďže ich reálne využitie je minimálne. Síce sa ukladajú, ale rozumne použiť sa nedajú (rozšírenie TagSifter aspoň trochu umožňovalo ich využitie, ale ani to už nefunguje a ani ručné zostavenie záložky pre places nefunguje, pretože vývojári Firefox asi nemajú záujem sprístupniť tú funkčnosť).
velmi by ma zaujimal fakt, kolko ludi skutocne pouziva tagy pre zalozky pridane vo verzii 3Já nepoužívám ani ty záložky.
Pokud budeme odlišovat uživatelská data (= co uživateli leze do počítače) a ontologii, tak ontologii stačí „udělat jednou“ (a pak centrálně aktualizovat). Že to bude trvat dlouho? Jistě. Ontologickou databázi, co máte v hlavě stavíte od svého narození. Počítačové implementace samozřejmě vyžadují neskutečné množství práce a pak se licencují za odpovídající neskutečnou cenu.
Pokud jde o tvorbu uživatelských dat (= značkování syrových dat, identifikace údajů), tak určité věci zvládne automat (hlavičky e-mailu), o určité věci se může pokusit (rozpoznávání předmětů na obrázcích), určité věci musí najít a označit uživatel (nejlépe již autor souboru, nikoliv jeho příjemce).
Spoustu věcí lze zautomatizovat, ale dokud je potřeba člověk a ten to odmítá, tak o to asi nestojí a můžeme ho z našeho ideálního světa odstranit.
V okamžiku, kdy uživatel nebude na identifikaci potřeba, protože automaty dokážou vše identifikovat a ontologická databáze zařadit a učící systémy najít v nových datech vzory a aktualizovat jimi ontologickou databázi, tak líný uživatel ztratí potřebu se sémanticky strojů ptát, protože stroje vyřeší vše za něj, protože bude lépe informovány než člověk (doporučuji od Clarka Proti pádu noci). Takže ať na to koukám tak nebo tak, tak pasivní člověk je z hlediska „centrálního mozku lidstva“ nezajímavý, neperspektivní a tudíž vaše otázka postrádá smysl ;)
Vypina se to buhvi kde (killall -9 to resi vzdy)Vypnutí je popsáno v článku.
o kterych nikdo nevi co to dela - typicky dbus, polofunkcnim vecem typu NetworkManager, pochybne fungujiciho pulseaudioŘekl bych, že já nevím co to dělá != nikdo neví co to dělá. NM a PA dost trpí/trpěly nekvalitou ovladačů, protože mívají tendenci používat funkce, které se předtím obvykle vůbec nepoužívaly a které byly drobátko nefunkční.
a stavu znameho ze sveta windows - "Kdyz nevis co s tim, tak to restartni. Kdyz to nepomuze, preinstaluj". Sakra tak se linux nikdy nechoval - tohle je pokrok?Není to důsledek typu uživatelů, kteří to radí, než (ne)kvalit software?
Máte asi pravdu, Clarke napsal Franknsteina v roce 1964 a Heinlein Měsíc je drsná milenka v roce 1966.
...ale hledejte seno v kupce jehel...
S Nepomukom by to malo ísť ľahko
Btw, zajak dlouho myslíte, že si index googlu uvědomí sám sebe?To se snad uz davno stalo, ne? Nebo myslite, ze tu firmu fakt ridi dva zidovsti kluci s nedodelanym doktoratem, jeden z Moskvy a druhy z Michiganu? Tomu snad preci nikdo neveri...
USE=-semantic-desktop
Takhle když by se Vám do krásně zaindexovaného počítače někdo naboural,tak si tam může dělat co chce, index neindex.
Asi je jasné, že když mám (nekryptovaném) disku stopadesát dvd s filmy a mezi tím nějaké informace, které díky tagování a indexování a ontologiím začnou dávat smysl nejen mě, ale i cizím lidem, stálo by za to tato metadata nějak zabezpečit, a kryptovat kvůli tomu celý disk je minimálně diskutabilní a tak podobně.
Majitel zašifruje index a nechá otevřená zdrojová data (sto padesát DVD). Útočník se zmocní disku a nechá si zdrojová data zaindexovat vlastním nástrojem.
Najděme deset rozdílů mezi majitelovým zašifrovaným indexem a útočníkovým nově spočítaným indexem.
Dík za info. Píšu si do diáře o hned po naučit se portugalsky.
Ale příliš optimistický nejsem, z wgetu mě s xattr vyhodili. I když Micah Cowan odstupil, takže bych mohl zákeřně převzít správu a svůj patch si povolit sám :D
z wgetu mě s xattr vyhodiliLink?
gmane.comp.web.wget.general: Extended attribute support
Celá pravda je ta, že Micah měl vizi wgetu jako nástroje pro frontové stahování s možností pozastavit a obnovit činnost, na to potřeboval dostat do wgetu jakousi databázi relací, kam by se všechno ukládalo. A mně řekl, že není starost wgetu spolupracovat, ať se ostatní aplikace naučí jeho databázi a metadata si tahají odtamtud. Na to jsme se trochu pohádali, protože takový wgetocentrický pohled jsem nestrávil.
Teď když Micah odstoupil, tak přiznal, že celý (součástí bylo roztrhat wget na drobné nástroje, které si budou data předávat rourami) to je natolik šílené, že by se to muselo udělat jako úplně nový nezávislý wget 2.
Jinak já ten patch pořád udržuji a na svém desktopu používám, takže jestli je zájem, není problém jej nasadit na poslední verzi wgetu.
Myslím že šifrovat data na disku pro případ průniku je zbytečné, protože největším problémem je, že se do počítače někdo naboural. -- Michal V.=:-O
Na webu existuje hezká věc s názvem hypertext, díky které není třeba psát komentáře cizích lidí znova. To je vysoce náročná práce náchylná k chybám. A chyby pak vyvolávají dojem, že mi vkládáte do úst/klávesnice něco, co jsem nikdy neřekl/nenapsal.
Zkusím to raději sám, když dovolíte
Myslím, že šifrovat data na disku investovat do speciální ochrany Nepomuk indexu pro případ průniku je zbytečné, protože největším problémem je fakt, že se do počítače někdo naboural, tudíž je nejlepší investovat do zabezpečení celého systému.
-- skutečný Michal V.
Pokusím se to naposledy napsat tak stručně a jasně, jak jenom umím. Extra ochrana Nepomuk indexu je k ničemu, bezpečnější je mít chráněná všechna data.
Pokud se vám někdo do počítače nabourá, je uplně jedno jestli je naindexovaný nebo ne. Pokud není, útočník si ho lehce naindexuje sám.Bezpečnostními problémy s indexovacími službami se to v historii jen hemží. Program locate se dal znásilnit k odhalení nepřístupných souborů. Existuje známá metodika zvaná Google hacking. Ani neočekávám že strigi bude v něčem lepší. Navíc nepomuk není jen o indexovaní. Někdo tu vykřikoval, že nepomuku budou postupně všechny aplikace bonzovat co uživatel dělá. Budou k dispozici informace "tento soubor přišel mailem tehdy a tehdy od toho a toho", atd. To je spousta privátních informací k ochraně. Konečně, jednoho slunného dne nějakou skopovou hlavu napadne, že by ta sémantická data mohli uživatelé SDÍLET...
Disk musí být šifrovaný, jinak máte smůlu.To může a nemusí pomoct, indexer bude muset mít stále přístup k původním datům, aby něco zaindexoval.
Zcela neočekávaně tento problém již řeší stávající „hloupé“ statistické (obvykle relační) databáze, které mají vypracované způsoby různého stupně utajení dat, zamlžování odpovědí nebo odmítnutí vrátit příliš úzkou odpověď.
BelBell
Za druhé tak, jako jakákoliv víceuživatelská databáze obsahuje řízení přístupuA to přesně Nepomuk není - indexuje to pouze a výhradně data jednoho uživatele. Jediné, co jsem našel ohledně sdílení je nápad push tag clouds on the web. Ale to je pořád sdílení na úrovni dat, nikoli možnost dotazování se na uživatelově počítači.
Nerozumím. Buďto k databázi má přístup jen jeden uživatel, pak problém není z definice, nebo se sdílí, ale pak jsem možná řešení naznačil, přičemž bylo poukázáno, že ve skutečnosti se nesdílí, tudíž problém opět neexistuje.
Pokud máte problém s tím, že si uživatel vědomě zaindexuje citlivá data, citlivá data uklidí a někdo mu vykrade index, tak to je problém uživatele, že si nechal zaindexovat něco, co nechtěl, potažmo stupidita indexovací služby, že jí není možné vysvětlit, která data nemá indexovat.
Buďto k databázi má přístup jen jeden uživatel, pak problém není z definiceA to zase ne, jelikož i uživatel může mít pro různé programy různá práva k souborům; dejme tomu že prohlížeč webu nebude mít přístup k dokumentům, ale z nějakého úchylného důvodu bude mít přístup k indexeru, takže se bude moct dovědět co máte za soubory. Neříkám, že taková zranitelnost existuje, nebo že by nešla jednoduše ošetřit. Říkám, že indexer a sémantická databáze k tomu je další kanál kterým můžou proudit data a jen budoucnost ukáže, jestli tím k nějakému problému dojde nebo ne.
přičemž bylo poukázáno, že ve skutečnosti se nesdílíJasně, ale zároveň si myslím, že to jednou k takovému požadavku dojde a pak děj se vůle boží.
tak to je problém uživatele, že si nechal zaindexovat něco, co nechtěl, potažmo stupidita indexovací služby, že jí není možné vysvětlit, která data nemá indexovatViděl bych to na kombinaci obojího, jednak bezpečnost toho zmetka zatím opravdu asi nikdo neřešil a jednak neexistuje v tomto směru žádná osvěta. Po spuštění je default indexovat všechno co mu přijde pod ruku a pokud se po něm nepídíte, tak vypínač nenajdete.
přítelkyně se napotvoru překlepla se ve slově "karma" na "kama" a indexer to pravostranně automaticky rozšířil a našel "kamasutra"Tady by asi zabrala ta výše zmíněná MLS/PI databáze: pokud byste porno označil jako důvěrné, tak by Vám bez příslušné úrovně přístupu databáze řekla že v tom adresáři jsou fotky zahradního nábytku.
hádám, že se ukládají právě do adresáře .kde.Jak vidno z výše uvedeného jsem tyto informace poptával ale bez úspěchu.
Ja nejak ale nevidím problém. Zrejme to nie je prvé a ani posledné cudzie slovo, ktoré sa stalo natívnym. Navyše tu nejde ani len o gramatiku ale o prachobyčajnú slovnú zásobu, ktorá sa celkom zrejme musí meniť s tým, jak sa mení svet. Chápem isté obavy o to, aby jazyk nezdegeneroval, ale tie sú vcelku nemiestne, pretože už sa tak dávno stalo Jazyk je proste živý a pravopis nemôže byť ničím iným ako pokusom o zachytenie jeho štruktúry v jednom konkrétnom čase. Možno by nebolo od veci, keby bol pravopis verzovaný, tak ako softvér. Potom by sa dalo rozlišovať medzi ľuďmi ako Vy, ktorí používajú stabilnú verziu z roku 1980 a ľuďmi na bleeding edge :-P
A čo keď to bude czenglish? To je akože argument proti? Vy si asi neuvedomujete, že angličtina je celkom náhodná spleť saxonštiny, staroangličtiny, francúzštiny, latinčiny a ja neviem čoho ešte a rovnako tak všetky ostatné európske moderné jazyky. Tisíce rokov sa nám tu vyvíjajú a výrazy a tvary sa prelievajú z jedného do druhého. Prečo zrazu musíte mať nad tým absolútnu kontrolu a všetok vývoj zastaviť? Nemám rád túto totalitu, čo nám tu vzniká na všetkých úrovniach Keby to zaviedli pred 2000 rokmi, tak tu dnes máme len gréčtinu a latinčinu, starogermánčinu, keltštinu a nejakú protoslovančinu a nič viac. Desiatky jazykov by vôbec nevznikli. Ste schopný aspoň toto pochopiť? Že pri Vašom dôslednom trvaní na nemennej gramatike by ani žiadna čeština, o ktorej zachovaní tu teraz diskutujete, nevznikla?
Paměť nemohla být "read".
Při zavedení povolit přihlášení.
Ja nič neospravedlňujem. Len Vám hovorím, že takéto kombinácie nie sú v jazykoch nič nové. Nevzniklo to príchodom internetu, ale deje sa to odkedy jazyky existujú. Ja sa pochopiteľne nebavím o rysoch jazyka, ktoré používa 1% obyvateľov (medzi ktoré patria prekladateľské chyby). Také sa pochopiteľne neuchytia. Ale keď už nejakú gramatickú chybu používa väčšina národa (a slovo manažer namiesto správa určite medzi takéto slova patrí), tak trvanie na gramaticky správnom tvare je choré. Gramatika má IMHO odrážať živý jazyk a nie nejaký jazyk idealistický spred 100 rokov. Stále hovoríte o logike jazyka, ktorá sa nesmie narúšať. To si skutočne myslíte, že niečo také existuje? Že jazyk spontánne sa vyvíjajúci bol schopný dosiahnuť formy, ktorá je matematiky presná až natoľko, aby sa dalo hovoriť o logike? Nechcite ma rozosmiať. Keby niečo také existovalo, tak by nebol problém s automatizovanými prekladmi (ktorý očividne je). Vám ide celkom proste a jednoducho o trvaní na nejakých ad-hoc pravidlách, lebo Vám pripadá, že sú dané odniekiaľ zhora a popisujú dokonalý Boží jazyk. Pritom to nie je nič iné ako neúplný popis jazyka živého v nejakom čase spred x storočí + drobné vylepšenia.
Proč nepoužili jako backend ověřené CLucene/Lucene?Něco málo je v zápisku Sebastiana Truega, kde popisuje možnost použít Virtuoso. Podle toho, co je tam napsáno to vypadá, že strigi naopak clucene používá pořád, ale dochází k nějakému mapování výsledků z RDF dotazů, či co.
Impozantní seznam kde všude se Lucene používá.Lucene != clucene, to jsou dva různé projekty. Správný odkaz je Clucene: Powered by. Nicméně v tom seznamu je uvedeno i Soprano, takže nějak dokáže s Clucene pracovat.
Tomu ty rychlokvašky Virtuoso, Soprano a Seame & spol nesahají ani po kotníky.Pozor, Virtuoso není rychlokvaška, naopak existuje už řadu let. Pouze byla v roce 2006 uvolněna jeho GPL edice (takže by mě zajímalo, za jak dlouho Oracle koupí i OpenLink Software).
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.