Letos v říjnu se v Praze uskuteční hned několik konferencí. Odehraje se zde nově vzniklá konference LinuxDays. K ní se přidá čtvrtý ročník openSUSE Conference, dvanáctý ročník SUSE Labs conference a aby to nebylo málo, přidá se i první ročník Gentoo miniconf. A to vše ve stejné dny a na stejném místě.
… více »Hudba dokáže většině lidí přinést dobrou náladu. Proto je téma květnového openMagazinu audio. Existuje pro Linux zvukové studio, které milovníci hudby potřebují? Ano, květnové číslo obsahuje rozsáhlý článek o nastavení realtimového zvukového serveru. Ale nejen to. Přehrávat skladby lze v několika přehrávačích. Seznamte se s nimi. Až se sbírka rozroste, lze ji uspořádat programem, na to určeným.
… více »
degradovat svůj blog tím, že bych ten článek otiskl pouze tady.A proto tímto mrzáčkem degraduješ blog na abclinuxu? Chceš-li vést blog jinde, nic ti přeci nebrání. Abclinuxu zjevně pouze zneužíváš ve snaze přivést na ten svůj "opravdový" blog více návštěvníků.
Bylo by mi líto napsat sem nějaký pěkný článek a nevydat ho u sebe...A proč nemáš u sebe upoutávku na celý článek, který by vyšel tady? :-P
Zjistit co je skutečným jádrem stránky, asi nebude úplně těžké. Mám n (stačí málo, třeba 10) stránek s blogy (poznám podle podobného schématu url), tak odstraním to co je všude přibližně stejné a oddělím tak šablonu od obsahu. Obsah (text) přetransformuju do nějaké kanonické podoby a spočtu hash. Hashe třeba setřídím a získám tak skupiny stránek, které mají víceméně stejný obsah.
odstranění překlepů pomocí slovníkuZrovna google slovníky nepoužívá, protože se snaží psát svoje služby nezávisle na jazyce. I takové "did you mean" není spellchecker jako takový, ale statistická analýza slov
Ovšem porovnávání textů nezávisle na jazyce je docela jednoduché. Stačí srovnat četnost výskytů stejných n-tic slov v obou textech a potom nějakou chytrou funkcí rozhodnout, zda jsou, nebo nejsou stejné. Tam se pár překlepů i změn hravě ztratí a je to rychlé na zpracování.
Je možné, že se tímto způsobem dá i eliminovat rozdílná šablona obou webů. Místo toho, aby se pouze vyhodnotil počet stejných ntic (možná relativně k velikosti dokumentů), mohlo by stačit dávat pozor na jejich vzájemné umístění a porovnat až to.
0K!AS
Všichni chceme, aby blogy měli co nejlepší úroveň, já vedu svůj marný boj proti lidem, co blogy zneužívají ke kladení otázek, které by patřily spíše do poradny. Ale je prostě rozdíl, když něco řekne buránek Ignor a člověk široce respektovaný. Ten druhý případ navíc způsobí to, že se odvážou i ti, kteří by jinak byli zticha, mají přece pravdu, když to říká i Mr. X.
Tvůj Vedoucí
Přečtou si blogpost na ábíčku, přečtou si komentáře... a radši nic nenapíšou.Tak takový člověk by musel být nesoudný blázen
Každý rozumný člověk uvidí, co se kritizuje, a pochopí to.
Tiskni
Sdílej:
Petr Cibulka: čtvrtým operátorem by v ČR mohl být jen úplný finanční sebevrah |
|
|
Titanic 3D, Twilight, Avengers, Prometheus ... trailerový HD nášup! |
|