Portál AbcLinuxu, 8. prosince 2025 17:24
degradovat svůj blog tím, že bych ten článek otiskl pouze tady.A proto tímto mrzáčkem degraduješ blog na abclinuxu? Chceš-li vést blog jinde, nic ti přeci nebrání. Abclinuxu zjevně pouze zneužíváš ve snaze přivést na ten svůj "opravdový" blog více návštěvníků.
Bylo by mi líto napsat sem nějaký pěkný článek a nevydat ho u sebe...A proč nemáš u sebe upoutávku na celý článek, který by vyšel tady? :-P
Zjistit co je skutečným jádrem stránky, asi nebude úplně těžké. Mám n (stačí málo, třeba 10) stránek s blogy (poznám podle podobného schématu url), tak odstraním to co je všude přibližně stejné a oddělím tak šablonu od obsahu. Obsah (text) přetransformuju do nějaké kanonické podoby a spočtu hash. Hashe třeba setřídím a získám tak skupiny stránek, které mají víceméně stejný obsah.
odstranění překlepů pomocí slovníkuZrovna google slovníky nepoužívá, protože se snaží psát svoje služby nezávisle na jazyce. I takové "did you mean" není spellchecker jako takový, ale statistická analýza slov
Ovšem porovnávání textů nezávisle na jazyce je docela jednoduché. Stačí srovnat četnost výskytů stejných n-tic slov v obou textech a potom nějakou chytrou funkcí rozhodnout, zda jsou, nebo nejsou stejné. Tam se pár překlepů i změn hravě ztratí a je to rychlé na zpracování.
Je možné, že se tímto způsobem dá i eliminovat rozdílná šablona obou webů. Místo toho, aby se pouze vyhodnotil počet stejných ntic (možná relativně k velikosti dokumentů), mohlo by stačit dávat pozor na jejich vzájemné umístění a porovnat až to.
0K!AS
Všichni chceme, aby blogy měli co nejlepší úroveň, já vedu svůj marný boj proti lidem, co blogy zneužívají ke kladení otázek, které by patřily spíše do poradny. Ale je prostě rozdíl, když něco řekne buránek Ignor a člověk široce respektovaný. Ten druhý případ navíc způsobí to, že se odvážou i ti, kteří by jinak byli zticha, mají přece pravdu, když to říká i Mr. X.
Tvůj Vedoucí
Přečtou si blogpost na ábíčku, přečtou si komentáře... a radši nic nenapíšou.Tak takový člověk by musel být nesoudný blázen
Každý rozumný člověk uvidí, co se kritizuje, a pochopí to.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.