abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    včera 20:11 | Komunita

    Bylo rozhodnuto, že Linux From Scratch (LFS) končí s podporou System V init. Nové verze knih s návody na instalaci vlastního linuxového systému ze zdrojových kódů už budou pouze se systemd.

    Ladislav Hagara | Komentářů: 0
    včera 17:00 | Nová verze

    Byla vydána nová verze 2026.1.0 "Like a Version" svobodného softwaru ScummVM (Wikipedie) umožňujícího bezproblémový běh mnoha klasických adventur na zařízeních, pro které nebyly nikdy určeny. Přehled novinek v poznámkách k vydání a na GitHubu. Změněno bylo číslování verzí. Předchozí verze byla 2.9.1.

    Ladislav Hagara | Komentářů: 0
    včera 14:55 | IT novinky

    Internetový prohlížeč Firefox bude mít nové ovládací prvky pro umělou inteligenci, které umožní uživatelům vypnout vestavěné AI funkce přímo v nastavení prohlížeče. Jednotlivě půjde vypnout nebo zapnout automatické překlady stránek, generovaní popisného textu k obrázkům v otevřených PDF dokumentech, samoorganizaci tabů do skupin, náhledy odkazů s krátkým shrnutím a boční panel s chatbotem. Tyto možnosti v nastavení prohlížeče

    … více »
    NUKE GAZA! 🎆 | Komentářů: 1
    včera 14:44 | IT novinky

    Desktopové prostředí KDE Plasma 6.6, která je právě ve fázi beta, nahrazuje stávající SDDM novým Plasma Login Managerem, který je ale pevně navázán na systemd. Plasma Login Manager využívá systemd-logind a další součásti systemd, které nejsou dostupné v operačních systémech bez systemd, jako je například FreeBSD, případně jsou linuxové distribuce Gentoo, Void Linux anebo Alpine Linux. Pro uživatele zatím stále ještě existuje možnost používat SDDM.

    NUKE GAZA! 🎆 | Komentářů: 3
    včera 14:33 | Komunita

    Na webu komunitního setkání CSNOG 2026 jsou dostupné prezentace v PDF, jejich videozáznamy a fotografie z lednové akce ve Zlíně. CSNOG 2026 se zúčastnilo téměř 300 zájemců o vystoupení věnovaných správě sítí, legislativním a regulačním tématům nebo projektům z akademické sféry. Letos byly prezentace rozdělené do dvou treků, ve kterých se představilo 35 přednášejících. Setkání komunity CSNOG organizují společně sdružení CESNET, CZ.NIC a NIX.CZ.

    VSladek | Komentářů: 0
    včera 11:33 | IT novinky

    Americká vesmírná společnost SpaceX miliardáře Elona Muska koupila další Muskovu firmu xAI, která se zabývá vývojem umělé inteligence (AI). Informovala o tom na svém účtu na síti 𝕏. Musk tímto krokem propojí několik ze svých služeb, včetně chatbota s prvky umělé inteligence Grok, sociální sítě 𝕏 či satelitního internetového systému Starlink. Tržní hodnota společnosti SpaceX dosahuje jednoho bilionu dolarů (20,6 bilionu Kč), hodnota xAI pak činí 250 miliard dolarů.

    Ladislav Hagara | Komentářů: 3
    2.2. 23:22 | Bezpečnostní upozornění

    Byl odhalen supply chain attack na Notepad++: útočníci kompromitovali hosting Notepad++ a vybrané dotazy na aktualizace přesměrovávali na servery pod jejich kontrolou. Doporučuje se stáhnout instalátor a přeinstalovat.

    a1bert | Komentářů: 6
    2.2. 13:22 | Zajímavý projekt

    Francouzská veřejná správa má v rámci vládní iniciativy LaSuite Numérique ('Digitální sada') v plánu od roku 2027 přestat používat Microsoft Teams a Zoom a přejít na videokonferenční platformu Visio, hostovanou na vlastním hardwaru. Konkrétně se jedná o instance iniciativou vyvíjeného open-source nástroje LaSuite Meet, jehož centrální komponentou je LiveKit. Visio nebude dostupné pro veřejnost, nicméně LaSuite Meet je k dispozici pod licencí MIT.

    NUKE GAZA! 🎆 | Komentářů: 5
    2.2. 12:11 | IT novinky

    Eben Upton oznámil další zdražení počítačů Raspberry Pi: 2GB verze o 10 dolarů, 4GB verze o 15 dolarů, 8GB verze o 30 dolarů a 16GB verze o 60 dolarů. Kvůli růstu cen pamětí. Po dvou měsících od předchozího zdražení.

    Ladislav Hagara | Komentářů: 18
    2.2. 05:11 | Zajímavý software

    Shellbeats je terminálový hudební přehrávač pro Linux a macOS, který umožňuje vyhledávat a streamovat hudbu z YouTube, stahovat odtud skladby a spravovat lokální playlisty. Pro stahování dat z YouTube využívá yt-dlp, pro práci s audiostreamy mpv. Je napsán v jazyce C a distribuován pod licencí GPL-3.0, rezpozitář projektu je na GitHubu.

    NUKE GAZA! 🎆 | Komentářů: 7
    Které desktopové prostředí na Linuxu používáte?
     (18%)
     (6%)
     (0%)
     (10%)
     (25%)
     (3%)
     (5%)
     (2%)
     (12%)
     (30%)
    Celkem 745 hlasů
     Komentářů: 25, poslední včera 19:50
    Rozcestník

    Dotaz: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti

    7.3.2013 13:23 Bubla
    Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    Přečteno: 328×
    Dobrý den,

    jakým způsobem se přistupuje ke hledání podobností v databázi? dejme tomu, že mám dotaz typu 'ahoj'

    položky v databázi

    - ahojblas - ahoj - blas - ldsd ahoj - bubak - kralik

    jakým způsobem z tohoto seznamu poté vyfiltrovat slova, která mají největší podobnost? Celé toto hledání je spíše fulltext nebo fuzzy matching?

    Předpokládám, že na tuto funkcionalitu budou potřebné regulární výrazy, že ano?

    Odpovědi

    7.3.2013 13:24 Bubla
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    vzorek databáze ještě jednou

    - ahojblas

    - ahoj

    - blas

    - ldsd ahoj

    - bubak

    - kralik
    Tarmaq avatar 7.3.2013 13:56 Tarmaq | skóre: 39
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    pokud ti staci jen vyrazy, ktere obsahuji 'ahoj', tak staci zadat:
    SELECT vyraz
    FROM vyrazy
    WHERE vyraz LIKE '%ahoj%'
    
    Don't panic!
    7.3.2013 14:43 potato
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    Fuzzy matching se dělá v nejjednodušším případě Levenstheinovou vzdáleností řetězců s vhodně definovanými meziznakovými vzdálenostmi, ve složitějším s použitím statistických modelů daného jazyka. Což ovšem nenapíšeš standardním SQL dotazem. Nestandardní existují. Postgresql má přímo funkci levenshtein, dá se vygooglit jakási T-SQL implementace, etc.

    Má-li záznam ten řetězec přímo obsahovat, nanejvýš s nějakým bordelem okolo, tak můžeš použít LIKE, jak píše kolega. Nicméně vybrat pak maximálně shodný zase potřebuje metriku nad řetězci, tudíž si tímhle moc nepomůžeš.
    7.3.2013 15:33 Bubla
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    děkuji za info

    a jakým způsobem by se k tomuto přistupovalo, pokud by to bylo např. v programovacím jazyce místo SQL?
    7.3.2013 16:52 DarkKnightCZ | skóre: 12
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    regularni vyrazy, pouzijes funkce stylu strstr/strpos, nebo si napises vlastni algoritmus stylem - "prochazej cely radek, znak po znaku, pokud se rovna aktualni znak prvnimu znaku slova a zaroven nasledujici znak se rovna druhemu znaku slova a zaroven dalsi nasledujici znak se rovna tretimu znaku slova atd. az po konec slova, slovo bylo nalezeno"
    7.3.2013 17:03 potato
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    Jen to ne. Najdeš si knihovnu, která implementuje řetězcové metriky, a použiješ ji. Hledej fuzzy matching, Levenshtein, string distance, edit distance, ...
    7.3.2013 17:14 graviton
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    http://norvig.com/spell-correct.html <- co třeba tohle, to je takový pěkný příklad...
    7.3.2013 17:23 Bubla
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    Děkuji, to vypadá jako pěkná ukázka, zkusím se z toho něco přiučit. Přitom se zkusím ještě podívat pořádně na ten fuzyy matching. ještě jednou děkuji za informace.
    7.3.2013 17:45 Bubla
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    tak tady je ještě další ukázka možností, kdyby někdo potřeboval

    http://stackoverflow.com/questions/682367/good-python-modules-for-fuzzy-string-comparison
    7.3.2013 17:47 Bubla
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    a ještě obdobné vlákno na http://stackoverflow.com/questions/451884/similar-string-algorithm/451910#451910
    7.3.2013 18:42 Bubla
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    Tak to vypadá, že už mi něco funguje, teď jsem ale přišel na jeden zásadní problém...

    jde totiž o to, že některé řetězce ze kterých bych chtěl vybírat, tak jsou různě dlouhé... např.

    - 'Alfonz bulba velký'

    - 'Quercus lodes malý'

    - 'Sanchenzo Lopez'

    - 'Lopez oglomenz'

    - 'lodes'

    a bohužel většina těch dostupných knihoven předpokládá celé jedno slovo, nebo sérii vůči sérii.

    tedy pokud budu hledat 'lopez', tak s největší pravděpodobností vrátí 'lodes', a 'Lopez oglomenz' nebude mít dostatečně velký koeficient, napadlo mě tedy všechny rozdělit na části a hledat v nich, jenže to je pak nutné držet i původní verzi a nějak správně zacílit původní verzi. No další problém se vyskytne v případě kdy někdo zadá výraz 'lodes Sanchenzo' a já budu mít části rozdělené?

    z toho mi vychází, že bude nutné provést několik testů a pak je mezi sebou porovnat? tedy rozdělit slova jak na vstupu tak v databázi a pak je opět nějak složit?
    7.3.2013 19:26 potato
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    To je otázka metriky. Já bych taky řekl, že lodes je bližší...

    První krok asi tedy musí být pořádná specifikace kritéria blízkosti. Když máš dvě slova a jedno z nich odpovídá přesně, zjevně to preferuješ před přibližnou shodou podobně dlouhých slov. Co když budeš k tomu přesně odpovídajícímu slovu mít přilepenou celou větu? Bibli? Nekonečný rozvoj pí? Pořád to má být bližší než lodes? Nejdřív je nutné vědět, co chceš udělat, potom lze řešit jak.
    7.3.2013 20:10 graviton
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    Bez znalosti problémové domény asi těžko navrhneme přibližný trefovač, který by v ní generoval přirozeně se chovající odhady.

    Jen nadhodím trik, se kterým jsme kdysi ubastlili relativně přirozeně se chovající slovníček nad daty s mixem slov a celých vět:
    1. setřídili jsme si slovník podle délky slova/fráze vzestupně
    2. hledání hledalo ve slovníku zadanou věc sekvenčně jako podřetězec (žádné překlepy)
    3. hledání se zastavilo po N nálezech
    Díky bodu 1 to přesné zásahy vracelo nejdřív a případně to potom vracelo i slova s daným podřetězcem nebo fráze s tím slovem.

    Je otázka, jak do toho začlenit nějaké přibližné porovnávání, asi jet na dva průchody - přesný a přibližný, na výstupu jejich výsledky nějak ováhovaně zkombinovat.

    Netuším, jestli z toho něco k něčemu bude, jen tak nadhazuju...
    8.3.2013 23:18 Logik
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    Asi to co chceš je, rozdělit si fráze ve slovníku po slovech a vrátit libovolnou, která má alespoň jedno slovo podobné. Popř. můžeš hodnotu podobnosti vydělit délkou fráze ve slovech.

    Víceslovné fráze pak můžeš vyhledávat pomocí součinu podobnosti jednotlivých slov vyhledávané fráze.
    9.3.2013 09:03 Bubla
    Rozbalit Rozbalit vše Re: Hledání v databázi (slovník) nějakého výrazu či částečné podobnosti
    o to jsem se pokoušel, ale výsledek nebyl moc dobrý, jelikož se pak celé řetězce špatně skládaly dohromady.

    nakonec jsem použil match slova na řetězec a v rozdělil několik úrovní pro "match" viz 0.0-1.0 např. SequenceMatcher pokud poté dosahuje určité úrovně, tak dojde k kontrole jednotlivých slov v řetězci a původního slova, pokud je nějaká vyšší úroveň, tak jí vrátí.

    A tímto způsobem následně při hledání se vrátí několik matchu s různou úrovní přesnosti.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.