abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
včera 02:20 | Zajímavý článek

David Revoy, autor open source webového komiksu Pepper&Carrot nebo portrétu GNU/Linuxu, upozorňuje na svém blogu, že nový Inkscape 0.92 rozbíjí dokumenty vytvořené v předchozích verzích Inkscape. Problém by měl být vyřešen v Inkscape 0.92.2 [reddit].

Ladislav Hagara | Komentářů: 0
včera 02:02 | Komunita

Øyvind Kolås, hlavní vývojář grafických knihoven GEGL a babl, které využívá grafický program GIMP, žádá o podporu na Patreonu. Díky ní bude moci pracovat na vývoji na plný úvazek. Milník 1000 $, který by stačil na holé přežití, se již téměř podařilo vybrat, dalším cílem je dosažení 2500 $, které mu umožní běžně fungovat ve společnosti.

xkomczax | Komentářů: 12
21.1. 23:54 | Pozvánky

DevConf.cz 2017, již devátý ročník jedné z největších akcí zaměřených na Linux a open source ve střední Evropě, proběhne od pátku 27. ledna do neděle 29. ledna v prostorách Fakulty informačních technologií Vysokého učení technického v Brně. Na programu je celá řada zajímavých přednášek a workshopů. Letos je povinná registrace.

Ladislav Hagara | Komentářů: 0
21.1. 22:11 | Nová verze

Byla vydána verze 1.0.0 emulátoru terminálu Terminology postaveného nad EFL (Enlightenment Foundation Libraries). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
20.1. 17:00 | Nová verze

Byl vydán Docker 1.13. Přehled novinek na YouTube a v poznámkách k vydání na GitHubu. Docker umožňuje běh aplikací v softwarových kontejnerech (Wikipedia).

Ladislav Hagara | Komentářů: 4
20.1. 15:51 | Komunita

Mozilla.cz informuje, že nástroje pro webové vývojáře se možná oddělí od Firefoxu a stanou doplňkem. Nástroje pro webové vývojáře prošly velkým přepisem a tým, který se stará o jejich vývoj, by uvítal možnost jejich častějších aktualizacích nezávisle na vydávání nových verzí Firefoxu.

Ladislav Hagara | Komentářů: 10
20.1. 07:00 | Humor

Čtenářům AbcLinuxu vše nejlepší k dnešnímu Dni zvýšení povědomí o tučňácích (Penguin Awareness Day).

Ladislav Hagara | Komentářů: 0
20.1. 06:00 | Komunita

Bylo spuštěno hlasování o přednáškách a workshopech pro letošní InstallFest, jenž proběhne o víkendu 4. a 5. března v Praze. Současně byla oznámena změna místa. InstallFest se letos vrací zpět na Karlovo náměstí do budovy E.

Ladislav Hagara | Komentářů: 0
20.1. 02:48 | Komunita

Greg Kroah-Hartman potvrdil, že Linux 4.9 je jádrem s prodlouženou upstream podporou (LTS, Long Term Support). Podpora je plánována do ledna 2019. Aktuální jádra s prodlouženou podporou jsou tedy 3.2, 3.4, 3.10, 3.12, 3.16, 3.18, 4.1, 4.4 a 4.9.

Ladislav Hagara | Komentářů: 0
20.1. 00:11 | Zajímavý článek

Výrobce síťových prvků, společnost Netgear, spustila nový program, který slibuje vývojářům, expertům, ale i běžným uživatelům vyplacení finanční odměny za nalezení bezpečnostních chyby v jejich produktech. Za nalezení zranitelnosti v hardware, API nebo mobilní aplikaci nabízí odměnu od 150 do 15 tisíc dolarů (dle závažnosti).

Michal Makovec | Komentářů: 0
Jak se stavíte k trendu ztenčování přenosných zařízení (smartphony, notebooky)?
 (10%)
 (2%)
 (74%)
 (3%)
 (10%)
Celkem 363 hlasů
 Komentářů: 25, poslední 21.1. 13:34
Rozcestník
Reklama

Dotaz: Štruktúra na uloženie klúčových slov

Xgamer avatar 28.4.2010 22:50 Xgamer | skóre: 4
Štruktúra na uloženie klúčových slov
Přečteno: 234×
Zdravím

Ako semestrálny projekt z algoritmizácie som si vybral konvertor cčka do html+ zvyraznovač syntaxe. Trošku som sa však zasekol. Súbor s čkovským kodom chcem načitavat po riadkoch a po riadkoch to aj prevádzat. S čim mám však problem je ako čo najvhodnejšie implementovat slovnik klučových slov.

Totiž ked bude už riadok načitaný do nejakého bufferu budem potrebovat načitavat po jednotlivých znakoch vytvárať slova a potom ich porovnat zo slovami v slovníku. Kvôli zvýraznovaniu je asi potrebné mať rozličné slovniky na datove typy, operatory .... Preto by som pri hladaní či je slovo klučové prehladat všetky tieto "polia", čo by trvalo asi pomerne dlho. Napadlo ma ešte to uložit do hashovacej tabulky ale pre +- 50 slov neviem či sa mi to oplatí. Nejaký napad? Pravdou je aj to že nie som s hash tabulkou moc kamarát, preto hladám nejaké iné riešenie. Ďakujem

Odpovědi

28.4.2010 23:31 chrono
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov
Na takúto činnosť sa často používa gperf (ale sú aj iné možnosti).
28.4.2010 23:42 Ladicek | skóre: 28 | blog: variace | Havlíčkův brod
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov
Narvi si do Googlu výraz lexikální analýza. Přímá implementace (jeden veliký switch) nepotřebuje slovníky žádné, jen jednu množinu klíčových slov, protože ta vypadají stejně jako identifikátory (a rozlišit klíčová slova a ostatní identifikátory ihned je peklo).
Ještě na tom nejsem tak špatně, abych četl Viewegha.
AraxoN avatar 29.4.2010 08:33 AraxoN | skóre: 45 | blog: slon_v_porcelane | Košice
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov
Ja by som povedal, že na 50 pevne daných kľúčových slov sa neoplatí hash tabuľka. A ďalej by som povedal, že ak vstupom budú C-éčkové zdrojáky veľké rádovo v desiatkach kilobajtov, tak je neúčelné trápiť sa s nejakou prehnanou optimalizáciou. Ja by som to spravil tak, aby kód bol čo najprehľadnejší a najpriamočiarejší - ak teda zo zadania nevyplýva niečo iné.
A fine is a tax for doing wrong. A tax is a fine for doing well.
Xgamer avatar 29.4.2010 10:28 Xgamer | skóre: 4
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov
Tá lexikálna analýza vyzerá zaujimavo, už som robil niečo podobné pre odstraňovanie komentárov z cčkovských zdrojákov, ale to bolo o dost jednoduchšie ako tento prevod. Chcem využiť takú metódu, ktorá sa v praxi využíva, aby ma ten projekt o niečo obohatil. Preto si myslim, že v praxi sa využivajú pri takýchto úlohach hlavne tie stavové automaty či sa mýlim?
Martin Tůma avatar 29.4.2010 11:19 Martin Tůma | skóre: 38 | blog: RTFM | Praha
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov

Pro lexikální analýzu určitě použij konečný automat (ať už realizovaný řídící strukturou nebo tabulkou přechodů).

Nicméně lexikální analýza není všechno, pokuď chceš zdrojáky skutečně parsovat (například už jenom vědět, že na vstupu je skutečně zdroják C a ne jenom libovolná sekvence lexikálních elementů), budeš muset udělat i syntaktickou analýzu. Zkus se podívat na "rekurzivní sestup", to je asi nejjednodušší metoda (která ti na LL1 gramatiku tvé podmnožiny C bude stačit) asi ta nejjednodušší metoda.

Pak už ti stačí jenom doplnit implementovanou gramatiku o výstupní symboly a "obarvovač" je hotovej.

Každý má právo na můj názor!
Martin Tůma avatar 29.4.2010 11:31 Martin Tůma | skóre: 38 | blog: RTFM | Praha
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov

Ještě doplním odkaz na skripta na programovací jazyky z ČVUT FEL, která by ti měla odpovědět na všechny zvídavé otázky ;-).

Každý má právo na můj názor!
Xgamer avatar 29.4.2010 12:57 Xgamer | skóre: 4
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov
Ďakujem, to je skutočne pekný material :)
Xgamer avatar 29.4.2010 12:56 Xgamer | skóre: 4
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov
Myslím že sa zaobídem aj bez toho parsovania :-D, Budem rád keď zvládnem tu lexikálnu analyzu:) Určite sa pozriem na ten rekurzívny zostup.. Ďakujem
Josef Kufner avatar 3.5.2010 02:45 Josef Kufner | skóre: 66
Rozbalit Rozbalit vše Re: Štruktúra na uloženie klúčových slov
Tady na abíčku vyšel o tomhle celý seriál. Jinak pro vyhledávání se mi celkem osvědčilo použít obyčejné seřazené pole stringů (char **) a pustit na to bsearch() – celkem rychlé a velmi jednoduché. Ale pokud klíčová slova nacpeš přímo do lexikálního analyzátoru (toho konečného automatu), tak převod vůbec nemusíš řešit a udělá to už ten automat a to stejně efektivně jako trie.
Hello world ! Segmentation fault (core dumped)

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.