abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
    dnes 16:22 | Nová verze

    Byla vydána verze 1.90.0 programovacího jazyka Rust (Wikipedie). Podrobnosti v poznámkách k vydání. Vyzkoušet Rust lze například na stránce Rust by Example.

    Ladislav Hagara | Komentářů: 0
    dnes 16:11 | Nová verze

    GNUnet (Wikipedie) byl vydán v nové major verzi 0.25.0. Jedná se o framework pro decentralizované peer-to-peer síťování, na kterém je postavena řada aplikací.

    Ladislav Hagara | Komentářů: 0
    dnes 12:11 | Nová verze

    Byla vydána nová major verze 7.0 živé linuxové distribuce Tails (The Amnesic Incognito Live System), jež klade důraz na ochranu soukromí uživatelů a anonymitu. Nově je postavena je na Debianu 13 (Trixie) a GNOME 48 (Bengaluru). Další novinky v příslušném seznamu.

    Ladislav Hagara | Komentářů: 0
    dnes 04:44 | IT novinky

    Společnost Meta na dvoudenní konferenci Meta Connect 2025 představuje své novinky. První den byly představeny nové AI brýle: Ray-Ban Meta (Gen 2), sportovní Oakley Meta Vanguard a především Meta Ray-Ban Display s integrovaným displejem a EMG náramkem pro ovládání.

    Ladislav Hagara | Komentářů: 0
    dnes 01:11 | Nová verze

    Po půl roce vývoje od vydání verze 48 bylo vydáno GNOME 49 s kódovým názvem Brescia (Mastodon). S přehrávačem videí Showtime místo Totemu a prohlížečem dokumentů Papers místo Evince. Podrobný přehled novinek i s náhledy v poznámkách k vydání a v novinkách pro vývojáře.

    Ladislav Hagara | Komentářů: 4
    včera 16:22 | Nová verze

    Open source softwarový stack ROCm (Wikipedie) pro vývoj AI a HPC na GPU od AMD byl vydán ve verzi 7.0.0. Přidána byla podpora AMD Instinct MI355X a MI350X.

    Ladislav Hagara | Komentářů: 0
    včera 15:22 | Nová verze

    Byla vydána nová verze 258 správce systému a služeb systemd (GitHub).

    Ladislav Hagara | Komentářů: 5
    včera 15:11 | Nová verze

    Byla vydána Java 25 / JDK 25. Nových vlastností (JEP - JDK Enhancement Proposal) je 18. Jedná se o LTS verzi.

    Ladislav Hagara | Komentářů: 0
    včera 14:44 | Humor

    Věra Pohlová před 26 lety: „Tyhle aféry každého jenom otravují. Já bych všechny ty internety a počítače zakázala“. Jde o odpověď na anketní otázku deníku Metro vydaného 17. září 1999 na téma zneužití údajů o sporožirových účtech klientů České spořitelny.

    Ladislav Hagara | Komentářů: 8
    včera 11:33 | Zajímavý článek Ladislav Hagara | Komentářů: 0
    Jaké řešení používáte k vývoji / práci?
     (50%)
     (58%)
     (0%)
     (8%)
     (12%)
     (4%)
     (15%)
     (4%)
     (12%)
    Celkem 26 hlasů
     Komentářů: 3, poslední dnes 14:58
    Rozcestník

    Dotaz: poll vs epoll

    9.2.2016 14:21 Jardík
    poll vs epoll
    Přečteno: 733×
    Tak si tvořím ten event loop, protože jsem nic nenašel. Studoval jsem poll a epoll a nejsem z toho nadšený.

    poll

    poll() mi nabízí: přidání descriptoru v O(1), když je místo v poli, O(N), když bude potřeba realokovat. Pak O(N) kopií do kernelu a O(N) kopií z kernelu při volání poll(), a odebrání deskriptoru O(1). Budu muset udržovat 2 pole, jedno struct pollfd[N] a druhé pole ukazatelů na struktury, kde bude uložen pointer na callback a index, kde se fd nachází (aby odebrání bylo O(1)). Deskriptorů nebude hodně (v řádu stovek), ale budou se často měnit. Když bude jeden mít hodnotu 5, druhý 300 a třetí 60000, tak kvůli tomu nechci alokovat (dvě) pole s 60000 prvky, aby to mohlo být O(1), takže potřebuju ten index. Při odebrání prostě na místo přesunu poslední prvek. Každý thread bude mít event loop, takže by to ve výsledku bylo moc paměti. Stačí, že už kernel obsahuje mapování 1:1 na deskriptory, aby to mohlo být O(1). Takže souhrn:
    • Přidání: O(1), 0 syscallů, zřídka O(N) a nějaký syscall na realokaci
    • Odebrání: O(1), 0 syscallů
    • Poll: O(2*N) + něco dalšího v kernelu, 1 syscall

    epoll

    epoll() mi nabízí: stačila by mi struktura, kterou bude udržovat uživatel, ta bude obsahovat callback a deskriptor. Descriptor je potřeba totiž znát k odebrání, při použití obyčejného pollu mu ho můžu předat při volání callbacku, s epollem to možné není, protože ho z navráceného seznamu z kernelu neznám. Každé přidání a odebrání bude vyžadovat jeden syscall. Pollování bude taky jeden syscall a O(M) kopií z kernelu, kde M je velikost epoll bufferu, která se může lišit od počtu descriptorů N. Přidání a odebrání netuším, jestli O(1), nebo jestli má nějakou mapu s O(log(N)) ... Další problém s odebráním je, že musím v O(M) projít lineárně celý seznam "připravených" deskriptů, jestli tam není deskriptor už připraven, abych se ho později nestažil zpracovat. Pokud bych měl buffer stejně velký jako počet deskriptů (kdyby byl věčně plný od epollu(), tak bych ho zvětšoval M až do N), tak by odebrání mohlo být Nějaké O(N * log(N)) + syscall (jestli to má kernel jako mapu).

    Co jsem tak koukal na různé knihovny (libuv, libevent), tak to moc neřeší a alokují si pole, které je velké alespoň jako maximální deskripto, který můžete přidat. Některé mají fixní limit na 1024. To je třeba na mém systému výchozí hodnota pro proces, ale jde zvětšit až na 64k pro uživatelský proces a možná i víc pro roota.

    No moje otázka je, co s tím. Jak to řešit. Cílem je taky co nejméně alokací dělané knihovnou, alokaci by si měl nejlépe řešit uživatel knihovny, ale úplně to nepůjde. Epoll potřebuje nějaký buffer pro výstup a poll i pro vstup, takže sem tam budu muset alokaci provést. Kdybych nechtěl procházet buffer epollu při odebrání deskriptoru, mohl bych třeba alokovat ještě další strukturu a tam teprve ukládat informace s callbackem od uživatele a poznamenat si tam "odebráno", a teprve, až se k ní dostanu, tak ji uvolnit či připravit k dalšímu použití, ale to je další alokace na deskriptor.

    Odpovědi

    9.2.2016 14:26 Kit | skóre: 46 | Brno
    Rozbalit Rozbalit vše Re: Petr
    Mohu se zeptat, co to má společného s Petrem?
    Komentáře označují místa, kde programátor udělal chybu nebo něco nedodělal.
    9.2.2016 15:33 Jardík
    Rozbalit Rozbalit vše Re: Petr
    To byl překlik, za Petra jsem se chtěl vydávat a napsat to do jména a skončilo to v titulku.
    9.2.2016 15:56 Jardík
    Rozbalit Rozbalit vše Re: Petr
    A můžou za to sušenky. Kdyby tu bylo možné poslat dotaz bez sušenek, tak by mi to nepředvyplnilo jméno a mohl jsem být Petr. Přitom jsou použitý jenom k tomu, aby si to po náhledu pamatovalo "už měl náhled a zadal tenhle rok", přitom by to mohlo být jako skrytá hodnota ve formuláři.
    Max avatar 11.2.2016 07:11 Max | skóre: 72 | blog: Max_Devaine
    Rozbalit Rozbalit vše Re: Petr
    Opraveno.
    Zdar Max
    Měl jsem sen ... :(
    9.2.2016 15:24 tom
    Rozbalit Rozbalit vše Re: Petr
    fd ma max 4 byty kdezto epoll_data_t 8, takze by se mozna dalo zneuzit zbyvajici misto... kdyz bude callback pointeru zarovnany na 8 bytu, vleze se 35bitova adresa do epoll_data_t, coz by mohlo obsahnout cele mapovani uzivatelske binarky. Pokud se omezite na 2 bytovej fd, tak se to tam vleze urcite.
    9.2.2016 15:54 Jardík
    Rozbalit Rozbalit vše Re: Petr
    No, na x86-64 a aarch64, což chci alespoň oboje podporovat (32bit je mi ukradený), tak oboje mají adresu 48bit. Pokud bude zarovnaná na 8, tak mám 16 horních bitů a 3 spodní bity k použití, popř. když adresu posunu doprava, tak 19 bitů. Na x86-32 architektuře bych se vešel se všemi fd, na x86-64 mi to dělá rozsah 0-524287. Myslíte, že je to rozumné omezení? Kdybych ukládal přímo adresu funkce, tak bych mohl předpokládat zarovnání 16, to je další bit a maximální fd 1048575. Ale zase příde uživatel o možnost pomocí offsetof() spočítat adresu své struktury a byla by nutnost mít nějaký 'userdata' ukazatel, takže si nepomohu.
    9.2.2016 16:17 tom
    Rozbalit Rozbalit vše Re: Petr
    A co ma mit ten uzivatelskej callback za argumenty? Pokud nestaci fd, tak bych nechal uzivatele registrovat strukturu, ve ktere bude ten fd, callback a union { void*; uint64_t }, kterou dostane callback jako argument a pointer na tuhle strukturu bych si daval do event_data.

    Pokud budete chtit pak nejakej pokrocilej callback s buferovanim, napr. on_line_read(), tak si to udelate pres pres jednu funkci navic a zakladni on_read() callback.
    9.2.2016 17:46 Jardík
    Rozbalit Rozbalit vše Re: Petr
    Původní myšlenka byla, že budu mít nějako strukturu, nazvěme ji třeba PollHandler, která bude obsahovat adresu callbacku. Ta bude 'embedována' v jiné, uživatelově, struktuře:
    typedef struct PollHandler PollHandler;
    typedef void (*PollCallback)(PollHandler*, int events);
    
    struct PollHandler
    {
      PollCallback callback;
    };
    
    struct MyUserStruct
    {
      int someMemberHere;
      PollHandler pollHandler;
      int moreMembersHere;
    };
    
    Uživatel předá fd, požadované události a pointer na PollHandler do funkce na začátek pollování. Pointer na PollHandler bych uložil do epoll_data (popř. ho zkombinoval s fd). Když dostanu event z epoll_wait, tak přečtu pointer na PollHandler a zavolám callback s adresou PollHandleru. Z něho si pak uživatel spočítá adresu struktury a ušetří tak jeden pointer na 'userdata'.
    // Po epoll wait:
    (*pollHandler->callback)(pollHandler, readyEvents);
    
    // a v callbacku
    void userCallback(PollHandler* h, int events)
    {
      MyUserStruct* us = (MyUserStruct)((char*)h - offsetof(MyUserStruct, pollHandler));
      // dělej něco
    }
    
    Jenže chci umožnit, že v samotném callbacku může uživatel jako reakci na danou událost odstranit (či přidat) další takové 'handlery', takže nastane situace, kdy mám třeba pár set descriptorů vrácených v bufferu z epoll_wait a uživatel odebere nějaký descriptor, který může být v tomto bufferu. Musím tedy odstranit nejen decriptor z epoll deskriptoru a pak lineárně projít ten buffer a kontrolovat epoll_data, jestli tam není a pak ho buď nastavit na NULL, nebo na místo něho dát poslední položku a o jednu zmenšit počet položek. A to je to, čemu chci zabránit, procházet lineárně ten seznam, což by mohlo být pak i několikrát za sebou.

    I kdybych použil další nepřímý ukazatel, kde bych měl ukazatel na uživatelův ukazatel, tak on by zase musel někam uložit tento, aby s ním pak mohl odstranit descriptor, abych ho zase já mohl uvolnit. To má za následek alokování další struktury s tím, že uživatel místo neušetří (musí si pointer schovat). Pak ještě budu muset udržovat linked list 'uvolněných' těchto bloků a až dojedu na konec bufferu, tak je uvolnit, popř. nechat pro další použití (asi lepší). ... No třeba by to nebylo špatné, ještě se nad tím zamyslím.
    11.2.2016 01:57 Jardík
    Rozbalit Rozbalit vše Re: Petr
    Takže nakonec to dopadlo takto:
    struct poll_handler
    {
      uintptr_t magic_value_1;
      uintptr_t magic_value_2;
    };
    
    Kde
    magic_value_1 = (((uintptr_t)fd & 0xffff0000u) << 48)
                   | (uintptr_t)callback
                   | (uintptr_t)flags;
    
    magic_value_2 =  (((uintptr_t)fd & 0xffffu) << 48)
                   | (uintptr_t)userdata;
    
       nebo (podle nastavení flags)
    
    magic_value_2 =  next_poll_handler;
    
    Tím mám 16 bytů na strukturu.

    Vejdou se tam uživatelská data (musí být platný ukazatel, tj. má 47 spodních bitů (pointery s bitem 47 (který se pak kopíruje i do zbytku do 63) jsou rezervovány pro kernel), zarovnání je nedůležité, spodní bity v userdata nepoužiji. Nahoře mám 17 bitů, použiju jen 16 a tam kydnu tam spodních 16 bitů deskriptoru.

    Pak callback, kompilátor funkce zarovnává na 16, a opět max je 47 bitů. Takže horních 16 bitů pro horních 16 bitů deskriptoru, spodní 4 bity na flagy. Flag zatím užiju jeden, 'removed'. Ten nastavím, když uživatel odstraní deskriptor, zároveň se přepíšou userdata na pointer na další odstraněnou položku ... jak tedy uživatel odstraňuje, dělám linked list odstraněných položek.

    Obsluhování bufferu je tak, že procházím položky. Když je bit 'removed' nastaven, položku přeskočím, když ne, zavolám callback a jdu na další. Až dojedu na konec, tak struktury nalinkuju do seznamu s 'volnými' handlery. Ty neuvolňuju a nechávám je pro další použití při přidání deskriptoru.

    No ... a stejně se mi to nelíbí, je to hrozná splácanina, jestli to za těch ušetřených 8 bytů, o které by struktura narostla, stojí. Ale asi by byla moc hezká:
    struct poll_handler
    {
      poll_callback cb;
      void *userdata_or_next;
      int fd;
      int flags;
    };
    
    Při 65k descriptorech to je půl megabajtu.

    Jinak koukal jsem na zdroják kernelu a epoll uchovává přidané položky v obrovských strukturách, nalinkované v červenočerném stromu a pak ještě linkované pomocí ready-stavu a pak ještě linkované jánevímčím. Přidání/odebrání/modifikace je tedy O(log N) a stojí syscall.

    Založit nové vláknoNahoru

    Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

    ISSN 1214-1267   www.czech-server.cz
    © 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.