abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
eParkomat, startup z ČR, postoupil mezi finalisty evropského akcelerátoru ChallengeUp!
Robot na pivo mu otevřel dveře k opravdovému byznysu
Internet věcí: Propojený svět? Už se to blíží...
dnes 01:02 | Zajímavý článek

Minulý týden byly vydány verze 1.2.3 a 1.1.7 webového poštovního klienta Roundcube. V oznámení o vydání bylo zmíněno řešení bezpečnostního problému nalezeného společností RIPS a souvisejícího s voláním funkce mail() v PHP. Tento týden byly zveřejněny podrobnosti. Útočník mohl pomocí speciálně připraveného emailu spustit na serveru libovolný příkaz. Stejně, jak je popsáno v článku Exploit PHP’s mail() to get remote code execution z roku 2014.

Ladislav Hagara | Komentářů: 0
včera 16:00 | Nová verze

Byla vydána verze 0.98 svobodného nelineárního video editoru Pitivi. Z novinek lze zmínit například přizpůsobitelné klávesové zkratky. Videoukázka práce s nejnovější verzí Pitivi na YouTube.

Ladislav Hagara | Komentářů: 1
včera 15:00 | Zajímavý software

Stop motion je technika animace, při níž je reálný objekt mezi jednotlivými snímky ručně upravován a posouván o malé úseky, tak aby po spojení vyvolala animace dojem spojitosti. Jaký software lze pro stop motion použít na Linuxu? Článek na OMG! Ubuntu! představuje Heron Animation. Ten bohužel podporuje pouze webové kamery. Podpora digitálních zrcadlovek je začleněna například v programu qStopMotion.

Ladislav Hagara | Komentářů: 3
7.12. 21:21 | Nová verze Ladislav Hagara | Komentářů: 0
7.12. 11:44 | Zajímavý projekt

Na Indiegogo byla spuštěna kampaň na podporu herní mini konzole a multimediálního centra RetroEngine Sigma od Doyodo. Předobjednat ji lze již od 49 dolarů. Požadovaná částka 20 000 dolarů byla překonána již 6 krát. Majitelé mini konzole si budou moci zahrát hry pro Atari VCS 2600, Sega Genesis nebo NES. Předinstalováno bude multimediální centrum Kodi.

Ladislav Hagara | Komentářů: 2
7.12. 00:10 | Nová verze

Byla vydána verze 4.7 redakčního systému WordPress. Kódové označením Vaughan bylo vybráno na počest americké jazzové zpěvačky Sarah "Sassy" Vaughan. Z novinek lze zmínit například novou výchozí šablonu Twenty Seventeen, náhledy pdf souborů nebo WordPress REST API.

Ladislav Hagara | Komentářů: 6
6.12. 12:00 | Zajímavý projekt

Projekt Termbox umožňuje vyzkoušet si linuxové distribuce Ubuntu, Debian, Fedora, CentOS a Arch Linux ve webovém prohlížeči. Řešení je postaveno na projektu HyperContainer. Podrobnosti v často kladených dotazech (FAQ). Zdrojové kódy jsou k dispozici na GitHubu [reddit].

Ladislav Hagara | Komentářů: 27
6.12. 11:00 | Bezpečnostní upozornění

Byly zveřejněny informace o bezpečnostní chybě CVE-2016-8655 v Linuxu zneužitelné k lokální eskalaci práv. Chyba se dostala do linuxového jádra v srpnu 2011. V upstreamu byla opravena minulý týden [Hacker News].

Ladislav Hagara | Komentářů: 2
5.12. 22:00 | Komunita

Přibližně před měsícem bylo oznámeno, že linuxová distribuce SUSE Linux Enterprise Server (SLES) běží nově také Raspberry Pi 3 (dokumentace). Obraz verze 12 SP2 pro Raspberry Pi 3 je ke stažení zdarma. Pro registrované jsou po dobu jednoho roku zdarma také aktualizace. Dnes bylo oznámeno, že pro Raspberry Pi 3 je k dispozici také nové openSUSE Leap 42.2 (zprávička). K dispozici je hned několik obrazů.

Ladislav Hagara | Komentářů: 6
5.12. 06:00 | Zajímavý software

OMG! Ubuntu! představuje emulátor terminálu Hyper (GitHub) postavený na webových technologiích (HTML, CSS a JavaScript). V diskusi k článku je zmíněn podobný emulátor terminálu Black Screen. Hyper i Black Screen používají framework Electron, stejně jako editor Atom nebo vývojové prostředí Visual Studio Code.

Ladislav Hagara | Komentářů: 50
Kolik máte dat ve svém domovském adresáři na svém primárním osobním počítači?
 (32%)
 (24%)
 (29%)
 (8%)
 (5%)
 (3%)
Celkem 798 hlasů
 Komentářů: 50, poslední 29.11. 15:50
Rozcestník
Reklama

Dotaz: vhodný FS pro hodně paralelních zápisů

24.11.2015 15:51 pletiplot | skóre: 13
vhodný FS pro hodně paralelních zápisů
Přečteno: 627×
Hello, chystám se vytvářet server, na který bude velké množství zařízení (až desítky tisíc) sypat logy ze syslogů přes udp. Jeden log má denně jednotky MB. Chceme je ukládat na disk jako soubory v nějaké adresářové struktuře. Jaký vhodný filesystem byste mi doporučilili? Případně jaký md pod ním?

Nějaké kandidáty mám, ale chci slyšet i další názory.

Marek

Odpovědi

24.11.2015 16:08 Zdenek 'Mst. Spider' Sedlak | skóre: 37 | blog: xMstSpider
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
XFS, ale spis nez do souboru bych radil ukladat do DB, napr. Rsyslog + Cassandra je dobra kombinace...
24.11.2015 16:14 pletiplot | skóre: 13
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
To zvažuju taky, ale pro zpracování těch souborů už mám nějaké nástroje, které bych musel zas přepsat. Takže spíš hudba budoucnosti.
Josef Kufner avatar 24.11.2015 21:14 Josef Kufner | skóre: 66
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Zvaž, jak moc pracné by to bylo z pohledu dalšího rozvoje těch nástrojů a tvorby dalších. A také z pohledu údržby, replikace, konfigurace a podobně.

Těm existujícím nástrojům můžeš předřadit jednoduchý skript s dotazem, který data vypíše v očekávaném tvaru a očekávaném rozsahu (např. dle času).
Hello world ! Segmentation fault (core dumped)
27.11.2015 19:26 Jindřich Makovička | skóre: 13
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Přimlouvám se za DB (asi Mongo nebo Scylla). Pokud se ty všechny soubory mají fsyncovat, tak 50k klientů a dejme tomu 20ms na fsync umožňuje pro jednotlivé logy jeden sync na disk každých 1000s. Systém ty zápisy pravděpodobně nějak zagreguje, ale stejně bych šel do db (a textové logy případně vyrobil dodatečně).
24.11.2015 16:21 lertimir | skóre: 58 | blog: Par_slov
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Pokud je to server primárně na logy tak bych spíš preferovat to postavit na BSD a ZFS filesystem.
24.11.2015 16:35 pletiplot | skóre: 13
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Na BSD tu máme jednoho člověka a ten je příliš "drahý" na to, aby se staral o tenhle server.
24.11.2015 16:51 pletiplot | skóre: 13
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Ten ZFS, koukám, že je zaměřen hlavně na integritu, samé kontrolní součty při každém zápisu, je to opravdu tak výkonné při zápisu?
24.11.2015 17:34 lertimir | skóre: 58 | blog: Par_slov
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
No pro mne jsou logy kriticky důležitém, protože bez nich jsou závažné problémy. Jestli je to cca MB na stanici tak to je cca 3 000 zápisů na den a stanici a cca 10 000 stanic tak to je cca 30 000 000 operací za 86 000 sekund což je cca 500 operací za sekundu. To se dá udržet jedině velkými cache, aby v jednou zápisu se zapsalo více elementárních operací.
24.11.2015 19:09 j
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Hlavne na to potrebujes slusne nadimenzovany diskovy HW ... na FS zas az tak nezalezi. Rozdily budou pomerne marginalni.
Josef Kufner avatar 24.11.2015 21:24 Josef Kufner | skóre: 66
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
1 MB za den a stanici pro 10 000 stanic je docela malý objem dat, nějakých 10 GB za den. Na to bych doporučil tmpfs a logy rotovat na persistentní úložiště třeba každou hodinu (to se do 1 GB paměti vejde v pohodě). A nebo opravdu raději databázi, která to udrží konzistentní a bude mít obdobný objem paměti pro cache.

Pokud se IO operace z jednotlivých zařízení pošlou do paměti namísto na disk, tak to i celkem líný server v pohodě zvládne a větší blok dat už zapíše efektivně najednou.
Hello world ! Segmentation fault (core dumped)
24.11.2015 23:16 R
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Presne tak, nie je to vela dat. Ked sa nebudu logy synchronne zapisovat na disk po kazdom prijatom pakete, tak by nemal byt problem s vykonom.

Nevymyslal by som ziadny tmpfs ani databazu - nainstaloval Debian (defaultne ext4), nakonfiguroval normalne rsyslog (bez syncu) a urobil nejaky benchmark. Linux predsa vie vyuzit pamat ako cache aj bez tmpfs a databazy. Az keby sa ukazal nejaky problem s vykonom, tak by som vymyslal zlozitejsie riesenia.
24.11.2015 23:51 lertimir | skóre: 58 | blog: Par_slov
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
To beru, ale stejně tak pokud bude mít řekněme 32GB paměti a v podstatě všechno na cache, (a ZFS zase si cachuje celkem hodně) tak se diskové operace mohou hezky zgrupovat a disk to nezatíží. (nesmí tam mít sync po každém zápise.)
Josef Kufner avatar 25.11.2015 16:22 Josef Kufner | skóre: 66
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Není ani potřeba kdoví kolik GB. Při tomhle objemu stačí půl GB a rotovat jednou za hodinku nebo častěji.

Potíž je v tom, že při zavírání souboru se čeká, až soubor bude opravdu na disku. Tomu je potřeba se vyhnout, jinak by se cache neměla šanci využít.
Hello world ! Segmentation fault (core dumped)
24.11.2015 21:41 Andrej | skóre: 43 | blog: Republic of Mordor | Zürich
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů

Proč na BSD? ZFS může být i na Linuxu.

ǑǦŹǓǕǙǞǺǨȞȬḔḦḰḾṊṎṸẄẌỖ
24.11.2015 23:57 lertimir | skóre: 58 | blog: Par_slov
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Já ti nevím, se ZFS na linuxu nemám zkušenosti, ale je to ve FUSE a třeba NTFS, které také je ve FUSE je celkem pomalé vůči nativnímu FS, který jede v kernelu. Nevidím tu v tom linuxu žádnou výhodu, protože stejně když to vezmu přímočaře, tak na úlohu potřebuješ jenom jádro, filesystem, syslog a síťový subsystém. To máš jak v BSD tak v linuxu.
25.11.2015 09:06 Andrej | skóre: 43 | blog: Republic of Mordor | Zürich
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů

To je 5 let starý FUD. ZFS v kernelu Linux je k dispozici už hooodně dlouho. Jen se distribuuje zvlášť kvůli GPL versus CDDL.

ǑǦŹǓǕǙǞǺǨȞȬḔḦḰḾṊṎṸẄẌỖ
24.11.2015 21:43 Andrej | skóre: 43 | blog: Republic of Mordor | Zürich
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů

Btrfs. A žádný md pod ním, protože md patří do minulého desetiletí.

ǑǦŹǓǕǙǞǺǨȞȬḔḦḰḾṊṎṸẄẌỖ
24.11.2015 21:53 Aleš Kapica | skóre: 45 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
To je pěkná hovadina. Zrovna na tohle se Btrfs moc nehodí.
24.11.2015 23:55 j
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Naopak se na to hodi pomerne dost, nativne to trebas umi delat snapy, takze se to da velmi snadno a efektivne zalohovat. Klidne muzes zivy data ladovat na ssd, a intervalove to v podobe snapu posilat na disky.

Otazka je, co si od toho provozovatel slibuje.
25.11.2015 09:07 Andrej | skóre: 43 | blog: Republic of Mordor | Zürich
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
FUD.
ǑǦŹǓǕǙǞǺǨȞȬḔḦḰḾṊṎṸẄẌỖ
25.11.2015 09:18 Aleš Kapica | skóre: 45 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Vážený, používám Btrfs dost dlouho na to, abych věděl co píšu. Logy jsou obvykle soubory do kterých se trvale zapisuje, což by v tomto případě znamenalo, že by Btrfs neustále převalovalo hromady malých souborů. To není dobré ani z hlediska výkonu, ani z toho hlediska, že u logu je zájem zprávu do souboru a pokud možno u na blokové zařízení zapsat co nejdřív a ne čekat, až se souborový systém vykecá.

Pokud máte ověřeno že to není pravda, tak to laskavě dokažte.
25.11.2015 14:32 Andrej | skóre: 43 | blog: Republic of Mordor | Zürich
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů

Zamyslel jste se aspoň na chvíli, jak bezobsažný blábol tady žvaníte? Žvaníte a neříkáte přitom absolutně nic. Kde máte fakta, data, výsledky benchmarků? Nenechte se mýlit, „důkazní břemeno“ je na vaší straně, nikoliv na mé straně. Vy jste tady začal trousit nesmyslný a ničím nepodložený FUD o Btrfs. Pak máte tedy dvě možnosti: Buď své nesmysly věrohodně doložíte přesným a technicky relevantním vysvětlením, proč by Btrfs nebyl ideálním řešením — což nejde, že ano, protože jsou to zkrátka nesmysly —, nebo budete dále sám sebe zesměšňovat vymýšlením dalšího FUDu o tom, jak se filesystém „vykecá“. Velmi vtipné, vskutku. Btrfs používán na všech svých systémech od roku 2010, tedy opravdu velmi dlouho, a nesetkal jsem se dosud s nasazením, na které by se nehodil. Po technické stránce je Btrfs v drtivé většině případů nejlepší dostupnou volbou a jeho jediným problémem jsou žvanilové šířící ničím nepodložený FUD. Otázka je, komu tím prospějete. :-D To je asi tak první hláška, která mě v tomto kontextu napadá.

ǑǦŹǓǕǙǞǺǨȞȬḔḦḰḾṊṎṸẄẌỖ
25.11.2015 14:46 Aleš Kapica | skóre: 45 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Řekl bych, že váš blábol je mnohem bezobsažnější. Používám Btrfs neméně dlouho jako vy, a na rozdíl od vás jsem vyzkoušel opravdu všechny možné i nemožné kombinace souborových systémů a blokových zařízení pod nimi. Sám mám systém na notebooku v Btrfs raid 1 - přesto bych na stroj, určený k ukládání mnoha logů Btrfs nedoporučil. A také jsem napsal proč. Ovšem vy jste se zatím zcela křupansky spokojil s tím, že se ze mne v této diskuzi snažíte dělat blbce aniž byste své demagogické zvolání podložil čímkoliv jiným, než prohlášení, že Btrfs používáte dlouho. Přitom jste nenapsal ani zbla o tom na já data a na kolika strojích ho používáte. Pokud jde o mne, tak k tomu stačí prohledat obsah tohoto webu.
25.11.2015 11:58 cronin | skóre: 48
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Ak sa skutočne jedná o tak kritickú vec, nemal by byť problém simulovať záťaž a spustiť benchmark na rôznych FS. Obávam sa však, že výsledky nebudú také, si prajete. Rozdiely spôsobené FS budú pravdepodobne malé a nijaký jasný víťaz nebude. Aspoň nie o toľko, aby to spôsobilo rozdiel v uskutočniteľnosti zámeru či neskoršej škálovateľnosti riešenia. Kľúčom k horizontálnej škálovateľnosti je osvedčený prístup "rozdeľ a panuj" - viete nechať rozličné skupiny staníc logovať na iné partície či dokonca servery? Bude úzkym miestom skutočne súborový systém a diskové operácie, alebo veľký počet sieťových prenosov cez možno už i tak vyťaženú sieť? Považujem za dobré, že ste sa zamysleli nad výberom vhodného FS pre konkrétne nasadenie, upozorňujem iba, že pokiaľ nemáte testami podložené, že FS je kritickým miestom pre výkonnosť, je táto otázka marginálna.

25.11.2015 16:27 pletiplot | skóre: 13
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Pokusím se odpovědět všem. Není to zas tak kritické, logy s čtou, jen když jsou hlášené nějaké problémy na těch konkrétních stanicích. Takže dělat 2 měsíce nějaké benchmarky by celou akci prodražilo, takže prostě uděláme rešerši (jejíž součástí je tenhle dotaz), vybereme, co je teoreticky nejvhodnější, a pokud to nebude stačit, tak to nějak překopeme. Takže jsme vybrali md raid 10 ze šesti disků a xfs, rsyslogd s co nejvíc late sync nastavením.

Děkuji všem za rady, ještě dám vědět, jak to dopadlo.
25.11.2015 17:43 Juraj
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Oplati sa aj nastudovat sysctl parametre ako dirty_* a sledovat vyuzitie pamati.

Volat sync v co najdlhsich intervaloch moze byt kontraproduktivne lebo to znamena ze aj dlhsie potrva (a ked dlho caka, prestane prijimat pakety).
26.11.2015 06:11 Peter Golis | skóre: 53 | Bratislava
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Odporučím to dať vypracovať odborníkom. Ak sú tie logy kritické, tak je potrebný synchronný zápis na disk. Ten bude pri paralelizácii vyžadovať vysoké I/O. Sranda bude pri nejakom nevhodnom zbastlenom riešení keď sa začnú chŕliť logy desať alebo sto násobne rýchlejšie (napr boti na ssh).

A ak sú tie logy nepodstatné a vyhodnocujú sa len keď fyzicky ľahne jeden zo strojov, tak to je ozaj lepšie riešiť cez DB a nehať stroj na UPS. Kým sa bude treba nabudúce povenovať forenznej analýze tabuľkovými metódami, tak ten selekt do súboru slúžiacemu ako vstup skriptom bude dávno hotový.

PS: čo si pamätám, tak napr syslog-ng mal komerčnú podporu. Nechceš ich sponznúť?
Max avatar 26.11.2015 07:14 Max | skóre: 64 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Vysoké IO si pohlídá cache na řadiči, pokud používají, a to rapidně. Jinak osobně bych z toho nedělal takového velblouda, vesměs to je malé řešení.
MD + XFS je dobrá volba.
Zdar Max
Měl jsem sen ... :(
26.11.2015 07:33 lertimir | skóre: 58 | blog: Par_slov
Rozbalit Rozbalit vše Re: vhodný FS pro hodně paralelních zápisů
Souhlasím s Maxem přede mnou. Není problém mít současně otevřených 10k souborů v syslogu a paralelně do nich psát. Rozumě velké cache zátěž pochytají. UPS je asi samozřejmé, v cache bude mnoho dat.

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.