abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 16:11 | Komunita

Vývojáři relačního databázového systému PostgreSQL oznámili, že schválili svůj Code of Conduct (CoC) aneb kodex chování vývojářů PostgreSQL.

Ladislav Hagara | Komentářů: 2
dnes 14:44 | Nová verze

Byla vydána verze 1.0 poštovního serveru Courier (Wikipedie). Aktualizovány byly také související balíčky jako Courier authentication library, Courier-IMAP, SqWebMail, maildrop nebo Cone.

Ladislav Hagara | Komentářů: 0
dnes 02:22 | Zajímavý software

Společnost ​Versity Software otevřela svůj archivační souborový systém ScoutFS. Zdrojové kódy jsou k dispozici na GitHubu (kernel space, user space) pod licencí GPLv2.

Ladislav Hagara | Komentářů: 18
dnes 00:44 | Nová verze

Byla vydána verze 4.2 programovacího jazyka Swift (Wikipedie). Zdrojové kódy jsou k dispozici na GitHubu. Ke stažení jsou oficiální binární balíčky pro Ubuntu 18.04, Ubuntu 16.04 a Ubuntu 14.04. Přehled novinek ve videozáznamu přednášky z WWDC 2018.

Ladislav Hagara | Komentářů: 1
včera 17:55 | Nová verze

Po třech a půl letech od vydání verze 3.4.1 byla vydána nová verze 3.4.2 programu pro filtrování spamu Apache SpamAssassin (Wikipedie). Z novinek lze zmínit 4 nové pluginy. Pravidla budou ověřována pomocí SHA-256 a SHA-512 místo SHA-1. Řešeny jsou také 4 bezpečnostní chyby. Například chyba CVE-2018-11780 v pluginu PDFInfo zneužitelná ke vzdálenému spuštění kódů (RCE).

Ladislav Hagara | Komentářů: 0
včera 16:22 | Pozvánky

Díky openSUSE Video Teamu lze sledovat živý přenos většiny prezentací z letošní SUSE Labs Conference. Záznamy proběhlých prezentací budou postupně přidávány na kanál SUSE Labs na YouTube.

Michal Kubeček | Komentářů: 0
včera 10:22 | Pozvánky

Na webových stránkách konference LinuxDays byl zveřejněn program přednášek a workshopů. Současně byla spuštěna registrace. Konference proběhne o víkendu 6. a 7. října 2018 v Praze v areálu ČVUT v Dejvicích na Fakultě informačních technologií.

Ladislav Hagara | Komentářů: 0
včera 02:22 | Komunita

Linus Torvalds se v oznámení o vydání 4. rc verze Linuxu 4.19 omlouvá za své chování. Posledním commitem před zvýšením rc3 na rc4 bylo odstranění souboru s Code of Conflict a přidání souboru s Contributor Covenant Code of Conduct vycházejícího z Contributor Covenant. Vývoj Linuxu 4.19 dokončí Greg Kroah-Hartman. Linus Torvalds si bere volno a bude pracovat na svém chování. Pravděpodobně vylepší svého poštovního klienta, aby mu nedovolil odesílat emaily obsahující nadávky.

Ladislav Hagara | Komentářů: 40
16.9. 11:33 | Nová verze

Byla vydána verze 1.23 open source nástroje pro on-the-fly šifrování (OTFE) dat VeraCrypt. Přehled novinek v nejnovější verzi tohoto nástupce TrueCryptu v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
15.9. 11:11 | Nová verze

Byly vydány verze 3.0.3 a 3.16 softwaru Wine (Wikipedie), tj. softwaru vytvářejícího aplikační rozhraní umožňující chod aplikací pro Microsoft Windows také pod GNU/Linuxem. Stabilní verze 3.0.3 je třetí opravnou verzí verze 3.0 vydané v lednu. Opravuje 52 chyb. Z novinek vývojové verze 3.16 lze zmínit například počáteční implementaci OPC Services (Open Packaging Conventions).

Ladislav Hagara | Komentářů: 1
Na optické médium (CD, DVD, BD aj.) jsem naposledy vypaloval(a) data před méně než
 (13%)
 (15%)
 (21%)
 (23%)
 (24%)
 (3%)
 (1%)
Celkem 351 hlasů
 Komentářů: 33, poslední 16.9. 11:55
Rozcestník

Dotaz: Linux cluster - stonith / fencing

28.2. 13:40 Odpadlik
Linux cluster - stonith / fencing
Přečteno: 345×
Není tu náhodou někdo kdo rozumí clusterům, konkrétně pacemaker/stonith/fencing? Docela rád bych věděl, proč je třeba u HA clusteru s GFS2 nutno toto konfigurovat...

Řešení dotazu:


Odpovědi

28.2. 14:40 DarkKnight | skóre: 26
Rozbalit Rozbalit vše Re: Linux cluster - stonith / fencing
Co udela cluster, kdyz se spojeni prerusi mezi jednotlivymi uzly? Da se predpokladat, ze i kdyz ma node minoritni quorum, tak porad na nej muze nekdo zkusit zapsat, cimz by doslo k nekonzistenci dat (ktera jsou platna, na prvni casti rozpadleho clusteru, nebo na druhe?).

Z tohoto duvodu se prave aplikuje STONITH - pokud nema ta cast rozpadleho clusteru majoritni quorum, zabij ho (neresi problemy, kdy se rozpoji vsechny uzly najednou). To je i duvod, proc se u dvouuzlovych clusteru (velmi pitomy napad - kvuli split-brainu) STONITH vypina.
28.2. 14:54 Odpadlik
Rozbalit Rozbalit vše Re: Linux cluster - stonith / fencing
To je sice pravda, ale v případě HA clusteru je to k ničemu. GFS2 je sdílený FS - tzn tam se předpokládá, že resource užívají oba uzly zároveň. Tj můj dotaz to neodpovídá.
28.2. 16:44 Lyco | skóre: 12 | blog: Lyco
Rozbalit Rozbalit vše Re: Linux cluster - stonith / fencing
GFS2 sice může být sdílený FS, ale to ještě neznamená, že je schopný dlouhodobě bezpečného provozu bez spojení mezi jednotlivými uzly. Podle dokumentace to vypadá, že nody které ztratí quorum přestanou pracovat, ale nenašel jsem co to přesně znamená - pokud zůstanou read-only, můžou aplikace vidět zastaralá data, což je problém pokud někdo (klienti aplikací s daty na GFS2 a pod.) vidí data z obou stran clusteru. I pokud by tam tenhle problém nebyl, je tu pořád riziko chyb v programu, v částech kter jsou míň otestované než to co běží v normálním provozu.

Navíc, to že server neodpovídá před timeoutem (a to je obvykle jediná věc kterou o něm ostatní můžou zjistit) neznamená, že nic nedělá. Krom toho, že může prostě pracovat pomalu nebo nedělat nic, může být taky vážně rozbitý a aktivně ničit data. (To jsem reálně viděl, naštěstí v nekritické věci - chyba v kernelu způsobila, že MySQL server spadl, ale před tím do logu zapsal několik MB nulových bytů. Kdyby to byl binlog, tak rozbije repliku.) V případě, že se o něm ví, že neodpovídá, je nejjistější ho prostě zabít.

Obecně, většina distribuovaných systémů předpokládá, že se věci pokazí jen tak, že něco přestane pracovat (fail-stop model): packet se ztratí nebo opozdí, server se restartuje nebo je pomalý. Takové systémy se katastrofálně rozbijí, pokud porucha způsobí něco vážnějšího. STONITH je pragmatické řešení: bylo by příliš složité a pomalé zabezpečit se proti všem typům chyb, tak zkusíme zajistit, že nefunkční server vždycky přestane pracovat, a zajistíme to co nejdřív.

Viz také https://en.wikipedia.org/wiki/Byzantine_fault_tolerance
Příspěvek se rázem stává až o 37,5 % pravdivější, je-li pod ním napsáno reálné jméno.
Řešení 1× (Aleš Kapica)
28.2. 18:08 DarkKnight | skóre: 26
Rozbalit Rozbalit vše Re: Linux cluster - stonith / fencing
Ale odpovida. To co pisu neznamena, ze nemuzes zapisovat na oba uzly najednou. Ale pokud dojde k chybe (to je to dulezite) - tj. treba se prerusi konektivita mezi jednim uzlem a zbytkem clusteru, aplikace najednou zacne pracovat se stejnym souborem na kazdem uzlu a problem je na svete. Ktera verze zmeny je ta spravna? Obecne nelze predpokladat, ze jedna je spravna a druha je spatna - proto STONITH jeden uzel zabije (ten, ktery nema majoritni quorum) a je zajistene, ze na ten uzel uz nikdo nezapise.

A znovu pripominam, ze dvouuzlovy cluster nedava pro data-sensitive aplikace (FS, DB, aj.) smysl - neni to HA.
1.3. 08:55 Odpadlik
Rozbalit Rozbalit vše Re: Linux cluster - stonith / fencing
Ale to je přeci běžný problém který se řeší zámkem. Jako rozuměl bych kdyby se v tomto případku STONITH definovalo na dlm démon nutný k provozu GFS či síťovou konektivitu. Ono se to ale řeší přes samotné blokové zařízení:

pcs stonith create iscsi-stonith-device fence_scsi devices=/dev/sdb meta provides=unfencing

... což mi opravdu nedává žádný smysl. Co tento příkaz vlastně udělá? Podotýkám že nezajistí exkluzivní přístup k blokovému zařízení /dev/sdb - tak co tedy zajistí?
1.3. 13:27 Lyco | skóre: 12 | blog: Lyco
Rozbalit Rozbalit vše Re: Linux cluster - stonith / fencing
Split-brain v 2nodovém clusteru je problém, který zámkem nelze vyřešit. Buď dojde k deadlocku (když zámek nemá timeout a některý node umře natrvalo), nebo k nekonzistenci dat (pokud je výpadek komunikace - způsobený např. přetížením - delší než timeout zámku, a oba nody zapíšou různá data). Klasický zámek je v reálné (tj. nespolehlivé) síti neřešitelný problém.

Ten iscsi device ve tvém stonithu je pravděpodobně quorum disk. To je takový divný hack - cluster dvou nodů totiž nedokáže při ztrátě spojení mezi nimi rozhodnout, kdo má zůstat naživu, a nody by se vzájemně zabily. Proto oba servery zkusí kontaktovat třetí node - v tomhle případě disk připojený SCSI protokolem - a zamknout ho. SCSI protokol garantuje že uspěje maximálně jeden node, ten se to dozví a zabije ten druhý který zámek nedostal. V podstatě má takový cluster 3 nody, ale jeden z nich slouží jenom k rozhodování "sporů".

K tomuhle účelu se často používá přímo ta sdílená storage na které jsou data, protože nechceme, aby node který ztratil spojení se storagí byl ten, který přežil stonith.

(Tady poznamenávám, že quorum diskům sám moc nerozumím, takže možná jsou detaily špatně.)
Příspěvek se rázem stává až o 37,5 % pravdivější, je-li pod ním napsáno reálné jméno.
2.3. 09:47 Odpadlik
Rozbalit Rozbalit vše Re: Linux cluster - stonith / fencing
No je to skutečně o zámcích, takže máte pravdu:

https://access.redhat.com/solutions/15575

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.