abclinuxu.cz AbcLinuxu.cz itbiz.cz ITBiz.cz HDmag.cz HDmag.cz abcprace.cz AbcPráce.cz
AbcLinuxu hledá autory!
Inzerujte na AbcPráce.cz od 950 Kč
Rozšířené hledání
×
dnes 02:00 | IT novinky

Počátkem roku někdo odcizil z Intelu několik GB citlivých dat. Prvních 20 GB bylo zveřejněno [Hacker News, ZDNet].

Ladislav Hagara | Komentářů: 0
včera 19:33 | Nová verze

Bylo vydáno Ubuntu 20.04.1 LTS, tj. první opravné vydání Ubuntu 20.04 LTS s kódovým názvem Focal Fossa. Přehled novinek v poznámkách k vydání a v přehledu změn. Součástí oznámení je infografika Ubuntu od 2004 do 20.04 LTS (png).

Ladislav Hagara | Komentářů: 0
včera 18:00 | Pozvánky

MojeFedora.cz upozorňuje na letošní Flock aneb letošní online konferenci zaměřenou na přispěvatele do Fedory. Konference probíhá od zítra 7. srpna do neděle 9. srpna, viz program.

Ladislav Hagara | Komentářů: 0
včera 15:00 | Nová verze

Po půl roce od vydání verze 2.31 byla vydána verze 2.32 knihovny glibc (GNU C Library). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
včera 09:33 | IT novinky

Dnes končí bezpečnostní konference Black Hat USA 2020 (Twitter) a začíná bezpečnostní konference DEF CON 28 (Twitter). Kvůli onemocnění COVID-19 ne v Las Vegas, ale pouze virtuálně. Na konferenci DEF CON naplánované přednášky jsou již k dispozici na DEF CON Media Serveru a na YouTube.

Ladislav Hagara | Komentářů: 1
včera 07:33 | Nová verze

Po více než pěti letech byla vydána nová verze 1.7 multiplatformního grafického editoru Pinta (Wikipedie). Přehled novinek v poznámkách k vydání.

Ladislav Hagara | Komentářů: 0
včera 00:33 | Komunita

V září loňského roku Richard Stallman rezignoval na funkci prezidenta Free Software Foundation (FSF). Včera byl zvolen nový prezident. Je jím Geoffrey Knauth (Twitter).

Ladislav Hagara | Komentářů: 7
5.8. 18:11 | Nová verze

Mozilla na svém blogu informuje o Enhanced Tracking Protection (ETP) 2.0 aneb nové verzi rozšířené ochrany proti sledování ve Firefoxu. Nová verze chrání také před technikou redirect tracking a každých 24 hodin smaže sledovací cookies. Podrobněji na blogu věnovaném bezpečnosti.

Ladislav Hagara | Komentářů: 0
5.8. 14:33 | Nová verze

The Document Foundation oznámila na svém blogu vydání nové verze 7.0 svobodného kancelářského balíku LibreOffice. Podrobný přehled nových vlastností i s náhledy v poznámkách k vydání (cs) nebo také na Youtube a PeerTube.

Ladislav Hagara | Komentářů: 11
5.8. 13:33 | Nová verze

Byla vydána nová stabilní verze 3.2 (3.2.1967.41) webového prohlížeče Vivaldi (Wikipedie). Přehled novinek v příspěvku na blogu. Zdůraznit lze vylepšený obraz v obraze. Nejnovější Vivaldi je postaven na Chromiu 84.0.4147.108.

Ladislav Hagara | Komentářů: 25
Dokážete si představit, že by váš hlavní počítač (desktop, notebook) byl v současné době založen na architektuře jiné než x86 (x86_64)? Například ARM, POWER, RISC-V,…
 (9%)
 (12%)
 (57%)
 (16%)
 (5%)
Celkem 164 hlasů
 Komentářů: 12, poslední včera 15:14
Rozcestník

Pacemaker - problém se integrací nodu

20.11.2014 11:56 | Přečteno: 793× | Za vším hledej Linux | Výběrový blog | poslední úprava: 21.11.2014 12:57

Poučné vyprávění o lapálii včerejšího podvečera

Při aplikaci změn síťové konfigurace - viz včerejší blogpost na téma Jak skamarádit openvswitch a systemd, se ukázalo že onen pomyslný jásot byl poněkud předčasný. Neumím totiž ovlivnit pořadí služeb, jsou-li nahazované přes systemd, což je u Pacemakeru docela podstatná věc.

Dokud jsem měl nainstalován pouze balík systemd, bez balíku systemd-sysv, tak se systemd pokoušel spustit corosync a pacemaker, ještě před nahozením openvswitche. To logicky končilo selháním, protože v tu dobu ještě rozhraní, přes které má probíhat komunikace corosyncu ještě neexistují.

Po doinstalování balíku systemd-sysv byl výsledek ještě tristnější - k nahození virtuálních síťových rozhraní nedošlo vůbec. Možná by se to dalo pořešit přes obligátní:

..
    up ip link set $IFACE up
    down ip link set $IFACE down
..

..jenže to už mi začala docházet trpělivost.

Nod gg, na kterém jsem s tím laboroval, se totiž začal chovat poněkud divně. Ačkoliv konfigurace sítě byla zcela identická jako u výchozího nodu ga - pochopitelně až na jiné adresy - síť po restartu nejprve naskočila pak škytla, spadla.. Po chvíli zase naskočila, pak zase spadla.. Při dalším naskočení jsem se přihlásil a zkusil systemd opět odinstalovat, jenže během této operace připojení upadlo definitivně. Nezbylo než dojít dolů do serverovny, zapíchnout monitor s klávesnicí a problém pořešit rovnou u stroje.

Na monitoru byl kernel panic. Zmáčknul jsem reset a koukal co se bude dít - opět kernel panic. Zkusil jsem starší kernel. Zase kernel panic. To už mi bylo divné. Najel jsem do ramdisku. Namountoval systémový disk. Potud vše ok. Chci se přepnout přes chroot do systému a tu to na mne zařvalo input/output error a nic. Zkusím ls, find. Žádný problém. No koukal jsem na to jako blázen, tak jsem si přizval na pomoc kolegu, Pavla Píšu.

Nebudu vás dále napínat. Ukázalo se, že systémový disk je na cestě do věčných lovišť a s vadnými sektory si ani Btrfs neporadí.

Až potud žádný problém. Systém všech nodů je identický. Vykuchal jsem disk, místo něj vrazil nový na který jsem naklonoval po síti systém z nodu ga. Nabootoval systemrescuecd, skočil do chrootu, upravil hostname, síťovou konfiguraci, nakopíroval certifikáty puppetu a reinstaloval grub2.

Jenže ouha! Systém najel, Puppet přeplácnul co měl, ale do clusteru se nod nezapojil. Co to?! No blbnul jsem s tím do dvou do rána, ovšem bezvýsledně. X krát jsem mazal konfiguraci i soubory které náleží ke corosyncu a pacemakeru. Kontroloval konfigurační soubory a nastavení práv - přičemž jsem odhalil i některé trapné chyby a překlepy. Ovšem stále nic. Nakonfiguroval jsem i druhý ring, protože stroje jsou propojené přes dva nezávislé switche. Furt nic. Stále to vypadalo takto:

Stack: corosync
Current DC: gf (167904085) - partition with quorum
Version: 1.1.12-2f2dcca
6 Nodes configured
0 Resources configured


Online: [ ga gb gc gd ge gf gg ]

A na stroji gg takto:

Stack: corosync
Current DC: gf (167904085) - partition with quorum
Version: 1.1.12-2f2dcca
1 Nodes configured
0 Resources configured


Online: [ gg ]

Během nesčetných restartů jsem kontroloval logy, abych zjistil co se děje, ale nic jsem z nich nevykoukal. Při nahození nodu gg bylo vidět že tam nějaká komunikace probíhá a corosync se o něco snaží, ale nikam to nevedlo.

Řešení..

Večer už jsem byl z toho tak zoufalý, že jsem si říkal, zda-li není problém v uuid virtuálního switche. Ten totiž po naklonování zůstal stejný jako u stroje ga. Podobné klonování nodu jsem již v minulosti jednou absolvoval, když mi chcípnul disk v jednom z nodů clusteru Peanuts. Tehdy to proběhlo bez problémů, ovšem tenkrát jsem ještě openvswitch nepoužíval. Ovšem to vyžadovalo opět fyzickou přítomnost u stroje. Nechal jsem to tedy na ráno, až budu opět v práci.

Po příchodu do kanclu už jsem byl odhodlán sejít dolů do serverovny, když tu mne napadla ještě jedna věc - co když jsem po výměně disku prohodil síťové kabely? Každá ze síťovek je sice zapojena do samostatného fyzického switche, ale co když při připojení přes ssh tcp pakety probublávají mezi sítěmi na nodu co dělá maškarádu? Komunikace corosyncu však probíhá přes udp a pro každý ring je jiný subnet a port. Pokud jsou kabely přehozené, logicky se pak gg s ostatními nody nedomluví.

Otevřel jsem si tedy soubor /etc/udev/rules.d/70-persistent-net.rules, prohodil pojmenování síťových zařízení a nechal stroj restartovat.

A voilá! Po obživnutí síťového připojení se nod gg objevil mezi ostatními nody, jako to má být..

Malá, nezištná rada..

Pokud by vám někdy bylo líto vyhodit nějaký - svého času skvělý, rychlý, drahý - disk, jen proto, že se občas chová divně. Tak si vzpomeňte na tenhle blogpost.

Ledva jsem pořešil nod gg a začal konečně řešit co je třeba, vychcípnul disk v nodu ge. Naštěstí v btrfs raid6 poli, které jsem dosud nijak nevyužíval. A vzápětí pošel systémový disk v nodu gd. Bohužel podobným způsobem jako u gg, takže jsem dospěl k rozhodnutí pro jistotu všechny systémové disky nodů ze Schrotu přehodit na raid1, abych si ušetřil práci s klonováním.

A ta rada? Pochybné disky bez milosti vyhodoďte, nebo věnujte někomu, kdo vám pije krev.

       

Hodnocení: 100 %

        špatnédobré        

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

Komentáře

Vložit další komentář

20.11.2014 13:20 Jirka
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Pěkné, pěkné. Jen nechápu jednu věc. Proč je pro změnu uuid virtuálního switche nutná fyzická přítomnost u stroje?
20.11.2014 13:46 Aleš Kapica | skóre: 50 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Protože je to starý stroj, který nemá přístup přes ipmi, není připojený na KVM konzoli, nemá volný žádný interface přes který by bylo možné komunikovat při laborování s virtuálním switchem a nejspíš by bylo nutné přepíchnout i monitor a klávesnici z jiného stroje.
20.11.2014 22:32 mimi.vx | skóre: 37 | blog: Mimi.VX | Praha
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
USE="-gnome -kde";turris
20.11.2014 23:20 Aleš Kapica | skóre: 50 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Dík. Až budu mít vyřešené to co potřebuji a dost času na hraní se systemd, tak se na to určitě podívám. Ovšem vidím to tak nejdřív za rok a bůhví co a jak tou dobou bude. Třeba už budu taky v pánu - jako Ivan.
23.11.2014 08:51 odin
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Kdyby mi do toho neco bylo, tak vam reknu, ze kdyz prestanete psat prispevky na soukromy blog v pracovni dobe, treba vam zbyde vice casu na praci.
21.11.2014 12:34 David Jaša | skóre: 44 | blog: Dejvův blog
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Neumím totiž ovlivnit pořadí služeb, jsou-li nahazované přes systemd, což je u Pacemakeru docela podstatná věc.

Dokud jsem měl nainstalován pouze balík systemd, bez balíku systemd-sysv, tak se systemd pokoušel spustit corosync a pacemaker, ještě před nahozením openvswitche.
tak buď do openvswitch.service dáš Before=corosync.service pacemaker.service, nebo obráceně do corosync.service a pacemaker.service dáš Before=openvswitch.service, nebo pokud nosíš pásek i kšandy, tak dáš obojí.

Ale spíš to vypadá jako postěžování si, než že bys to chtěl nějak řešit a nešlo to.
21.11.2014 12:45 Aleš Kapica | skóre: 50 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Předpokládám, že jsi už narazil na můj poznatek v diskuzi pod předchozím blogpostem, že klíčový problém je v tom, že Debianu potřebná unita chybí. Pokud bych si ji ale chtěl napsat, tak bys mi ještě včera ráno tímto příspěvkem značně ulehčil práci, takže díky i za jiné čtenáře této diskuze, které jsi tímto nakopnul správným směrem.
23.11.2014 08:32 odin
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Jak jinak, opet prispevek v pracovni dobe. At ziji statem financovane instituce!
23.11.2014 09:46 Aleš Kapica | skóre: 50 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Copak? Vyfoukli vám kšeft?
23.11.2014 14:06 odin
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Nevyfoukli. Obavam se, ze se ani zadna soutez konat nebude. O prinosnosti takoveho projektu radeji pomlcim, je to podle mne jen dalsi velky bratr a buzerace slusnych podnikatelu. Bude to asi tak stejne prinosne, jako existence statem financovanych vysokych skol se zamestnanci, kteri si v pracovni dobe pisi soukrome blogposty.
23.11.2014 16:14 Aleš Kapica | skóre: 50 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Stále je ten přínos k obecnému prospěchu mnohonásobně vyšší, než ten váš.
23.11.2014 18:01 odin
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
To je mozne, i kdyz si myslim, ze vy ani ja to posoudit nemuzeme. Vy ani nevite, cim se zivim, a ja si to netroufam odhadovat. Kazdopadne na smysluplnost jakehosi spolecensky agregovaneho prospechu jiz davno neverim. Je krasne, ze kazdy studuje zadarmo, ma zdarma zdravotni peci, a dokonce jsou financovany radoby vedecke instituce a projekty, ktere nemaji smysl, ale pokud bych toto obecne "blaho" mohl vymenit za snizeni dane z prijmu pravnickych osob nebo dph, menil bych to hned.
24.11.2014 15:02 David Jaša | skóre: 44 | blog: Dejvův blog
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
To je mozne, i kdyz si myslim, ze vy ani ja to posoudit nemuzeme.
Tak proč ho teda soudíš v každém svém příspěvku?
24.11.2014 21:33 Odin
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Koho? Myslite pisatele blogpostu? Jak jej soudim? O jeho osobni prinosu, i kdybych vedel jak prinos definovat, jsem se nikdy nevyjadroval a nebudu. Jen se mi nelibi publikovani soukromych veci v pracovni dobe u zamestnance statem financovane instituce.
24.11.2014 23:49 Aleš Kapica | skóre: 50 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Pacemaker - problém se integrací nodu
Jen se mi nelibi publikovani soukromych veci v pracovni dobe u zamestnance statem financovane instituce.
Podle hodnocení příspěvku soudě, že budete nejspíš sám, kdo tento blogpost považuje za ryze soukromou věc publikovanou v pracovní době. Nehledě na samotný fakt, že "pracovní doba" je v případě mého zaměstnání pojem poněkud vágní. Pokud za ni považujete pouhou přítomnost na pracovišti, tak by vaše ataky možná měly nějaké opodstatnění, ale já nejsem vrátný, sekretářka, nebo účetní co pracují od do.

Založit nové vláknoNahoru

ISSN 1214-1267   www.czech-server.cz
© 1999-2015 Nitemedia s. r. o. Všechna práva vyhrazena.