Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

11.6.2018 23:25 | Přečteno: 3892× | linux | poslední úprava: 12.6.2018 07:52

Úkol byl jasný, naladit 2x OEL7 (aka CentOS 7), aby outsourcovaná firma mohla naladit Oracle RAC přes NFS. Oba os jsem předal čistý, up to date, vše přednastaveno atd. Týpek si nastavil mounpointy na 4x nfs volume (storage server je NetApp), naladit Oracle RAC podle dosavadních zkušeností apod. Následně byl server předán zpět k testování, abychom si na něm vyzkoušeli všechno možné včetně všech zakoupených options apod.

NFS se náhodně po startu nepřipojuje

Všiml jsem si, že jeden node má problémy s automatickým mountem NFS volume z NetApp storage po startu OS. Chování bylo zcela náhodné. Jednou se nepřipojila jedna volume, podruhé dvě jiné atd. První node tímto problémem netrpěl. Dostupné info :

Komentáře

Stejné stroje s totožnou konfigurací. Není problém, když se tedy oba chtějí připojit? Byl ten druhý vždycky "druhý"?

12.6.2018 00:01 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Ano, stroje jsem předal naprosto stejně nastavený. Nulový rozdíl (resp. rozdíl jen IP+MAC+hostname). Stroje se jmenovaly a byly nastaveny stejně a jména a IP se neměnily.
Zdar Max

Měl jsem sen ... :(

12.6.2018 00:03 ewew | skóre: 40 | blog: ewewov_blog
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Toto by som nečakal od skúseného admina. Ale aj toto sa deje.

Root v linuxe : "Root povedal, linux vykona."

12.6.2018 00:09 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Vysvětli.
Zdar Max

Měl jsem sen ... :(

12.6.2018 00:10 ewew | skóre: 40 | blog: ewewov_blog
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Že by si nechal tie isté ip v konfiguráku na obidvoch serveroch.

Root v linuxe : "Root povedal, linux vykona."

12.6.2018 00:13 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Jak z reakce "(resp. rozdíl jen IP+MAC+hostname)" usuzuješ, že byly stejné IP? Nebyly. Vše regulérně nastaveno, oba stroje měli rozdílné IP, rozdílné MAC i rozdílné názvy.
Zdar Max

Měl jsem sen ... :(

12.6.2018 00:32 ewew | skóre: 40 | blog: ewewov_blog
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Ok. Jedine čo ma napadá je, že ten NetApp nezvláda viacnásobne súčasne pripojenie nfs.

Root v linuxe : "Root povedal, linux vykona."

12.6.2018 00:33 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Samá voda.
Zdar Max

Měl jsem sen ... :(

12.6.2018 00:34 ewew | skóre: 40 | blog: ewewov_blog
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Ok. Tu ja končím. nemá zmysel pokračovať v hádani.

Root v linuxe : "Root povedal, linux vykona."

Podle těch hlášek se vám podařilo nějak zacyklit závislosti mezi nfs-server.service a u02-oraredo.mount, ale jak se vám to podařilo, to bez konfigurace naslepo hádat nehodlám, stejně jako to, proč by na tom stroji vůbec měl běžet NFS server, když jste se o něm vůbec nezmínil.

12.6.2018 07:50 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Ano, je to tak, správně jsi si všiml, že tam běží nfs server, že je tam kolize mezi nastavením nfs serveru a nfs mounpointy.
Na rozjetí Oracle byla najmuta firma, aby provedli nastavení a další věci dle jejich zkušeností, protože jsme přecházeli na EE verzi Oracle, kde je spousta novinek a na jiný způsob storage.
Výsledkem bylo, že týpek, co to rozjížděl, absolutně ohledně linuxu netušil. Nešel mu x forwarde (potřeba kvůli instalátoru Oracle), tak se pokoušel rozjíždět grafické prostředí.
Nakonec jsem díky chybě v blogu i zjistil, že ani neví, jak připojit nfs. Jeden večer mi radostně napsal, že se mu podařilo připojit nfs.
Chyba zmíněná v blogu byla zapříčiněna tím, že jen na druhém nodu nainstaloval nfs server a nastavil ho takto :

cat /etc/exports
/u02/oradata               192.168.1.1(rw,sync,no_wdelay,insecure,no_root_squash)
/u02/oraredo               192.168.1.1(rw,sync,no_wdelay,insecure,no_root_squash)

Takže kolize byla zapříčiněna tím, že ten člověk vůbec netušil, co dělá :-/.
Zdar Max

Měl jsem sen ... :(

12.6.2018 07:54 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Ó jé… Tak tohle jsem fakt nečekal.

12.6.2018 09:25 klkl
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Takže pak už ale stroje nebyly totožně nastavené...

12.6.2018 09:44 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Já jsem psal, že stroje jsem nastavil naprosto shodně a pak je předal. Když koukám do komentářů, tak tam se taktéž v tomto smyslu vyjadřuji konzistentně.
Zdar Max

Měl jsem sen ... :(

12.6.2018 12:55 hklt
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Ano, ale tak nějak jsem počítal, že stejně nastavené i zůstaly. Takhle by mohl provést cokoliv i smazat HDD... Můj první dotaz by tedy byl: "Vrtal jste se v tom?"

12.6.2018 13:22 Michal Kubeček | skóre: 71 | Luštěnice
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

To je zbytečné, jak říká Greg House: "Everybody lies." Takže před odevzdáním si zazálohovat veškerou konfiguraci (a možná raději i checksumy úplně všeho) a po vrácení porovnat.

12.6.2018 10:09 Ruža Becelin | skóre: 40 | blog: RuzaBecelinBlog
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

To mate z toho, ze nechate nekoho hrabat na servery. Ten "specialista" mel sedet vedle admina a rikat co a jak, ne fyzicky sam neco delat.

12.6.2018 11:40 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Zkušenost je taková, že většinou se nové instalace dělají po večerech na dálku. Nepamatuji se, kdy se něco někdy instalovalo lokálně, vždy to byl člověk někde na konci vpn tunelu s vymezeným přístupem, který pak dodal dokumentaci + proběhlo případné školení/diskuse na cca 2h.
Zdar Max

Měl jsem sen ... :(

12.6.2018 18:55 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Od toho vymysleli MS Lync / Skype for Business, ne? :-)

Zkušenost je taková, že tam kde jim na kvalitě záleží nejdříve procesy vyvinou, pak je otestují a pak je releasnou do produkce... Vývoj, test a release do produkce zajišťují zpravidla jiní lidé.

12.6.2018 20:55 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Jednak se tu nebavíme o produkci, ale o testovacím prostředí, a jednak nevím, jak by to měl Skype/Lync řešit.
Zdar Max

Měl jsem sen ... :(

12.6.2018 20:58 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

a jednak nevím, jak by to měl Skype/Lync řešit.

Screensharing.

12.6.2018 21:52 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Na linuxu to zas tak moc dobře nefunguje a řešit to přes nějaký druh vzdálené plochy je časově náročné. Jak už jsem psal, většinou to nefunguje tak, že se domluví den a člověk to celý den ladí, ale domluví se termín, do kdy to musí být a dotyčný to dělá v čase, kdy chce/může. Což může být během dne, nebo o po večerech a o víkendech. To je celkem běžná praxe.
Outsourcing jako takový je stejně o nějaké té důvěře. Chápu, že tak, jak to popisuješ, to někde funguje, ale upřímně v tom vidím spoustu časových překážek.
Zdar Max

Měl jsem sen ... :(

12.6.2018 22:10 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Outsourcing jako takový je stejně o nějaké té důvěře. Chápu, že tak, jak to popisuješ, to někde funguje, ale upřímně v tom vidím spoustu časových překážek.

To nemá nic společného s otázkou insourcované / outsourcované IT, ale mnoho s otázkou - jaký je service maturity level u služeb, jež má organizace doručuje. Tzn. veškeré procesy, včetně tvého inicializačního buildu by měly býti doručeny konzistentně, dle zdokumentovaného procesu, a při předávkách by měla být shoda - tedy kvalita tebou poskytované služby kontrolována; veškeré změny by opět měly býti zdokumentovány, zpětně revidovány, nepotřebné změny z procesu elimonovány a při předávce dalšímu článku v dodavatelsko-orběratelském řetězci (klidně v rámci te stejné organizace) by měl býti opět proveden audit, že je vše ve shodě s tím, jak to bylo - jako proces zdokumentováno.

13.6.2018 09:40 Max | skóre: 73 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Hmm, aby to tak fungovalo, potřeboval bych tak ještě 3 lidi do teamu.
Zdar Max

Měl jsem sen ... :(

13.6.2018 15:35 Käyttäjä 11133 | skóre: 58 | blog: Ajattelee menneisyyttä
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Quality, Cost, Delivery trojúhelník platí i v IT, nejen v automotive.

12.6.2018 10:12 ewew | skóre: 40 | blog: ewewov_blog
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

Možno keby si predtým pozrie manuál k NFS možno by k tomuto nedošlo.

Root v linuxe : "Root povedal, linux vykona."

14.6.2018 00:01 citanus | skóre: 12 | Cork (Ireland)
Rozbalit Rozbalit vše Re: Střípky z IT - (3) : NFS : Uhádnete, kde byl problém?

boze asi se budu muset na systemd podivat poradne.. koukal jsem na ten vystup nekolikrat a stejne jsem to prehlid. A pritom to tam upne bije do oci. Michael je borec!