Portál AbcLinuxu, 30. dubna 2025 11:24
Úkol byl jasný, naladit 2x OEL7 (aka CentOS 7), aby outsourcovaná firma mohla naladit Oracle RAC přes NFS. Oba os jsem předal čistý, up to date, vše přednastaveno atd. Týpek si nastavil mounpointy na 4x nfs volume (storage server je NetApp), naladit Oracle RAC podle dosavadních zkušeností apod. Následně byl server předán zpět k testování, abychom si na něm vyzkoušeli všechno možné včetně všech zakoupených options apod.
Všiml jsem si, že jeden node má problémy s automatickým mountem NFS volume z NetApp storage po startu OS. Chování bylo zcela náhodné. Jednou se nepřipojila jedna volume, podruhé dvě jiné atd. První node tímto problémem netrpěl. Dostupné info :
# /etc/fstab 192.168.1.1:/vol_ssd_rac_sdb_oradata /u02/oradata nfs4 rw,bg,hard,nointr,rsize=32768,wsize=32768,tcp,vers=4.1,timeo=600,acregmin=0,acregmax=0,acdirmin=0,actimeo=0 0 0 192.168.1.1:/vol_ssd_rac_sdb_redo /u02/oraredo nfs4 rw,bg,hard,nointr,rsize=32768,wsize=32768,tcp,vers=4.1,timeo=600,acregmin=0,acregmax=0,acdirmin=0,actimeo=0 0 0 192.168.1.1:/vol_ssd_rac_sdb_ocr /u02/oraocr nfs4 rw,bg,hard,nointr,rsize=32768,wsize=32768,tcp,vers=4.1,timeo=600,acregmin=0,acregmax=0,acdirmin=0,actimeo=0 0 0 192.168.1.1:/vol_ssd_rac_sdb_gimr /u02/oragimr nfs4 rw,bg,hard,nointr,rsize=32768,wsize=32768,tcp,vers=4.1,timeo=600,acregmin=0,acregmax=0,acdirmin=0,actimeo=0 0 0 # systemctl log : May 16 12:24:21 rac2-ph systemd[1]: Found ordering cycle on nfs-server.service/start May 16 12:24:21 rac2-ph systemd[1]: Found dependency on u02-oraredo.mount/start May 16 12:24:21 rac2-ph systemd[1]: Found dependency on nfs-server.service/start May 16 12:24:21 rac2-ph systemd[1]: Breaking ordering cycle by deleting job u02-oraredo.mount/start
Tiskni
Sdílej:
Systemd ? Alebo to bolo oneskorením na sieti čo spôsobilo timeout. Chyba protokolu NFS ?
To som čakal. Nexistuje šanca, že by som to uhádol.
Toto by som nečakal od skúseného admina. Ale aj toto sa deje.
Že by si nechal tie isté ip v konfiguráku na obidvoch serveroch.
Ok. Jedine čo ma napadá je, že ten NetApp nezvláda viacnásobne súčasne pripojenie nfs.
Ok. Tu ja končím. nemá zmysel pokračovať v hádani.
nfs-server.service
a u02-oraredo.mount
, ale jak se vám to podařilo, to bez konfigurace naslepo hádat nehodlám, stejně jako to, proč by na tom stroji vůbec měl běžet NFS server, když jste se o něm vůbec nezmínil.
cat /etc/exports /u02/oradata 192.168.1.1(rw,sync,no_wdelay,insecure,no_root_squash) /u02/oraredo 192.168.1.1(rw,sync,no_wdelay,insecure,no_root_squash)Takže kolize byla zapříčiněna tím, že ten člověk vůbec netušil, co dělá :-/.
a jednak nevím, jak by to měl Skype/Lync řešit.Screensharing.
Outsourcing jako takový je stejně o nějaké té důvěře. Chápu, že tak, jak to popisuješ, to někde funguje, ale upřímně v tom vidím spoustu časových překážek.To nemá nic společného s otázkou insourcované / outsourcované IT, ale mnoho s otázkou - jaký je service maturity level u služeb, jež má organizace doručuje. Tzn. veškeré procesy, včetně tvého inicializačního buildu by měly býti doručeny konzistentně, dle zdokumentovaného procesu, a při předávkách by měla být shoda - tedy kvalita tebou poskytované služby kontrolována; veškeré změny by opět měly býti zdokumentovány, zpětně revidovány, nepotřebné změny z procesu elimonovány a při předávce dalšímu článku v dodavatelsko-orběratelském řetězci (klidně v rámci te stejné organizace) by měl býti opět proveden audit, že je vše ve shodě s tím, jak to bylo - jako proces zdokumentováno.
Možno keby si predtým pozrie manuál k NFS možno by k tomuto nedošlo.
boze asi se budu muset na systemd podivat poradne.. koukal jsem na ten vystup nekolikrat a stejne jsem to prehlid. A pritom to tam upne bije do oci. Michael je borec!
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.