Portál AbcLinuxu, 7. května 2025 01:08

Dotaz: non-root LV obcas neni aktivni po rebootu VM

8.1.2024 10:12 MP
non-root LV obcas neni aktivni po rebootu VM
Přečteno: 1406×
Odpovědět | Admin
Cau,

na Debian 10-12 se trapim s jednim problemem. Na Proxmox VM pouzivam vsude LVM ve stylu:

vgX-root

vgX-swap

vgY-data

V hromade stovek VM mi po vetsinou pri aktualizacich vypadne alespon jedna nahodna VM, ktera po rebootu nema aktivni vgY-data. System tedy pri pokusu mountovat danou LV via /etc/fstab spadne do initramfs prikazove radky. Staci reset VM a nabehne to. Nesetkal se nekdo s timto problemem a jak ho vyresil nakonec?

Diky.
Nástroje: Začni sledovat (0) ?Zašle upozornění na váš email při vložení nového komentáře.

Odpovědi

8.1.2024 13:30 X
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Odpovědět | | Sbalit | Link | Blokovat | Admin
V hromade stovek VM mi po vetsinou pri aktualizacich vypadne alespon jedna nahodna VM, ktera po rebootu nema aktivni vgY-data.
Duvod? Jak jsi to diagnostikoval? Nebo to ma byt nejaka hadanka?
14.2.2024 10:17 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Příloha:
Jak mam debugovat tohle?
14.2.2024 11:08 X
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Jednoduse, staci si to precist. Mas tam jasne napsane v cem je problem a jak to akutne resit. Z dlouhodobeho hlediska, viz Jenda, bych se podival jak mas resene uloziste co nikdo nevi ie. zelezo, disky, pole etc.
14.2.2024 13:51 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Vazne nevim, jak debugovat neco, cemu nestaci defaultni 90s timeout, navic kdyz je to lokalni 10GB lv nad hw raidem. A zvlast, kdyz si to vybere nahodnou VM na nahodnem pve. V patek jsem aktualizoval s restartem ~50 VM, v utery ~150 VM, tentokrat zadne nespadlo na podobne veci (VM jsou na nfs i lokalnich lvm), a znicehonic to spadne na jedne zalohovaci masine. Po resetu VM to samozrejme nabehne okamzite.
14.2.2024 15:10 X
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
V logach toho Proxmoxu, pole, lvm neni v tom case absolutne vubec nic?
14.2.2024 16:17 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Nic jsem zatim nenasel. Ten restart VM je pouze interni, tzn. restartuje se v ramci VM, ne v ramci pve (nezmeni se tedy ani PID). Takze ten virtualni disk je stale pripojeny k VM. Protoze tentokrat timeout byl rovnou root disk, tak neni nic v syslogu VM. Ani nevim, ze by pve logoval vnitrni stav bootovani VM.
Jendа avatar 9.1.2024 07:26 Jendа | skóre: 78 | blog: Jenda | JO70FB
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Odpovědět | | Sbalit | Link | Blokovat | Admin
Populární je, že když bootuje virtualizační cluster, všichni se perou o storage, ještě pouští po dlouhé době fsck, který opravuje naakumulované chyby, věci se zpomalí a vytimeoutují. Ale tohle mi přijde divné:
System tedy pri pokusu mountovat danou LV via /etc/fstab spadne do initramfs prikazove radky.
Když čteš fstab a mountuješ podle něj, tak už jsi z initramfs venku. Není to systemd emergency shell už v „normálním“ systému? Pak bych zkusil zvýšit timeouty (do fstabu x-systemd.device-timeout=900, případně ještě nofail).
k3dAR avatar 14.2.2024 23:53 k3dAR | skóre: 63
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
trochu to ma zamotane ;-) dotaz je na "non-root" lv, ktere se mountuje dle /etc/fstab, ale na screenshotu se mu nepripoji "root" lv, takze se necetlo /etc/fstab, ale opravdu to spadlo do initramfs :)
porad nemam telo, ale uz mam hlavu... nobody
15.2.2024 11:23 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Je to tak, trochu jsem si neuvedomele pomotal, kdy to mountuje /etc/fstab a kdy je to initramfs. Cekam, az se mi stane ten pripad s non-root LVM a zatim prisel pripad s tim, ze padnul rovnou root.
Max avatar 16.2.2024 10:41 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
A byl by fstab a grub.cfg z jedné z těch mašin, co ti to udělaly?
Zdar Max
Měl jsem sen ... :(
16.2.2024 16:10 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Příloha:
Zde z masiny, co padl posledne ten root, aktualizovany Debian 12.

/etc/fstab:
/dev/mapper/vg0-root /               ext4    errors=remount-ro 0       1
/dev/mapper/vg0-swap none            swap    sw              0       0
/dev/sr0        /media/cdrom0   udf,iso9660 user,noauto     0       0
/dev/mapper/vg1-barman /mnt/storage/barman ext4 errors=remount-ro 0 0
18.2.2024 00:20 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Odpovědět | | Sbalit | Link | Blokovat | Admin

Svoji roli může hrát čas. Pokud toho máš hodně, tak mohou sehrát svoji roli timeouty, jak psal Jenda. Než se ti to všechno poskládá..

To byl mimochodem důvod proč jsem už před mnoha lety řešení, jaké používá Proxmox, opustil. Hrál jsem si clusterem zhruba ve stejné době, kdy se objevil Proxmox – pozůstatkem je můj manuál pro Pacemaker. A to co nabízel Citrix je v zásadě stejné řešení, které se lišilo jen v detailech a hypervizoru.

Základem infrastruktury kterou používám, je agent, normální shellový skript, který jsem si původně napsal pro Pacemaker. Ale opruzy spojené s aktualizacemi, mne dohnaly k tomu, že jsem to vyřešil jinak. Je to všechno mnohem jednodušší, žádné extra aplikace alá libvirt s bambilionem zbytečných závislostí, kde už se jen prase vyzná v tom, co to vlastně dělá. A tak mám už 8 let klid. Ale to by bylo pro většinu zdejších remcalů nezajímavé, protože to nemá žádné UI. A přestože je konfigurace stupidně prostá, možnost chyby při konfiguraci nového stroje existuje. Sice to není nic fatálního, ale kdo neví co dělá by z toho byl zmaten a o blbé pindy nestojím.

13.3.2024 12:47 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Odpovědět | | Sbalit | Link | Blokovat | Admin
Příloha:
Zde je screen, kdy padne non-root lv
13.3.2024 17:45 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
To je jenom zpráva, že skončil timeout. Ten zbytek už jsou jen závislosti. Měl by ses zaměřit na bloková zařízení ve skupině vg1.
13.3.2024 20:28 X
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Nebude to ten nahodny fsck nad vg0(videt nahore), ktery nestihne dobehnout pred fs-local.mount ktery na nej nepocka?
Max avatar 14.3.2024 12:52 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Podle mně nejlepší tip.
Zdar Max
Měl jsem sen ... :(
15.3.2024 12:37 X
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
touch /forcefsck && reboot;
13.3.2024 20:55 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Zaujímalo by ma na koľko štartov je nastavený interval between checks pre ten FS, a ako často sa tie stroje rebootujú. I keď v tomto prípade by som zvýšil timeout pre čakanie na disk keďže pri štarte je na diskovom poli asi dosť vysoké I/O, a prebehnúť kvantá veľkých diskov nebude len tak.

A tak isto mi udrelo do očí niečo s WiFi kartou (regulatory.db). Čo sú t za virtuálky keď majú WiFi?
14.3.2024 09:31 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Konfigurace fstab jsem daval vyse, je identicka. Takze ten interval bude default v debianu 10-12 (do debian 9 jsem s tim problem nemel). Stroje se restartuji pokud je nove jadro, takze vetsinou to byva 1x mesicne, restartuje se to davkove po 10 strojich. Na I/O bych to moc nesazel, bezi to nad nvme. Zkusim odpozorovat, zda se to dela jen na tom konkretnim diskovem poli, kde jsou databazove VM, protoze na dalsich polich mame spis nedatabazove (tzn. je tam velmi malo VM, ktere maji extra vg1 pro data).

Co se tyce cekani na disk, tak tam by mel byt defaultni systemd timeout 90s?

Co se tyce wifi, na tech VM nikdy wifi nebyla a ani nebude, ani na tom zeleze. Zrejme je to primo v distribucnim jadru.
14.3.2024 09:51 Aleš Kapica | skóre: 52 | blog: kenyho_stesky | Ostrava
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM

Šmarjá, jste snad slepí?! Tp, že se v logu objevují na přeskáčku různé zprávy souvisí s paralelizací procesů při spouštění. Některé doběhnou dřív, jiné později. A v tom je také zakopaný pes. To u čeho je DEPEND se nevykoná protože selže to na čem to závisí. A tím je sestavení LVM skupiny vg1, kde tím pádem nevznikne LV oddíl postgresql, takže není co namountovat.

Já už LVM nepoužívám, ale v manuálu, který jsem si k LVM sepsal k tomu něco je. Každému doporučuji, ať si v takovém případě vezme tužku a papír, aby si udělal jasno co kde je, co se kam mountuje, z čeho je to sestavené, atp.

Max avatar 14.3.2024 12:55 Max | skóre: 72 | blog: Max_Devaine
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
dmesg a full log ze systemd jsi si nevytahoval?
Zdar Max
Měl jsem sen ... :(
15.3.2024 08:29 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Priste, uz jsem byl v casovem skluzu a ted toho mam dost.
15.3.2024 17:01 Peter Golis | skóre: 64 | blog: Bežné záležitosti | Bratislava
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Zobrať si logy je snáď základ pri riešení pretrvávajúceho problému.

Teda ak sa k tomu človek nepostaví tak, že reboot je finálne riešenie. To by stačil watchdog.
14.6.2024 11:25 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Tak dnes mi to padlo a mel jsem cas si udelat logy. 10:41 je reboot po apt update, 10:49 je po resetu kvuli padnutemu lv /dev/mapper/vg1-barman

cat /etc/fstab ... /dev/mapper/vg1-barman /mnt/storage/barman ext4 errors=remount-ro 0 0

Kdyz si udelam grep na /mnt/storage/barman, tak v obou pripadech je to stejne...
2024-06-14T10:41:52.305114+02:00 HOSTNAME kernel: [    0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-6.1.0-18-amd64 root=/dev/mapper/vg0-root ro quiet
2024-06-14T10:41:52.305195+02:00 HOSTNAME kernel: [    0.038591] Kernel command line: BOOT_IMAGE=/boot/vmlinuz-6.1.0-18-amd64 root=/dev/mapper/vg0-root ro quiet
2024-06-14T10:41:52.305196+02:00 HOSTNAME systemd[1]: Found device dev-mapper-vg0\x2dswap.device - /dev/mapper/vg0-swap.
2024-06-14T10:41:52.305201+02:00 HOSTNAME systemd[1]: Activating swap dev-mapper-vg0\x2dswap.swap - /dev/mapper/vg0-swap...
2024-06-14T10:41:52.305211+02:00 HOSTNAME systemd[1]: Activated swap dev-mapper-vg0\x2dswap.swap - /dev/mapper/vg0-swap.
2024-06-14T10:41:52.305223+02:00 HOSTNAME systemd[1]: Found device dev-mapper-vg1\x2dbarman.device - /dev/mapper/vg1-barman.
2024-06-14T10:41:52.306184+02:00 HOSTNAME kernel: [    2.462710] device-mapper: core: CONFIG_IMA_DISABLE_HTABLE is disabled. Duplicate IMA measurements will not be recorded in the IMA log.
2024-06-14T10:41:52.306185+02:00 HOSTNAME kernel: [    2.462755] device-mapper: uevent: version 1.0.3
2024-06-14T10:41:52.306186+02:00 HOSTNAME kernel: [    2.462922] device-mapper: ioctl: 4.47.0-ioctl (2022-07-28) initialised: dm-devel@redhat.com
2024-06-14T10:41:52.306285+02:00 HOSTNAME kernel: [    8.349008] Adding 2670588k swap on /dev/mapper/vg0-swap.  Priority:-2 extents:1 across:2670588k FS


2024-06-14T10:49:00.898806+02:00 HOSTNAME kernel: [    0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-6.1.0-21-amd64 root=/dev/mapper/vg0-root ro quiet
2024-06-14T10:49:00.898907+02:00 HOSTNAME systemd[1]: Found device dev-mapper-vg0\x2dswap.device - /dev/mapper/vg0-swap.
2024-06-14T10:49:00.898920+02:00 HOSTNAME systemd[1]: Activating swap dev-mapper-vg0\x2dswap.swap - /dev/mapper/vg0-swap...
2024-06-14T10:49:00.898927+02:00 HOSTNAME systemd[1]: Found device dev-mapper-vg1\x2dbarman.device - /dev/mapper/vg1-barman.
2024-06-14T10:49:00.898940+02:00 HOSTNAME systemd[1]: Activated swap dev-mapper-vg0\x2dswap.swap - /dev/mapper/vg0-swap.
2024-06-14T10:49:00.899000+02:00 HOSTNAME kernel: [    0.034036] Kernel command line: BOOT_IMAGE=/boot/vmlinuz-6.1.0-21-amd64 root=/dev/mapper/vg0-root ro quiet
2024-06-14T10:49:00.900619+02:00 HOSTNAME kernel: [    2.561002] device-mapper: core: CONFIG_IMA_DISABLE_HTABLE is disabled. Duplicate IMA measurements will not be recorded in the IMA log.
2024-06-14T10:49:00.900620+02:00 HOSTNAME kernel: [    2.561032] device-mapper: uevent: version 1.0.3
2024-06-14T10:49:00.900620+02:00 HOSTNAME kernel: [    2.561154] device-mapper: ioctl: 4.47.0-ioctl (2022-07-28) initialised: dm-devel@redhat.com
2024-06-14T10:49:00.900705+02:00 HOSTNAME kernel: [    4.912363] Adding 2670588k swap on /dev/mapper/vg0-swap.  Priority:-2 extents:1 across:2670588k FS
journalctl -u mnt-storage-barman.mount
Jun 14 10:37:57 HOSTNAME systemd[1]: mnt-storage-barman.mount: Deactivated successfully.
Jun 14 10:37:57 HOSTNAME systemd[1]: Unmounted mnt-storage-barman.mount - /mnt/storage/barman.
-- Boot 5f74e1331a83416a84777cb21d26f3d8 --
Jun 14 10:41:51 HOSTNAME systemd[1]: mnt-storage-barman.mount: Directory /mnt/storage/barman to mount over is not empty, mounting anyway.
Jun 14 10:41:51 HOSTNAME systemd[1]: Mounting mnt-storage-barman.mount - /mnt/storage/barman...
Jun 14 10:41:51 HOSTNAME systemd[1]: Mounted mnt-storage-barman.mount - /mnt/storage/barman.
Jun 14 10:44:42 HOSTNAME systemd[1]: mnt-storage-barman.mount: Deactivated successfully.
Jun 14 10:44:42 HOSTNAME systemd[1]: Unmounted mnt-storage-barman.mount - /mnt/storage/barman.
-- Boot d7bd76fb9d1a490b944d74ea43fe2516 --
Jun 14 10:46:31 HOSTNAME systemd[1]: Dependency failed for mnt-storage-barman.mount - /mnt/storage/barman.
Jun 14 10:46:31 HOSTNAME systemd[1]: mnt-storage-barman.mount: Job mnt-storage-barman.mount/start failed with result 'dependency'.
-- Boot e2b2bb006de241a69feb33b8f15b33cf --
Jun 14 10:49:00 HOSTNAME systemd[1]: mnt-storage-barman.mount: Directory /mnt/storage/barman to mount over is not empty, mounting anyway.
Jun 14 10:49:00 HOSTNAME systemd[1]: Mounting mnt-storage-barman.mount - /mnt/storage/barman...
Jun 14 10:49:00 HOSTNAME systemd[1]: Mounted mnt-storage-barman.mount - /mnt/storage/barman.

systemctl cat mnt-storage-barman.mnt
# /run/systemd/generator/mnt-storage-barman.mount
# Automatically generated by systemd-fstab-generator

[Unit]
Documentation=man:fstab(5) man:systemd-fstab-generator(8)
SourcePath=/etc/fstab
Before=local-fs.target
After=blockdev@dev-mapper-vg1\x2dbarman.target

[Mount]
What=/dev/mapper/vg1-barman
Where=/mnt/storage/barman
Type=ext4
Options=errors=remount-ro

Nic problemoveho krome timeoutu pri mount fs tam nevidim. V priloze full journal z obou boot.
14.6.2024 11:33 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Ted jsem narazil na toto...

https://www.suse.com/support/kb/doc/?id=000020331

Asi sysifovska volba, co bude lepsi, kdyz asi jine reseni neni, pokud UUID nechci pouzivat.
19.6.2024 16:25 MP
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Příloha:
Pridan vypis journalu.
19.6.2024 17:26 X
Rozbalit Rozbalit vše Re: non-root LV obcas neni aktivni po rebootu VM
Nevidim nic ;(

Založit nové vláknoNahoru

Tiskni Sdílej: Linkuj Jaggni to Vybrali.sme.sk Google Del.icio.us Facebook

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.