drbd a pacemaker - prazdny /proc/drbd po failoveru

Ahoj,

mam rozbehnuty drbd a pacemaker. Vše zdá se funguje bez problémů až na to že po failoveru na nodeB mám "prázdný" výstup z /proc/drbd na nodeA:

Every 1.0s: cat /proc/drbd                                             nodeA: Sun Nov 17 12:34:46 2019

version: 8.4.11 (api:1/proto:86-101)
srcversion: 1A039827F6ABC247A25EC61

Konfigurace pacemakeru:

node 1: nodeA \
        attributes standby=on
node 2: nodeB \
        attributes standby=off
primitive pri_drbd_omd ocf:linbit:drbd \
        params drbd_resource=r0 \
        op monitor interval=7s role=Slave \
        op monitor interval=5s role=Master
primitive pri_fs_omd Filesystem \
        params device="/dev/drbd0" fstype=ext4 directory="/checkmkdata/" \
        op monitor interval=30s timeout=30s \
        meta target-role=Started
ms ms_drbd_r0 pri_drbd_omd \
        meta master-max=1 master-node-max=1 clone-max=2 clone-node-max=1 notify=true
property cib-bootstrap-options: \
        have-watchdog=false \
        dc-version=1.1.18-2b07d5c5a9 \
        cluster-infrastructure=corosync \
        last-lrm-refresh=1573477103 \
        cluster-name=checkmk \
        stonith-enabled=false \
        no-quorum-policy=ignore
rsc_defaults rsc-options: \
        resource-stickiness=1

Konfigurace drbd:

resource r0 {
        protocol C;
        startup {
                wfc-timeout  15;
                degr-wfc-timeout 60;
        }
        net {
                cram-hmac-alg sha1;
                shared-secret "xxxx";
        }
        on nodeA {
                device /dev/drbd0;
                disk /dev/md0;
                address 10.0.0.6:7788;
                meta-disk internal;
        }
        on nodeB {
                device /dev/drbd0;
                disk /dev/md0;
                address 10.0.0.7:7788;
                meta-disk internal;
        }
}

Čým by to mohlo být? A jde nějak dosáhnout toho, aby po failoveru zůstal na nodeA normální výstup v /proc/drbd?

Děkuji.

Odpovědi

Jestli to nic neukazuje, tak drbd na nodu A v tuto chvíli nereplikuje data. Zkus drbd-overview.

17.11.2019 16:13
Rozbalit Rozbalit vše Re: drbd a pacemaker - prazdny /proc/drbd po failoveru

A prohlédni si log. Tam najdeš hafo inspirujících stížností, že je něco špatně. Taky crm_mon, crm resource clear ...

Corosync/pacemaker ti na nodu A ted vůbec nespustili drbd. Patrně měli nějaký důvod, který nedokázali vyřešit.

Tak příčina byla prozaická ... simuloval sem failover tím, že jsem v crm pomocí 'node standby nodeA' poslal nodeA od standby. V tu chvíli se provoz přepnul na nodeB a zároveň přestala replikace drbd.

Když jsem teď v crm spustil 'node online nodeA', tak provoz zůstal přepnutý na nodeB, ale replikace drbd na nodeA se opět rozběhla.

Teď musím jen přijít na to, jak přepnout provoz na nodeB a zároveň zachovat replikaci drbd, protože při delším provozu na nodeB bez funkční replikace trvá dlouho než se data mezi nody sesynchronizují.

18.11.2019 09:09
Rozbalit Rozbalit vše Re: drbd a pacemaker - prazdny /proc/drbd po failoveru

# crm resource help
Resource management
...
Commands:
        ban              Ban a resource from a node
...
        clear            Clear any relocation constraint
...
        move             Move a resource to another node
...

Dotaz: drbd a pacemaker - prazdny /proc/drbd po failoveru

Odpovědi