Lösungen und Tipps von den mpex Profis

mpex Techblog

21.07.2020

Pacemaker – Problem: CIB-Änderungen werden nicht mehr propagiert, aber Corosync ist OK

In einer Pacemaker-Umgebung mit Corosync kann das Problem auftreten, dass CIB-Änderungen nicht mehr propagiert werden, obwohl Corosync OK ist. Pacemakers IPC-Buffer können ein in seiner Größe angeschwollenes CIB nicht mehr aufnehmen.

Umgebung

Pacemaker mit Corosync.

Problem

CIB-Änderungen werden nicht mehr propagiert, aber Corosync ist OK. Im Log findet sich Meldungen nach folgendem Muster:
Jul 21 14:58:17 [9047] rt-1023817-1 cib: error: crm_compress_string: Compression of 4357170 bytes failed: output data will not fit into the buffer provided (-8) Jul 21 14:58:17 [9047] rt-1023817-1 cib: error: crm_ipc_prepare: Could not compress the message (4357170 bytes) into less than the configured ipc limit (2131072 bytes). Set PCMK_ipc_buffer to a higher value (17429340 bytes suggested)

Analyse

Pacemakers IPC-Buffer können ein in seiner Größe angeschwollenes CIB nicht mehr aufnehmen. Der Cluster kann nicht mehr bedient werden.

Korrektur des Grundproblems

  • PCMK_ipc_buffer muss in /etc/default/pacemaker auf einen hinreichend großen Wert gesetzt sein, ca. 20M: PCMK_ipc_buffer=21310720.
  • Alle Nodes im Cluster identifizieren, auf denen dieser Wert zu gering oder nicht gesetzt wurde und korrigieren.

Wiederherstellung des Clusters

  • CIB dumpen und als Rettungskopie speichern, falls Cluster noch responsiv ist: cibadmin -Q > cib.xml.bak. Andernfalls neueste Revision aus /var/lib/pacemaker/cib/ kopieren.
  • Falls der Cluster noch responsiv ist, wenn möglich auf allen Nodes Maintenance-Modus aktivieren.
  • Pacemaker auf allen Nodes durchstarten.
  • Maintenance-Modus deaktivieren.

Kann mpex weiterhelfen?

Mit über 20 Jahren Erfahrung im Bereich Managed Hosting haben wir ein umfangreiches Repertoire an Problemlösungen angesammelt, die uns beim Betrieb von Serverumgebungen auf höchstem technischen Niveau geholfen haben. Unsere Systeme bauen komplett auf Open-Source-Technologien auf. Damit sind wir flexibel und können bei technischen Schwierigkeiten direkt selbst eingreifen. Analog zur Open-Source-Idee haben wir uns für diesen Techblog entschieden, um unsere Expertise und Problemlösungen mit dir zu teilen. Dazu zählen Technologien wie Bacula, Debian, Pacemaker, Puppet, diverse allgemeine Serverprobleme und noch vieles darüber hinaus. Wenn du mehr über unsere individuellen Business-Lösungen erfahren und dich als Admin auf deine Kernkompetenzen konzentrieren möchtest, sprich uns einfach an. Wir realisieren das Managed Hosting deiner Anwendung und kümmern uns in Zukunft um all solche Probleme.

Zum Kontaktformular
mpex GmbH
Weitere Blog Artikel
12.08.2020

Pacemaker – Problem: Fehlermeldung bei Ausführung von resize2fs gegen ein kürzlich vergrößertes Dateisystem

Fehlermeldung z.B. "Das Dateisystem ist schon xxxx Blöcke groß. Nichts zu tun!" bzw. "The filesystem is already xxxx blocks long. Nothing to do!"

Artikel lesen
05.08.2020

Pacemaker – Problem: Dienst lässt sich nicht stoppen

Pacemaker Dienst lässt sich nicht stoppen und hängt scheinbar ewig fest. Gibt es weitere aktive Ressourcen oder ist die Node noch aktiv?

Artikel lesen

Kontaktformular - Sprechen Sie uns an!

Sprechen Sie uns an!

Sie wollen mehr über uns und unsere Leistungen erfahren? Lernen Sie uns im persönlichen Gespräch kennen!

Telefon: +49 30 780 97 180
E-Mail: info@mpex.de