Lösungen und Tipps von den mpex Profis

mpex Techblog

21.07.2020

Pacemaker – Problem: CIB-Änderungen werden nicht mehr propagiert, aber Corosync ist OK

In einer Pacemaker-Umgebung mit Corosync kann das Problem auftreten, dass CIB-Änderungen nicht mehr propagiert werden, obwohl Corosync OK ist. Pacemakers IPC-Buffer können ein in seiner Größe angeschwollenes CIB nicht mehr aufnehmen.

Umgebung

Pacemaker mit Corosync.

Problem

CIB-Änderungen werden nicht mehr propagiert, aber Corosync ist OK. Im Log findet sich Meldungen nach folgendem Muster:
Jul 21 14:58:17 [9047] rt-1023817-1 cib: error: crm_compress_string: Compression of 4357170 bytes failed: output data will not fit into the buffer provided (-8) Jul 21 14:58:17 [9047] rt-1023817-1 cib: error: crm_ipc_prepare: Could not compress the message (4357170 bytes) into less than the configured ipc limit (2131072 bytes). Set PCMK_ipc_buffer to a higher value (17429340 bytes suggested)

Analyse

Pacemakers IPC-Buffer können ein in seiner Größe angeschwollenes CIB nicht mehr aufnehmen. Der Cluster kann nicht mehr bedient werden.

Korrektur des Grundproblems

  • PCMK_ipc_buffer muss in /etc/default/pacemaker auf einen hinreichend großen Wert gesetzt sein, ca. 20M: PCMK_ipc_buffer=21310720.
  • Alle Nodes im Cluster identifizieren, auf denen dieser Wert zu gering oder nicht gesetzt wurde und korrigieren.

Wiederherstellung des Clusters

  • CIB dumpen und als Rettungskopie speichern, falls Cluster noch responsiv ist: cibadmin -Q > cib.xml.bak. Andernfalls neueste Revision aus /var/lib/pacemaker/cib/ kopieren.
  • Falls der Cluster noch responsiv ist, wenn möglich auf allen Nodes Maintenance-Modus aktivieren.
  • Pacemaker auf allen Nodes durchstarten.
  • Maintenance-Modus deaktivieren.

Kann mpex weiterhelfen?

Mit über 20 Jahren Erfahrung im Bereich Managed Hosting haben wir ein umfangreiches Repertoire an Problemlösungen angesammelt, die uns beim Betrieb von Serverumgebungen auf höchstem technischen Niveau geholfen haben. Unsere Systeme bauen komplett auf Open-Source-Technologien auf. Damit sind wir flexibel und können bei technischen Schwierigkeiten direkt selbst eingreifen. Analog zur Open-Source-Idee haben wir uns für diesen Techblog entschieden, um unsere Expertise und Problemlösungen mit dir zu teilen. Dazu zählen Technologien wie Bacula, Debian, Pacemaker, Puppet, diverse allgemeine Serverprobleme und noch vieles darüber hinaus. Wenn du mehr über unsere individuellen Business-Lösungen erfahren und dich als Admin auf deine Kernkompetenzen konzentrieren möchtest, sprich uns einfach an. Wir realisieren das Managed Hosting deiner Anwendung und kümmern uns in Zukunft um all solche Probleme.

Zum Kontaktformular
mpex GmbH
Weitere Blog Artikel
13.01.2021

LDAP – Problem: Authentifizierung wird abgelehnt

durch die Fehlermeldung im LDAP Logfile: "RESULT tag=97 err=49 text=" wird die Authentifizierung abgelehnt.

Artikel lesen
06.01.2021

Bacula – Problem: Fehlermeldung "Unable to authenticate with Storage daemon"

Fehlermeldung beim Verbindungsversuch mit bacula-sd: "Unable to authenticate with Storage daemon".

Artikel lesen

Kontaktformular - Sprechen Sie uns an!

Sprechen Sie uns an!

Sie wollen mehr über uns und unsere Leistungen erfahren? Lernen Sie uns im persönlichen Gespräch kennen!

Telefon: +49 30 780 97 180
E-Mail: info@mpex.de