Incident du lundi 19 juin

Vers 17h15, on me signale que le service ne répond plus. Après une rapide investigation je me rends compte que Prosody, notre serveur XMPP, est en train de prendre 100% du CPU et ne log plus rien, ne répond plus sur aucun port, et ne fait rien d’utile du tout d’après strace. C’est le même symptôme que lors de l’interruption de source inconnue dans la nuit du jeudi 8 juin pour laquelle j’avais simplement relancé Prosody.

Je décide alors de prendre du temps pour analyser la situation en compagnie de Zash sur le salon d’aide de Prosody, mais je ne parviens pas à déterminer la cause du problème et restaure donc les services, qui reprennent leur cours normal à 18h51.

J’en ai profité au passage pour mettre à jour Prosody et le passer à lua5.2, pour bénéficier des dernières améliorations.

Édition le 22 juin : certains modules avaient disparus de la configuration, notamment Carbons et HTTP Upload, ils viennent d’être remis.