Coupure temporaire du serveur le vendredi 29 juillet

Bonjour à tous,

Hier soir nous avons décidé de relancer le serveur afin de corriger quelques oublis lors de la migration, vous avez par exemple récupéré les préférences des salons telles qu’elles étaient avant (notamment le fait qu’ils soient loggés ou pas), et les statistiques sont de retour.

Cependant, l’un des buts de ce reboot était d’obtenir une adresse IPv6 pour garder le contact avec les serveurs n’ayant pas la chance d’avoir une IPv4, et nous n’avons toujours pas réussi.

Édition, le 10 août : Suite à la suggestion par Nicosss d’odhcp6c, une IPv6 a été obtenue et le serveur est maintenant joignable à l’adresse 2001:bc8:3c61:f00::1 !

Déroulement sommaire des opérations :

23:43:01 : Écriture d’un module Prosody pour faire des annonces globales sur tous les domaines ainsi que sur les salons, relu par les développeurs, qui sera publié d’ici peu.

00:53:17 : Coupure de Prosody après avoir annoncé environ une heure de coupure des services pour être large, puis reboot du serveur entier afin de passer à un noyau LTS (support à long terme).

01:08:07 : Perte de la connexion IPv4 après un échec d’obtention d’une IPv6, un second reboot du serveur est nécessaire mais l’interface web d’Online.net notre hébergeur nous répond “Error: Reboot failed”.

01:13:51 : Après plusieurs tentatives de correction du problème et un appel au support d’Online.net, leur IPMI est en panne donc on ne peut pas contrôler le serveur à distance, un technicien se rendra sur place pour forcer un reboot et rétablir l’IPMI.

01:30:41 : Le serveur est réapparu, mais il est probablement démarré sur une image de secours, donc on n’y a pas accès.

01:50:46 : Nous avons de nouveau accès au serveur, que nous démarrons sur une image de secours d’Ubuntu 14.04 (dernière distribution Linux disponible) afin de corriger les problèmes de réseau qui nous empêchent d’accéder au serveur quand il est démarré normalement.

03:44:08 : Après de nombreuses tentatives pour obtenir une IPv6, toutes soldées par un échec, que ce soit avec systemd-networkd, netctl, dhcpcd ou dhclient, nous décidons d’abandonner pour ce soir et de rétablir les services en IPv4 seulement.

04:08:57 : Prosody rencontrait des problèmes dû à une très basse limite du nombre de file descriptors ouverts, c’est-à-dire en gros le nombre de connections simultanées qu’il peut effectuer, que ce soit avec les utilisateurs ou avec les autres serveurs. Après avoir monté la limite de 1024 à 16384, tous les problèmes sont corrigés.

04:18:52 : Tous les services sont rétablis, merci de votre patience !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Comment ID: nYA1SQ

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.