Impossible de se connecter dans la nuit du 31 octobre 2016

Bonjour,

Dans le but d’améliorer les services, ici obtenir des statistiques sur les méthodes de connexion des utilisateurs, j’ai modifié hier soir le module d’identification SASL de Prosody, testé en local puis déployé sur JabberFR. La différence de version (JabberFR tournant sur une version légèrement plus ancienne de Prosody) a provoqué un bug qui empêchait quiconque de s’identifier jusqu’à ce que je trouve le problème et que je le corrige à 11h36 ce matin.

Je suis désolé pour l’interruption de service que ça a entraîné, et je ferai en sorte que ça ne se reproduise pas.

Renouveau de JabberFR

logo

Note : ce billet a été originellement rédigé chez LinuxFR.

JabberFR est une association née en 2012 à partir de la structure officieuse existant depuis environ 2003 sous le même nom, qui a avec le temps fusionné avec les services fournis par (feu) l’APINC. JabberFR était plus une fédération de services qu’un simple serveur, avec pour but affiché de rendre la vie plus facile aux utilisateurs francophones de Jabber, via des services mis en commun et exposés de la même façon sur chaque serveur de la fédération :

  • L’annuaire des utilisateurs (JUD) pour faciliter la découverte de contacts ;
  • Le serveur de discussions chat.jabberfr.org ;
  • La passerelle IRC irc.jabberfr.org pour faciliter la transition ;
  • Un proxy SOCKS (XEP-0065) pour assurer un transfert de fichier efficace.

Les buts affichés de l’association sont :

  • Mettre à disposition (enfin, continuer la mise à disposition) des services de messagerie instantanée libres à travers les serveurs gérés par l’association tels que jabber.fr, chat.jabberfr.org, ou im.apinc.org ;
  • Promouvoir les applications et services qui y sont liés, notamment grâce au wiki, ou par la présence de membres à des évènements grand public ;
  • Améliorer l’existant en développant des logiciels ou composants lorsque le besoin est ressenti.

Continuer la lecture

Maintenance du jeudi 8 septembre 2016

Pour résoudre un problème de fuite de mémoire, ainsi que quelques bugs (tels que des statistiques faussées et autres détails), le serveur XMPP va être redémarré ce jeudi 8 septembre autour de 23h30.

La reprise du service devrait être immédiate ou peu s’en faut, mais comme d’habitude les mises à jour (si nécessaire) se feront via des mises à jour de ce billet.

Édition du 08/09/2016 23h33 : tout s’est déroulé comme prévu, les services sont opérationnels.

Coupure temporaire du serveur le vendredi 29 juillet

Bonjour à tous,

Hier soir nous avons décidé de relancer le serveur afin de corriger quelques oublis lors de la migration, vous avez par exemple récupéré les préférences des salons telles qu’elles étaient avant (notamment le fait qu’ils soient loggés ou pas), et les statistiques sont de retour.

Cependant, l’un des buts de ce reboot était d’obtenir une adresse IPv6 pour garder le contact avec les serveurs n’ayant pas la chance d’avoir une IPv4, et nous n’avons toujours pas réussi.

Édition, le 10 août : Suite à la suggestion par Nicosss d’odhcp6c, une IPv6 a été obtenue et le serveur est maintenant joignable à l’adresse 2001:bc8:3c61:f00::1 !

Continuer la lecture

Petite interruption des composants

Bonsoir !

Nous avons eu une légère interruption de certains services due à un disque dur plein sur malaxeuz, notre serveur, notamment chat.jabberfr.org, l’annuaire, la présence web.

01:41:00 : On me notifie que les salons ne répondent plus, je me connecte au serveur et cherche la cause du bug. Deux processus d’analyse de logs prennent une quantité énorme de mémoire et continuent de grossir, après une rapide analyse je décide de les stopper afin d’éviter de se retrouver en manque de mémoire. Je remarque ensuite que la partition du système est pleine, je supprime donc quelques anciens fichiers pour faire de la place.

01:45:41 : Ceci n’aura pas suffi à rétablir la connexion avec les salons, je fais donc la disco de nos principaux domaines, jabberfr.org (Prosody) fonctionne, jabber.fr (Ejabberd) fonctionne aussi, mais aucun des composants n’apparaît connecté. Après avoir regardé dans les logs d’Ejabberd, je vois que tous les composants sont déconnectés, et je me résous donc à les relancer.

01:50:09 : Tous les services sont rétablis.

J’en profite au passage pour vous annoncer une migration des services d’ici la fin du mois, notre hébergeur actuel fermant ses portes nous sommes en train de mettre en place un changement de serveur physique. plus d’informations très bientôt !

Maintenance exceptionnelle le dimanche 29 mars 2015

Bonjour à tous !

Suite à une faille présente dans une bibliothèque que Prosody utilise, ce serveur a été redémarré en urgence. Pour plus d’informations sur cette faille, vous pouvez lire les notes de version de Prosody 0.9.8 (en anglais)

mu-conference, notre serveur de conférences, sera redémarré ce mercredi premier avril à 20h (et c’est pas une blague !) afin de corriger quelques problèmes de connexion.

Votre nouvel administrateur, Link Mauve. 🙂

Mise à jour du 01/04/2015 à 21h45 : mu-conference a été correctement relancé, la connexion à la base de données est rétablie.

Maintenance le dimanche 2 mars 2014

Une maintenance du serveur de JabberFR, entrainant l’arrêt complet de tous les services, aura lieu le dimanche 2 mars 2014 de 16h à 18h.

Au programme :

  • prosody :
    • mise à jour vers la 0.9.3
    • installation et activation du backend libevent (pour ne plus subir la limite des 1024 descripteurs de fichiers…)
    • installation et activation de mod_limits (pour limiter la bande passante au niveau c2s et s2s dans l’espoir que ça calme les utilisateurs indésirables qui nous plantent le serveur de temps à autre)
  • ejabberd :
    • re-compilation avec le support de exmpp (si j’y arrive, ce qui n’est pas gagné…) pour pouvoir faire des sauvegardes des utilisateurs via la XEP-0227, ce qui permettra à terme de pouvoir effacer les comptes indésirables sereinement

Mise à jour de 16h05 La maintenance commence. Comme la dernière fois, vous pouvez suivre la maintenance sur le salon jabberfr-sos@muc.last-exile.org (client web).

Mise à jour de 16h15 : libevent et mod_limits en place.

Mise à jour de 18h : La maintenance est finie. Bilan: on a maintenant un prosody à jour (avec la 0.9.3), le backend libevent activé et un mod_limits en place. Quant à ejabberd, il  a gagné (si quelqu’un a déjà réussi l’exploit de l’utiliser avec exmpp pour la commande export_piefxis ou export_piefxis_host de ejabberdctl, qu’il me fasse signe, son aide sera grandement appréciée).

Évolution de la population des salons Jabber (2013)

Ce billet fait suite à une première analyse effectuée pour l’année 2012. Le périmètre de l’analyse est très restreint, comme l’année dernière (voire les précisions sur l’outil utilisé plus bas).

  • Synthèse

Globalement la tendance de fréquentation est la baisse : en moyenne la fréquentation a baissé de plusieurs personnes par salon.

Ensemble des salons sur 2013

D’autre part, on note sur les salons les plus peuplés des fluctuations beaucoup plus importantes au cours de l’année avec des creux significatifs lors du printemps, du mois d’août et du mois de décembre.

Amplitude journalière sur jabberfr@

A part en décembre où le taux d’occupants permanents est grand, le reste de l’année les variations journalières restent d’environ 15 personnes.

2 faits marquants sur les salons observés :

– le salon discussion@ a été déserté d’une grande partie de ses occupants à partir de mai.

– le salon tatoeba@, fréquenté pour moitié par des IRCiens via une passerelle, déménage de serveur (chat.tatoeba.org).

  • Notes sur les données

Les données sont collectées toutes les 15 min, puis moyennées sur chaque journée (avec l’outil Statsalons). Un bug a entrainé la perte des données du mois de novembre.

Les évolutions de l’outil permettent désormais de collecter les fréquentations de l’intégralité des salons d’un serveur, et ce pour plusieurs serveurs. Cette collecte est instanciée depuis Juin 2013 pour chat.jabberfr.org, représentant un total d’environ 150 salons (morts ou vivants).

L’outil n’a pas connu beaucoup de modifications depuis l’année dernière : début de restructuration des fonctions de collecte (permettant de gérer automatiquement les nouveaux salons d’un serveur), outils d’analyse de disponibilité des données.

 

Beaucoup de travail reste à faire pour arriver à un outil pleinement fonctionnel et robuste : formaliser les traitements sur les données brutes (sous-échantillonage, calcul des moyennes …), formaliser la création des graphiques, créer une interface utilisateur permettant la visualisation des données de façon dynamique (choix des plages temporelles, groupes de salons, traitements…), proposer une API pour permettre la réutilisation des données par d’autres services (je pense par exemple au moteur de recherche http://search.wensley.org.uk).

Maintenance le dimanche 26 janvier 2014 (ou quand migration rime avec virtualisation)

Une maintenance du serveur de JabberFR, entrainant l’arrêt complet de tous les services, aura lieu le dimanche 26 janvier 2014 de 14h à 18h.

Le but de cette maintenance est de migrer tous les services de notre serveur actuel (fraiseuz) vers un nouveau virtualisé (malaxeuz) hébergé sur une nouvelle machine. Cette migration nous apportera deux avantages :

  • Facilitera les migrations futures au sein du réseau APINC en cas de nouveau changement de machine physique (parce que non, ce n’est pas aussi simple que de juste migrer une instance de serveur xmpp)
  • Mise en place d’une solution DRBD (qui peut être vu comme du RAID 1 via le réseau), facillitant ainsi la reprise du service en cas de problème avec la machine principale

À noter que dans un premier temps, cette migration n’entrainera pas de changement d’adresses IP (quleque soit le service). Par contre, dans les jours à venir, l’ensemble des sites web hébergés sur fraiseuz actuellement en changeront. Mais ça donnera lieu à un nouveau billet.

À noter aussi que je mettrai à jour ce billet en fonction de l’évolution de la migration.

Mise à jour de 19h12 : Finalement la mise à jour prend plus de temps que prévu (oui c’est laborieux), mais les services principaux n’ont pas été coupés tout de suite. Actuellement les bases mysql, prosody et ejabberd sont migrés, mais pas encore redémarrés. Je m’attaque au firewall et aux IPs. Le premier service à revenir devrait être prosody.

Mise à jour de 20h21 : Prosody est de nouveau disponible. Au passage, il a été mis à jour à la 0.9.2.

Mise à jour de 21h10 : Ejabberd est de nouveau disponible. Au passage, il a été mis à jour à la 2.1.13.

Mise à jour de 23h01 : Ejabberd n’aura pas tenu longtemps, puisque le temps de mettre à jour le billet, il était déjà retombé. Après une bonne prise de tête avec des erreurs incompréhensibles, et quelques redémarrages du nouveau serveur, le service est de nouveau disponible depuis 22h20.

Mise à jour de 23h42 : Pour ceux désireux de suivre plus en détail la migration, vous pouvez venir sur le salon jabberfr-sos@muc.last-exile.org (client web).

Mise à jour du 27/01/2014 à 00h38 : Les salons sont de retours. La suite (et fin j’espère), ce soir. Mais pour le moment les 3 principaux services sont fonctionnels. À noter que je ferais sans doute un post-mortem de cette migration dans quelques jours, en mettant en avant les problèmes rencontrés.

Mise à jour du 27/01/2014 à 19h08 : La redirection du port 443 vers le port 5222 a été remise en place (vous pouvez donc recommencer à glander au boulot \o/).

Mise à jour du 28/01/2014 à 08h21 : Un redémarrage de ejabberd et prosody est prévu ce soir entre 19h et 20h (pour pouvoir appliquer certaines modifications nécessaires à la suite de la migration).

Mise à jour du 28/01/2014 à 20h04 : Serveur redémarré.

Mise à jour du 29/01/2014 à 00h39 : Les sites sont revenus (et muckl aussi par la même occasion). Tous, à part http://im.apinc.org/etat/ qui redirige pour le moment sur http://jabber.apinc.org/ (mais ce n’est que temporaire).

Mise à jour du 29/01/2014 à 23h52 : Les passerelles irc et j2j ainsi que Deep Thought sont de retour.

Mise à jour du 30/01/2014 à 00h26 : Presence et jud sont de retour.

Mise à jour du 30/01/2014 à 23h57 : Un redémarrage du serveur sera effectué demain entre 06h30 et 07h00, afin de pouvoir libérer l’adresse ip temporaire utilisée lors de la migration. À noter aussi que des admins de l’APINC feront une intervention demain dans le datacenter pour, entre autres, débrancher fraiseuz. Il ne devrait a priori pas y avoir d’interruption de service durant l’intervention.

Mise à jour du 31/01/2014 à 07h02 : Le redémarrage s’est bien passé.

Mise à jour du 01/02/2014 à 00h09 : Plusieurs sites étaient indisponibles depuis le dernier redémarrage. C’est maintenant corrigé. Le problème venait d’un soucis de montage au démarrage de la machine. La cause du problème est en cours d’investigation.

Mise à jour du 05/02/2014 à 08h11 : Afin de pouvoir mettre en place la solution de redondance, l’équipe de l’APINC redémarrera malaxeuz le jeudi 06 février 2014 à 22h. Pour rappel, malaxeuz est le nom de la machine (virtuelle) accueillant l’ensemble des services XMPP de JabberFR. L’opération ne devrait pas prendre plus de 20min.

Mise à jour du 06/02/2014 à 22h54 : Cela fait 20min que le serveur est redémarré.

Réunion mai 2013

Voici 8 mois qu’a eu lieu la dernière réunion de travail. 8 mois pendant lesquels on s’est déchaîné comme des fous !

Ha, omega me souffle que ce n’est pas crédible, et il n’a pas tout à fait tort (IRL, tout ça). Quoi qu’il en soit, il y a quand même eu suffisament d’avancées pour que cela vaille la peine qu’on fasse le point sur la situation actuelle, et que l’on prépare l’avenir ensemble. 🙂

Une réunion aura donc lieu le jeudi 23 mai 2013 de 20h30 à 22h00 (heures de Paris) sur le salon association@chat.jabberfr.org. La réunion étant ouverte à tout le monde (membres de l’association ou pas), nous vous attendons nombreux, mais dans le calme et respectueux du lieu.

L’ordre du jour est disponible dès maintenant sur le wiki. Pour les plus impatients, sachez que l’on y parlera, entre autres, de la migration de im2 sur prosody (et de ce que ça entraîne) et du fait que l’on stagne à 13 membres depuis janvier. Le temps restant sera consacré aux éventuelles questions du « public » restées sans réponse.