Évolution de la population des salons Jabber (2013)

Ce billet fait suite à une première analyse effectuée pour l’année 2012. Le périmètre de l’analyse est très restreint, comme l’année dernière (voire les précisions sur l’outil utilisé plus bas).

  • Synthèse

Globalement la tendance de fréquentation est la baisse : en moyenne la fréquentation a baissé de plusieurs personnes par salon.

Ensemble des salons sur 2013

D’autre part, on note sur les salons les plus peuplés des fluctuations beaucoup plus importantes au cours de l’année avec des creux significatifs lors du printemps, du mois d’août et du mois de décembre.

Amplitude journalière sur jabberfr@

A part en décembre où le taux d’occupants permanents est grand, le reste de l’année les variations journalières restent d’environ 15 personnes.

2 faits marquants sur les salons observés :

– le salon discussion@ a été déserté d’une grande partie de ses occupants à partir de mai.

– le salon tatoeba@, fréquenté pour moitié par des IRCiens via une passerelle, déménage de serveur (chat.tatoeba.org).

  • Notes sur les données

Les données sont collectées toutes les 15 min, puis moyennées sur chaque journée (avec l’outil Statsalons). Un bug a entrainé la perte des données du mois de novembre.

Les évolutions de l’outil permettent désormais de collecter les fréquentations de l’intégralité des salons d’un serveur, et ce pour plusieurs serveurs. Cette collecte est instanciée depuis Juin 2013 pour chat.jabberfr.org, représentant un total d’environ 150 salons (morts ou vivants).

L’outil n’a pas connu beaucoup de modifications depuis l’année dernière : début de restructuration des fonctions de collecte (permettant de gérer automatiquement les nouveaux salons d’un serveur), outils d’analyse de disponibilité des données.

 

Beaucoup de travail reste à faire pour arriver à un outil pleinement fonctionnel et robuste : formaliser les traitements sur les données brutes (sous-échantillonage, calcul des moyennes …), formaliser la création des graphiques, créer une interface utilisateur permettant la visualisation des données de façon dynamique (choix des plages temporelles, groupes de salons, traitements…), proposer une API pour permettre la réutilisation des données par d’autres services (je pense par exemple au moteur de recherche http://search.wensley.org.uk).

Évolution de la population des salons Jabber

Ce billet propose une première analyse des statistiques de fréquentation des salons de chat.jabberfr.org effectuées à partir d’un outil développé spécifiquement.

Évolution de la population dans une journée

  • Analyse

L’étude porte sur un échantillon arbitraire de 6 salons du serveur chat.jabberfr.org :
– jabberfr@chat.jabberfr.org : Salon des utilisateurs de Jabber francophones
– discussion@chat.jabberfr.org : Salon de discussion généraliste
– sciences@chat.jabberfr.org : Discussions concernant les sciences
– mathematiques@chat.jabberfr.org : Discussions autour des maths
– debian-fr@chat.jabberfr.org : Salon de la communauté Debian francophone
– tatoeba@chat.jabberfr.org : Salon de la communauté Tatoeba (passerelle avec un salon IRC)

La plage temporelle couvre du 1er décembre 2011 au 31 décembre 2012; cependant une grande partie des données du mois de décembre ont étés perdues.

En excluant le mois de décembre peu exploitable, la tendance globale est à une légère augmentation de la fréquentation de ces salons durant l’année. Le salon tatoeba@ connait une hausse importante (+100%) mais cette hausse est d’abord due à la fréquentation du salon IRC auquel il est relié. Les variations de fréquentation sur les salons jabberfr@ et debian-fr@ peuvent être très rapides (10 personnes de moins en moyenne en l’espace de quelques jours).
On note au moins 2 ruptures importantes du serveur durant mi-mars et début juin, ainsi qu’une 15aine de plus faible durée dans la période couverte.
Le début de l’été est propice à l’augmentation de la fréquentation (forte augmentation entre mai et juillet; plus de 5 fois il y a eu plus de 30 personnes en moyenne dans la journée sur jabberfr@), ce qui est probablement un signe de jeunesse de la population jabberienne.

L’analyse des min/max durant la journée permet d’évaluer le nombre d’idler dans le salon; sans surprise, le salon tatoeba@, relié à un salon IRC, excelle avec une variation d’environ 5 personnes dans une journée. Les principaux salons jabber « purs » fluctuent de 10 à 20 occupants dans la journée.

Ces statistiques montrent que globalement la population des salons s’accroit, mais très faiblement. L’étendue des données est encore faible et ne permet donc pas de faire des analyses sur le long terme. Néanmoins, ces courbes permettent de surveiller l’évolution de la population des salons Jabber au fil des mois, et permettront d’évaluer l’impact des différentes opérations de promotions de Jabber (publication d’articles sur LinuxFR, organisation d’évènements dans les salons …).

Ces statistiques ne permettent pas d’évaluer l’activité des salons; pour cela, on pourra se rapporter à l’outil Mucron.

  • Apropos de l’outil Statsalons

L’outil Statsalons (site du projet) relève le nombre d’occupants dans chaque salon tous les quarts d’heure puis produit des graphes à différentes échelles temporelle : journée, mois, année; sur ces deux derniers sont tracés les valeurs moyennes sur la journée ainsi que les bornes min/max rencontrées dans la journée.

Cet outil, réalisé en Python, n’est qu’à l’état de démonstrateur et de nombreuses évolutions sont prévues dans une prochaine version pour rendre l’outil plus fiable, plus facile d’utilisation mais aussi plus complet dans les analyses possibles. Actuellement seule la fonction de traçage n’est pas codée depuis zéro (utilisation de matplotlib); un des objectifs de la prochaine version est de s’appuyer sur plus de briques libres existantes (Sqlite pour le stockage, NumPy pour les traitements, …).

Un service en ligne public devrait être proposé prochainement pour récupérer les données disponibles et consulter à la demande les différentes courbes.