Sunday, March 14, 2010

Un bruit et un signe

Quand j'ai mis avant-hier ma courbe sur le volume de crédit accordé pour les hypothèques sur un logement enregistrées jusqu'à un novembre, je n'étais pas le conscient que la donnée de ce mois avait publié cela le même matin, accompagné du communiqué de presse correspondant de l'INE (c'est ce qu'il a demander aux amis de t'envoyer le dernier fichier actualisé).
Dès que par la nuit j'ai emporté une surprise après avoir vu que précisément les nouvelles parlaient de cette statistique, et ils soulignaient qu'en novembre, pour la première fois dès 2007, s'étaient constituées plus d'hypothèques sur un logement que dans le même mois de l'année précédente (encore 1,8 % pour être précis).
Comme j'étais rassemblé dans le sujet du volume du crédit, il n'avait pas prêté beaucoup d'attention au nombre de prêts, mais en effet, en novembre, pour la première fois depuis un avril 2007, ils ont été accordés plus qu'un an avant.
La question intéressante qui se pose ici est celle de la difficulté pour détecter des changements de tendance et pour les distinguer des dents simples de scie (que j'ai nommés d'autres fois anecdatos). Je m'explique : dans la majorité des phénomènes sociaux que nous observons à travers du temps, et que nous comptons (par des jours, des semaines, des mois, des années...) il y aura des tendances de fond (une stabilité, une croissance, un décroissement) et les dents de scie (d'une manière errante la donnée de chaque période concrète ne suit pas exactement la tendance, mais c'est quelque chose de plus haut ou quelque chose plus en bas que l'on pourrait attendre). Si les dents de scie sont prononcés, et nous observons beaucoup sur eux, nous courons le danger de passer chaque mois (ou une semaine, ou la période qui est) dès la panique jusqu'à l'optimisme, et vice versa, d'une manière errante, selon la déviation de la tendance qui frappe cette fois, sans nous rendre de compte de ce que nous réagissons devant des oscillations autour de la tendance, et nous ne voyons pas la tendance même.
Comment savoir si la dernière donnée d'une série est un dent de scie ou un changement de tendance ? Strictement en parlant, nous ne pourrons pas le savoir jusqu'à ce que nous voyions ceux qui viennent après. Mais ce que oui nous pouvons facilement vérifier est si les données avec le niveau de désagrégation temporelle que nous utilisons sont données ou non aux dents de scie. Par exemple, la donnée qui vient d'être publiée consiste en ce qu'en novembre encore 1,8 % d'hypothèques a été enregistrée sur un logement qu'en novembre 2008. Voyons la trajectoire de cet indicateur dans les dernières années (click pour agrandir) :

Nous pouvons voir que oui, il y a des dents de scie, et ils sont dans quelques cas considérables (même en oubliant les plus criards, en mars et l'avril, qui est vu affectés par les danses de la semaine sainte). Nous pouvons simplement l'illustrer avec les valeurs des sept derniers mois (arrondis à l'unité) :-25,-10,-19,-6,-6,-18, +2.
Avec ce degré d'oscillation autour de la tendance, il est difficile de savoir si la donnée de novembre est plus un dent de scie, ou un vrai changement faisait des niveaux positifs. Mais oui nous pouvons savoir que cette statistique, quand il s'ajoute par des mois, est laissée produire des dents de scie. Un remède pour ces situations est d'"aplanir" le virage, pour que les becs vers le haut et vers le bas ils soient compensés, et voyons la tendance de fond. Comment faire cela ? Très simple, au lieu de regarder la donnée par des mois, nous pouvons le voir par de plus grandes périodes. Que nous analysions les données temporelles par des jours, par des semaines, par des mois ou par des années c'est une convention relativement arbitraire. Mais l'une des bonnes raisons pour modifier la convention consiste précisément en ce que si le degré de l'agrégation que j'utilise produit une statistique avec beaucoup de dents de scie, peut-être il consiste en ce que je désagrège trop, que je mets la loupe trop près des données, et les oscillations autour de la tendance me déroutent.
Nous pouvons voir, donc, l'évolution de cet indicateur par perodos, par exemple, de trois mois. Au lieu d'utiliser des trimestres complets et successifs, des trimestres peuvent être utilisés deslizantes, que se superposent les uns avec les autres (comme nous faisons, par exemple, avec l'inflation, quand nous donnons la valeur des douze derniers mois, et nous le révisons chaque mois). Ainsi, chaque donnée de la série serait ene+feb+mar, feb+mar+abr, mar+abr+may, abr+may+jun...
Dans le graphique suivant nous voyons le résultat pour les dernières années (dans un bleu) superposé à la donnée mensuelle (dans rouge) que nous avons vu avant (click pour agrandir) :

La nouvelle statistique a à peine des dents de scie, ce qui est un bon indice de ce qu'il s'agit d'un niveau d'agrégation plus adapté pour distinguer la tendance des oscillations au sujet de la même. J'habille ainsi, la dernière donnée (un septembre - oct-nov) n'est pas un changement trop important, mais il confirme simplement le processus de freinage doux à la chute qui se rendait le long de 2009 : depuis une chute maximale de-41 % (dans le trimestre terminé dans ene-09), les baisses étaient adoucies d'une manière assez uniforme pendant toute l'année, et dans la dernière période la diminution est déjà "seulement" de-8 %. Une chose logique, d'autre part : après être tombé pendant un an 30-40 % sont difficiles que recommence à tomber autant.
J'imagine qu'il est de demander beaucoup qu'un journal décide que ce qu'il importe n'est pas la donnée mensuelle, mais la donnée trimestrielle, qui requiert une propre élaboration, s'écarter du communiqué de presse de l'INE, et l'expliquer aux lecteurs. Mais : ne serait-il pas ce, le type de choses que nous demanderions à quelques moyens auxquels il leur plaît penser qu'ils nous servent pour distinguer la vraie information sur les données simples, pour séparer le signe du bruit ?.

No comments:

Post a Comment