Les valeurs sûres dans le domaine de la visualisation des données – Les histogrammes

2014-09-life-of-pix-free-stock-photos-New-York-buildings-street

Cet article vient compléter la série sur les valeurs sûres dans le domaine de la visualisation des données. La semaine prochaine, je présenterai des exemples venant appuyer encore une fois les articles de cette série.

Lorsque vient le temps de préparer les affichages graphiques que vous insérerez dans vos rapports et documents, prenez le temps de choisir le bon type, sans vous arrêter à ce qui paraîtrait bien dans la page. Si les données nécessitent un histogramme pour faire la démonstration de vos résultats, pourquoi utiliser une tarte ? Si le temps est présent sur l’axe des X et que vous désirez démontrer l’évolution de vos données, pourquoi utiliser un histogramme ? Il n’y a jamais de répétition lorsque vient le temps d’afficher l’information, juste des graphiques qui doivent démontrer efficacement la forme de vos données.

 

Les histogrammes ou comment mieux se comparer

Cette fois, c’est le rapport annuel 2014 d’Hydro-Québec qui va permettre de faire la démonstration nécessaire. À la page 52, les graphiques à secteurs suivants (figure 1) sont présentés et tous les deux présentent les mêmes problématiques. Le faux pas le plus évident est le fait qu’un graphique à secteurs doit toujours représenter les parties d’un tout en pourcentage. Ici, ce sont directement les montants qui sont inscrits, on peut dès lors penser que le type de graphique utilisé n’est pas le bon. On l’a probablement choisi simplement parce que c’était plus facile de les faire cadrer dans la mise en page.

figure1

figure 1

Également, si c’est une comparaison qu’on a voulu démontrer, ce n’est pas très efficace. Par exemple, pour le graphique de droite sur l’affectation des fonds en 2014, les parts sur le remboursement et les dividendes étant similaires, il faut lire les montants pour distinguer vraiment la différence entre les deux. La façon dont les secteurs sont placés, dans ce type de graphique, ne permet pas facilement d’effectuer des comparaisons.

L’histogramme permet d’afficher cette information de bien meilleure façon, le tout en utilisant une seule couleur au lieu de trois (figure 2).

figure 2

figure 2

Mais attention, l’axe doit toujours commencer à zéro dans le cas des histogrammes. Sinon, les différences entre chaque barre paraissent plus grandes ce qui produit une distorsion entre les valeurs associées aux barres et les barres elles-mêmes. Un exemple du résultat d’une telle manipulation est présenté ci-dessous (voir figure 3) et est une indication de ce qu’il ne faut pas faire.

figure 2.1

figure 3


L’avantage principal de l’histogramme est la possibilité de pouvoir comparer les barres entre elles, étant donné qu’elles sont près les unes des autres. De plus, même s’il est possible d’y afficher les pourcentages, il est correct d’y afficher des montants.


Mais attention tout de même lorsque vous utilisez les histogrammes, certains pièges peuvent se présenter. Même s’ils permettent de faire des comparaisons, c’est moins évident lorsqu’on empile les valeurs les unes sur les autres. La partie du bas est facilement comparable, mais dès que l’on remonte, la comparaison devient de plus en plus difficile.

Le rapport d’Hydro-Québec présente sa propre vision à la page 12 (figure 4) d’un histogramme empilé. Ça pourrait être une solution mais malheureusement, dans ce cas-ci, l’utilisation d’un tel graphique ne semble pas être la bonne.

figure3

Figure 4

Premièrement, l’histogramme présente à la fois des TWh (térawatt/heure) dans la première barre et des ventes nettes en million de dollars dans la seconde. De plus, les pourcentages associés à chaque catégorie sont affichés à la droite des barres. Des lignes font le lien entre les deux barres pour nous aider à faire visuellement la comparaison. L’axe des Y, lui, présente uniquement les pourcentages. Lorsqu’on y jette un oeil rapide, on est enclin à penser que c’est la même mesure dans les deux cas. Il faut regarder un peu plus attentivement pour comprendre ce qu’ils ont voulu faire. En fait, on peut en déduire par exemple que même s’il y a beaucoup de ventes effectuées au Québec, ce ne sont pas les plus payantes.


Lorsqu’on utilise les histogrammes empilés, c’est que l’on considère que c’est la comparaison du total de chacune des barres qui est importante et non pas celle de chacune des différentes parts entres-elles.


Il certain que ce n’est pas la comparaison du total qui était voulu, mais bien de démontrer un lien entre les ventes versus le marché. Dans ce cas-ci, il est possible de faire mieux sans même empiler les valeurs, mais plutôt en les regroupant. Ci-dessous, un exemple de ce qui aurait pu être produit (figure 5).

figure 5

figure 5

N’hésitez pas à me transmettre aussi les bons ou mauvais exemples que vous rencontrez dans le cadre de votre travail. Cela pourrait éventuellement faire partie de l’un de mes articles.

Vous avez apprécié cette lecture ? Voici les différents articles de cette série sur les valeurs sûres dans le domaine de la visualisation de données :

» Les valeurs sûres dans le domaine de la visualisation de données – Les courbes

» Les valeurs sûres dans le domaine de la visualisation de données – Les barres horizontales

» Les valeurs sûres dans le domaine de la visualisation de données – Les tableaux

» Les valeurs sûres dans le domaine de la visualisation des données – L’encre informationnelle

Photo : LifeOfPix

auteur de l

Publié par: Karine Martel

Rédactrice de blogues depuis plusieurs années, je suis aussi formatrice et conférencière. Ayant une grande passion pour la visualisation de l'information, c'est ce sujet que j'aime principalement aborder.

Laisser un commentaire

loading