1. Livres & vidéos
  2. Data visualisation avec Tableau Desktop
  3. Exercice final
Extrait - Data visualisation avec Tableau Desktop Des graphiques aux tableaux de bord interactifs
Extraits du livre
Data visualisation avec Tableau Desktop Des graphiques aux tableaux de bord interactifs Revenir à la page d'achat du livre

Exercice final

Présentation

Comme vous avez dû l’éprouver à la lecture de ce livre, maîtriser la visualisation de données demande à la fois théorie et pratique ; néanmoins, si la théorie peut être comprise rapidement, la pratique exige plus de temps. Pour conclure, nous vous invitons donc à réaliser un projet Tableau complet : représenter sur un graphique en hémicycle l’équilibre des forces politiques d’une assemblée d’élus.

Peut-être avez-vous sauté quelques chapitres ? Peut-être même voulez-vous commencer par mesurer votre connaissance de Tableau avant de voir quels sont les chapitres dont vous auriez besoin ? Ce chapitre, présenté comme une série d’exercices, ne suppose pas que vous ayez lu tout le livre. La solution corrigée présente une explication accessible à un novice, quitte à vous renvoyer sur le chapitre correspondant pour plus de détails.

Au moment de l’écriture de ces lignes, un gouvernement a été censuré pour la première fois depuis plus de soixante ans ; le nouveau Premier ministre semble fragile, et le spectre d’une dissolution revient planer sur l’Assemblée. L’exemple choisi pour notre graphique en hémicyle, l’Assemblée nationale...

Développer le projet

Voici donc la série d’exercices ; vous trouverez les solutions à la fin de ce chapitre.

Organiser les données

Vous pouvez télécharger le fichier de données utilisé depuis la page Informations générales, ou bien aller chercher une version plus à jour. Le résultat final est également mis à disposition. 

Source de données et inspirations

Le site web de l’Assemblée (www.assemblee-nationale.fr) comporte une partie open data (https://data.assemblee-nationale.fr), sur laquelle on trouve facilement la liste des députés sous différents formats techniques (data.assemblee-nationale.fr/acteurs/deputes-en-exercice). La version Fichier .CSV - liste des députés en format Excel comporte tout ce dont nous avons besoin :

  • une granularité au siège, autrement dit une ligne de données correspond à un député ;

  • un identifiant numérique unique ;

  • le groupe politique de chaque député.

images/16SOB103.png

Le fichier de données

Toujours sur le site web de l’Assemblée, la partie Vos députés - Groupes politiques présente également une représentation intitulée Répartition des groupes politiques dans l’hémicycle qui nous aidera à objectiver la position politique exacte de chaque groupe.

Les données de remplissage

Notre objectif est d’utiliser une représentation en camembert en faisant tenir toutes les données utiles dans la moitié supérieure du camembert, afin d’obtenir un hémicycle. Pour cela, il faut donc falloir rajouter des données fictives en nombre exactement égal, afin qu’elles occupent l’autre moitié du camembert.

images/16SOB104.png

Principe du demi-camembert

Exercice 1 : ajouter des données fictives**

Il serait facile d’utiliser Excel ou n’importe quel autre outil pour modifier le fichier de données et lui rajouter des lignes de données fictives, mais Tableau dispose d’une fonctionnalité qui va nous permettre de faire encore plus simple et d’éviter de modifier le fichier source. Pouvez-vous imaginer laquelle ?

images/16SOB105.png

Indice :...

Faire le bilan

Nous n’avons utilisé qu’un seul type de graphique, généralement considéré comme le plus simple, et pourtant les défis techniques étaient au rendez-vous. Il nous a fallu quelque 80 pages pour faire un demi-camembert !

Histoire de faire un petit bilan, voici l’ensemble des notions techniques que nous avons utilisées au cours de ce cas pratique :

  • requête Union ;

  • compteur de lignes ;

  • champ calculé ;

  • constructions conditionnelles IF et CASE ;

  • formule de tri ;

  • dimension versus mesure ;

  • discret versus continu ;

  • propriétés par défaut (agrégation, format numérique) ;

  • propagation des NULL ;

  • médiane, centile ;

  • expressions LOD ;

  • priorités de tri ;

  • alias ;

  • attribut, fonction ATTR ;

  • calcul de table ;

  • adressage versus partitionnement ;

  • groupe ;

  • axe double ;

  • camembert double ;

  • paramètre ;

  • formule de filtre ;

  • fonction RANDOM ;

  • tableau de bord et disposition en conteneurs ;

  • action.

Nous espérons que vous aurez trouvé ce cas pratique instructif et divertissant ! Pour ceux qui ont l’esprit de compétition, ce projet comporte 45 exercices pour un total de 74 étoiles. Nous vous invitions donc à compter vos points et à vous vanter de votre score auprès...

Solutions commentées

Solutions commentées de la partie Données

Exercice 1 : ajouter des données fictives**

La solution consiste à faire une union entre le fichier et une seconde version de lui-même.

 Dans l’onglet Source de données, faites un clic droit sur la table liste_deputes_excel.csv et choisissez Convertir en union.

 La fenêtre Union s’ouvre, glissez-y à nouveau le fichier Liste_deputes_excel.csv depuis le volet de gauche, puis cliquez sur OK pour valider l’union.

images/16SOB106.png

Mettre en place l’union

 Juste pour rendre les choses plus explicites, faites un nouveau clic droit sur la table, choisissez Renommer et nommez la table Union.

En base de données, l’union est un type de requête consistant à mettre l’une à la suite de l’autre deux tables comportant les mêmes colonnes. Pour en savoir plus, vous pouvez vous reporter au chapitre Requêtes complexes.

 Si les données n’apparaissent pas, cliquez sur Rafraîchir.

 Passez sur une feuille de calcul. Vous pouvez constater que Tableau a l’excellente idée d’ajouter automatiquement un champ Nom de la table, qui permet de différencier les données issues de l’une ou l’autre table, le nom de la seconde étant suffixé par 1.

images/16SOB107.png

Le champ automatique Nom de la table

Nous avons maintenant obtenu le jeu de données qui nous donnera un camembert dont les députés constitueront exactement la moitié et les données fictives l’autre moitié.

Une solution alternative consisterait à faire un produit cartésien avec une source de données comportant exactement deux lignes, par exemple une unique colonne Type de donnée dont les deux valeurs seraient « député » et « fictif ». Dans la pratique, c’est un peu plus compliqué à mettre en place, car Tableau n’accepte pas les produits cartésiens ; il faudrait donc déguiser ce produit cartésien, par exemple en faisant une jointure sur deux Calculs de relation envoyant toujours la même valeur (voir le chapitre Requêtes complexes). Dans notre cas, le produit cartésien serait une solution parfaitement fonctionnelle, mais l’union s’avère...