Accueil
 

Opérateurs statistiques

(modules non disponibles dans "Cartes & Données Edition Personnelle")

Dans ce chapitre, vous allez apprendre à utiliser les possibilités offertes par les outils statistiques de Cartes & Données : réaliser un calcul, filtrer une donnée, effectuer une discrétisation d'une série statistique, et fusionner des entités géographiques.


Calcul

Nous allons découvrir l'utilisation du module Calcul à travers la réalisation d'une carte simple sur le pourcentage d'internautes dans la population des régions françaises en 1999. Nous avons pour cela besoin de deux données : le nombre d'internautes et la population de chaque région. Il suffit ensuite de diviser le nombre d'internautes par la population et multiplier le résultat par 100 pour obtenir notre pourcentage.

La mise en œuvre est extrêmement simple : on place sur l'organigramme un module "Carte", et on charge le fond de la France par régions. On place ensuite 2 modules "Données" et on les relie au fond de carte. Le premier donnera le nombre d'internautes et le second la population 99. Il suffit maintenant de placer un module calcul sur l'organigramme et de lui relier les deux données.

On peut alors représenter le résultat du calcul avec des plages de couleurs, après avoir discrétisé ce taux.

Dans le paramétrage du calcul, vous voyez la liste des données reliées (A : nombre d'internautes et B : population). Vous pouvez modifier l'ordre des entrées en les glissant verticalement, pour déterminer qui est A et qui est B. Ensuite vous pouvez utiliser ces lettres pour entrer votre formule de calcul dans la zone prévue à cet effet.

Suivant les cas de figures, il est possible de demander au Calcul de considérer une donnée invalide comme égale à 0. Cependant ici, il n'y a pas de donnée pour la Corse, et il s'agit bien d'une donnée manquante et non d'une valeur nulle (il y a certainement des internautes en Corse, mais nous ne savons pas combien). Il est donc nécessaire de laisser décochée la case "les données invalides sont considérées comme nulles".

Le résultat du calcul apparaît dans la colonne calcul de la fenêtre des données.

Cet organigramme est disponible dans les exemples fournis avec C&D dans le dossier "exemples_guide". Il s'appelle "guide_2.cd".


Filtre

Ce module permet d'effectuer des sélections sur les données statistiques.

Par exemple ici on va extraire la ville de TOURS et sa proche agglomération du fond de carte de l'Indre-et-Loire par communes.

Un module Carte permet de charger le fond de carte de l'Indre-et-Loire par communes. Pour sélectionner et extraire les communes qui nous intéressent, il faut utiliser le fichier donnant les distances des communes d'Indre & Loire à la ville de Tours.

C'est le rôle du module de données "Distance_a_Tours". Ensuite le module "Filtre" est relié à cette donnée et contient la formule "A<10" pour ne prendre que les communes à moins de 10 km de Tours. Si on avait plusieurs données, on aurait pu utiliser une formule mettant en jeu toutes les données en entrées, comme pour le module Calcul.

On peut préciser si le filtre doit fabriquer uniquement un "Fond de carte" ou bien s'il doit également reprendre les "Données continues" pour les remettre en sortie de module. Ce choix conditionne évidemment les modules que l'on pourra connecter après. Nous voulons ici un espace géographique qui va nous servir pour faire une représentation sur une autre donnée.

Notre filtre est devenu comme un nouveau module Carte, mais qui ne contient que les communes répondant à sa formule de sélection. Les communes retenues s'affichent dans une fenêtre distincte nommée "fenêtre de Filtre".

Nous avons représenté sur notre sélection la population 1999 des communes au moyen d'un symbole proportionnel.

Cet organigramme est disponible dans les exemples fournis avec C&D dans le dossier "exemples_guide". Il s'appelle "guide_3.cd".





Fusion

Le module Fusion permet de créer rapidement de nouveaux fonds de cartes en associant et en regroupant des entités géographiques. Ainsi, vous pouvez recréer des découpages qui vous sont propres (ex : sectorisation commerciales, Unités d'Action Sociale, etc.) à partir d'un fond de carte existant. Nous allons découvrir cette fonctionnalité en créant un zonage fictif à partir des départements français.

Pour réaliser une fusion, il est tout d'abord nécessaire d'attribuer un critère commun aux départements que nous souhaitons fusionner. Cette donnée sera identique pour tous les départements qui appartiennent à une même zone. Nous n'allons pas forcément utiliser une valeur chiffrée comme lors de l'utilisation du module Filtre.

Ici, nous allons "qualifier" nos départements suivant qu'ils appartiennent à une zone ou à une autre, par le nom de la zone dans laquelle ils se trouvent. Les données utilisées associent 5 valeurs aux zones : NORD, SUD, EST, OUEST, PARIS.

Le module Fusion va alors regrouper et "fondre" en un seul polygone tous les départements qui ont la même qualité. Il se comporte alors comme un nouveau fond de carte. Les entités ainsi créées possèdent alors leur propre fenêtre de tableur, comme tout fond de carte importé dans C&D. Celle-ci est nommée "fenêtre de Fusion", et contient 5 entités, soit autant que de données qualitatives différentes présentes dans le fichier de données utilisé pour la fusion.

Les entités fusionnées ont reçu automatiquement un identifiant donné par le module Fusion : la qualité utilisée pour réaliser l'opération. On peut maintenant associer des données à ces nouvelles zones, ou bien simplement les mettre en valeur comme ici avec un contour rouge.

Cet organigramme est disponible dans les exemples fournis avec C&D dans le dossier "exemples_guide". Il s'appelle "guide_4.cd".


Discrétisation

Les principes

Cette opération consiste à regrouper vos entités en classes afin de rendre possible la représentation en plages de couleurs. Si vous souhaitez représenter vos données sur une carte avec un dégradé de six couleurs, vous allez devoir regrouper vos entités en six groupes correspondant chacun à une couleur.

Attention, cette étape est déterminante pour le message que va transmettre la carte finale. En effet Cartes & Données (à partir de la version Premium) vous propose plusieurs types de discrétisation, en fonction de la nature de votre série de données et de la façon dont vous voulez les présenter :

  • Standard : cette discrétisation est adaptée pour les séries dites normales (conformes à la courbe de Gauss). Elle n'est pas adaptée pour mettre en exergue des valeurs exceptionnelles. Les classes sont centrées sur la moyenne et de largeur égale à un écart type.
  • Standard centrée zéro : identique à la discrétisation standard, les classes sont de largeur égale à un écart type, mais elles sont centrées sur zéro. Cette discrétisation est adaptée par exemple pour représenter les résultats d'une régression avec un dégradé de couleurs froides à couleurs chaudes.
  • Quantiles : les classes contiendront toutes le même nombre de valeurs (par exemple, pour 100 données et 5 classes, chaque classe contiendra 20 éléments). Comme pour la discrétisation standard, vous risquez de ne pas bien faire apparaître les valeurs exceptionnelles.
  • Moyennes emboîtées : pour effectuer cette discrétisation, on place dans un ensemble les valeurs inférieures à la moyenne et dans un autre celles supérieures à la moyenne. On divise alors chacun des deux ensembles obtenus de la même façon en calculant leur propre moyenne. On obtient donc quatre classes. On peut renouveler cette opération et obtenir alors huit classes.
  • Egales étendues : les classes auront toutes la même largeur : pour 5 classes, si le minimum est 0 et le maximum 100, les seuils de classe seront 20, 40, 60 et 80.
  • Jenks : cette discrétisation repose sur la notion de variance, c'est-à-dire sur la dispersion des valeurs de la donnée autour de la moyenne. Elle vise à minimiser la variance intra-classes (donc à maximiser l'homogénéité des classes), et à maximiser la variance inter-classes (donc à accroître les différences entre classes).
  • Observés : vous décidez vous-même des seuils de classes en vous aidant du diagramme de fréquences et du module "boîte et moustaches" dont nous détaillons le fonctionnement ci-dessous. Cette méthode est la seule disponible dans "Cartes & Données Edition Personnelle". Si vous utilisez cette version, vous devrez donc systématiquement saisir vos propres seuils ou importer des données déjà discrétisées dans Cartes & Données.

Vous apprendrez très rapidement à choisir la discrétisation la plus adaptée à votre problématique grâce aux outils statistiques à votre disposition et plus simplement à la sensibilité que vous allez acquérir à la vue de vos cartes.

La mise en oeuvre

Dans l'organigramme, le module "Discrétisation" est logiquement lié à un module "Données statistiques". La donnée statistique en question doit être de type "Donnée continue". L'exemple ci-dessous permet de bien comprendre combien la discrétisation peut influer sur l'aspect de la carte.

Nous avons utilisé le fond de carte de la France par régions puis la donnée "population". Nous utilisons également un module surface afin de calculer la surface de chaque région. Un module de calcul permet d'obtenir la densité, et c'est cette donnée qui va être discrétisée. Un module remplissage représentera les classes en couleurs.

Dans la fenêtre de paramétrage de la discrétisation, le premier onglet (Paramètres) permet de choisir les différents types de discrétisation disponibles. A droite on trouve les seuils de classes et en bas des informations sur la donnée. Dans le deuxième onglet, appelé Graphiques, vous trouvez une "Boîte et moustaches" et les diagrammes de fréquences et cumuls.

Si les discrétisations automatiques ne vous conviennent pas, on peut utiliser la discrétisation "Observée" qui permet de choisir manuellement les seuils de classes. Vous pouvez cliquer sur la flèche située sous la liste des seuils pour recopier automatiquement les seuils de la colonne "Automatique" dans la colonne "Observé". Vous pouvez alors modifier ces seuils en validant chaque saisie avec la touche "Flèche vers le bas" de votre clavier.

Après le choix définitif de la discrétisation, vous devez mettre à jour le remplissage en choisissant un dégradé de couleurs adapté à votre nombre de classes.

Il faudrait un livre entier pour décrire les différentes discrétisations. Essayez-les, variez les nombres de classes (cliquez sur "Appliquer" pour visualiser la nouvelle carte) et observez les changements dans la carte. Nous ne pouvons vous indiquer "LA" discrétisation dans cet exemple, car c'est un choix propre à chaque cartographe. Il vous appartient de trouver la discrétisation qui correspondra au message que vous souhaitez faire passer.

Cet organigramme est disponible dans les exemples fournis avec C&D dans le dossier "exemples_guide". Il s'appelle "guide_5.cd".


Boîte et moustaches

Ce module sert à afficher des indicateurs statistiques concernant une ou plusieurs données. Les résultats sont donnés à titre indicatif et ne peuvent être cartographiés (vous pouvez utiliser les fonctions du module calcul si vous souhaitez utiliser les variables statistiques pour une représentation cartographique : voir la référence technique de ce module).
Pour utiliser le module "Boîte et moustaches", il suffit de lier ce module à une ou plusieurs données continues. A droite de la boîte de dialogue apparaît la liste des données liées et à gauche les boîtes et moustaches correspondantes (voir la référence technique pour la description complète d'une boîte et moustache).
En cliquant sur le nom d'une donnée, vous faites apparaître une fenêtre affichant tous les indicateurs statistiques (écart type, moyenne...).
Dans le module discrétisation, vous disposez également d'une boîte et moustaches pour vous aider à choisir la meilleure méthode de discrétisation.


Démonstration visuelle

Nous avons déjà vu avec la discrétisation quelle influence pouvaient avoir les modules de calculs statistiques. Mais ce n'est pas le seul cas. Voici 4 traitements différents appliqués à la même donnée (vartiation de la population en France entre 1990 et 1999) et représentés par le même module de symboles (exemple "guide_6.cd") :


Fenêtres graphiques

Le bouton apparait dans plusieurs fenêtres de paramétrages (régression, boîte et moustaches..). Il permet de copier le graphique dans une fenêtre séparée, pour l'export, l'impression, la recherche, ou encore la comparaison avec d'autres graphiques :