Opérateurs statistiques
(modules non disponibles dans "Cartes & Données Edition Personnelle")
Dans ce chapitre, vous allez apprendre à utiliser les possibilités offertes par les outils
statistiques de Cartes & Données : réaliser un calcul, filtrer une donnée, effectuer une
discrétisation d'une série statistique, et fusionner des entités géographiques.
Calcul
Nous allons découvrir l'utilisation du module Calcul à travers la réalisation d'une carte
simple sur le pourcentage d'internautes dans la population des régions françaises en 1999. Nous avons
pour cela besoin de deux données : le nombre d'internautes et la population de chaque région. Il suffit
ensuite de diviser le nombre d'internautes par la population et multiplier le résultat par 100 pour obtenir
notre pourcentage.
La mise en œuvre est extrêmement simple : on place sur l'organigramme un module "Carte", et on charge le
fond de la France par régions. On place ensuite 2 modules "Données" et on les relie au fond de carte. Le
premier donnera le nombre d'internautes et le second la population 99. Il suffit maintenant de placer un module calcul
sur l'organigramme et de lui relier les deux données.
On peut alors représenter le résultat du calcul avec des plages de couleurs, après avoir
discrétisé ce taux.
Dans le paramétrage du calcul, vous voyez la liste des données reliées (A : nombre
d'internautes et B : population). Vous pouvez modifier l'ordre des entrées en les glissant verticalement, pour
déterminer qui est A et qui est B. Ensuite vous pouvez utiliser ces lettres pour entrer votre formule de calcul
dans la zone prévue à cet effet.
Suivant les cas de figures, il est possible de demander au Calcul de considérer une donnée invalide
comme égale à 0. Cependant ici, il n'y a pas de donnée pour la Corse, et il s'agit bien d'une
donnée manquante et non d'une valeur nulle (il y a certainement des internautes en Corse, mais nous ne savons
pas combien). Il est donc nécessaire de laisser décochée la case "les données invalides
sont considérées comme nulles".
Le résultat du calcul apparaît dans la colonne calcul de la fenêtre des données.
Cet organigramme est disponible dans les exemples fournis avec C&D dans le dossier "exemples_guide". Il
s'appelle "guide_2.cd".

Filtre
Ce module permet d'effectuer des sélections sur les données statistiques.
Par exemple ici on va extraire la ville de TOURS et sa proche agglomération du fond de carte de
l'Indre-et-Loire par communes.
Un module Carte permet de charger le fond de carte de l'Indre-et-Loire par communes. Pour sélectionner et
extraire les communes qui nous intéressent, il faut utiliser le fichier donnant les distances des communes
d'Indre & Loire à la ville de Tours.
C'est le rôle du module de données "Distance_a_Tours". Ensuite le module "Filtre" est relié
à cette donnée et contient la formule "A<10" pour ne prendre que les communes à moins de 10 km
de Tours. Si on avait plusieurs données, on aurait pu utiliser une formule mettant en jeu toutes les
données en entrées, comme pour le module Calcul.
On peut préciser si le filtre doit fabriquer uniquement un "Fond de carte" ou bien s'il doit également
reprendre les "Données continues" pour les remettre en sortie de module. Ce choix conditionne évidemment
les modules que l'on pourra connecter après. Nous voulons ici un espace géographique qui va nous servir
pour faire une représentation sur une autre donnée.
Notre filtre est devenu comme un nouveau module Carte, mais qui ne contient que les communes répondant
à sa formule de sélection. Les communes retenues s'affichent dans une fenêtre distincte
nommée "fenêtre de Filtre".
Nous avons représenté sur notre sélection la population 1999 des communes au moyen d'un symbole
proportionnel.
Cet organigramme est disponible dans les exemples fournis avec C&D dans le dossier "exemples_guide". Il
s'appelle "guide_3.cd".
Fusion
Le module Fusion permet de créer rapidement de nouveaux fonds de cartes en associant et en regroupant des
entités géographiques. Ainsi, vous pouvez recréer des découpages qui vous sont propres (ex
: sectorisation commerciales, Unités d'Action Sociale, etc.) à partir d'un fond de carte existant. Nous
allons découvrir cette fonctionnalité en créant un zonage fictif à partir des
départements français.
Pour réaliser une fusion, il est tout d'abord nécessaire d'attribuer un critère commun aux
départements que nous souhaitons fusionner. Cette donnée sera identique pour tous les départements
qui appartiennent à une même zone. Nous n'allons pas forcément utiliser une valeur chiffrée
comme lors de l'utilisation du module Filtre.
Ici, nous allons "qualifier" nos départements suivant qu'ils appartiennent à une zone ou à une
autre, par le nom de la zone dans laquelle ils se trouvent. Les données utilisées associent 5 valeurs aux
zones : NORD, SUD, EST, OUEST, PARIS.
Le module Fusion va alors regrouper et "fondre" en un seul polygone tous les départements qui ont la
même qualité. Il se comporte alors comme un nouveau fond de carte. Les entités ainsi
créées possèdent alors leur propre fenêtre de tableur, comme tout fond de carte
importé dans C&D. Celle-ci est nommée "fenêtre de Fusion", et contient 5 entités, soit
autant que de données qualitatives différentes présentes dans le fichier de données
utilisé pour la fusion.
Les entités fusionnées ont reçu automatiquement un identifiant donné par le module
Fusion : la qualité utilisée pour réaliser l'opération. On peut maintenant associer des
données à ces nouvelles zones, ou bien simplement les mettre en valeur comme ici avec un contour
rouge.
Cet organigramme est disponible dans les exemples fournis avec C&D dans le dossier "exemples_guide". Il
s'appelle "guide_4.cd".

Discrétisation
Les principes
Cette opération consiste à regrouper vos entités en classes afin de rendre possible la
représentation en plages de couleurs. Si vous souhaitez représenter vos données sur une carte avec
un dégradé de six couleurs, vous allez devoir regrouper vos entités en six groupes correspondant
chacun à une couleur.
Attention, cette étape est déterminante pour le message que va transmettre la carte finale. En effet
Cartes & Données (à partir de la version Premium) vous propose plusieurs types de
discrétisation, en fonction de la nature de votre série de données et de la façon dont vous
voulez les présenter :
- Standard : cette discrétisation est adaptée pour les séries dites normales (conformes
à la courbe de Gauss). Elle n'est pas adaptée pour mettre en exergue des valeurs exceptionnelles. Les
classes sont centrées sur la moyenne et de largeur égale à un écart type.
- Standard centrée zéro : identique à la discrétisation standard, les classes
sont de largeur égale à un écart type, mais elles sont centrées sur zéro. Cette
discrétisation est adaptée par exemple pour représenter les résultats d'une
régression avec un dégradé de couleurs froides à couleurs chaudes.
- Quantiles : les classes contiendront toutes le même nombre de valeurs (par exemple, pour 100
données et 5 classes, chaque classe contiendra 20 éléments). Comme pour la discrétisation
standard, vous risquez de ne pas bien faire apparaître les valeurs exceptionnelles.
- Moyennes emboîtées : pour effectuer cette discrétisation, on place dans un ensemble
les valeurs inférieures à la moyenne et dans un autre celles supérieures à la moyenne. On
divise alors chacun des deux ensembles obtenus de la même façon en calculant leur propre moyenne. On
obtient donc quatre classes. On peut renouveler cette opération et obtenir alors huit classes.
- Egales étendues : les classes auront toutes la même largeur : pour 5 classes, si le minimum
est 0 et le maximum 100, les seuils de classe seront 20, 40, 60 et 80.
- Jenks : cette discrétisation repose sur la notion de variance, c'est-à-dire sur la
dispersion des valeurs de la donnée autour de la moyenne. Elle vise à minimiser la variance
intra-classes (donc à maximiser l'homogénéité des classes), et à maximiser la
variance inter-classes (donc à accroître les différences entre classes).
- Observés : vous décidez vous-même des seuils de classes en vous aidant du diagramme de
fréquences et du module "boîte et moustaches" dont nous détaillons le fonctionnement ci-dessous.
Cette méthode est la seule disponible dans "Cartes & Données Edition Personnelle". Si vous utilisez
cette version, vous devrez donc systématiquement saisir vos propres seuils ou importer des données
déjà discrétisées dans Cartes & Données.
Vous apprendrez très rapidement à choisir la discrétisation la plus adaptée à
votre problématique grâce aux outils statistiques à votre disposition et plus simplement à
la sensibilité que vous allez acquérir à la vue de vos cartes.
La mise en oeuvre
Dans l'organigramme, le module "Discrétisation" est logiquement lié à un module "Données
statistiques". La donnée statistique en question doit être de type "Donnée continue". L'exemple
ci-dessous permet de bien comprendre combien la discrétisation peut influer sur l'aspect de la carte.
Nous avons utilisé le fond de carte de la France par régions puis la donnée "population". Nous
utilisons également un module surface afin de calculer la surface de chaque région. Un module de calcul
permet d'obtenir la densité, et c'est cette donnée qui va être discrétisée. Un module
remplissage représentera les classes en couleurs.
Dans la fenêtre de paramétrage de la discrétisation, le premier onglet (Paramètres)
permet de choisir les différents types de discrétisation disponibles. A droite on trouve les seuils de
classes et en bas des informations sur la donnée. Dans le deuxième onglet, appelé Graphiques, vous
trouvez une "Boîte et moustaches" et les diagrammes de fréquences et cumuls.
Si les discrétisations automatiques ne vous conviennent pas, on peut utiliser la discrétisation
"Observée" qui permet de choisir manuellement les seuils de classes. Vous pouvez cliquer sur la flèche
située sous la liste des seuils pour recopier automatiquement les seuils de la colonne "Automatique" dans la
colonne "Observé". Vous pouvez alors modifier ces seuils en validant chaque saisie avec la touche "Flèche
vers le bas" de votre clavier.
Après le choix définitif de la discrétisation, vous devez mettre à jour le remplissage
en choisissant un dégradé de couleurs adapté à votre nombre de classes.
Il faudrait un livre entier pour décrire les différentes discrétisations. Essayez-les, variez
les nombres de classes (cliquez sur "Appliquer" pour visualiser la nouvelle carte) et observez les changements dans la
carte. Nous ne pouvons vous indiquer "LA" discrétisation dans cet exemple, car c'est un choix propre à
chaque cartographe. Il vous appartient de trouver la discrétisation qui correspondra au message que vous
souhaitez faire passer.
Cet organigramme est disponible dans les exemples fournis avec C&D dans le dossier "exemples_guide". Il
s'appelle "guide_5.cd".

Boîte et moustaches
Ce module sert à afficher des indicateurs statistiques concernant une ou plusieurs données. Les
résultats sont donnés à titre indicatif et ne peuvent être cartographiés (vous pouvez
utiliser les fonctions du module calcul si vous souhaitez utiliser les variables statistiques pour une
représentation cartographique : voir la référence technique de
ce module).
Pour utiliser le module "Boîte et moustaches", il suffit de lier ce module à une ou plusieurs
données continues. A droite de la boîte de dialogue apparaît la liste des données
liées et à gauche les boîtes et moustaches correspondantes (voir la référence technique pour la description complète d'une boîte
et moustache).
En cliquant sur le nom d'une donnée, vous faites apparaître une fenêtre affichant tous les
indicateurs statistiques (écart type, moyenne...).
Dans le module discrétisation, vous disposez également d'une boîte et moustaches pour vous aider
à choisir la meilleure méthode de discrétisation.

Démonstration visuelle
Nous avons déjà vu avec la discrétisation quelle influence pouvaient avoir les modules de
calculs statistiques. Mais ce n'est pas le seul cas. Voici 4 traitements différents appliqués à la
même donnée (vartiation de la population en France entre 1990 et 1999) et représentés par le
même module de symboles (exemple "guide_6.cd") :




Fenêtres graphiques
Le bouton apparait dans plusieurs fenêtres de paramétrages
(régression, boîte et moustaches..). Il permet de copier le graphique dans une fenêtre
séparée, pour l'export, l'impression, la recherche, ou encore la comparaison avec d'autres graphiques
:

|