LES SOLUTIONS AVEC
Cartes & Données
Banque_RegressionAgencesPop.cd
Cette carte toute simple en apparence cache un raisonnement particulièrement astucieux : la recherche des points
extrêmes dans la relation entre la population et le nombre d'agences bancaires.

Prenons la population des communes d'Indre & Loire. Y
a-t-il une relation avec le nombre d'agences ? Probablement ! La régression nous le dira :

Effectivement, la corrélation paraît bonne, la
valeur de 0.979 du coefficient le confirme. Comment se présente cette donnée de régression ?

La discrétisation par méthode gaussienne
(standard) paraît adéquate vue la forme de la donnée. Comme c'est une régression, on peut
prendre la discrétisation standard centrée sur zéro, au lieu de la centrer sur la moyenne, ainsi
les 3 premières classes représenteront exactement toutes les valeurs négatives, et les 3
dernières, les valeurs positives.
Le reste suit naturellement, un remplissage où les
classes extrêmes sont très foncées par rapport aux autres, et un filtre qui va isoler les valeurs
extrêmes avec la formule : "a<-1.6 | a>1.6" (1.6 est la valeur seuil des classes extrêmes).
Le contour noir renforce les communes extrêmes, alors que le remplissage nous dit si c'est positif
(sur-représentation bancaire) ou négatif (sous-représentation).
Attention à ne pas inverser les entrées de la
régression, le nombre d'agences doit être en ordonnées du graphique, c'est-à-dire que le
module donnant le nombre d'agences doit être le second. Sinon les couleurs seront inversées.
|