Accueil
 

LES SOLUTIONS AVEC
Cartes & Données

Banque_RegressionAgencesPop.cd


Cette carte toute simple en apparence cache un raisonnement particulièrement astucieux : la recherche des points extrêmes dans la relation entre la population et le nombre d'agences bancaires.

  Prenons la population des communes d'Indre & Loire. Y a-t-il une relation avec le nombre d'agences ? Probablement ! La régression nous le dira :

  Effectivement, la corrélation paraît bonne, la valeur de 0.979 du coefficient le confirme. Comment se présente cette donnée de régression ?

  La discrétisation par méthode gaussienne (standard) paraît adéquate vue la forme de la donnée. Comme c'est une régression, on peut prendre la discrétisation standard centrée sur zéro, au lieu de la centrer sur la moyenne, ainsi les 3 premières classes représenteront exactement toutes les valeurs négatives, et les 3 dernières, les valeurs positives.

  Le reste suit naturellement, un remplissage où les classes extrêmes sont très foncées par rapport aux autres, et un filtre qui va isoler les valeurs extrêmes avec la formule : "a<-1.6 | a>1.6" (1.6 est la valeur seuil des classes extrêmes).
Le contour noir renforce les communes extrêmes, alors que le remplissage nous dit si c'est positif (sur-représentation bancaire) ou négatif (sous-représentation).

  Attention à ne pas inverser les entrées de la régression, le nombre d'agences doit être en ordonnées du graphique, c'est-à-dire que le module donnant le nombre d'agences doit être le second. Sinon les couleurs seront inversées.