regression.cd
La régression linéaire est une méthode qui permet d'estimer à quel point un
phénomène en explique un autre. On vérifie s'il y a ou non corrélation entre deux
variables. Dans l'exemple suivant, nous allons essayer d'estimer s'il existe un rapport entre le nombre de
médecin et la population dans les régions française.

Notre organigramme comporte tout d'abord un module Carte avec le fond de carte de la France par régions
(france_region.vxf). Deux modules Données y sont reliés : l'un contient le nombre de
généralistes en 2006 (nb_medecin.xls), l'autre la population en 2006 (nb_medecin.xls / population
estimée au 1er janv. 2006). Ces deux modules sont reliés vers le même module de
Régression.
Le module Régression fournit dans sa fenêtre de paramétrage le graphique en nuage de points, la
droite de régression et le coefficient de corrélation linéaire qui permettent d'estimer et de
qualifier le rapport entre les deux phénomènes.

Pour une bonne corrélation, le coefficient doit être proche de un, et les points rouges doivent
être proches de la droite. Dans le cas contraire, il est inutile d'aller plus loin, les deux données ne
sont pas corrélées, en tous cas pas directement.
Le module Régression produit également une donnée qui peut être cartographiée :
les résidus de régression linéaire. Ces valeurs représentent les disproportions de
médecins pour chaque région par rapport à la "norme" nationale. Dans cet exemple, elles sont
positives s'il y a une disproportion en faveur des médecins, et négatives s'il y a une disproportion en
faveur de la population. Ces données sont ensuite discrétisées en reliant le module
Régression à un module Discrétisation. Ces données sont ensuite affichées en plages
de couleurs sur la carte au moyen d'un module Remplissage dans lequel on choisira une palette double (ici rouge-verte)
pour montrer la double progression dans le positif et le négatif.
Référence technique
|