Accueil
 

regression.cd


La régression linéaire est une méthode qui permet d'estimer à quel point un phénomène en explique un autre. On vérifie s'il y a ou non corrélation entre deux variables. Dans l'exemple suivant, nous allons essayer d'estimer s'il existe un rapport entre le nombre de médecin et la population dans les régions française.

Notre organigramme comporte tout d'abord un module Carte avec le fond de carte de la France par régions (france_region.vxf). Deux modules Données y sont reliés : l'un contient le nombre de généralistes en 2006 (nb_medecin.xls), l'autre la population en 2006 (nb_medecin.xls / population estimée au 1er janv. 2006). Ces deux modules sont reliés vers le même module de Régression.

Le module Régression fournit dans sa fenêtre de paramétrage le graphique en nuage de points, la droite de régression et le coefficient de corrélation linéaire qui permettent d'estimer et de qualifier le rapport entre les deux phénomènes.

Pour une bonne corrélation, le coefficient doit être proche de un, et les points rouges doivent être proches de la droite. Dans le cas contraire, il est inutile d'aller plus loin, les deux données ne sont pas corrélées, en tous cas pas directement.

Le module Régression produit également une donnée qui peut être cartographiée : les résidus de régression linéaire. Ces valeurs représentent les disproportions de médecins pour chaque région par rapport à la "norme" nationale. Dans cet exemple, elles sont positives s'il y a une disproportion en faveur des médecins, et négatives s'il y a une disproportion en faveur de la population. Ces données sont ensuite discrétisées en reliant le module Régression à un module Discrétisation. Ces données sont ensuite affichées en plages de couleurs sur la carte au moyen d'un module Remplissage dans lequel on choisira une palette double (ici rouge-verte) pour montrer la double progression dans le positif et le négatif.


Référence technique