L'Analyse Statistique Multivariée dans Cartes & Données

[précédent] - [suivant] - [menu]

L'Analyse en Composantes Principales

Description

Le module d'A.C.P. prend en entrée plusieurs modules de données continues associées à un même fond de carte.
Le tableau de données est ainsi constitué de n individus (le nombre d'entités du fond de carte) caractérisés par p variables quantitatives (les données associées aux entités). Il constitue donc une matrice composée de n lignes et p colonnes.

Le but du module d'A.C.P. est de présenter l'information contenue dans ce tableau de dimension importante sous forme simplifiée.

Calculs

Le module va commencer par standardiser les données, c'est-à-dire les centrer et les réduire. Ensuite, il va constituer la matrice de corrélation entre les variables, puis trouver les vecteurs propres de cette matrice, ainsi que leur valeur propre associée. Il va alors calculer les coordonnées des individus et des variables sur ces vecteurs (pour la représentation graphique), ainsi que les autres paramètres (voir plus loin).

Les vecteurs propres donnent les axes factoriels. Ils sont déterminés de façon à rendre compte le mieux possible de la dispersion des données présentes dans la matrice.

Résultats

Certaines informations sont disponibles dans la fenêtre de paramétrage du module:

Les valeurs propres et le pourcentage d'information prise en compte par chaque axe factoriel:

L'histogramme des valeurs propres:

La représentation des individus (carrés rouges) et des variables (carrés bleus) dans le plan factoriel choisi:

Vous avez ainsi la possibilité de choisir deux axes, et de voir la représentation des individus et des variables dans ce plan factoriel.
Les deux premiers axes fournissent le maximum d'information pour la représentation graphique, mais vous pouvez choisir n'importe quels axes (de 1 à p).

Tous les résultats des calculs issus de l'A.C.P. sont disponibles sous forme de fichier texte en cliquant sur le bouton

Dans ce fichier, vous allez trouver:

  • la matrice initiale centrée réduite
  • les valeurs propres de la matrice de corrélation
  • les vecteurs propres de la matrice de corrélation
  • l'inertie totale du nuage
  • la hiérarchie entre les axes (le pourcentage de concentration de l'information de chaque axe donné par la valeur propre)
  • le cumul des hiérarchies entre les axes
  • les informations relatives à tous les axes, détaillées ci-dessous:

Pour chaque individu et chaque variable, les résultats sont de cinq types:

  • leurs coordonnées sur les axes factoriels, permettant de les situer par rapport au système d'axes.
  • leurs contributions aux axes factoriels, mesurant le rôle joué par chacun dans la formation de l'axe.
  • leurs qualités de représentation sur les axes factoriels, mesurant leur proximité avec les axes.
  • leurs parts dans l'inertie totale du nuage, donnant une idée de leur spécificité par rapport à la moyenne.
  • leurs poids relatifs, indiquant l'importance du rôle de chacun dans le traitement.

Interprétation

Les résultats détaillés ci-dessus doivent être interprétés avec précaution. En effet, les résultats ne sont affirmés que pour les valeurs les plus fortes (et les plus faibles) des coordonnées des individus et des variables.

Plus une coordonnée est proche de 0, moins l'axe correspondant est significatif (la variable ou l'individu participe de moins en moins à la structure mise en évidence par l'axe). Pour interpréter les coordonnées, il faut donc raisonner en terme d'opposition, et pour cela s'intéresser aux valeurs extrêmes.

Par ailleurs, on ne peut pas se contenter d'un seul axe (même du premier) pour avoir une idée claire de ce qui caractérise un individu en particulier, ou pour comparer deux individus entre eux. L'examen de plusieurs axes permet en revanche de reconstituer avec assez d'exactitude les caractéristiques spécifiques de chaque individu par rapport à l'ensemble des variables.

Cartographie

Le tableau contenant les coordonnées des individus sur tous les axes est fourni en sortie de ce module, dans le but de le faire suivre d'un module de Classification Ascendante Hiérarchique. Voir le chapitre suivant, description du module de C.A.H., pour plus de détails.

Pour plus de détails, vous pouvez vous reporter au livre suivant:
L'analyse statistique des données en géographie. Lena Sanders. Collection Alidade. Groupement d'Intérêt Public Reclus. Montpellier. 1989.

[précédent] - [suivant] - [menu]