L'Analyse en Composantes Principales
Description
Le module d'A.C.P. prend en entrée plusieurs modules de données
continues associées à un même fond de carte.
Le tableau de données est ainsi constitué de n individus
(le nombre d'entités du fond de carte) caractérisés
par p variables quantitatives (les données associées
aux entités). Il constitue donc une matrice composée de
n lignes et p colonnes.
Le but du module d'A.C.P. est de présenter l'information contenue
dans ce tableau de dimension importante sous forme simplifiée.
Calculs
Le module va commencer par standardiser les données, c'est-à-dire
les centrer et les réduire. Ensuite, il va constituer la matrice de
corrélation entre les variables, puis trouver les vecteurs propres
de cette matrice, ainsi que leur valeur propre associée. Il va alors
calculer les coordonnées des individus et des variables sur ces vecteurs
(pour la représentation graphique), ainsi que les autres paramètres
(voir plus loin).
Les vecteurs propres donnent les axes factoriels. Ils sont
déterminés de façon à rendre compte le mieux
possible de la dispersion des données présentes dans la matrice.
Résultats
Certaines informations sont disponibles dans la fenêtre de
paramétrage du module:
Les valeurs propres et le pourcentage d'information prise en compte par chaque
axe factoriel:
L'histogramme des valeurs propres:
La représentation des individus (carrés rouges) et des variables
(carrés bleus) dans le plan factoriel choisi:
Vous avez ainsi la possibilité de choisir deux axes, et de voir la
représentation des individus et des variables dans ce plan
factoriel.
Les deux premiers axes fournissent le maximum d'information pour la
représentation graphique, mais vous pouvez choisir n'importe quels
axes (de 1 à p).
Tous les résultats des calculs issus de l'A.C.P. sont disponibles
sous forme de fichier texte en cliquant sur le bouton
Dans ce fichier, vous allez trouver:
-
la matrice initiale centrée réduite
-
les valeurs propres de la matrice de corrélation
-
les vecteurs propres de la matrice de corrélation
-
l'inertie totale du nuage
-
la hiérarchie entre les axes (le pourcentage de concentration de
l'information de chaque axe donné par la valeur propre)
-
le cumul des hiérarchies entre les axes
-
les informations relatives à tous les axes, détaillées
ci-dessous:
Pour chaque individu et chaque variable, les résultats sont de cinq
types:
-
leurs coordonnées sur les axes factoriels, permettant de les situer
par rapport au système d'axes.
-
leurs contributions aux axes factoriels, mesurant le rôle joué
par chacun dans la formation de l'axe.
-
leurs qualités de représentation sur les axes factoriels, mesurant
leur proximité avec les axes.
-
leurs parts dans l'inertie totale du nuage, donnant une idée de leur
spécificité par rapport à la moyenne.
-
leurs poids relatifs, indiquant l'importance du rôle de chacun dans
le traitement.
Interprétation
Les résultats détaillés ci-dessus doivent être
interprétés avec précaution. En effet, les résultats
ne sont affirmés que pour les valeurs les plus fortes (et les plus
faibles) des coordonnées des individus et des variables.
Plus une coordonnée est proche de 0, moins l'axe correspondant est
significatif (la variable ou l'individu participe de moins en moins à
la structure mise en évidence par l'axe). Pour interpréter
les coordonnées, il faut donc raisonner en terme d'opposition, et
pour cela s'intéresser aux valeurs extrêmes.
Par ailleurs, on ne peut pas se contenter d'un seul axe (même du premier)
pour avoir une idée claire de ce qui caractérise un individu
en particulier, ou pour comparer deux individus entre eux. L'examen de plusieurs
axes permet en revanche de reconstituer avec assez d'exactitude les
caractéristiques spécifiques de chaque individu par rapport
à l'ensemble des variables.
Cartographie
Le tableau contenant les coordonnées des individus sur tous les
axes est fourni en sortie de ce module, dans le but de le faire suivre
d'un module de Classification Ascendante Hiérarchique. Voir le chapitre
suivant, description du module de C.A.H., pour plus de détails.
Pour plus de détails, vous pouvez vous reporter
au livre suivant:
L'analyse statistique des données en géographie. Lena Sanders.
Collection Alidade. Groupement d'Intérêt Public Reclus. Montpellier.
1989.
|