Analyse en Composantes Principales
| Entrées |
Données continues (nombre illimité, minimum 2) |
| Sortie |
Matrice spécifique A.C.P. |
Ecran :

Description :
Le but d'une Analyse en Composantes Principales est de résumer et de hiérarchiser l'information contenue
dans la matrice constituée de n lignes (n étant le nombre d'entités du fond de
carte) et de p colonnes (p étant le nombre de données en entrées). Les
entités du fond de carte sont appelées les individus, et les données en entrées sont
appelées les variables.
Calculs :
- Standardiser les données : les données sont centrées et réduites ( xi = ( xi -
moyenne de x ) / écart-type de x ).
- Constituer la matrice de corrélation entre les variables. Cette matrice est carrée
symétrique d'ordre p (dans la case (i,j), on place le coefficient de corrélation entre la
variable i et la variable j).
- Trouver les vecteurs propres de la matrice de corrélation, ainsi que leur valeur propre
associée.
- Calculer les coordonnées des individus et des variables sur ces vecteurs, pour la représentation
graphique.
- Calculer les autres paramètres (voir ci-dessous).
Interprétation :
Les vecteurs propres donnent les axes factoriels, et en choisissant deux axes, on peut représenter les
individus et les variables sur le graphique ci-dessus.
Les axes factoriels sont déterminés de façon à rendre compte le mieux possible de la
dispersion des données présentes dans la matrice. Les deux premiers fournissent le maximum d'information
pour la représentation graphique, mais vous pouvez choisir n'importe quels axes.
Graphiques :
Sous chaque graphique, vous trouverez un bouton : permettant de créer une nouvelle
"fenêtre graphique" à partir du dessin courant. Cette fenêtre vous permettra de comparer
plusieurs graphiques, de les exporter ou de les imprimer.
Résultats :
Dans le tableau situé en bas à gauche de la fenêtre de paramétrage se trouvent les valeurs
propres et le pourcentage d'information prise en compte par l'axe correspondant. Le graphique situé en bas
à droite représente l'histogramme des valeurs propres. En cliquant sur un rectangle rouge (qui
représente la valeur propre), le numéro de la valeur propre sélectionnée s'affiche
au-dessus du graphique.
Dans le graphique situé en haut à droite se trouve la représentation des individus
(carrés rouges) et des variables (carrés bleus) dans le plan factoriel choisi. En effet,
l'axe horizontal correspond à l'axe que vous avez sélectionné dans le champ de saisie axe
1, et l'axe vertical à celui du champ de saisie axe 2. Ces axes sont compris entre 1 et le nombre de
données en entrée.
En cliquant sur un carré rouge ou bleu, le nom de l'individu ou de la variable en question s'affiche sous le
graphique. Si vous voulez connaître précisément les coordonnées d'une variable ou d'un
individu dans le plan factoriel, il vous faut cliquer sur le bouton Sauvegarder les résultats et lire le
fichier créé.
En changeant la taille de la fenêtre, les dessins s'adapteront automatiquement
à la nouvelle taille.
Si la case tous les axes est cochée, les calculs sont effectués pour tous les axes, sinon ils
sont effectués seulement pour les 2 axes choisis, ce qui réduit le temps de calcul (surtout dans le cas
où le nombre d'entrées du module est important), ainsi que la taille du fichier de résultats.
En cliquant sur le bouton Sauvegarder les résultats, vous allez créer un fichier texte dans
lequel seront inscrits tous les résultats de l'A.C.P.
Dans ce fichier, vous allez trouver :
- la matrice initiale centrée réduite
- les valeurs propres de la matrice de corrélation
- les vecteurs propres de la matrice de corrélation
- l'inertie totale du nuage
- la hiérarchie entre les axes (le pourcentage de concentration de l'information de chaque axe donné
par la valeur propre)
- le cumul des hiérarchies entre les axes
-
les informations relatives :
- à tous les axes, si vous avez coché la case tous les axes
- aux 2 axes souhaités, si vous avez coché la case 2 axes
Les informations relatives aux axes sont les suivantes :
Pour chaque individu et chaque variable, les résultats sont de cinq types :
- leurs coordonnées sur les axes choisis, permettant de les situer par rapport au système
d'axes.
- leurs contributions aux axes choisis, mesurant le rôle joué par chacun dans la formation de
l'axe.
- leurs qualités de représentation sur les axes choisis, mesurant leur proximité avec les
axes.
- leurs parts dans l'inertie totale du nuage, donnant une idée de leur spécificité par rapport
à la moyenne.
- leurs poids relatifs, indiquant l'importance du rôle de chacun dans le traitement.
Sortie :
Le tableau contenant les coordonnées des individus sur tous les axes est fourni en sortie, dans le but de faire
une Classification Ascendante Hiérarchique à la suite de ce module. Voir le module de
C.A.H. pour plus de détails sur cette classification.
Notions de statistiques :
Les résultats détaillés ci-dessus doivent être interprétés avec
précaution. En effet, les résultats ne sont affirmés que pour les valeurs les plus fortes (et les
plus faibles) des coordonnées des individus et des variables.
Plus une coordonnée est proche de 0, moins l'axe correspondant est significatif (la variable ou l'individu
participe de moins en moins à la structure mise en évidence par l'axe). Pour interpréter les
coordonnées, il faut donc raisonner en terme d'opposition, et pour cela s'intéresser aux valeurs
extrêmes.
Par ailleurs, on ne peut pas se contenter d'un seul axe (même du premier) pour avoir une idée claire de
ce qui caractérise un individu en particulier, ou pour comparer deux individus entre eux. L'examen de plusieurs
axes permet en revanche de reconstituer avec assez d'exactitude les caractéristiques spécifiques de
chaque individu par rapport à l'ensemble des variables.
Pour plus de détails, vous pouvez vous reporter au livre suivant :
L'analyse statistique des données en géographie. Lena Sanders. Collection Alidade. Groupement
d'Intérêt Public Reclus. Montpellier. 1989.
Script :
2 module untyped_list ""
3 mod_type integer "103"
3 mod_subtype integer "520"
3 mod_name string "ACP"
3 mod_dads integer_list ""
4 ? integer "10"
4 ? integer "9"
4 ? integer "8"
4 ? integer "7"
4 ? integer "6"
4 ? integer "5"
4 ? integer "4"
3 all_axis boolean "F"
3 axis1 integer "1"
3 axis2 integer "2"
3 ind_nb integer "20"
3 var_nb integer "7"
Exemple d'utilisation
|