Accueil
 

Analyse factorielle des correspondances

Entrées Données qualitatives (nombre illimité)
ou
1 Matrice spécifique A.F.C.
Sortie Donnée qualitative

Paramètres

Description :

Le but de l’Analyse Factorielle des Correspondances est le même que celui de l’analyse en composantes principales : elle consiste en la recherche d’une hiérarchisation de l’information contenue dans une matrice constituée de n lignes (n étant le nombre d'entités du fond de carte) et de p colonnes (p étant le nombre de données en entrées).
L’AFC présente le grand intérêt de permettre le traitement de variables qualitatives et de mettre en évidence des structures qui ne sont pas nécessairement linéaires.
Attention, les différentes qualités ne sont pas considérées comme ordonnées, et vous ne pouvez pas choisir par exemple une série de qualités du type : "Lourd", "Moyen", "Léger". Le calcul ne tient pas compte de l'ordre de ces trois qualités, et le résultat risque d'être faux.

Calculs

  • standardisation des données par un codage disjonctif complet,
  • constitution du tableau des fréquences,
  • constitution de la matrice d’inertie selon la métrique de chi²,
  • calcul des coordonnées (valeurs des projections sur les axes factoriels), de la contribution (part d’un point i ou j à l’inertie expliquée par le facteur) et les qualités de représentation,
  • calcul des autres paramètres (voir ci-dessous).

Interprétation

Il faut tout d’abord déterminer le nombre d’axes sur lequel travailler à l’aide des valeurs propres, puis déterminer la définition des axes à l’aide des coordonnées, des contributions et des qualités.

Dans une AFC, les lignes et les colonnes jouent le même rôle, on ne représente qu’un seul graphique. De ce fait on peut interpréter graphiquement la proximité entre les individus-lignes et entre les individus-colonnes. Deux individus-lignes proches révèlent un comportement semblable. Deux individus-colonnes proches révèlent un comportement semblable (à condition que les qualités soient convenables). Il n’est pas permis d’interpréter la proximité entre un individu-ligne et un individu-colonne. En revanche, il est possible d’interpréter la position d’un individu-ligne par rapport à l’ensemble des individus-colonnes ou d’un individu-colonne par rapport à l’ensemble des individus-lignes.

Graphiques

Sous chaque graphique, vous trouverez un bouton : permettant de créer une nouvelle "fenêtre graphique" à partir du dessin courant. Cette fenêtre vous permettra de comparer plusieurs graphiques, de les exporter ou de les imprimer.


Résultats

Dans le tableau situé en bas à gauche de la fenêtre de paramétrage se trouvent les valeurs propres et le pourcentage d'information prise en compte par l'axe correspondant. Le graphique situé en bas à droite représente l'histogramme des valeurs propres. En cliquant sur un rectangle rouge (qui représente la valeur propre), le numéro de la valeur propre sélectionnée s'affiche au-dessus du graphique.
Dans le graphique situé en haut à droite se trouve la représentation des individus (carrés rouges) et des variables (carrés bleus) dans le plan factoriel choisi. En effet, l'axe horizontal correspond à l'axe que vous avez sélectionné dans le champ de saisie axe 1, et l'axe vertical à celui du champ de saisie axe 2. Ces axes sont compris entre 1 et le nombre de données en entrée.
En cliquant sur un carré rouge ou bleu, le nom de l'individu ou de la variable en question s'affiche sous le graphique. Si vous voulez connaître précisément les coordonnées d'une variable ou d'un individu dans le plan factoriel, il vous faut cliquer sur le bouton Sauvegarder les résultats et lire le fichier créé.

En changeant la taille de la fenêtre, les dessins s'adapteront automatiquement à la nouvelle taille.

Si la case tous les axes est cochée, les calculs sont effectués pour tous les axes, sinon ils sont effectués seulement pour les 2 axes choisis, ce qui réduit le temps de calcul (surtout dans le cas où le nombre d'entrées du module est important), ainsi que la taille du fichier de résultats.

En cliquant sur le bouton Sauvegarder les résultats, vous allez créer un fichier texte dans lequel seront inscrits tous les résultats de l'A.F.C.

Dans ce fichier, vous allez trouver :

  • les valeurs et les vecteurs propres de la matrice de corrélation
  • l'inertie totale du nuage
  • la hiérarchie entre les axes (le pourcentage de concentration de l'information de chaque axe donné par la valeur propre)
  • le cumul des hiérarchies entre les axes
  • les informations relatives:
    • à tous les axes, si vous avez coché la case tous les axes
    • aux 2 axes souhaités, si vous avez coché la case 2 axes

Les informations relatives aux axes sont les suivantes :

Pour chaque individu et chaque variable, les résultats sont de cinq types :

  • leurs coordonnées sur les axes choisis, permettant de les situer par rapport au système d'axes.
  • leurs poids relatifs, indiquant l'importance du rôle de chacun dans le traitement.
  • leurs contributions aux axes choisis, mesurant le rôle joué par chacun dans la formation de l'axe.
  • leurs qualités de représentation sur les axes choisis, mesurant leur proximité avec les axes.

Sortie

Le tableau contenant les coordonnées des individus sur tous les axes est fourni en sortie, dans le but de faire une Classification Ascendante Hiérarchique à la suite de ce module. Voir le module de C.A.H. pour plus de détails sur cette classification.

Notions de statistiques

Les résultats détaillés ci-dessus doivent être interprétés avec précaution. En effet, les résultats ne sont affirmés que pour les valeurs les plus fortes (et les plus faibles) des coordonnées des individus et des variables.
Plus une coordonnée est proche de 0, moins l'axe correspondant est significatif (la variable ou l'individu participe de moins en moins à la structure mise en évidence par l'axe). Pour interpréter les coordonnées, il faut donc raisonner en terme d'opposition, et pour cela s'intéresser aux valeurs extrêmes.
Par ailleurs, on ne peut pas se contenter d'un seul axe (même du premier) pour avoir une idée claire de ce qui caractérise un individu en particulier, ou pour comparer deux individus entre eux. L'examen de plusieurs axes permet en revanche de reconstituer avec assez d'exactitude les caractéristiques spécifiques de chaque individu par rapport à l'ensemble des variables.

Pour des informations complémentaires, vous pouvez voir le détail du principe et des calculs utilisés par le module.

Source : Cours de Méthodes Quantitatives de François Bavaud
Section Informatique et Méthodes Mathématiques (IMM)
Faculté des Lettres, Université de Lausanne
Bâtiment BFSH2, CH-1015 Lausanne
Suisse/Switzerland

Script :

2      module untyped_list ""
3        mod_type integer "103"
3        mod_subtype integer "518"
3        mod_name string "AFC"
3        mod_dads integer_list ""
4          ? integer "4"
4          ? integer "5"
4          ? integer "9"
4          ? integer "6"
4          ? integer "7"
4          ? integer "8"
4          ? integer "14"
3        all_axis boolean "F"
3        axis1 integer "1"
3        axis2 integer "2"
3        ind_nb integer "20"
3        var_nb integer "21"


Exemple d'utilisation