L'Analyse Statistique Multivariée dans Cartes & Données

[précédent] - [suivant] - [menu]

Notions théoriques

Qu'est-ce que l'Analyse Statistique Multivariée ?

Il s'agit d'un ensemble de méthodes adaptées à l'analyse de l'organisation de l'espace géographique et de ses différenciations.

L'utilisation de ces méthodes nécessite une organisation un peu systématique de l'information gégraphique sous la forme d'une matrice d'information spatiale. L'espace analysé est découpé en un ensemble d'unités élémentaires (les individus spatiaux), chacune décrite par une série d'indicateurs (variables) relatifs au problème géographique analysé.

Face à une matrice de ce type, constituée d'autant de lignes que l'on considère d'unités spatiales et de colonnes qu'il y a de variables choisies, le géographe souhaite extraire deux types d'informations complémentaires, l'une issue de l'analyse des colonnes et l'autre de celle des lignes :

  • Les colonnes décrivent des répartitions géographiques. L'analyse univariée permet de décrire chacune d'entre elles, d'analyser leur organisation dans l'espace, et de rendre compte de la nature des différenciations introduites par chacun des phénomènes étudiés. L'analyse multivariée permet de passer à un autre niveau d'analyse par la confrontation des différentes distributions qui permettra de découvrir des régularités, d'analyser de façon précise les interrelations entre les variables sélectionnées, d'essayer de mettre en évidence des combinaisons plus ou moins systématiques de variables et de dégager les composantes qui structurent l'espace géographique étudié.

  • Les lignes caractérisent chaque unité géographique par rapport à un ensemble d'indicateurs. Leur comparaison permet de regrouper les unités élémentaires pour former des entités spatiales de plus grandes dimensions. On procède ainsi à une classification qui tient compte de toutes les variables simultanément et telle que les unités géographiques qui constituent une classe se ressemblent plus entre elles qu'elles ne ressemblent aux autres unités de l'ensemble de l'espace étudié. On peut ainsi définir des sous-ensembles homogènes et, si l'on introduit une contrainte de contiguïté, on peut procéder à une régionalisation.

Les méthodes d'analyse des données permettent d'effectuer relativement facilement ce type de travail et ce, quelles que soient les dimensions de la matrice d'information spatiale regroupant l'ensemble des données. L'ensemble de ces méthodes repose sur une restructuration et une simplification de l'information, et selon la nature de celle-ci et le problème posé, certaines sont plus appropriées que d'autres.

Les méthodes les plus utilisées en Géographie

1. L'Analyse en Composantes Principales

C'est une des techniques les plus classiques de la statistique multivariée. Elle permet d'extraire le maximum d'information sous une forme simple et cohérente à partir d'un ensemble très important de données, et elle sert à mettre en évidence les interrelations entre les variables et les ressemblances et oppositions entre les unités géographiques analysées.

Cette technique s'applique principalement aux tableaux de mesure, c'est-à-dire à un ensemble de variables quantitatives, hétérogène ou non.

2. L'Analyse Factorielle des Correspondances

Elle s'applique principalement aux tableaux de contigence, mais permet également d'analyser des données qualitatives.

3. La Classification Ascendante Hiérarchique

C'est une des méthodes de classification automatique les plus utilisées en géographie. Elle consiste à effectuer un regroupement progressif des individus selon leur degré de ressemblance jusqu'à l'obtention d'une unique classe les regroupant tous.
Une fois ce calcul effectué, les individus seront répartis en différentes classes, le nombre de classes étant défini par l'utilisateur.

Elle permet d'effectuer des typologies régionales emboîtées, et elle est très utile pour cartographier de manière synthétique une information complexe et multidimensionnelle.

 

Les analyses factorielles et les techniques de classification sont complémentaires, et on est le plus souvent amené à les utiliser conjointement pour analyser un problème donné. Il est par exemple fréquent de faire suivre une A.C.P. par une C.A.H.

Les méthodes d'analyse des données apparaissent comme des outils privilégiés pour traiter l'espace géographique dont les différenciations sont par essence même complexes et multidimensionnelles. Mais, bien qu'elles puissent servir à tester des hypothèses, elles n'ont pas en elles-mêmes un pouvoir explicatif. Ces outils se révèlent indispensables pour les praticiens à certaines étapes de leur recherche, mais il faut savoir que l'intérêt des résultats des traitements effectués dépend largement de la réflexion géographique en amont et en aval.


[précédent] - [suivant] - [menu]