|
|||||||||||||||||||||||||
![]() |
|
||||||||||||||||||||||||
|
Ecran :
Description :
La fenêtre de paramétrage se décompose en 2 onglets :
Le choix de la discrétisation se fait selon le type de donnée en entrée. Les utilisateurs peu habitués à cette opération apprendront très vite à reconnaître la bonne discrétisation en s'aidant notamment de la boîte et moustaches présente dans l'onglet Graphiques. La discrétisation par défaut est celle en quantiles mais attention elle n'est pas toujours la plus juste. Le nombre de classes peut être un chiffre entre 1 et 512, excepté lors du calcul des moyennes
emboîtées, pour lequel le nombre de classes doit être une puissance de 2 (2, 4, 8, 16, 32... 512).
ATTENTION : le nombre de classes ne doit en général pas dépasser 12,
pour une bonne représentation en couleurs ou symboles qualitatifs.
Le facteur pour l'écart-type permet de choisir un facteur multiplicatif qui déterminera la largeur des classes dans le cas des discrétisations standard et standard centrée sur zéro. Pour la discrétisation par seuils observés, les seuils peuvent être
Le bouton représentant une flèche, qui se situe en dessous du tableau des seuils, permet de transférer les valeurs des seuils automatiques dans la colonne des seuils observés. La zone de texte située en bas de l'onglet Paramètres contient les indices de Jenks et de
Tai, les variances inter-groupe et intra-groupe, le nombre d'éléments contenus dans
chaque classe, ainsi qu'un résumé statistique de la donnée. Voir le paragraphe consacré aux
indices plus loin.
L'onglet Graphiques, dont une copie d'écran se trouve ci-dessus, contient :
En déplaçant la souris sur le graphique, la valeur pointée par la souris s'affiche dans la zone Valeur de la donnée située en-dessous du graphique. Dans le cas d'une discrétisation par seuils observés, des barres grises verticales
représentant les seuils apparaissent sur les graphiques. Vous pouvez les déplacer à la souris de
façon à positionner manuellement les seuils en vous aidant des graphiques. Leur déplacement n'est
autorisé qu'entre les valeurs minimum et maximum de la donnée.
Pour vous aidez à choisir la discrétisation la plus adaptée, une échelle allant de 0 à 1 vous indique l'indice de TAI. Plus cet indice tend vers 1, plus votre discrétisation est juste. En changeant la taille de la fenêtre, les dessins s'adapteront automatiquement à la nouvelle taille. Graphiques :
Types de données :
En revanche, si le module a déjà des connexions en sortie, alors son type d'entrée restera figé. Pour lui connecter une donnée matricielle, il faudra d'abord le déconnecter de ses fils. Formules utilisées pour les indices : Indice de Jenks (du nom de son auteur) : écart d'une classe = valeur absolue de :
Indice de Jenks = ( somme des écarts de chaque classe ) / nombre de classes Indice de Tai (Tabular Accuracy Index également mis au point par Jenks) : Distance1 = somme des distances entre les valeurs et la moyenne de la classe dans laquelle elles sont
Indice de Tai = 1 - Distance1 / Distance2 Plus l'indice de Tai est proche de un, plus la discrétisation est bonne.
Variance inter-groupe : Cet indice indique si les classes obtenues sont similaires ou différentes. Distance = somme des distances carrées entre la moyenne de chaque classe et la moyenne générale
des données
Variance inter-groupe = Distance / (nombre de classes - 1) Variance intra-groupe : Cet indice indique si les classes obtenues sont homogènes ou disparates. Distance = somme des distances carrées entre les valeurs et la moyenne de la classe dans laquelle elles sont Variance intra-groupe = Distance / (nombre de données - nombre de classes) Lorsque vous comparez différentes discrétisations, les deux variances ci-dessus sont très importantes, vous devez diminuer la variance intra-groupe pour rendre les groupes homogènes, et augmenter la variance inter-groupe pour éloigner les groupes les uns des autres. Liste des discrétisations : Standard :
Avec un même facteur pour l'écart-type, cette discrétisation donne lieu à seulement deux
répartitions :
En effet, par exemple pour 3, 5, 7 ... classes avec un facteur pour l'écart-type de 1, la classe centrale sera toujours centrée sur la moyenne, et de largeur un écart-type. Cette discrétisation n'est pas adaptée aux données relatives, par exemple, si vous cartographiez un pourcentage, la moyenne des données n'est pas la moyenne des pourcentages. Standard centrée sur zéro :
Quantiles :
Egales étendues :
Moyennes emboîtées :
Cette discrétisation n'est pas adaptée aux données relatives, par exemple, si vous cartographiez un pourcentage, la moyenne des données n'est pas la moyenne des pourcentages. Jenks :
Observés :
Principe commun aux discrétisations (sauf quantiles) :
Attention : les seuils sont stockés en simple précision, et par conséquent la discrétisation ne peut distinguer des valeurs dont les 8 premiers chiffres sont identiques. Script : 2 module untyped_list "" 3 mod_type integer "103" 3 mod_subtype integer "502" 3 mod_name string "Discrétisation" 3 mod_dads integer_list "" 4 ? integer "4" 3 work_on_matrix boolean "F" 3 quant_type integer "802" 3 class_nb integer "4" 3 stddur_fact double "1" 3 user_thresholds double_list "" 4 ? double "0" 4 ? double "0" 4 ? double "0" 4 ? double "0" 4 ? double "0" 3 auto_thresholds double_list "" 4 ? double "17" 4 ? double "45" 4 ? double "65" 4 ? double "78" 4 ? double "95" 3 classes_count integer_list "" 4 ? integer "4" 4 ? integer "4" 4 ? integer "4" 4 ? integer "3" 3 jenks double "0.013676485" 3 tai double "0.63260762" 3 inter_grp double "2054.4944" 3 intra_grp double "75.113636" Valeurs pour quant_type : Observés 801 Quantiles 802 Egales étendues 803 Moyennes emboîtées 804 Standard 805 Standard centrée sur zéro 806 Jenks 807 Dans la liste des seuils automatiques, on peut voir que le minimum et le maximum des valeurs sont également dans la liste. Ces valeurs sont obligatoires, mais elles sont recalculées par le module. Il est donc possible de mettre des zéros. Exemple d'utilisation
|