Le cube spatio-temporel d’ArcGis : 2- hot spots et cold spots

Dans l’article précédent (Le Cube spatio-temporel d’ArcGis : 1- découverte) nous avons vu comment crée un cube spatio-temporel à partir d’un nuage de points XYZ.
Le cube spatio-temporel
Les points sont regroupés en « boîtes » (bins) correspondant à des pixels 3D.
Nous avons vu comment le représenter dans une scène 3D d’ArcGis Pro. Dans cet article nous allons voir comment analyser les tendances temporelles des valeurs des bins, en utilisant l’analyse des points chauds émergents.
cub20

Le but de cet outil est d’identifier des tendances de regroupement des valeurs du cube construit à partir de vos données, ce qu’on peut appeler des « agrégats spatiaux ».

Pour la description  de la méthode mathématique qui est derrière cet outil  recherche (Getis-Ord Gi*) vous pouvez télécharger ici l’article de Getis et Ords.

Contentons nous ici de dire que la méthode recherche, sur les trois axes, à déterminer si les valeurs d’occurrence des points dans votre cube peuvent être considérés, statistiquement, comme regroupés (hot spots) ou non regroupés (cold spots).

Le résultat de la méthode consiste en:

  • une valeur appelée p-value qui est la valeur de probabilité pour que la distribution spatiale des points soit due au hasard. Si p-value est grand, cela veut dire qu’il est très probable que la distribution dans les pixels 3D autour de ce point soit simplement le résultat du hasard. Une valeur de p-value basse, au contraire, indique qu’il est très probable que le regroupement ne soit pas du au hasard et donc que ce soit le résultat d’un phénomène particulier.
  • une valeur appelée z-score qui est une valeur de déviation standard. Ce n’est pas une autre valeur indépendante de la p-value, c’est une valeur complémentaire.

Si vous observez une valeur faible de p-value vous vous direz qu’il a de fortes probabilités pour que le phénomène observé soit significatif. Oui mais, fortes comment? Le z-score vous indique que si cette valeur se situe à plus de trois  écarts type de la moyenne vous avez moins de 1% de chances de vous tromper. Si elle se situe entre 2 et 3, vous aurez 5% et si elle se situe entre 1 et 2 vous en aurez 10%. C’est donc à vous, en fonction du sujet et de vos connaissances, de déterminer le seuil de risque acceptable pour votre hypothèse.

 

relation entre la -value et le z-score de la méthode hot spotrNous allons continuer l’exemple de l’article précédent en utilisant le cube réalisé. Pour effectuer l’analyse; vous lancez l’autre commande disponible dans la boîte à outils Outils d’exploration des modèles spatio-temporels, Analyse des points chauds émergents.

cub21Les trois premiers champs sont simples, cube en entrée, couche en sortie et, pour l’instant, dans Variable d’analyse vous n’avez le choix que de COUNT.

Par contre, les deux champs suivants peuvent prêter à confusion. En effet, lors de la construction du cube, dans l’étape précédente, il y avait deux champs similaires. Ces champs permettaient de regrouper les points par pixel 3D. Nous avions défini des pixels de 40km en X et Y et de 12 heures en Z (temps).

Ici il ne s’agît pas du tout de ça. Ici vous devez indiquer (ou laisser la commande les calculer par défaut) qu’est ce que vous considérez comme voisinage d’un pixel 3D. Est-ce que des pixels situés à 200 km sont voisins ou pas? Est-ce que des pixels séparés par deux jours sont considérés comme voisins ou pas?

En fonction de vos réponses (ou non réponses) les résultats ne seront pas les mêmes.

Si vous ne remplissez pas les champs, le calcul du voisinage XY par défaut est un peu obscur, par contre en Temps la valeur par défaut est de 1.

Une fois la commande achevée, vous retrouvez la nouvelle couche affichée dans votre vue 2D avec la classification suivante:

 

résultat de la classification des points chauds

Pour s’y retrouver dans les résultats, tout d’abord, vous avez deux groupes:

  • un groupe de « hot spots » (points chauds), là il se passe quelque chose
  • un groupe de « cold spots » (points froids), là il ne se passe pas.
  • un troisième « groupe » regroupe les pixels 3D qui n’ont pas pu être classés en hot ou cold, les « No trend detected ».

Après, pour chaque type (hot ou cold) vous trouverez les pixels 3D classés selon:

New spot : le dernier pixel 3D de la série temporelle apparaît comme un point chaud ou froid, tandis que dans tout le reste des pas de temps cet endroit ne l’était pas. Ce sont des points à surveiller dans les prochaines séries temporelles pour vérifier s’ils sont bien des points significatifs ou pas.

Consecutive  Spot: dans la série temporelle il y a une suite de pas de temps significatifs et consécutifs. Cette série représente moins de 90% des pas de temps.

Intensifying spot: Plus de 90% des pas de temps sont significatifs et les valeurs croissent avec le temps. Les derniers pixels sont plus forts que ceux du début. Le dernier pas de temps est significatif.

Persistent  Spot: plus de 90% des pas de temps sont significatifs mais on ne descelle pas de tendance à l’augmentation ou à la diminution dans la série temporelle.

Diminishing Spot : Plus de 90% des pas de temps sont significatifs et les valeurs diminuent avec le temps. Les derniers pixels sont plus faibles que ceux du début. Le dernier pas de temps est significatif

Sporadique  Spot: moins de 90% des pas de temps sont significatifs. Les pas de temps significatifs sont intercalés entre des pas de temps non significatifs. Si les pas de temps significatifs sont des hot spots, il n’y a pas dans la série des cold spots, et vice-versa.

Oscillant  Spot: moins de 90% des pas de temps sont significatifs. Comme pour le précédent les pas non significatifs sont intercalés parmi les pas significatifs. Par contre, dans les pas significatifs on observe des points chauds et des points froids.

Historical  Spot:La période la plus récente n’est pas significative, mais au moins quatre-vingt dix pour cent des intervalles de temps ont été des points chauds ou froids statistiquement significatifs.

Ces résultats s’appliquent à chaque série temporelle du cube, c’est à dire à chaque colonne de celui-ci. Sa représentation est donc, forcément en deux dimensions.

Par contre, chaque pas de temps peut être significatif ou pas, et ce, selon un, deux ou trois écarts types. Nous pouvons donc visualiser ces résultats avec l’outil de Visualisation 3D du cube spatio-temporel (voir cet outil dans l’article précédent)

Vous devez avoir une fenêtre 3D (Scene) dans votre projet. Si vous n’en avez pas, cliquez sur Insérer->Nouvelle Scene

Vous devez enlever la référence à une couche d’élévation. En effet, si vous ne le faites pas, les colonnes du cube seront affichées par rapport au niveau du sol et vous perdrez en visibilité de la correspondance des différents pas de temps.

Dans la fenêtre du geoprocesseur, lancez la commande de visualisation 3D.

visualiser en 3d le hot spot analysis

Par rapport à la même commande lancée dans l’article précédent, comme ici nous avons fait une analyse des points chauds, dans la fenêtre « Display variable », en plus de COUNT nous trouvons « Hot and Cold spot results », que nous sélectionnons.

Le résultat de la commande s’affiche:

résultat de l'afficahge 3D de l'analyse des points chauds

et la fenêtre de légende permet de voir quelles sont les classes affichées:

classification du résultat de l'analyse des points chaudsLes points chauds en rouge, les points froids en bleu, avec une intensité qui donne la confiance des résultats: un écart type = 90%, deux écarts type = 95%, trois écarts type = 99%.

Avec ces deux articles vous avez de quoi commencer à vous essayer à l’analyse spatio-temporelle. Nous y reviendrons dans un futur article sur les différentes technique de pré-traitement des données pour qu’elles puissent être traitées avec ces deux outils.

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *