SIG et aide à la décision (1) : le classement avec des nombres flous

Les processus de décision s’appuient sur des informations de source et de type très variés. Ces informations sont utilisées par le ou les décideurs pour effectuer des choix, c’est à dire retenir un certain nombre d’entités et en exclure d’autres.

Prenons un exemple :
Une action doit être effectuée sur des communes, mais cette action dépend :
1. de la superficie des communes, comprise entre 2500 et 3000 hectares
2. du nombre d’habitants de la commune, compris entre 2500 et 5000
Le but de l’opération est d’effectuer un classement d’objets (les communes) selon deux critères (population et surface).

Utilisation des requêtes classiques des SIG.

Les outils proposés par les SIG travaillent de la manière suivante :
On effectue une sélection des communes en retenant comme résultat les communes qui ont une population comprise entre les deux bornes souhaitées (dans cet exemple entre 2500 et 5000 habitants)
On effectue une sélection des communes en retenant comme résultat les communes qui ont une surface comprise entre les deux bornes souhaitées (dans cet exemple entre 2500 et 3000 hectares)
On retient comme résultat final seulement les communes qui apparaissent dans les deux résultats de sélection précédents, en éliminant celles qui n’apparaissent que dans une seule des sélections.

Prenons par exemple l’ensemble des communes du Finistère.

Pour déterminer les communes répondant au critère Population on applique la requête de sélection:

« POPULATION » >=2500 AND « POPULATION » <=5000

Les 54 communes dont la population est comprise entre 2500 et 5000 sont les suivantes

communes avec populatiion comprise entre 2500 et 5000 habitants

 

Pour déterminer les communes répondant au critère Superficie on applique la requête de sélection:

« SUPERFICIE » >=2500 AND « SUPERFICIE » <=3000

Les 26 communes dont la superficie est comprise entre 2500 et 3000 ha sont les suivantes:

communes dont la superficie est comprise entre 2500 et 3000 ha

 

Les 10 communes qui satisfont les deux conditions sont les suivantes:

communes qui satisfont aux deux critères

 

Si nous sommes un service technique, le résultat nous convient et nous le transmettons à nos chers élus.

Si nous sommes des élus, nos problèmes commencent:

Pourquoi la commune de Plouenan n’est pas dans le résultat? Parce qu’elle a une population de 2451 habitants et une superficie de 3077 ha.

Et la commune de Rédené? Parce qu’elle a 2464 ha, mais 2870 habitants.

Et la commune de… Bref, la liste sera plus ou moins longue, mais à chaque classement fait en utilisant notre logique tout ou rien (booléenne), classique en SIG, nous aurons des situations plus ou moins limites qui poseront problème.

Comprenons alors que pour une grande partie des élus, le fait qu’on leur annonce que notre outil est une « aide à la décision » est loin de les convaincre!

Une autre logique, un autre résultat

Une commune ayant 2499 habitants et non 2500 sera éliminée du résultat, tout comme une commune ayant 3001 ha et non 3000.
Dans les processus de décision, les valeurs des variables utilisées sont toujours entachées d’une certaine incertitude. Pour que le SIG puisse être un outil d’aide à la décision, il est indispensable de donner à l’utilisateur des outils qui correspondent à sa méthode de raisonnement.
La valeur de 2500 habitants est utilisée par le SIG comme une valeur stricte. Hors, dans l’esprit du décideur, cette valeur n’est qu’une valeur représentative d’une « taille » de commune (par exemple «commune moyenne »).

L’utilisation de « nombres flous » est une autre possibilité de classement d’objets.

Comment on définit une commune moyenne en logique floue? Au lieu d’utiliser deux valeurs comme bornes minimum-maximum on va utiliser quatre valeurs:

  • Les deux bornes du nombre d’habitants entre lesquelles les communes correspondent totalement à sa perception d’une commune moyenne : par exemple : 2500 et 5000 ;
  • La borne inférieure à partir de laquelle il est tout à fait exclu que la commune soit moyenne : par exemple 1500 ;
  • La borne supérieure à partir de laquelle il est exclu que la commune soit moyenne : par exemple 7500.

Ceci permet de construire une fonction « d’appartenance » qui prend la forme

fonction d'appartenance des comunes à l'ensemble "communes moyennes"

 

Où l’on mesure l’appartenance à l’ensemble « Communes moyennes » entre 0 et 1 : les valeurs de population ayant une appartenance 0 sont complètement « exclues » de la classification, les valeurs ayant une appartenance de 1 sont « complètement incluses » et les valeurs entre 0 et 1 correspondent à une « plus ou moins » appartenance (d’où le terme de « flou »).

Si on applique cette fonction d’appartenance à nos communes du Finistère (nous verrons les outils dans le prochain article) à la catégorie Communes moyennes, on obtient le résultat suivant:

agrégation floue de superficie et population

 

Chaque commune a une valeur résultante comprise entre 0 et 1.

Pour plus de clarté, nous avons regroupés les communes en 5 classes:

  • celles qui correspondent très bien au critère : valeurs résultantes comprises entre 0.8 et 1.0 : 63 communes (en rouge)
  • celles qui correspondent plutôt bien au critère : valeurs résultantes comprises entre 0.6 et 0.8 : 16 communes (en orange foncé)
  • celles qui correspondent moyennement au critère : valeurs résultantes comprises entre 0.4 et 0.6 : 16 communes (en orange clair)
  • celles qui correspondent plutôt mal au critère : valeurs résultantes comprises entre 0.2 et 0.4 : 18 communes (en jaune foncé)
  • celles qui correspondent mal au critère : valeurs résultantes comprises entre 0.0 et 0.20 : 170 communes (en jaune clair)

Si on applique la fonction d’appartenance à nos communes du Finistère à la catégorie Communes de surface moyenne avec des bornes situées à 2000 ha – 2500 ha – 3000 ha et 4000 ha, on obtient le résultat suivant:

résultat du nombre flou superficie

 

Chaque commune a une valeur résultante comprise entre 0 et 1.

Nous avons regroupés les communes en 5 classes comme pour la population:

  • celles qui correspondent très bien au critère : valeurs résultantes comprises entre 0.8 et 1.0 : 46 communes (en rouge)
  • celles qui correspondent plutôt bien au critère : valeurs résultantes comprises entre 0.6 et 0.8 : 14 communes (en orange foncé)
  • celles qui correspondent moyennement au critère : valeurs résultantes comprises entre 0.4 et 0.6 : 10 communes (en orange clair)
  • celles qui correspondent plutôt mal au critère : valeurs résultantes comprises entre 0.2 et 0.4 : 6 communes (en jaune foncé)
  • celles qui correspondent mal au critère : valeurs résultantes comprises entre 0.0 et 0.20 : 207 communes (en jaune clair)

Effectuons maintenant le croisement des deux nombres flous (encore, nous verrons les outils dans l’article suivant):

Le résultat de l’agrégation des deux nombres flous : superficie et population est le suivant

fz7

 

Chaque commune a une valeur résultante comprise entre 0 et 1.

Nous avons regroupés les communes en 5 classes :

  • celles qui correspondent très bien aux deux critères : valeurs résultantes comprises entre 0.8 et 1.0 : 15 communes (en rouge)
  • celles qui correspondent plutôt bien aux deux critères : valeurs résultantes comprises entre 0.6 et 0.8 : 6 communes (en orange foncé)
  • celles qui correspondent moyennement aux deux critères : valeurs résultantes comprises entre 0.4 et 0.6 : 113 communes (en orange clair)
  • celles qui correspondent plutôt mal aux deux critères : valeurs résultantes comprises entre 0.2 et 0.4 : 19 communes (en jaune foncé)
  • celles qui correspondent mal aux deux critères : valeurs résultantes comprises entre 0.0 et 0.28 : 130 communes (en jaune clair)

 

Si on compare les deux types de démarche, en considérant que pour la démarche floue une appartenance  de 80% peut être considérée comme très bonne, on a :

Démarche  Population  Superficie   Croisement
Booléenne 54   26  10
Floue    63    46  15

Bien sûr, les deux communes, Rédené et Plouenan, qui nous posaient problème au départ sont comprises dans les 15 communes retenues par le biais du traitement flou. La commune de Rédené a une appartenance de 0.93 et celle de Plouenan de 0.92 .

Le classement d’entités géographiques

Dans cet exemple nous avons utilisé deux critères pour « classer » nos communes.

Le classement d’objets selon plusieurs critères est une opération courante de la vie de tous les jours. Quand on achète un produit on prend en compte le degré de satisfaction que donnent son prix, sa durée de vie, son « standing » …

Pour chaque critère nous définissons nous-mêmes des fonctions « floues » (prix entre X et Y euros, pouvant aller jusqu’à Z au maximum) ou des « classements flous » comme par exemple le « standing » (i.e : mauvais, moyen, bon, haut, très haut).

Nous réalisons nos choix en croisant les valeurs des différentes variables prises en compte et en obtenant un classement des différents produits en fonction du degré de satisfaction globale.

Prenons le cas simple de croisement de deux critères auxquels on attribue 5 valeurs de satisfaction : mauvais, plutôt mauvais, moyen, plutôt bon, bon. Chaque objet aura comme résultat un degré de satisfaction codé sur ces mêmes cinq valeurs.

Si nous recherchons un véhicule à partir de ses caractéristiques de résistance et de prix, par exemple, on retrouvera des véhicules très résistants, donc satisfaction maximale du premier critère, mais dont le prix est un peu au-dessus de ce que l’on souhaite, donc satisfaction moyenne du deuxième critère.

Quelle est la valeur résultante du croisement ? En réalité il n’y a pas une valeur résultante, mais plusieurs, en fonction de la personne qui fait le choix. Certains feront mentalement la moyenne des deux et donneront un classement « plutôt bon », pour d’autres le prix  l’emportera et classeront ce véhicule comme « moyen », d’autres enfin seront plus sensibles au critère résistance et classeront le véhicule comme « bon ».

L’exemple devient encore plus clair si l’on considère un véhicule très résistant mais très cher (satisfaction complète d’un critère et insatisfaction complète de l’autre).Est ce que l’on donnera une valeur « moyenne », « plutôt mauvaise » ou « mauvaise » ?

Les outils SIG basés sur la logique classique travaillent sur le principe de la valeur minimum. Le résultat du croisement est la plus petite valeur des deux critères, qui
rappelons-le seront codés seulement en 0 et 1. Si un des deux critères n’est pas satisfait on a une paire de valeurs 1-0, le résultat du croisement sera donc 0.

L’utilisation d’un outil d’analyse spatiale souple permet de déterminer la fonction de croisement utilisée par l’opérateur. Cette étape revient simplement à demander à l’opérateur le résultat de trois croisements : Très bon – moyen, moyen – moyen, et Très bon – mauvais .

Le résultat de ce test permet de choisir une fonction parmi les 50 fonctions de croisement possibles quand on prend en compte 5 degrés de satisfaction (Théorie des possibilités, Applications à la représentation des connaissances en informatique, D. DUBOIS et H. PRADE, Masson 1988).

Dans les articles suivants nous allons voir deux outils développés pour ArcGis qui vous permettront de réaliser toutes ces opérations.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *