﻿{"id":3740,"date":"2017-01-13T09:23:22","date_gmt":"2017-01-13T08:23:22","guid":{"rendered":"http:\/\/www.sigterritoires.fr\/?p=3740"},"modified":"2017-01-13T11:19:10","modified_gmt":"2017-01-13T10:19:10","slug":"analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes","status":"publish","type":"post","link":"https:\/\/www.sigterritoires.fr\/index.php\/analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes\/","title":{"rendered":"Analyse exploratoire des donn\u00e9es pour la g\u00e9ostatistique:les histogrammes"},"content":{"rendered":"<p>Apr\u00e8s l&rsquo;article <a href=\"http:\/\/wp.me\/p6XU0A-Y9\">Introduction \u00e0 l&rsquo;analyse exploratoire des donn\u00e9es pour la g\u00e9ostatistique<\/a> , nous allons commencer \u00e0 aborder chacun des outils disponibles pour r\u00e9aliser l&rsquo;analyse exploratoire des donn\u00e9es spatialis\u00e9es. Nous commen\u00e7ons avec les histogrammes.<!--more--><\/p>\n<h2>Les Histogrammes<\/h2>\n<p>M\u00eame si nous allons prendre comme base les outils Geostatiscal Analyst d&rsquo;ArcGis, vous pourrez trouver des outils similaires dans les autres logiciels <a href=\"https:\/\/www.sigterritoires.fr\/\">SIG<\/a> (Outils SAGA dans QGis, &#8230;).<\/p>\n<p>L&rsquo;outil d&rsquo;histogrammes dans l&rsquo;AEDS fournit une description univari\u00e9e (une variable) de vos donn\u00e9es. L&rsquo;outil affiche la distribution de fr\u00e9quence pour le jeu de donn\u00e9es d&rsquo;int\u00e9r\u00eat et calcule la statistique r\u00e9capitulative. L&rsquo;objectif premier \u00e0 rechercher est de valider le fait que la distribution des valeurs de chaque variable ob\u00e9it \u00e0 un ph\u00e9nom\u00e8ne al\u00e9atoire.<\/p>\n<h3>R\u00e9partition des fr\u00e9quences<\/h3>\n<p>La distribution de fr\u00e9quence est un graphique \u00e0 barres qui indique la fr\u00e9quence \u00e0 laquelle les valeurs observ\u00e9es tombent dans certains intervalles ou classes. Vous sp\u00e9cifiez le nombre de classes de largeur \u00e9gale qui doivent \u00eatre utilis\u00e9es dans l&rsquo;histogramme. La proportion relative de donn\u00e9es qui tombe dans chaque classe est repr\u00e9sent\u00e9e par la hauteur de chaque barre. Par exemple, l&rsquo;histogramme ci-dessus montre la distribution de fr\u00e9quence (10 classes) pour un ensemble de donn\u00e9es.<\/p>\n<p><a href=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v6.png\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" data-attachment-id=\"3742\" data-permalink=\"https:\/\/www.sigterritoires.fr\/index.php\/analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes\/_v6\/\" data-orig-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v6.png?fit=827%2C477&amp;ssl=1\" data-orig-size=\"827,477\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"_v6\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v6.png?fit=640%2C369&amp;ssl=1\" class=\"aligncenter wp-image-3742 size-full\" src=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v6.png?resize=640%2C369\" alt=\"exemple d'histogramme de geostatistical analyst\" width=\"640\" height=\"369\" srcset=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v6.png?w=827&amp;ssl=1 827w, https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v6.png?resize=300%2C173&amp;ssl=1 300w, https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v6.png?resize=768%2C443&amp;ssl=1 768w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><\/a><\/p>\n<p>Les caract\u00e9ristiques importantes d&rsquo;une distribution peuvent \u00eatre r\u00e9sum\u00e9es par quelques statistiques qui d\u00e9crivent sa distribution, son \u00e9talement et sa forme.<\/p>\n<h3>Mesures de la distribution<\/h3>\n<p>Les valeurs de la distribution vous donnent une id\u00e9e d&rsquo;o\u00f9 se situe le centre et d&rsquo;autres parties de la distribution. Pour ce qui est de notre objectif de valider le fait d&rsquo;une distribution al\u00e9atoire, ces valeurs ne nous apportent rien en particulier. Par contre ils nous renseignent sur le lot de donn\u00e9es de mani\u00e8re \u00e0 mieux cerner ses caract\u00e9ristiques. Si nous voulons faire une symbologie par classes, il est bien utile d&rsquo;avoir sous la mains ces valeurs.<\/p>\n<p><em><strong>La moyenne<\/strong><\/em> est la moyenne arithm\u00e9tique des donn\u00e9es. La moyenne fournit une mesure du centre de la distribution.<\/p>\n<p><em><strong>La valeur m\u00e9diane<\/strong> <\/em>correspond \u00e0 une proportion cumulative de 0,5. Si les donn\u00e9es \u00e9taient class\u00e9es dans l&rsquo;ordre croissant, 50% des valeurs seraient inf\u00e9rieures \u00e0 la m\u00e9diane et 50% des valeurs seraient au-dessus de la m\u00e9diane. La m\u00e9diane fournit une autre mesure du centre de la distribution.<\/p>\n<p><em><strong>Les premier et troisi\u00e8me quartiles<\/strong><\/em> correspondent \u00e0 une proportion cumulative de 0,25 et 0,75, respectivement. Si les donn\u00e9es \u00e9taient class\u00e9es en ordre croissant, 25% des valeurs seraient situ\u00e9es en dessous du premier quartile et 25% des valeurs seraient situ\u00e9es au-dessus du troisi\u00e8me quartile.<\/p>\n<p>Si vous voulez une classification, en quatre classes d&rsquo;\u00e9gale importance (nombre de points), il vous suffit de prendre comme bornes le premier quartile, la m\u00e9diane et le troisi\u00e8me quartile. Vous aurez 25% de vos donn\u00e9es dans chacune des classes.<\/p>\n<h3>Mesure d&rsquo;\u00e9talement<\/h3>\n<p>L&rsquo;\u00e9cart de points autour de la valeur moyenne est une autre caract\u00e9ristique de la distribution de fr\u00e9quence affich\u00e9e. La variance des donn\u00e9es est l&rsquo;\u00e9cart quadratique moyen de toutes les valeurs par rapport \u00e0 la moyenne. Les unit\u00e9s sont le carr\u00e9 des unit\u00e9s des mesures originales et, parce qu&rsquo;elles impliquent des diff\u00e9rences au carr\u00e9, la variance calcul\u00e9e est sensible aux valeurs anormalement \u00e9lev\u00e9es ou basses.<br \/>\nL&rsquo;\u00e9cart-type est la racine carr\u00e9e de la variance. Il d\u00e9crit la diffusion des donn\u00e9es sur la moyenne dans les m\u00eames unit\u00e9s que les mesures d&rsquo;origine.<\/p>\n<p>Dans l&rsquo;exemple pr\u00e9c\u00e9dent, la moyenne des valeurs est 0,22705 et l&rsquo;\u00e9cart-type est de 0,083076. Grosso-modo ceci veut dire que 68% de nos donn\u00e9es se trouveront dans la fourchette 0,14 \u00e0 0,30.<\/p>\n<p>Plus l&rsquo;\u00e9cart-type est grand, plus la courbe de distribution est aplatie. Plus l&rsquo;\u00e9cart-type est petit, plus pointue est la courbe. Le probl\u00e8me au quotidien est que ceci s&rsquo;applique \u00e0 chaque type de donn\u00e9e et qu&rsquo;il n&rsquo;y a pas de sens de comparer l&rsquo;\u00e9cart type de temp\u00e9ratures avec l&rsquo;\u00e9cart-type de la surface de la banquise, car les unit\u00e9s de mesure n&rsquo;ont aucun lien.<\/p>\n<p>C&rsquo;est beaucoup plus simple de regarder l&rsquo;allure de la distribution, vous verrez tout de suite si vous \u00eates en <a href=\"https:\/\/www.sigterritoires.fr\/index.php\/cartes-enc-dans-qgis-avec-postgis1\/\">face<\/a> d&rsquo;une distribution aplatie ou pointue!<\/p>\n<p><a href=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" data-attachment-id=\"3743\" data-permalink=\"https:\/\/www.sigterritoires.fr\/index.php\/analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes\/_v7\/\" data-orig-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?fit=337%2C251&amp;ssl=1\" data-orig-size=\"337,251\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"_v7\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?fit=337%2C251&amp;ssl=1\" class=\"aligncenter size-full wp-image-3743\" src=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?resize=337%2C251\" alt=\"\" width=\"337\" height=\"251\" srcset=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?w=337&amp;ssl=1 337w, https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?resize=300%2C223&amp;ssl=1 300w\" sizes=\"auto, (max-width: 337px) 100vw, 337px\" \/><\/a><\/p>\n<h3>Mesures de forme<\/h3>\n<p>La distribution de fr\u00e9quence est \u00e9galement caract\u00e9ris\u00e9e par sa forme. Et c&rsquo;est ici que nous avons les \u00e9l\u00e9ments les plus importants pour d\u00e9terminer si la distribution de nos donn\u00e9es suit une loi normale ou pas.<br \/>\n<em><strong>Le coefficient d&rsquo;asym\u00e9trie (Skewness)<\/strong> <\/em>est une mesure de la sym\u00e9trie d&rsquo;une distribution. Pour les distributions sym\u00e9triques, le coefficient d&rsquo;asym\u00e9trie est nul. La moyenne est plus grande que la m\u00e9diane pour les distributions positivement asym\u00e9triques, et vice versa pour les distributions n\u00e9gativement asym\u00e9triques. La figure ci-dessous montre une distribution positivement biais\u00e9e.<\/p>\n<p><a href=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v9.png\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" data-attachment-id=\"3745\" data-permalink=\"https:\/\/www.sigterritoires.fr\/index.php\/analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes\/_v9\/\" data-orig-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v9.png?fit=753%2C415&amp;ssl=1\" data-orig-size=\"753,415\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"_v9\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v9.png?fit=640%2C353&amp;ssl=1\" class=\"aligncenter wp-image-3745 size-full\" src=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v9.png?resize=640%2C353\" alt=\"exemple d'histogramme asym\u00e9trique\" width=\"640\" height=\"353\" srcset=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v9.png?w=753&amp;ssl=1 753w, https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v9.png?resize=300%2C165&amp;ssl=1 300w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><\/a>Pour une distribution normale, la valeur du coefficient d\u2019asym\u00e9trie est 0. Mais s&rsquo;il ne l&rsquo;est pas exactement, comment interpr\u00e9ter le r\u00e9sultat? Dans notre premier exemple d&rsquo;histogramme le coefficient d\u2019asym\u00e9trie est de -0.17. Est-ce qu&rsquo;il est significativement diff\u00e9rent de 0?<\/p>\n<p>Il y a plusieurs fa\u00e7ons de r\u00e9pondre \u00e0 cette question. Retenons ici le plus simple, sans calculs suppl\u00e9mentaires. C&rsquo;est le tableau qu&rsquo;on trouve dans le livre <em>\u00ab\u00a0Probabilit\u00e9s, analyse des donn\u00e9es et statistique\u00a0\u00bb<\/em> de G.\u00a0Saporta (\u00e9d. Technip) p.\u00a0587. Ce tableau indique, pour un nombre n de valeurs de l&rsquo;histogramme, les valeurs \u00e0 ne pas d\u00e9passer.<\/p>\n<p><a href=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v8.png\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" data-attachment-id=\"3746\" data-permalink=\"https:\/\/www.sigterritoires.fr\/index.php\/analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes\/_v8\/\" data-orig-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v8.png?fit=597%2C557&amp;ssl=1\" data-orig-size=\"597,557\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"_v8\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v8.png?fit=597%2C557&amp;ssl=1\" class=\"aligncenter size-full wp-image-3746\" src=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v8.png?resize=597%2C557\" alt=\"\" width=\"597\" height=\"557\" srcset=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v8.png?w=597&amp;ssl=1 597w, https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v8.png?resize=300%2C280&amp;ssl=1 300w\" sizes=\"auto, (max-width: 597px) 100vw, 597px\" \/><\/a><\/p>\n<p>Les valeurs sont donn\u00e9es pour des risques de 1\u00a0% et de 5\u00a0% pour <em>n<\/em> entre 7 \u00e0 5\u00a0000. Pour notre exemple, sur un \u00e9chantillon de 450 observations et un risque d\u2019erreur de 5%, le coefficient doit \u00eatre compris entre -0,188 et 0,188 pour consid\u00e9rer que la distribution est bel et bien sym\u00e9trique.<\/p>\n<p>Nous sommes bien dans ce cas.<\/p>\n<p><em><strong>Le coefficient d\u2019aplatissement ( kurtosis)<\/strong> <\/em>est bas\u00e9 sur la hauteur des bords (ou queues) d&rsquo;une distribution et fournit une mesure de la probabilit\u00e9 que la distribution produise des valeurs aberrantes, c&rsquo;est \u00e0 dire qu&rsquo;il y ait des valeurs qui s&rsquo;\u00e9cartent beaucoup de la moyenne.<\/p>\n<p>Le kurtosis d&rsquo;une distribution normale est \u00e9gale \u00e0 3. Les distributions avec des bords relativement \u00e9pais sont appel\u00e9es \u00a0\u00bb leptokurtiques \u00a0\u00bb et ont un kurtosis de valeur sup\u00e9rieure \u00e0 3. Les distributions avec des bords relativement minces sont d\u00e9nomm\u00e9es \u00a0\u00bb platykurtiques\u00a0\u00bb et ont un kurtosis inf\u00e9rieur \u00e0 3. Dans la figure ci-dessous, une distribution normale est donn\u00e9e en rouge, et une distribution leptokurtique (bords \u00e9pais) est donn\u00e9e en noir<\/p>\n<p><a href=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" data-attachment-id=\"3743\" data-permalink=\"https:\/\/www.sigterritoires.fr\/index.php\/analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes\/_v7\/\" data-orig-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?fit=337%2C251&amp;ssl=1\" data-orig-size=\"337,251\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"_v7\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?fit=337%2C251&amp;ssl=1\" class=\"aligncenter size-full wp-image-3743\" src=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?resize=337%2C251\" alt=\"\" width=\"337\" height=\"251\" srcset=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?w=337&amp;ssl=1 337w, https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v7.png?resize=300%2C223&amp;ssl=1 300w\" sizes=\"auto, (max-width: 337px) 100vw, 337px\" \/><\/a>Sur le lot de donn\u00e9es correspondant \u00e0 la courbe en noir, il va \u00eatre plus difficile de savoir si des valeurs trop \u00e9lev\u00e9es ou trop faibles sont des valeurs aberrantes, c&rsquo;est \u00e0 dire des erreurs de mesure.<\/p>\n<p>En r\u00e9sum\u00e9: si le kurtosis est inf\u00e9rieur \u00e0 3, vous serez favoris\u00e9 dans la recherche des valeurs aberrantes, par exemple en utilisant les polygones de Vorono\u00ef (que nous verrons dans un article ult\u00e9rieur), s&rsquo;il est sup\u00e9rieur \u00e0 3, ce sera plus difficile.<\/p>\n<p>Vous pouvez, selon l&rsquo;outil utilis\u00e9, trouver une autre valeur \u00e0 la place du kurtosis, l&rsquo;exc\u00e8s de kurtosis. C&rsquo;est simplement le kurtosis moins 3. Comme la valeur 3 est la valeur centrale, l&rsquo;exc\u00e8s de kurtosis permet de reconna\u00eetre imm\u00e9diatement les courbes platikurtiques (valeurs n\u00e9gatives de l&rsquo;exc\u00e8s) des leptokurtiques (valeurs positives).<\/p>\n<h2>Interpr\u00e9tation des histogrammes<\/h2>\n<p><span id=\"result_box\" class=\"\" lang=\"fr\"><span class=\"\">Certaines m\u00e9thodes de krigeage fonctionnent mieux si les donn\u00e9es sont approximativement distribu\u00e9es normalement (la courbe en forme de cloche).<\/span><br \/>\n<span class=\"\">En particulier, les cartes de quantiles et de probabilit\u00e9 utilisant le krigeage ordinaire, simple et universel supposent que les donn\u00e9es proviennent d&rsquo;une distribution normale.<\/span><br \/>\n<span class=\"\">Comme nous l&rsquo;avons vu dans l&rsquo;article pr\u00e9c\u00e9dent, le krigeage repose \u00e9galement sur l&rsquo;hypoth\u00e8se de la stationnarit\u00e9.<\/span> <span class=\"\">Cette hypoth\u00e8se exige, en partie, que toutes les valeurs des donn\u00e9es proviennent de distributions qui ont la m\u00eame variabilit\u00e9.<\/span> <span class=\"\">Nous observons souvent dans la nature que, lorsque les valeurs augmentent, leur variabilit\u00e9 augmente.<\/span> <span class=\"\">Les <em><strong>transformations<\/strong> <\/em>des donn\u00e9es source peuvent \u00eatre utilis\u00e9es pour rendre vos donn\u00e9es normalement distribu\u00e9es et satisfaire l&rsquo;hypoth\u00e8se d&rsquo;une variabilit\u00e9 \u00e9gale pour tout l&rsquo;ensemble.<br \/>\n<\/span><\/span><\/p>\n<p><span id=\"result_box\" class=\"\" lang=\"fr\"><span class=\"\">Dans les outils histogramme de Geostatistical Analyst, vous trouverez\u00a0 plusieurs types de transformations, y compris la Box Cox (\u00e9galement connue sous le nom de transformation exponentielle), logarithmique et arcsinus.<\/span><\/span><\/p>\n<p><a href=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v11.png\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" data-attachment-id=\"3748\" data-permalink=\"https:\/\/www.sigterritoires.fr\/index.php\/analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes\/_v11\/\" data-orig-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v11.png?fit=760%2C412&amp;ssl=1\" data-orig-size=\"760,412\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"_v11\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v11.png?fit=640%2C347&amp;ssl=1\" class=\"aligncenter wp-image-3748 size-full\" src=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v11.png?resize=640%2C347\" alt=\"menu de transformations de l'histogramme dans geostatistical analyst\" width=\"640\" height=\"347\" srcset=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v11.png?w=760&amp;ssl=1 760w, https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v11.png?resize=300%2C163&amp;ssl=1 300w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><\/a>La simple observation (plus la valeur de la Skewness significativement diff\u00e9rente de 0 selon la table des d\u00e9passements) nous indique que la distribution n&rsquo;est pas normale.<\/p>\n<p>Si nous s\u00e9lectionnons une transformation Box Cox avec une valeur de param\u00e8tre (puissance de la fonction exponentielle) de O.55 on a<\/p>\n<p><a href=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v12.png\"><img data-recalc-dims=\"1\" loading=\"lazy\" decoding=\"async\" data-attachment-id=\"3749\" data-permalink=\"https:\/\/www.sigterritoires.fr\/index.php\/analyse-exploratoire-des-donnees-pour-la-geostatistiqueles-histogrammes\/_v12\/\" data-orig-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v12.png?fit=761%2C412&amp;ssl=1\" data-orig-size=\"761,412\" data-comments-opened=\"1\" data-image-meta=\"{&quot;aperture&quot;:&quot;0&quot;,&quot;credit&quot;:&quot;&quot;,&quot;camera&quot;:&quot;&quot;,&quot;caption&quot;:&quot;&quot;,&quot;created_timestamp&quot;:&quot;0&quot;,&quot;copyright&quot;:&quot;&quot;,&quot;focal_length&quot;:&quot;0&quot;,&quot;iso&quot;:&quot;0&quot;,&quot;shutter_speed&quot;:&quot;0&quot;,&quot;title&quot;:&quot;&quot;,&quot;orientation&quot;:&quot;0&quot;}\" data-image-title=\"_v12\" data-image-description=\"\" data-image-caption=\"\" data-large-file=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v12.png?fit=640%2C346&amp;ssl=1\" class=\"aligncenter wp-image-3749 size-full\" src=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v12.png?resize=640%2C346\" alt=\"resultat d'une transformation exponentielle de l'histogramme dans geostatistical analyst\" width=\"640\" height=\"346\" srcset=\"https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v12.png?w=761&amp;ssl=1 761w, https:\/\/i0.wp.com\/www.sigterritoires.fr\/wp-content\/uploads\/2017\/01\/v12.png?resize=300%2C162&amp;ssl=1 300w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><\/a>La Skewness est maintenant pratiquement 0 (0,0077).<\/p>\n<p>Il suffira de transformer les donn\u00e9es en entr\u00e9e avec cette fonction pour que les outils g\u00e9ostatistiques fonctionnent correctement. Dans Geostatistical Analyst, il n&rsquo;est pas n\u00e9cessaire de transformer les donn\u00e9es en entr\u00e9e. Il suffit d&rsquo;indiquer la transformation \u00e0 faire et les donn\u00e9es seront transform\u00e9es automatiquement avant d&rsquo;effectuer les calculs geostatistiques, puis les r\u00e9sultats seront transform\u00e9s avec la transformation inverse, tout aussi automatiquement.<\/p>\n<p>Si vous vous demandez comment on a trouv\u00e9 la valeur 0.55, ce n&rsquo;est pas compliqu\u00e9, en t\u00e2tonnant. Chaque fois que vous modifiez la valeur du param\u00e8tre, l&rsquo;affichage est recalcul\u00e9. Vous voyez tout de suite la valeur de la Skewness. Par it\u00e9rations, vous vous approcherez de la valeur 0.<\/p>\n<p>Dans le prochain article nous verrons un autre outil de l&rsquo;analyse exploratoire des donn\u00e9es spatialis\u00e9es: les QQ-plots (diagrammes quantile-quantile).<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Apr\u00e8s l&rsquo;article Introduction \u00e0 l&rsquo;analyse exploratoire des donn\u00e9es pour la g\u00e9ostatistique , nous allons commencer \u00e0 aborder chacun des outils disponibles pour r\u00e9aliser l&rsquo;analyse exploratoire des donn\u00e9es spatialis\u00e9es. Nous commen\u00e7ons avec les histogrammes.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"give_campaign_id":0,"_bbp_topic_count":0,"_bbp_reply_count":0,"_bbp_total_topic_count":0,"_bbp_total_reply_count":0,"_bbp_voice_count":0,"_bbp_anonymous_reply_count":0,"_bbp_topic_count_hidden":0,"_bbp_reply_count_hidden":0,"_bbp_forum_subforum_count":0,"sfsi_plus_gutenberg_text_before_share":"","sfsi_plus_gutenberg_show_text_before_share":"","sfsi_plus_gutenberg_icon_type":"","sfsi_plus_gutenberg_icon_alignemt":"","sfsi_plus_gutenburg_max_per_row":"","_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"jetpack_post_was_ever_published":false,"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":true,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[145,152],"tags":[357,15,65,361,356,360,359],"class_list":["post-3740","post","type-post","status-publish","format-standard","hentry","category-arcgis","category-outils_divers","tag-analyse-exploratoire","tag-arcgis","tag-arcmap","tag-geostatistical-analyst","tag-geostatistiques","tag-kurtosis","tag-skewness"],"aioseo_notices":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/p6XU0A-Yk","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/posts\/3740","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/comments?post=3740"}],"version-history":[{"count":0,"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/posts\/3740\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/media?parent=3740"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/categories?post=3740"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.sigterritoires.fr\/index.php\/wp-json\/wp\/v2\/tags?post=3740"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}