Analyse Exploration des données

Tous ce qui existe autour de nous peut être utiliser comme une donnée et nous fournir des informations des recherches. Sa peut être la couleur d’un objet, une photo, une vidéo, document, un journal, une recherche scientifique, un recensement.  En gros les données sont partout autour de nous. La donnée est un indicateur crucial dans les processus de prise de décision. L’on entend par donnée le résultat brut de la mesure ou de l’observation du monde réel, effectuée en référence à une échelle de perception des phénomènes. La donnée constitue la mémoire du monde.

L’analyse exploratoire de données est une technique qui permet d’étudier un ensemble de donnée et les analysées afin de ressortir ses diffèrent caractéristique qui découle de ces données. L’une des méthodes les plus courante pour faciliter les interprétations à l’utilisateur aujourd’hui est la mise en place des dascheboord (tableau de bord) interactif qui permet de visualiser la variation des données sur diffèrent forme graphique afin de rendre l’interprétation plus objective des informations recueillies et d’établi des mesures typiques qui résument la distribution.

Les indicateurs de performance en analyse exploratoire de donnée les plus courant vont être basée sur trois paramètres : Les paramètres de tendance centrale (ou de position), Les paramètres de dispersion, Les paramètres de concentration.

La tendance centrale a pour but de donner des informations plus précises sur la localisation des donnée mère (localisation dès leur distribution). En fonction du volume de donnée a analysée, plusieurs tendances centrales peuvent être utiliser pour faire parler les données : il s’agit de la Moyenne qui est la (somme de produit des effectifs) / (nombre d’effectif total de la distribution), celle-ci indique le centre d’équilibre de la distribution. Le mode lui va indiquer le centre de concentration de la distribution, c’est la modalité ayant le centre le plus élevé. Et enfin vient la médiane qui indique le centre de position d’une distribution.

Les paramètre de dispersion : l’action d’être divisée, de s’éparpiller correspond à la dispersion. En analyse exploratoire de donnée (statistique), une dispersion mesure la variabilité des valeurs d’une distribution. En général la dispersion est toujours positive. D’autant plus grand que les valeurs de la série sont étalées. Autrement dit la dispersion permet de voir s’il existe une relation entre les données à manipuler. Les indicateur de mesure les plus courant sont : la variance, l’écart-type et l’interquartile. Ces indicateurs complètent l’information apportée à celle plus haut sur les indicateurs de mesure de tendance centrale, mesurés par la moyenne , la médiane et le mode.

Le dernier paramètre est celui de la concentration : En mathématiques, la concentration de la mesure est un principe appliqué en théorie de la mesure, en statistiques, en probabilités et en combinatoire, et a des conséquences dans d’autres domaines tels que la théorie des Espaces de Banach. Informellement, cela signifie qu’une fonction qui ne varie pas trop d’un point à un autre (fonction lipschitzienne) prend d’autant moins de valeurs différentes que son nombre de variable est grand. Cette fonction apparaît donc quasiment constante. Concrètement, en statistique, ce phénomène explique notamment pourquoi une fonction qui dépend de nombreuses variables indépendantes de manière lipschitzienne est essentiellement constante, permettant ainsi de fournir une autre démonstration au théorème centrale limite.(Wikipédia)

Analyse Exploration des données

Tous ce qui existe autour de nous peut être utiliser comme une donnée et nous fournir des informations des recherches. Sa peut être la couleur d’un objet, une photo, une vidéo, document, un journal, une recherche scientifique, un recensement.  En gros les données sont partout autour de nous. La donnée est un indicateur crucial dans les processus de prise de décision. L’on entend par donnée le résultat brut de la mesure ou de l’observation du monde réel, effectuée en référence à une échelle de perception des phénomènes. La donnée constitue la mémoire du monde.

L’analyse exploratoire de données est une technique qui permet d’étudier un ensemble de donnée et les analysées afin de ressortir ses diffèrent caractéristique qui découle de ces données. L’une des méthodes les plus courante pour faciliter les interprétations à l’utilisateur aujourd’hui est la mise en place des dascheboord (tableau de bord) interactif qui permet de visualiser la variation des données sur diffèrent forme graphique afin de rendre l’interprétation plus objective des informations recueillies et d’établi des mesures typiques qui résument la distribution.

Les indicateurs de performance en analyse exploratoire de donnée les plus courant vont être basée sur trois paramètres : Les paramètres de tendance centrale (ou de position), Les paramètres de dispersion, Les paramètres de concentration.

La tendance centrale a pour but de donner des informations plus précises sur la localisation des donnée mère (localisation dès leur distribution). En fonction du volume de donnée a analysée, plusieurs tendances centrales peuvent être utiliser pour faire parler les données : il s’agit de la Moyenne qui est la (somme de produit des effectifs) / (nombre d’effectif total de la distribution), celle-ci indique le centre d’équilibre de la distribution. Le mode lui va indiquer le centre de concentration de la distribution, c’est la modalité ayant le centre le plus élevé. Et enfin vient la médiane qui indique le centre de position d’une distribution.

Les paramètre de dispersion : l’action d’être divisée, de s’éparpiller correspond à la dispersion. En analyse exploratoire de donnée (statistique), une dispersion mesure la variabilité des valeurs d’une distribution. En général la dispersion est toujours positive. D’autant plus grand que les valeurs de la série sont étalées. Autrement dit la dispersion permet de voir s’il existe une relation entre les données à manipuler. Les indicateur de mesure les plus courant sont : la variance, l’écart-type et l’interquartile. Ces indicateurs complètent l’information apportée à celle plus haut sur les indicateurs de mesure de tendance centrale, mesurés par la moyenne , la médiane et le mode.

Le dernier paramètre est celui de la concentration : En mathématiques, la concentration de la mesure est un principe appliqué en théorie de la mesure, en statistiques, en probabilités et en combinatoire, et a des conséquences dans d’autres domaines tels que la théorie des Espaces de Banach. Informellement, cela signifie qu’une fonction qui ne varie pas trop d’un point à un autre (fonction lipschitzienne) prend d’autant moins de valeurs différentes que son nombre de variable est grand. Cette fonction apparaît donc quasiment constante. Concrètement, en statistique, ce phénomène explique notamment pourquoi une fonction qui dépend de nombreuses variables indépendantes de manière lipschitzienne est essentiellement constante, permettant ainsi de fournir une autre démonstration au théorème centrale limite.(Wikipédia)

A lire également