Page d'accueil encyclopedie-enligne.com en page d'accueil
Liste Articles: [0-A] [A-C] [C-F] [F-J] [J-M] [M-P] [P-S] [S-Z] | Liste Catégories | Une page au hasard | Pages liées

Écart type


Sommaire

En statistique élémentaire

L'écart type (ou déviation standard) est un critère de dispersion. Il mesure l'écart à la moyenne observée (et non à la moyenne théorique) et correspond à la moyenne quadratique des écarts entre les valeurs observées et la moyenne de ces valeurs observées. Il se note avec la lettre de l'alphabet grec, σ (sigma minuscule).

Formules : on trouve les formules suivantes

où sont les valeurs du caractère, les effectifs, les fréquences, les milieux des classes et \overline{x} la moyenne

En probabilité

L'écart type mesure la dispersion d'une variable aléatoire autour de son espérance E(X). Il se calcule sous plusieurs formes

En théorie des sondages

Lorsqu'il s'agit d'estimer la dispersion autour de la moyenne d'un caractère statistique dans une population de grande taille à partir d'un échantillon de taille n, on utilise pour l'écart type la valeur suivante

s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n(x_i-\overline{x})^2}.

On peut remarquer que

s = \sigma\sqrt{\frac{n}{n-1}}

Pourquoi n-1 ?

La question que l'on se pose généralement est « Pourquoi n - 1 ? ». La raison pour laquelle on divise par n - 1 au lieu de n est un bel exemple de l'interaction permanente entre les statistiques et les probabilités.

Le sondage de n individus correspond à une série de n variables aléatoires xi indépendantes d'espérance E(X) et de variance V(X).
La moyenne \overline{x} de l'échantillon est une variable aléatoire d'espérance E(X) et de variance \frac{1}{n} \cdot V(X) (la moyenne de n variables aléatoires fluctue moins qu'une seule variable aléatoire).
La variance v de l'échantillon est une variable aléatoire dont on veut calculer l'espérance.
v=\left(\frac{1}{n}\sum x_i^2\right) - \overline{x}^2.
x_i^2 est une variable aléatoire d'espérance E(x_i^2) = E(x_i)^2 + V(x_i) donc égale à .
\frac{1}{n}\sum x_i^2 est une variable aléatoire d'espérance .
\overline{x}^2 est une variable aléatoire d'espérance E(\overline{x})^2+V(\overline{x})=E(X)^2+\frac{1}{n}V(X) .
Donc E(v) = E(X)^2+V(X) - E(X)^2-\frac{1}{n}V(X)=\frac{n-1}{n}V(X).
La variance v de l'échantillon fluctue donc autour de \frac{n-1}{n}V(X) et non autour de V(X) comme on aurait pu s'y attendre.
Pour obtenir une estimation de V(X), il est donc nécessaire de prendre \frac{n}{n-1}v.
Et pour obtenir une estimation de l'écart type , il est nécessaire de prendre \sigma \sqrt{\frac{n}{n-1}}.

On nomme variance le carré de l'écart type :

Résumé simplifié pour néophytes

Plus communément appelée ECART-TYPE, la déviation standard caractérise la largeur de la distribution. Elle est exprimée mathématiquement comme étant la racine carrée de la variance, celle-ci mesurant la distribution des valeurs autour du centre de la courbe.

Écart-type (S) = Racine carrée de la variance

La variance est définie comme étant la moyenne arithmétique des carrés des différences entre les valeurs observées et la moyenne. C'est une mesure du degré de dispersion d'un ensemble de données. On la calcule sous la forme de l'écart au carré moyen de chaque nombre par rapport à la moyenne d'un ensemble de données.

Par exemple : Si par convention, la déviation standard par rapport à un échantillon équivaut à 15 points de QI de différence, cela signifie que les 2/3 environ de la population d'une classe d'âge ont un QI compris entre 85 et 115 --> Voir QI

Généralement, plus les valeurs sont largement distribuées, plus l'écart-type est élevé. Imaginez, par exemple, que nous devons séparer deux ensembles différents de résultats d'examens de 30 élèves; les notes du premier examen varient de 31 % à 98 % et celles du second, de 82 % à 93 %. Compte tenu de ces étendues, l'écart-type serait plus grand pour les résultats du premier examen.

Il n'est pas toujours facile d'évaluer l'importance que doit avoir l'écart-type pour que les données soient largement dispersées.
L'importance de la valeur moyenne de l'ensemble des données dépend aussi de l'importance de l'écart-type. Lorsque vous mesurez quelque chose en millions, le fait d'avoir des mesures qui se rapprochent de la valeur moyenne n'a pas la même signification que si vous mesurez le poids de deux personnes.
Par exemple, si après avoir mesuré les recettes annuelles de deux grandes entreprises, vous constatez un écart de 100 000 euros, la différence est considérée comme étant peu significative, alors que si vous mesurez le poids de deux personnes, dont l'écart est de 30 kilogrammes, la différence est considérée comme étant très significative.
Voilà pourquoi il est utile, dans la plupart des cas, d'évaluer quelle est l'importance de l'écart-type par rapport à la moyenne de l'ensemble de données.


Voir aussi



This site support the Wikimedia Foundation. This Article originally from Wikipedia. All text is available under the terms of the GNU Free Documentation License Page HistoryOriginal ArticleWikipedia