SQL-STDEVP ou STDEV et comment l'utiliser?

j'ai une table:

LocationId OriginalValue Mean
1          0.45         3.99  
2          0.33         3.99
3          16.74        3.99
4          3.31         3.99

et ainsi de suite...

Comment pourrais-je travailler sur les Standard Deviation en utilisant ce tableau et aussi ce que vous recommanderiez -STDEVP ou STDEV?

25
demandé sur gotqn 2013-02-15 15:39:06

3 réponses

Pour l'utiliser, il suffit:

SELECT STDEVP(OriginalValue)
FROM yourTable

à Partir de ci-dessous, vous voudrez probablement STDEVP.

ici:

STDEV est utilisé lorsque le groupe de nombres évalués est seulement un partielle d'échantillonnage de l'ensemble de la population. Le dénominateur pour diviser la somme des déviations au carré est N-1, Où N est le nombre d'observations ( un nombre d'éléments dans l'ensemble de données ). Techniquement, soustraire le 1 est renvoyé comme "non-biaisée."

STDEVP est utilisé lorsque le groupe de nombres évalués est complet - c'est le population entière de valeurs. Dans ce cas, le 1 N'est pas soustrait et le dénominateur pour diviser la somme des déviations au carré est simplement N lui-même, le nombre d'observations ( un nombre d'articles dans l'ensemble de données ). Techniquement, cela est considéré comme biaisées."Se rappeler que le P dans STDEVP signifie "population" peut être utile. Depuis l'ensemble de données n'est pas un simple échantillon, mais constitué de TOUTES les valeurs réelles, l'écart type de la fonction peut retourner un résultat plus précis.

25
répondu Dukeling 2013-02-15 12:42:10

généralement, vous devez utiliser STDEV lorsque vous devez estimer l'écart-type sur la base d'un échantillon. Mais si vous avez des données entières de la colonne comme arguments, alors utilisez STDEVP.

en général, si vos données représentent la population entière, utilisez STDEVP; sinon, utilisez STDEV.

notez que pour les grands échantillons, les fonctions retournent presque la même valeur, donc mieux utiliser STDEV dans ce cas.

14
répondu CodeMan 2016-08-05 10:12:53

en statistique, il existe deux types d'écarts types: un pour un échantillon et un pour une population. L'écart-type d'échantillon, généralement notée par la lettre s, est utilisé comme une estimation de l'écart type de population. L'écart-type de la population, généralement noté par la lettre grecque Sigma minuscule, est utilisé lorsque les données constituent la population complète. Il est difficile de répondre directement à votre question -- échantillon ou population -- parce qu'il est difficile de dire ce avec quoi vous travaillez: un échantillon ou d'une population. Elle dépend souvent du contexte. Considérons l'exemple suivant. Si je veux connaître l'écart-type de l'âge des étudiants dans ma classe, alors je u=utiliserait STDEVP parce que la classe est ma population. Mais si je veux l'utilisation de ma classe comme un échantillon de la population de tous les étudiants dans l'école (ce serait ce qui est connu comme un échantillon de commodité, et serait probablement biaisé, mais je digresse), alors j'utiliserais STDEV parce que ma classe est un échantillon. Le la valeur résultante serait ma meilleure estimation de la VEPTS. Comme mentionné ci-dessus (1) pour les grandes tailles d'échantillon (disons plus de trente), la différence entre les deux devient triviale, et (2) généralement, vous devriez utiliser STDEV, pas STDEVP, parce que dans la pratique, nous n'avons généralement pas accès à la population. En effet, on pourrait dire que si nous avions toujours accès aux populations, nous n'aurions pas besoin de statistiques. Tout le but des statistiques inférentielles est de pouvoir faire des inférences sur une population basée sur échantillon.

3
répondu Bill Qualls 2017-05-11 17:10:28