Sie sind auf Seite 1von 20

Desviación típica

En estadística, la desviación estándar


(también representada por la letra griega
minúscula sigma σ o la letra latina s, así como
por las siglas SD -de standard deviation- en
algunos textos traducidos del inglés) es una
medida que se usa para cuantificar la variación
o dispersión de un conjunto de datos
numéricos.1

Una desviación estándar baja indica que la


mayor parte de los datos de una muestra
tienden a estar agrupados cerca de su media
aritmética (también denominada el valor Una gráfica de la distribución normal (o curva en forma de campana, o curva
de Gauss), donde cada banda tiene un ancho de una vez la desviación
esperado), mientras que una desviación
estándar (véase también:regla 68-95-99,7)
estándar alta indica que los datos se extienden
sobre un rango de valores más amplio.

Índice
Consideraciones generales
Ejemplos básicos
Desviación estándar muestral de
la tasa metabólica de los petreles
Desviación estándar poblacional
de las calificaciones de ocho
alumnos
Desviación estándar muestral de
las edades de seis niños
Desviación estándar de la
estatura media de hombres
adultos
Definición de los valores de una
población
Variable aleatoria discreta
Probabilidad acumulada de una distribución normal con valor esperado 0 y
Variable aleatoria continua
desviación estándar 1
Estimación
Desviación estándar de la
muestra no corregida
Desviación estándar de la
muestra corregida
Desviación estándar de la
muestra no sesgada
Intervalo de confianza de la
desviación estándar de una
muestra
Identidades y propiedades
matemáticas
Interpretación y aplicación
Ejemplos de aplicación
Experimentos, pruebas
industriales y de hipótesis
Meteorología
Finanzas
Interpretación geométrica
La desigualdad de Chebyshov
Reglas para datos con una
distribución normal
Relación entre la desviación
estándar y la media
Desviación estándar de la media
Métodos de cálculo rápido
Cálculo ponderado
Historia
Véase también
Referencias
Enlaces externos

Consideraciones generales
La desviación estándar de una variable
aleatoria, población estadística, conjunto de
Fórmulas fundamentales
datos o distribución de probabilidad es la raíz
cuadrada de su varianza. Es algebráicamente
Variable aleatoria discreta:2
más simple, aunque en la práctica menos
robusta, que la desviación media.3 4 Una
propiedad útil de la desviación estándar es que, (Media aritmética)
a diferencia de la varianza, se expresa en las
mismas unidades que los datos a partir de los (Población completa)
que se calcula.

Además de expresar la variabilidad de una (Muestra de una población)


población, la desviación estándar se usa
comúnmente para medir la fiabilidad de las
Expresiones equivalentes:
conclusiones estadísticas. Por ejemplo, el
margen de error en los datos de los sondeos de
opinión se determina calculando la desviación (Población completa)
estándar esperada en los resultados si la misma
encuesta se llevara a cabo varias veces. Esta
(Muestra de una
interpretación de la desviación estándar a
menudo se denomina "error estándar" de la población)
estimación o "error estándar de la media"
Variable aleatoria continua:
(cuando se refiere a una media). Se calcula
como la desviación estándar de todas las
medias que se calcularían a partir de esa
población si se extrajera un número infinito de
muestras y se calculase la media para cada
muestra.

Es muy importante tener en cuenta que la desviación estándar de una población y el error estándar de una estadística obtenida a partir de esa
población (como la media) son bastante diferentes, pero están relacionados (relacionados por la inversa de la raíz cuadrada del número de
observaciones). El margen de error de una encuesta se calcula a partir del error estándar de la media (o, alternativamente, del producto de la
desviación estándar de la población y la inversa de la raíz cuadrada del tamaño de la muestra, que es lo mismo) y es por lo general,
aproximadamente el doble de la desviación estándar: la mitad del ancho de un
intervalo de confianzadel 95 por ciento.
En ciencia, muchos investigadores analizan la desviación estándar de los datos experimentales, y solo los efectos que se alejan mucho más
de dos desviaciones estándar de lo que sería esperable, se consideran estadísticamente significativos: el error aleatorio normal o la variación
en las mediciones se distinguen de esta manera de los efectos genuinos o asociaciones probables. En finanzas también es un indicador
importante, puesto que la desviación estándar de latasa de retorno de una inversión da una medida de suvolatilidad.

Cuando solo está disponible una muestra de datos de una población, el término desviación estándar de la muestra o desviación estándar
muestral, puede referirse a la cantidad mencionada anteriormente aplicada a esos datos, o también a una cantidad modificada que es una
estimación imparcial de ladesviación estándar de la población(la desviación estándar de toda la población).

Ejemplos básicos

Desviación estándar muestral de la tasa metabólica de los petreles


5
El libro de Murray Logan "Biostatistical Design and Analysis Using R" da el ejemplo siguiente:

Los naturalistas Furness y Bryant6 midieron la tasa metabólica en reposo de 8 petreles reproductivos y de 6 hembras. La tabla muestra el
conjunto de datos obtenidos por Furness.

Datos obtenidos por Furness de la tasa metabólica de los


petreles del norte
Sexo Tasa metabólica Sexo Tasa metabólica
Macho 525.8 Hembra 727.7
Macho 605.7 Hembra 1086.5
Macho 843.3 Hembra 1091.0
Macho 1195.5 Hembra 1361.3
Macho 1945.6 Hembra 1490.5
Macho 2135.6 Hembra 1956.1
Macho 2308.7
Macho 2950.0

La gráfica muestra la tasa metabólica para machos y hembras. Por simple inspección visual,
parece que la variabilidad de la tasa metabólica es mayor para los machos que para las hembras.
La desviación estándar de la muestra de la tasa metabólica para las hembras de petrel se calcula como se explica a continuación. La fórmula
para calcular la desviación estándar de la muestra es

donde son los valores observados de los elementos de la muestra, es el valor medio de estas observaciones, y N es el
número de observaciones de la muestra.

En la fórmula de la desviación estándar de la muestra, para este ejemplo, el numerador es la suma de las desviaciones al cuadrado de la tasa
metabólica de cada animal respecto a la tasa metabólica media. La siguiente tabla muestra el cálculo de esta suma de desviaciones al
cuadrado para los petreles hembra, cuya suma es de 886047.09, como se muestra en la tabla.

Cálculo de la suma de cuadrados para las hembras de petrel


Tasa Diferencia con la media al
Animal Sexo Media Diferencia con la media
metabólica cuadrado
1 Hembra 727.7 1285.5 -557.8 311140.84
2 Hembra 1086.5 1285.5 -199.0 39601.00
3 Hembra 1091.0 1285.5 -194.5 37830.25
4 Hembra 1361.3 1285.5 75.8 5745.64
5 Hembra 1490.5 1285.5 205.0 42025.00
6 Hembra 1956.1 1285.5 670.6 449704.36

Suma de las diferencias al


Media de las tasas metabólicas: 1285.5 886047.09
cuadrado:

El denominador en la fórmula de la desviación estándar de la muestra es N-1, donde N es el número de machos. En este ejemplo, hay N = 6
hembras, por lo que el denominador es 6-1 = 5. Por lo tanto, la desviación estándar de la muestra para los petreles hembra, es

Para los petreles macho, un cálculo similar proporciona una muestra de desviación estándar de 894.37, aproximadamente el doble que la
desviación estándar para las hembras. La gráfica muestra los datos de la tasa metabólica, las medias (puntos rojos) y las desviaciones
estándar (líneas rojas) para machos y hembras.
El uso de la desviación estándar de la muestra implica que estos 14 petreles son una muestra de una población mayor. Si estos 14 petreles
comprendieran toda la población (si fueran los últimos 14 petreles sobrevivientes), entonces se podría hablar de la desviación estándar de la
población, en lugar de la desviación estándar de la muestra. En la fórmula de la desviación estándar de la población, el denominador es N en
lugar de N-1. No siempre es posible tomar medidas de una población completa, por lo que de manera predeterminada, las aplicaciones
informáticas de estadística suelen calcular la desviación estándar de la muestra (es decir, dividiendo por N-1). De manera similar, los
artículos de revistas se refieren a la desviación estándar de lamuestra, a menos que se especifique lo contrario.

Desviación estándar poblacional de las calificaciones de ocho alumnos


Supóngase que toda la población estudiada son ocho alumnos determinados de una clase en particular. Para un conjunto discreto de datos, la
desviación estándar de la población se determina calculando la raíz cuadrada de la media de las desviaciones de los valores restados de su
valor promedio, elevadas al cuadrado. Las calificaciones de la clase de ocho estudiantes (es decir, de la población estadística completa) son
los siguientes ocho valores:

Estos ocho datos tienen una media (promedio) de 5:

En primer lugar, se calculan las desviaciones de cada dato respecto a la media, y seeleva al cuadrado el resultado de cada una:

La varianza es la media de estos valores:

y la desviación estándar de lapoblación es igual a la raíz cuadrada de la varianza:

Esta fórmula es válida solo si los ocho valores con los que se trabaja forman la población completa. Si los valores, en cambio, fueran una
muestra aleatoria extraída de una gran población de alumnos (por ejemplo, fueron 8 calificaciones elegidas al azar e independientemente de
un censo de 2 millones de alumnos), entonces el resultado se obtendría dividiendo por 7 (que es N − 1) en lugar de por 8 (que es N) en el
denominador de la última fórmula. En ese caso, el resultado de la fórmula original se denominaría la desviación estándar de la muestra.
Dividir por N - 1 en lugar de por N da una estimación imparcial de la varianza de una población más grande. Esta modificación se conoce
como corrección de Bessel.7

Desviación estándar muestral de las edades de seis niños


Aquí se muestra cómo calcular la desviación estándar de un conjunto de datos. Los datos representan la edad de los miembros de un grupo
de niños: {4, 1, 11, 13, 2, 7}

1. Calcular el promedio omedia aritmética

En este caso, n = 6:
Sustituyendo n por 6

2. Calcular la desviación estándar

Sustituyendo n por 6;

Sustituyendo por 6,33

Desviación estándar de la estatura media de hombres adultos


Si la población estudiada tiene una distribución aproximadamente normal, la desviación estándar proporciona información sobre la
proporción de las observaciones que se sitúan por encima o por debajo de ciertos valores. Por ejemplo, la estatura media de los hombres
adultos en los Estados Unidos es de aproximadamente 177.8 cm, con una desviación estándar de alrededor de 7.62 cm. Esto significa que la
mayoría de los hombres (alrededor del 68%, suponiendo un distribución normal) tienen una altura dentro de un intervalo de 7.62 cm
alrededor de la media (entre 170.18 y 185.42 cm) y que casi todos los hombres (alrededor del 95%) tienen una altura dentro de los 15.24 cm
alrededor de la media (entre 162.56 y 193.04 cm), un intervalo de dos desviaciones estándar de radio. Si la desviación estándar fuera cero,
entonces todos los hombres tendrían una altura de exactamente 177.8 cm (el valor medio). Si la desviación estándar fuera de 50.8 cm,
entonces los hombres tendrían alturas mucho más variables, con un rango típico de aproximadamente entre 127 y 228.6 cm. Un intervalo de
tres desviaciones estándar de radio representa el 99.7% de la población de la muestra que se estudia, asumiendo que posee una distribución
normal (en forma de campana). Consúltese laregla 68-95-99.7, o "regla empírica" para obtener más información.

Definición de los valores de una población


Sea X una variable aleatoria con valor medio:
Aquí el operador E denota el promedio o laesperanza matemática de X. Entonces la desviación estándar de X es la cantidad

(deducida utilizando las propiedades de lamedia).

En otras palabras, la desviación estándar σ (σ) es la raíz cuadrada de la varianza de X; es decir, es la raíz cuadrada del valor promedio de
(X - μ)2.

La desviación estándar de una distribución de probabilidad (de una variable) es la misma que la de una variable aleatoria que tiene esa
distribución. No todas las variables aleatorias tienen una desviación estándar, ya que estos valores no siempre existen necesariamente. Por
ejemplo, la desviación estándar de una variable aleatoria que sigue una distribución de Cauchy no está definida, porque su valor esperado μ
no está definido.

Variable aleatoria discreta


En el caso donde X toma valores aleatorios de un conjunto de datos finito x1, x2, ..., xN, con cada valor con la misma probabilidad, la
desviación estándar es

o, usando la notación con unsumatorio,

Si, en lugar de poseer probabilidades iguales, los valores poseen probabilidades diferentes, entonces se tiene que x1 tiene la probabilidad p1,
x2 tiene una probabilidadp2, ..., xN tiene una probabilidadpN. En este caso, la desviación estándar será

Variable aleatoria continua


La desviación estándar de unavariable aleatoria continua realX con una función de densidad de probabilidadp(x) es

donde las integrales en x se extienden sobre el todo el conjunto de valores posibles de la variable aleatoria
X.
En el caso de un familia paramétrica de distribuciones, la desviación estándar se puede expresar en términos de sus parámetros. Por ejemplo,
en el caso de la distribución log-normalcon los parámetros μ y σ2, la desviación estándar es

Estimación
Véase también: Varianza
Es posible encontrarse con la desviación estándar de una población completa en casos donde se conoce el valor de todos y cada uno de los
miembros de una población. En los casos en que esto no se puede hacer (en general, por tratarse con poblaciones muy grandes), la
desviación estándar σ se estima examinando una muestra de la población tomada aleatoriamente, y calculando un tratamiento estadístico de
la muestra dada, que se utiliza como una estimación de la desviación estándar de la población. Dicha estadística se denomina estimador,
un y
el estimador (o el valor del estimador, a saber, la estimación) se denomina desviación estándar de la muestra y se denota con s
(posiblemente con modificadores). Sin embargo, a diferencia del caso de estimar la media poblacional, para la que la media muestral es un
estimador simple con muchas propiedades deseables (sin sesgo, eficiente y con máxima probabilidad), no existe un estimador único para la
desviación estándar con todas estas propiedades, y la estimación no sesgada de la desviación estándar es un problema con muchas
implicaciones técnicas. La mayoría de las veces, la desviación estándar se calcula utilizando la desviación estándar de la muestra corregida
(usando N - 1, definida a continuación), y que a menudo se conoce simplemente como la "desviación estándar de la muestra", sin
calificadores. Sin embargo, otros estimadores son mejores en algunos aspectos: el estimador no corregido (que usa N) produce un error
cuadrático medio más bajo, mientras que el uso deN − 1.5 (para una distribución normal) elimina el sesgo casi por completo.

Desviación estándar de la muestra no corregida


La fórmula para la desviación estándar de una población (de una población finita) se puede aplicar a la muestra, utilizando el tamaño de la
muestra como el tamaño de la población (aunque el tamaño real de la población de la que se extrae la muestra sea mucho más grande). Este
estimador, denotado por sN, se conoce como la desviación estándar de la muestra no corregida, o algunas veces como la desviación
estándar de la muestra(considerada como la población total), y se define como sigue:

donde son los valores observados de los elementos de la muestra y es el valor medio de estas observaciones, mientras
que el denominador N representa el tamaño de la muestra: esta es la raíz cuadrada de la varianza de la muestra, que es el promedio de las
desviaciones al cuadrado respecto a la media muestral.

Este es un estimador consistente (porque converge en probabilidad al valor de la población cuando el número de muestras llega al infinito), y
posee la máxima verosimilitud estimadacuando la población está normalmente distribuida.

Sin embargo, posee un sesgo estadístico, ya que el número de observaciones es generalmente demasiado bajo. El sesgo disminuye a medida
que crece el tamaño de la muestra, disminuyendo como 1/N, y por lo tanto es más significativo para tamaños de muestra pequeños o
moderados; para el sesgo es inferior al 1 %. Por lo tanto, para tamaños de muestra muy grandes, la desviación estándar de la
muestra no corregida es generalmente aceptable. Este estimador también tiene un
error cuadrático mediouniformemente más pequeño que la
desviación estándar de la muestra corregida.

Desviación estándar de la muestra corregida


Si la varianza sesgada (el segundo momento central de la muestra, que es una estimación sesgada hacia abajo de la varianza de la población)
se utiliza para calcular una estimación de la desviación estándar de la población, el resultado es
Aquí, al tomar la raíz cuadrada se introduce un sesgo más hacia abajo, por la desigualdad de Jensen, debido a que la raíz cuadrada es una
función cóncava. El sesgo en la varianza se corrige fácilmente, pero el sesgo de la raíz cuadrada es más difícil de corregir y depende de la
distribución en cuestión.

Se obtiene un estimador no sesgado de lavarianza aplicando la corrección de Bessel, usando N − 1 en lugar de N para obtener la varianza de
la muestra no sesgada, denotada por s2:

Este estimador es insesgado si existe la varianza y los valores de la muestra se extraen independientemente con reemplazo (es decir, cada
elemento de la muestra se devuelve a la población antes de elegir el siguiente elemento). N - 1 corresponde al número de grados de libertad
del vector de desviaciones de la media,

Al calcular la raíz cuadrada se reintroduce un sesgo (porque la raíz cuadrada es una función no lineal, que no posee la propiedad
commutativa con respecto a la media), lo que produce ladesviación estándar de la muestra corregida, denotada por s:

Como se explicó anteriormente, mientras que s2 es un estimador no sesgado de la varianza poblacional, s sigue siendo un estimador sesgado
para la desviación estándar de la población, aunque es notablemente menos sesgado que la desviación estándar de la muestra no corregida.
Este estimador se usa comúnmente y generalmente se conoce simplemente como la "desviación estándar de la muestra". El sesgo aún puede
ser grande para muestras pequeñas (N menor de 10). A medida que aumenta el tamaño de la muestra, el valor del sesgo disminuye. Se

obtiene más información cuando la diferencia entre y se hace más pequeña.

Desviación estándar de la muestra no sesgada


Para la estimación de la desviación estándar no sesgada, no existe una fórmula que funcione en todas las distribuciones, a diferencia de lo
que sucede con la media y con la varianza. En su lugar, s se usa como base y se escala según un factor de corrección para producir una
estimación no sesgada. Por ejemplo, para la distribución normal, un estimador no sesgado viene dado por s/c4, donde el factor de corrección
(que depende de N) se da en términos de lafunción gamma, y es igual a:

Esto se debe a que la distribución de la desviación estándar de la muestra sigue una distribución χ (escalada), y el factor de corrección es la
media de la distribución χ.

Se puede dar una aproximación reemplazandoN − 1 por N − 1.5, dando como resultado:

El error en esta aproximación decae de forma cuadrática (como 1/N2), y es adecuado para todas las muestras, excepto las más pequeñas o
cuando se requiere una precisión máxima: paraN = 3, el sesgo es igual al 1.3%, y paraN = 9 el sesgo ya es menor del 0.1%.

Una aproximación más precisa es reemplazar el anterior por .8 Para otras distribuciones, la fórmula
correcta depende de la distribución, pero una regla de oro es usar el refinamiento adicional de la aproximación:
donde γ2 denota la curtosis de la población. El exceso de curtosis puede ser conocido de antemano para ciertas distribuciones, o estimado a
partir de los datos.

Intervalo de confianza de la desviación estándar de una muestra


Véanse también: Margen de error, Varianza y Distribución t de Student.
La desviación estándar que se obtiene de una muestra de una distribución no es del todo precisa, por razones matemáticas (de acuerdo con el
intervalo de confianza) y por razones prácticas de medición (error de medición). El efecto matemático puede ser descrito por el intervalo de
confianza o CI.

Para mostrar cómo una muestra más grande hace que el intervalo de confianza sea más estrecho, considérense los siguientes ejemplos:

Una pequeña población de N = 2 tiene solo 1 grado de libertad para estimar la desviación estándar. El resultado es que un IC del 95% de la
desviación estándar se extiende desde 0.45 ×s a 31.9 × s; los factores son aquí los siguientes:

donde es el p-cuantil de la distribución χ² con k grados de libertad, y es el nivel de confianza. Esto es equivalente a lo siguiente:

Con k=1, y . Los recíprocos de las raíces cuadradas de estos dos números proporcionan los factores 0.45
y 31.9 dados anteriormente.

Una población mayor de N = 10 tiene 9 grados de libertad para estimar la desviación estándar. Los mismos cálculos anteriores proporcionan
en este caso un IC del 95%, que va desde 0.69 × SD a 1.83 × SD. Por lo tanto, incluso con una población de 10 muestras, la desviación
estándar real puede ser casi dos veces mayor que la de la muestra. Para una población con una muestra de N = 100, esto se reduce a
0.88 × SD a 1.16 × s. Para estar más seguros de que la desviación estándar de la muestra queda cerca de la real, se necesita una muestra con
un gran número de datos.

Estas mismas fórmulas se pueden usar para obtener intervalos de confianza con la varianza de los residuos de un ajuste por mínimos
cuadrados según la teoría normal estándar, donde k sería el número de grados de libertad del error.

Identidades y propiedades matemáticas


La desviación estándar es invariante bajo los cambios del origen de coordenadas utilizado para la toma de los datos, y es directamente
proporcional con respecto a laescala de la variable aleatoria. Por lo tanto, para una constantec y variables aleatoriasX e Y:

La desviación estándar de la suma de dos variables aleatorias se puede relacionar con sus desviaciones estándar individuales y la covarianza
entre ellas:
donde y representan la varianza y lacovarianza respectivamente.

El cálculo de la suma de las desviaciones al cuadrado se puede relacionar con los


momentos calculados directamente a partir de los datos. En
la siguiente fórmula, la letraE se interpreta como el valor esperado, es decir,la media.

La desviación estándar de la muestra se puede calcular como:

Para una población finita con probabilidades iguales en todos los puntos, se tiene

Esto significa que la desviación estándar es igual a la raíz cuadrada de la diferencia entre el promedio de los cuadrados de los valores y el
cuadrado del valor promedio.

Consúltese la fórmula de cálculo de la varianzapara un resultado análogo con la desviación estándar de la muestra.

Interpretación y aplicación
Véanse también: Intervalo de predicción e Intervalo de confianza.
Una gran desviación estándar indica que los puntos de
datos pueden extenderse lejos de la media y una pequeña
desviación estándar indica que están agrupados cerca de
la media.

Por ejemplo, cada una de las tres poblaciones {0, 0, 14,


14}, {0, 6, 8, 14} y {6, 6, 8, 8} tiene una media de 7. Sus
desviaciones estándar son 7, 5 y 1, respectivamente. La
tercera población tiene una desviación estándar mucho
más pequeña que las otras dos porque sus valores son
todos cercanos a 7. La desviación estándar posee las
mismas unidades que los propios datos. Si, por ejemplo,
el conjunto de datos {0, 6, 8, 14} representa las edades
de una población de cuatro hermanos en años, la
desviación estándar es de 5 años. Como otro ejemplo, la
población {1000, 1006, 1008, 1014} puede representar Ejemplo de muestras de dos poblaciones con la misma media pero
las distancias recorridas por cuatro atletas, medidas en con desviaciones estándar diferentes. La población representada en
metros. Tiene una media de 1007 metros y una rojo tiene media 100 ys 10; la azul tiene media 100 ys 50
desviación estándar de 5 metros.

La desviación estándar puede servir como una medida de incertidumbre. En física, por ejemplo, la desviación estándar de un conjunto de
mediciones sucesivas de una misma magnitud (como por ejemplo, de la velocidad de la luz), indica la precisión de esas mediciones. Al
determinar si las mediciones concuerdan con una predicción teórica, la desviación estándar de esas mediciones es de crucial importancia: si
la media de las mediciones está demasiado alejada de la predicción (con la esta distancia medida según la desviación estándar), entonces la
teoría que se está probando probablemente necesita ser revisada. Esto tiene sentido, ya que se encuentran fuera del rango de valores que
podrían esperarse razonablemente si la predicción fuera correcta y la desviación estándar se cuantificara adecuadamente (véase intervalo de
predicción).
Si bien la desviación estándar determina en qué medida se alejan los datos de la media, hay otras medidas disponibles. Un ejemplo es la
desviación media, que podría considerarse una medida más directa de la distancia promedio, en comparación con la raíz de las distancias al
cuadrado inherente a la desviación estándar.

Ejemplos de aplicación
El valor práctico de comprender la desviación estándar de un conjunto de valores reside en apreciar su grado de variación con respecto a la
media.

Experimentos, pruebas industriales y de hipótesis


La desviación estándar a menudo se usa para comparar datos del mundo real con un modelo para probar el modelo. Por ejemplo, en
aplicaciones industriales, el peso de los productos que salen de una línea de producción puede necesitar cumplir con un valor legalmente
requerido. Al pesar alguna fracción de los productos, se puede determinar un peso promedio, que siempre será ligeramente diferente al
promedio a largo plazo. Al utilizar la desviación estándar, se puede calcular un valor mínimo y máximo tales que el peso promedio estará
dentro en un porcentaje muy alto de las ocasiones (un 99.9% o más). Si cae fuera del rango, es posible que el proceso de producción deba
corregirse. Pruebas estadísticas como estas son particularmente importantes cuando la obtención de medidas es relativamente cara. Por
ejemplo, si el producto necesita ser abierto y drenado para pesarse, o si el producto es alterado por la prueba.

En la ciencia experimental, se utiliza un modelo teórico de la realidad. Por ejemplo, la física de partículas usa convencionalmente un
estándar de "5 sigma" para la declaración de un descubrimiento.9 Un nivel de cinco sigma se traduce en una posibilidad entre 3.5 millones
de que una fluctuación aleatoria produzca el resultado predicho. Este nivel de certeza era necesario para afirmar que se había descubierto
una partícula consistente con el bosón de Higgs en dos experimentos independientes realizados por la Organización Europea para la
Investigación Nuclear,10 y este fue también el nivel de relevancia que llevó a la declaración de la detección de ondas gravitacionales por
primera vez.11

Meteorología
Como ejemplo simple, considérense las temperaturas máximas promedio diarias de dos ciudades, una interior y otra en la costa. Es útil
comprender que el rango de temperaturas máximas diarias para las ciudades cercanas a la costa es menor que para las ciudades del interior.
Por lo tanto, si bien estas dos ciudades pueden tener la misma temperatura máxima promedio, la desviación estándar de la temperatura
máxima diaria para la ciudad costera será menor que la de la ciudad interior, ya que, en cualquier día en particular, la temperatura máxima
real es más probable que se sitúe más lejos de la temperatura máxima promedio en la ciudad interior que en la costera.

Finanzas
En finanzas, la desviación estándar se usa a menudo como una medida del riesgo asociado con las fluctuaciones de precio de un activo
determinado (acciones, bonos, propiedad, etc.), o con el riesgo de una cartera de activos12 (fondos mutuos administrados activamente,
índice mutuo de fondos, o fondos cotizados). El riesgo es un factor importante para determinar cómo administrar de manera eficiente una
cartera de inversiones porque determina la variación en los rendimientos del activo y/o la cartera y brinda a los inversores una base
matemática para tomar decisiones de inversión (según una disciplina conocida como teoría moderna de carteras). El concepto fundamental
de riesgo es que a medida que aumenta, el rendimiento esperado de una inversión también debería aumentar, según un aumento conocido
como la prima de riesgo. En otras palabras, los inversores deben esperar un mayor rendimiento de una inversión cuando esa inversión
conlleva un mayor nivel de riesgo o incertidumbre. Al evaluar las inversiones, los inversores deben estimar tanto el rendimiento esperado
como la incertidumbre de los rendimientos futuros. La desviación estándar proporciona una estimación cuantificada de la incertidumbre de
los rendimientos futuros.

Por ejemplo, supongase que un inversor tiene que elegir entre dos acciones. Las acciones A en los últimos 20 años tuvieron un rendimiento
promedio del 10 por ciento, con una desviación estándar de 20puntos porcentuales (pp) y las acciones B, durante el mismo período, tuvieron
rendimientos promedio del 12 por ciento, pero una desviación estándar más alta de 30 pp. Como base del riesgo y la rentabilidad, un
inversor puede decidir que la acción A es la opción más segura, ya que los dos puntos porcentuales adicionales de la acción B no valen la
desviación estándar adicional de 10 pp (mayor riesgo o incertidumbre de la rentabilidad esperada). Es probable que las acciones B no
alcancen la inversión inicial (pero también que excedan la inversión inicial) con mayor frecuencia que las acciones A en las mismas
circunstancias, y se estima que en promedio solo retornarán un dos por ciento más. En este ejemplo, se espera que la acción A gane
alrededor del 10 por ciento, más o menos 20 pp (un rango del 30 por ciento al -10 por ciento), aproximadamente dos tercios de los
rendimientos del año futuro. Al considerar rendimientos o resultados más extremos en el futuro, un inversor debe esperar resultados de hasta
un 10 por ciento más o menos 60 pp, o un rango del 70 por ciento al 50 por ciento, que incluye los resultados en un rango de tres
desviaciones estándar del rendimiento promedio (alrededor del 99.7 por ciento de los rendimientos probables).

El cálculo del promedio (o media aritmética) del rendimiento de un valor en un período determinado generará el rendimiento esperado del
activo. Para cada período, se resta el rendimiento esperado de los resultados reales con respecto de la media. Al elevar al cuadrado la
diferencia en cada período y tomar el promedio, se obtiene la varianza general del rendimiento del activo. Cuanto mayor sea la variación,
mayor será el riesgo que conlleva. Calculando la raíz cuadrada de esta variación se obtiene la desviación estándar de la herramienta de
inversión en cuestión.

La desviación estándar de la población se usa para establecer el ancho de las bandas de Bollinger, una herramienta de análisis técnico
ampliamente utilizada. Por ejemplo, la banda superior de Bollinger se da como x + nσx.. El valor más comúnmente usado paran es 2; hay un
cinco por ciento de posibilidades de obtener un valor por fuera de la banda, asumiendo una distribución normal de los rendimientos.

Se sabe que las series temporales financieras son series no estacionarias, mientras que los cálculos estadísticos anteriores, como la
desviación estándar, se aplican solo a las series estacionarias. Para aplicar las herramientas estadísticas anteriores a las series no
estacionarias, la serie primero debe transformarse en una serie estacionaria, permitiendo el uso de herramientas estadísticas con una base
válida desde la que poder trabajar en términos homogéneos.

Interpretación geométrica
Para obtener algunas ideas y aclaraciones geométricas, se plantea una población con tres valores, x1, x2 y x3. Esto define un punto P = (x1,
x2, x3) en R 3. Considérese la recta L = {(r, r, r): r ∈ R}. Esta es la "diagonal principal" pasando por el origen. Si los tres valores dados
fueran todos iguales, entonces la desviación estándar sería cero y P estaría en L. Por lo tanto, es lógico suponer que la desviación estándar
está relacionada con la distancia de P con respecto a L. Ese es de hecho el caso. Para desplazarse ortogonalmente desde L hasta el punto P,
se comienza en el punto:

cuyas coordenadas son la media de los valores de partida.

Demostración

Mediante un poco de álgebra, se demuestra que la distancia entre P y M (que es la misma que la distancia ortogonal entre P y la recta L)
es igual a la desviación estándar del vector (x1, x2, x3), multiplicado por la raíz cuadrada del número de dimensiones del

vector (3 en este caso).

La desigualdad de Chebyshov
Una observación cualquiera rara vez se sitúa a más de unas pocas desviaciones estándar de la media. La
desigualdad de Chebyshovgarantiza
que, para todas las distribuciones para las que se define la desviación estándar, la cantidad de datos dentro de una serie de desviaciones
estándar de la media es al menos la que se indica en la siguiente tabla.
Distancia respecto a la media Población mínima abarcada

50%

2σ 75%
3σ 89%
4σ 94%
5σ 96%
6σ 97%

13

Reglas para datos con una distribución normal


El teorema del límite central establece que la distribución de un promedio de muchas
variables aleatorias independientes e idénticamente distribuidas tiende hacia la famosa
distribución normal en forma de campana con unafunción de densidad de probabilidadde

El color azul oscuro representa el


donde μ es la esperanza matemática de las variables aleatorias, σ equivale a la desviación intervalo de la desviación estándar a
estándar de su distribución dividida porn1/2, y n es el número de variables aleatorias. Por lo ambos lados de la media. Para la
distribución normal, esto representa
tanto, la desviación estándar es simplemente una variable de escala que ajusta la amplitud
el 68.27 por ciento del conjunto;
de la curva, aunque también aparece en laconstante de normalización. mientras que dos desviaciones
estándar de la media (azul medio y
Si una distribución de datos es aproximadamente normal, entonces la proporción de valores
oscuro) representan 95.45 por
de datos dentro de z desviaciones estándar de la media, se define por: ciento; tres desviaciones estándar
(azul claro, medio y oscuro)
representan el 99.73 por ciento; y
ó
cuatro desviaciones estándar
representan el 99.994 por ciento. Los
donde es la función error. La proporción que es menor o igual a un número, x, viene dos puntos de la curva situados a
una desviación estándar de la media
dada por la función de distribución:
son también los puntos de inflexión
de la gráfica.

.14

Si una distribución de datos es aproximadamente normal, cerca del 68 por ciento de los valores de los datos estarán dentro de una desviación
estándar de la media (matemáticamente, μ ± σ, donde μ es la media aritmética), del orden del 95 por ciento estarán dentro de dos
desviaciones estándar, y en torno a un 99.7 por ciento estarán dentro de tres desviaciones estándar
(3σ ). Esto se conoce como laregla 68-95-
99.7, o la regla empírica.

Para varios valores de z, el porcentaje de valores que se espera que se encuentren dentro y fuera del intervalo simétrico, CI = (-zσ, zσ), son
los siguientes:
Porcentaje dentro de (z)

z para el porcentaje abarcado


Intervalo Proporción dentro Proporción fuera
de Confianza Porcentaje Porcentaje Fracción
0.318 639 σ 25 % 75 % 3/4
0,674490 σ 50 % 50 % 1/2
0,994458 σ 68 % 32 % 1 / 3,125
1σ 68,2689492 % 31,7310508 % 1 / 3,1514872
1,281552 σ 80 % 20 % 1/5
1,644854 σ 90 % 10 % 1 / 10
1,959964 σ 95 % 5% 1 / 20
2σ 95,4499736 % 4,5500264 % 1 / 21,977895
2,575829 σ 99 % 1% 1 / 100
3σ 99,7300204 % 0,2699796 % 1 / 370,398
3,290527 σ 99,9 % 0,1 % 1 / 1000
3,890592 σ 99,99 % 0,01 % 1 / 10 000
4σ 99,993666 % 0,006334 % 1 / 15 787
4,417173 σ 99,999 % 0,001 % 1 / 100 000
3.4 / 1 000 000
4,5 σ 99,9993204653751 % 0,0006795346249 %
(a cada lado de la media)
4,891638 σ 99,9999 % 0,0001 % 1 / 1 000 000
5σ 99,9999426697 % 0,0000573303 % 1 / 1 744 278
5,326724 σ 99,99999 % 0,00001 % 1 / 10 000 000
5,730729 σ 99,999999 % 0,000001 % 1 / 100 000 000
6σ 99,9999998027 % 0,0000001973 % 1 / 506 797 346
6,109410 σ 99,9999999 % 0,0000001 % 1 / 1 000 000 000
6,466951 σ 99,99999999 % 0,00000001 % 1 / 10 000 000 000
6,806502 σ 99,999999999 % 0,000000001 % 1 / 100 000 000 000
7σ 99,9999999997440 % 0,000000000256 % 1 / 390 682 215 445

Relación entre la desviación estándar y la media


En estadística descriptiva, la media y la desviación estándar de un conjunto de datos son generalmente facilitados juntas. En cierto sentido,
la desviación estándar es una medida "natural" de las medidas de dispersión si el centro de los datos se mide alrededor de la media. Esto se
debe a que la desviación estándar respecto a la media es menor que desde cualquier otro punto. La declaración precisa es la siguiente:

Supóngase que x1, ..., xn son números reales y se define la función:

Usando el cálculo infinitesimal o completando el cuadrado, es posible demostrar queσ(r) tiene un mínimo único en la media:

La variabilidad también puede medirse mediante el coeficiente de variación, que es la relación de la desviación estándar con respecto a la
media. Es una magnitud adimensional.
Desviación estándar de la media
A menudo, se requiere información sobre la precisión de la media obtenida. Este parámetro se puede obtener determinando la desviación
estándar de la media de la muestra. Suponiendo una independencia estadística de los valores de la muestra, la desviación estándar de la
media está relacionada con la desviación estándar de la distribución por:

donde N es el número de observaciones de la muestra utilizada para estimar la media. Esto se puede probar fácilmente con (véanse las
propiedades básicas de la varianza):

(se supone la independencia estadística de los datos).

por lo tanto

De aquí se deduce que:

Se debe enfatizar que para estimar la desviación estándar de la media es necesario conocer de antemano la desviación estándar de
toda la población . Sin embargo, en la mayoría de las aplicaciones este parámetro es desconocido. Por ejemplo, si se realiza una serie de 10
mediciones de una cantidad previamente desconocida en un laboratorio, es posible calcular la media de la muestra resultante y la desviación
estándar de la muestra, pero es imposible calcular la desviación estándar de la media.

Métodos de cálculo rápido


Véase también: Algoritmos para calcular la varianza
Las dos fórmulas siguientes permiten calcular una desviación estándar agregando datos. Un conjunto de dos sumas de potencias s1 y s2 se
calculan sobre un conjunto deN valores de x, denotado como x1, ... , xN:

Dados los resultados de estas sumas en ejecución, los valores N, s1, s2 se pueden usar en cualquier momento para calcular el valor actual de
la desviación estándar de ejecución:

Donde N, como se mencionó anteriormente, es el tamaño del conjunto de valores (o también puede considerarse como
s0).
Del mismo modo, para la desviación estándar de la muestra,

En un programa de ordenador, a medida que las sumas de tres sj se hacen grandes, se debe considerar el error de redondeo y el
desbordamiento aritmético (por rebosamiento de grandes cantidades o por la pérdida de la mantisa). El siguiente método calcula el método
de las sumas con errores de redondeo reducidos.15 Se trata de un algoritmo de "una pasada" para calcular la varianza de n muestras sin la
necesidad de almacenar los datos anteriores durante el cálculo. La aplicación de este método a una serie devuelve valores sucesivos de la
desviación estándar correspondiente a n datos a medida que n crece con cada nueva muestra, en lugar de un cálculo que requiera analizar en
su totalidad el nuevo conjunto de datos.

Para k = 1, ..., n:

donde A es el valor medio.

Nota: desde o

Varianza de la muestra:

Varianza de la población:

Cálculo ponderado
Cuando los valores xi se ponderan con pesos desigualeswi, las sumas de potenciass0, s1, s2 se computan como:

y las ecuaciones de la desviación estándar se mantienen sin cambios. Téngase en cuenta que s0 es ahora la suma de los pesos y no el número
de muestras N.

El método incremental con errores de redondeo reducidos también se puede aplicar


, con cierta complejidad adicional.

Se debe calcular una suma de pesos para cadak desde 1 hasta n:

y los lugares donde se usa 1/n anteriormente deben reemplazarse porwi/Wn:


En la división final,

donde n es el número total de elementos, y n' es el número de elementos con ponderaciones distintas de cero. Las fórmulas anteriores se
hacen iguales a las fórmulas más simples dadas arriba si los pesos se toman como iguales a uno.

Historia
El término desviación estándar fue utilizado por primera vez en un escrito por Karl Pearson,16 en una comunicación a la Royal Society17
de 1894, aunque ya lo había utilizado en sus clases. Esta denominación sustituyó a otros nombres anteriores de la misma idea: por ejemplo,
Gauss usó la expresión error medio.18

Véase también
Regla 68–95–99.7 estándar Pooled standard Inecuación de
Precisión y exactitud Barra de error deviation Samuelson
Desigualdad de Desviación estándar Propagación de errores Seis Sigma
Chebyshov, desigualdad geométrica Percentil Error estándar
que relaciona los Distancia de Puntuación bruta Unidad tipificada
parámetros de origen y Mahalanobis Coeficiente de variación Volatilidad (finanzas)
escala. generalizando el número
de desviaciones Desviación estándar Método de Yamartino
Cumulante
estándar a la media robusta para calcular la
Desviación (estadística) desviación estándar de
Error medio absoluto Media cuadrática
Distancia correlativa la dirección del viento
Tamaño de la muestra
Distancia desviación Parámetro estadístico
estándar

Referencias
3. Gauss, Carl Friedrich (1816). «Bestimmung der
1. Bland, J.M.; Altman, D.G. (1996). «Statistics notes: Genauigkeit der Beobachtungen». Zeitschrift für
measurement error» (https://www.ncbi.nlm.nih.gov/pmc/art Astronomie und verwandte Wissenschaften 1: 187-197.
icles/PMC2351401). BMJ 312 (7047): 1654. PMC 2351401
(https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2351401).
4. Walker, Helen (1931). Studies in the History of the
PMID 8664723 (https://www.ncbi.nlm.nih.gov/pubmed/8664723).
Statistical Method. Baltimore, MD: Williams & Wilkins Co.
doi:10.1136/bmj.312.7047.1654 (http://dx.doi.org/10.1136%2Fbmj.31
pp. 24-25.
2.7047.1654). 5. Logan, Murray (2010), Biostatistical Design and Analysis
2. UPTC. Desviación típica. Fórmulas (http://virtual.uptc.edu. Using R (http://users.monash.edu.au/~murray/BDAR/)
co/ova/estadistica/docs/libros/ftp.bioestadistica.uma.es/libr (First edición), Wiley-Blackwell
o/node22.htm) 6. Furness, R.W.; Bryant, D.M. (1996). «Efecto del viento en
la tasa metabólica de los petreles del norte». Ecology 77:
1181-1188. doi:10.2307/2265587 (http://dx.doi.org/10.2307%2F22 13. Ghahramani, Saeed (2000). Fundamentals of Probability
65587). (2nd Edition). Prentice Hall: New Jersey . p. 438.
7. Weisstein, Eric W. «Bessel's Correction» (http://mathworl 14. Eric W. Weisstein. «Distribution Function» (http://mathworl
d.wolfram.com/BesselsCorrection.html). En Weisstein, d.wolfram.com/DistributionFunction.html). MathWorld—A
Eric W. MathWorld (en inglés). Wolfram Research. Wolfram Web Resource. Consultado el 30 de septiembre
8. John Gurland and Ram C. Tripathi (1971), «A Simple de 2014.
Approximation for Unbiased Estimation of the Standard 15. Welford, BP (August 1962). «Note on a Method for
Deviation», The American Statistician 25 (4): 30-32, Calculating Corrected Sums of Squares and Products» (ht
doi:10.2307/2682923 (http://dx.doi.org/10.2307%2F2682923) tp://zach.in.tu-clausthal.de/teaching/info_literatur/W elford.
9. «CERN | Accelerating science» (http://public.web.cern.ch/ pdf). Technometrics 4 (3): 419-420.
public/). Public.web.cern.ch. Consultado el 10 de agosto doi:10.1080/00401706.1962.10490022 (http://dx.doi.org/10.1080%2
de 2013. F00401706.1962.10490022).
10. «CERN experiments observe particle consistent with long- 16. Dodge, Yadolah (2003). The Oxford Dictionary of
sought Higgs boson | CERN press office» (http://press-arc Statistical Terms. Oxford University Press. ISBN 0-19-
hive.web.cern.ch/press-archive/PressReleases/Releases2 920613-9.
012/PR17.12E.html). Press.web.cern.ch. 4 de julio de 17. Pearson, Karl (1894). «On the dissection of asymmetrical
2012. Consultado el 30 de mayo de 2015. frequency curves». Philosophical Transactions of the
11. ((LIGO Scientific Collaboration)), ((Virgo Collaboration)) Royal Society A 185: 71-110. Bibcode:1894RSPTA.185...71P
(2016), «Observation of Gravitational Waves from a Binary (http://adsabs.harvard.edu/abs/1894RSPTA.185...71P).
Black Hole Merger», Physical Review Letters 116 (6): doi:10.1098/rsta.1894.0003 (http://dx.doi.org/10.1098%2Frsta.1894.
061102, Bibcode:2016PhRvL.116f1102A (http://adsabs.harvard.ed 0003).
u/abs/2016PhRvL.116f1102A), PMID 26918975 (https://www.ncbi.nl 18. Miller, Jeff. «Earliest Known Uses of Some of the W ords of
m.nih.gov/pubmed/26918975), arXiv:1602.03837 (https://arxiv.org/ab Mathematics» (http://jeff560.tripod.com/mathword.html).
s/1602.03837), doi:10.1103/PhysRevLett.116.061102 (http://dx.doi.o
rg/10.1103%2FPhysRevLett.116.061102)
12. «What is Standard Deviation» (http://www.edupristine.co
m/blog/what-is-standard-deviation). Pristine. Consultado el
29 de octubre de 2011.

Enlaces externos
Wikimedia Commons alberga una galería multimedia sobreDesviación típica.
Simulación de la desviación típica de una variable discreta conR (lenguaje de programación)
Hazewinkel, Michiel, ed. (2001), «Quadratic deviation», Encyclopaedia of Mathematics (en inglés), Springer, ISBN 978-
1556080104
A simple way to understand Standard Deviation
Standard Deviation – an explanation without maths
The concept of Standard Deviation is shown in this 8 pies (2,4 m) Probability Machine (named Sir Francis) comparing stock
market returns to the randomness of the beans dropping through the quincunx pattern. en YouTube from Index Funds
Advisors IFA.com

Obtenido de «https://es.wikipedia.org/w/index.php?title=Desviación_típica&oldid=113891044
»

Esta página se editó por última vez el 11 feb 2019 a las 20:30.

El texto está disponible bajo laLicencia Creative Commons Atribución Compartir Igual 3.0 ; pueden aplicarse cláusulas
adicionales. Al usar este sitio, usted acepta nuestrostérminos de uso y nuestra política de privacidad.
Wikipedia® es una marca registrada de laFundación Wikimedia, Inc., una organización sin ánimo de lucro.

Das könnte Ihnen auch gefallen