Beruflich Dokumente
Kultur Dokumente
Las medidas de asimetra son indicadores que permiten establecer el grado de simetra (o asimetra) que presenta una distribucin de probabilidad de una variable aleatoria sin tener que hacer su representacin grfica. Existen medidas que indican de la simetra o asimetra de la distribucin y del achatamiento o no de la misma. Empezando con la simetra, es lgico pensar que si la distribucin tiene una nica moda y es simtrica, entonces las tres medidas de centralizacin coinciden. Si no es simtrica, suele suceder que la mediana est comprendida entre la moda y la media. Medidas de simetra o asimetra. Miden la mayor o menor simetra de la distribucin. Existen dos medidas de este tipo: ndice de simetra de Pearson:
Si la distribucin es simtrica, ambos ndices son iguales a 0; si es asimtrica a la derecha, ambos son positivos; y si es asimtrica a la izquierda, ambos ndices son negativos. Medidas de curtosis. Miden la mayor o menor concentracin de datos alrededor de la media. Se suele medir con el coeficiente de curtosis:
Si este coeficiente es nulo, la distribucin se dice normal (similar a la distribucin normal de Gauss) y recibe el nombre de mesocrtica. Si el coeficiente es positivo, la distribucin se llama leptocrtica, ms puntiaguda que la anterior. Hay una mayor concentracin de los datos en torno a la media.
Si el coeficiente es negativo, la distribucin se llama platicrtica y hay una menor concentracin de datos en torno a la media. Sera ms achatada que la primera. Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
Figura 5-1
Ecuacin 5-9
Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan: (g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5).
(g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media.
Sesgo
Es el grado de asimetra que tiene la distribucin. La distribucin puede ser: - Insesgada: Si tiene forma de campana y el rea acumulada del centro de la distribucin a la derecha es igual a la que se acumula a la izquierda.
Insesgada
Moda=Mediana=Media
Con sesgo positivo o a la derecha: Si tiene la mayor acumulacin de frecuencias a la izquierda y una cola larga a la derecha.
Con sesgo negativo o a la izquierda: Si la mayor acumulacin est a la derecha y tiene una cola larga a la izquierda.
El segundo coeficiente de disimetra de Pearson mide el alejamiento de la simetra expresando la diferencia entre la media y la mediana en relacin con la desviacin estndar del grupo de mediciones. Es importante resaltar que: Para una distribucin simtrica el valor del coeficiente de disimetra siempre sera cero, ya que la media y la mediana tienen igual valor. Para una distribucin positivamente disimtrica, la media es siempre mayor que la mediana, por lo tanto el valor del coeficiente ser positivo. Para una distribucin negativamente disimtrica, la media es menor que la mediana, en consecuencia el valor del coeficiente ser negativo.
Donde al final se ha sustrado 3 (que es la curtosis de la Normal) con objeto de generar un coeficiente que valga 0 para la Normal y tome a sta como referencia de apuntamiento: Tomando, pues, la distribucin normal como referencia, una distribucin puede ser:
ms apuntada que la normal leptocrtica. menos apuntada que la normal- platicrtica. la distribucin normal es mesocrtica. En la distribucin normal se verifica que 4 = 34, donde 4 es el momento de orden 4 respecto a la media y la desviacin tpica.
As tendremos que:
Si la distribucin es leptocrtica 2 > 3 y g2 > 0 Si la distribucin es platicrtica 2 < 3 y g2 < 0 Si la distribucin es mesocrtica 2 = 3 y g2 = 0
Otra forma de medir la curtosis se obtiene examinando la frmula de la curtosis de la suma de variables aleatorias. Si Y es la suma de n variables aleatorias estadsticamente independiente, todas con igual distribucin X, entonces curtosis se hubiese definido como . , complicndose la frmula si la
Momento
Existen dos tipos de momentos:
Dada una variable aleatoria X con funcin de probabilidad o densidad f(x) podemos definir una funcin de X que sea igual a la variable elevada a un exponente entero no negativo.
k=0 k=1
A este primer momento respecto al origen que es igual al valor esperado se le llama tambin media aritmtica de la variable y se le denomina X, simplemente . En la mayora de los casos, la media expresa la tendencia central de la variable o el orden de magnitud de sus valores.
El resto de los momentos respecto al origen tienen escaso inters en la mayora de los casos.
Momentos respecto a la media
Dada una variable aleatoria X con funcin de probabilidad o densidad f(x) podemos definir una funcin de X que sea igual a la diferencia entre la variable y su media aritmtica elevada a un exponente entero no negativo.
k=0 k=1 Es decir, en cualquier variable aleatoria su primer momento respecto de la media es igual a 0. Esta propiedad se utilizar reiteradamente en las demostraciones estadsticas. k=2 Este segundo momento respecto de la media se le llama tambin varianza.
La varianza de una variable mide la dispersin de sus valores respecto al valor central . Para calcular la varianza por un mtodo ms sencillo se utiliza la expresin:
Es decir, la varianza de una variable es igual a la media de los cuadrados menos el cuadrado de la media.
a3
m3 S3
x
n i 1
ns 3
Datos Agrupados:
a3
m3 S3
f x
k i1 i
ns3
Sesgo No hay sesgo. La distribucin es insesgada La distribucin tiene sesgo positivo o a la derecha. La distribucin tiene sesgo negativo o a la izquierda.
a3 > 0
a3 < 0
a4
m4 S4
x
n i 1
ns 3
Datos Agrupados
a4
m4 S4
f x
k i1 i
ns 4
Coeficiente curtosis
a4 = 3 a4 > 3
momento
de Curtosis
a4 < 3
TRABAJO DE ESTADISTICA
TEMA Medios de asimetra y de apuntamiento. INTEGRANTES: Sarabia crcamo josse T00027615 Guerrero Ramrez Lenidas Jos T00027450 Docentes Wilfredo berrio blanco Curso Tecnologa en sistemas
19-septiembre-2011
Cartagena - Bolvar