Sie sind auf Seite 1von 17

Estadstica Descriptiva Segunda Parte

Mara Esther Caamao Sierra.

11 de octubre de 2011

Introduccin

Cuando nos referimos a un conjunto de datos, estos pueden ser derivados de una muestra o de una poblacin

Si el objetivo es realizar inferencia estadstica, requeriremos usar descripciones numricas muestrales para hacer inferencias sobre las correspondientes medidas de la poblacin. Estas descripciones numricas miden las siguientes caractersticas bsicas:

Tendencia Central: La tendencia que tienen los datos a centrarse alrededor de determinados valores numricos. Variabilidad: Esto es la dispersin de los datos. Ubicacin Relativa: Medidas que nos permiten describir la localizacin relativa de una medida particular dentro de un conjunto de datos.

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Medidas de Tendencia Central

Media Aritmtica Mediana Moda

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Media Aritmtica

Media Aritmtica ( o simplemente media): Es la suma de todas las mediciones dividida por el nmero total de mediciones dentro del conjunto de datos

x = n=1 xi /n i Observa que podemos obtener medias muestrales denotado por x o medias poblacionales denotada por Entre ms grande sea la muestra la media muestral ser ms parecida a la media poblacional. Entre ms variables sean los datos menos parecida ser la media muestral de la poblacional.

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Mediana

Mediana: Es la medida que divide los datos exactamente a la mitad; cuando estos son ordenados de manera ascendente o descendente.

Si n es impar, la mediana M es el nmero de en medio del conjunto de datos Si n es par, la mediana M es la media de los dos nmeros de en medio del conjunto de datos Si el conjunto de datos est sesgado a la derecha, la media ser mayor que la mediana. Si el conjunto de datos est segado a la izquierda, la media ser menor que la mediana. Si el conjunto de datos es simtrico, la media ser igual a la mediana.

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Moda

Moda: Es la medida que ocurre ms frecuente en un conjunto de datos.


La moda nos muestra en donde los datos tienden a concentrarse. La clase que contiene la frecuencia relativa mayor se le conoce como clase modal. La moda es el punto medio de la clase modal. Esta medida de tendencia central puede ser no nica para un conjunto de datos

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Medidas de Variabilidad

Rango: el rango de un conjunto de datos es igual a la medida ms grande menos la medida ms pequea Varianza: es igual a la suma del cuadrado de las distancias entre la media dividida por el valor n-1 Desviacin Estndar: se dene como la raz positiva de la varianza

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Rango

El rango es un valor fcil de entender y de calcular pero es una medida insensible de variacin cuando tenemos conjunto grande de datos. Observa grca en el pizarrn Ambas distribuciones de datos tienen el mismo rango, pero el segundo conjunto de datos tiende a concentrarse ms cerca de la media. Por lo tanto, los datos del segundo conjunto son menos variables que los datos del conjunto 2.

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Varianza

La varianza es el promedio del cuadrado de las distancias de cada dato con respecto a la media de los datos.

s2 =

n i =1 (xi

Las unidades de la varianza siempre estarn al cuadrado . Por ejemplo si los datos expresan metros, la varianza se expresara en metros cuadrados, etc. La razn por la que al calcular la varianza se usa en el denominador de la ecuacin n-1 en lugar de n, es porque si usamos n entonces tendemos a producir un valor estimado por debajo de la varianza poblacional (estadsticamente esto signica generar un estimador sesgado) .

x )/(n 1)

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Desviacin Estndar

La desviacin estndar es la raz cuadrada de la varianza y esta medida de variabilidad siempre estar expresada en las unidades originales de medicin a diferencia de la varianza.

s=

s2

Cuando se comparan la variabilidad de dos muestras selecionadas de una misma poblacin, la muestra con la mayor desviacin estndar es la ms variable de las dos. Para proveer una medida de variabilidad para cualquier conjunto de datos en si mismo y sin importar la curva de la frecuencia de distribucin de los datos, hacemos uso de los criterios expresados en el teorema matemtico de P.L. Chebyshev.

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Regla de Chebyshev para la interpretacin de la Desviacin Estndar en cualquier Distribucin

Estas reglas son aplicables para cualquier conjunto de datos , sin importar la curva de la frecuencia de distribucin de los datos

No hay informacin alguna sobre una fraccin de las mediciones que caen entre 1 desviacin estndar de la media, es decir en el intervalo ( s, x + s) para muestras. x Al menos 3/4 de las mediciones caern 2 desviaciones estndar de la media, es decir; en el intervalo ( 2s, x + 2s) x Al menos 8/9 de las mediciones caern 3 desviaciones estndar de la media, es decir; en el intervalo ( 3s, x + 3s) x Generalmente, para cualquier nmero k mayor que 1, al menos 1 1/k 2 de las mediciones caern en k desviaciones estandar de la media, es decir; en el intervalo ( ks, x + ks) x

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Regla de Chebyshev para la interpretacin de la Desviacin Estndar en la Curva Normal

Aproximadamente el 68 % las mediciones que caern entre 1 desviacin estndar de la media, es decir en el intervalo ( s, x + s) para muestras. x Aproximadamente el 95 % de las mediciones caern 2 desviaciones estndar de la media, es decir; en el intervalo ( 2s, x + 2s) x Aproximadamente el 99,7 % de las mediciones caern 3 desviaciones estndar de la media, es decir; en el intervalo ( 3s, x + 3s) x

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Medidas de Ubicacin Relativa

Estas medidas nos permiten la localizacin / ubicacin relativa de una medida particular con respecto a todo el conjunto de datos p th. percentil: es un nmero tal que p % de las mediciones caen abajo del pth. percentil y el (100 p) % caen arriba de l. Z-score: representa la distancia entre una medicin dada y la media, expresada en desviaciones estandar. En otras palabras es realizar una transformacin de datos con una media y una varianza especicas a datos de una distribucin normal con media 0 y varianza 1.

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Percentiles (P avo.)

Los percentiles son valores prticos slo para grandes conjuntos de datos. Si por ejemplo, se te dijera que tu calicacin fue 80 en un examen y que esta calicacin se encuentra en el 90 avo percentil , esto signica que el 90 % de las calicaciones fueron menores que la tuya y 10 % fueron mayores. Si en este ejmplo en particular, se realizara un histograma de frecuencias relativas, el 90 avo percentil tendra que estar localizado en un punto tal que el 90 % del total del rea bajo el histograma se localizara abajo del 90 avo percentil y 10 % arriba. El uso ms comn de los percentiles son los cuantiles represetando un 25 %.

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Z - Score

La Z-Score hace uso de la media y la desviacin estandar del conjunto de datos para poder especicar una localizacin relativa de la medicin. Representa la distancia entre una medicin dada y la media expresada en desviaciones estandar:

Z = (x x )/s

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Uso de la Regla de Chebyshev en funciones Z- score

Aproximadamente el 68 % las mediciones que caern en el intervalo (1, 1) para muestras. Aproximadamente el 95 % de las mediciones caern en el intervalo (2, 2) Aproximadamente el 99,7 % de las mediciones caern en el intervalo (3, 3)

Mara Esther Caamao Sierra.

Estadstica Descriptiva Segunda Parte

Relaciones Bivariadas: Introduccin a la Regresin Lineal.

Las palabras correlacin, relacin y asociacin implica una relacin entre dos variables. Una forma para describir la relacin entre dos variables cuantitativas, tambin conocido como relacin bivariada, es a travs de diagramas de puntos, mejor conocido como scatograma. El scatograma es una grca bidimensional, en la cual los valores de una variables se describen a lo largo del eje vertical y la otra variable a lo largo del eje horizontal. Cuando un incremento de una variable es generalmente asociada con un incremento en la segunda ariable, se dice que ambas variables positivamente relacionadas positiamente correlacionadas ( Ver grca en el pizarrn). Alteernativamente, si una variable tiene la tendencia de decrecer conforme la otra se incrementa, se dice que las variables estn negativamente correlacionadas. Cuando no se ve tendencia alguna, se dice que ambas variables no estn relacionadas.
Mara Esther Caamao Sierra. Estadstica Descriptiva Segunda Parte

Das könnte Ihnen auch gefallen