Sie sind auf Seite 1von 4

NOCIONES BSICAS DE ESTADSTICA

INTRODUCCION La estadstica es una herramienta (un instrumento), que permite, mediante su uso, analizar y entender mejor los datos. Para utilizar la estadstica de manera eficiente, es necesario saber usarla, es decir, cundo se puede utilizar, qu pruebas son las apropiadas, qu limitaciones tiene su uso y cules son sus ventajas. Para ello no es necesario comprender su diseo y cules son los principios de su funcionamiento.

MEDIDAS DE TENDENCIA CENTRAL. Existen 3 medidas de tendencia central (pro medios): la media, la moda y la mediana. La Media, consiste en el cuociente entre la sumatoria () de todas las observaciones de la distribucin y n o el nmero de stas:

X =

x
i =1

i =n

La Moda, corresponde a la observacin ms frecuente de la distribucin. Tiene la misma acepcin que se le confiere a esta palabra en la vida cotidiana. Una vestimenta, por ejemplo, que est de moda es aquella que es usada por un mayor nmero de personas (=es la ms frecuente). La Mediana, corresponde a la observacin del centro de la distribucin, es decir aquella observacin que tiene el 50% de las otras observaciones por encima de ella ( = son mayores) y el 50% por debajo de ella (= son menores). Cuando n es impar, una vez ordenadas las observaciones, slo una de ellas cumplir con esta caracterstica. Cuando el n es par, sin embargo, la mediana corresponder al punto medio entre las dos observaciones distintas ms cercanas al punto medio. La media, la mediana y la moda son promedios, pero no son necesariamente los mismos en una distribucin y se ven afectados de distinta manera por las otras observaciones de la distribucin. Por ejemplo, si se cambia el valor ms alto o l ms bajo de una distribucin, el valor de la media se ver afectado, no ser afectado el valor de la mediana y no necesariamente cambiar el valor de la moda. De las tres medidas de tendencia central, la media es la de mayor utilidad en la estadstica experimental.

MEDIDAS DE DISPERSIN CON RESPECTO A LA MEDIA.

La amplitud de una distribucin y la dispersin de las observaciones individuales respecto a la media, son caractersticas propias de cada distribucin. Existen 3 medidas que representan esta propiedad. Supongamos que la media de las notas de la Primera Prueba de un determinado curso es 5,1, y es igual a la prueba tomada el ao anterior. Significa esto que ambas distribuciones tienen los mismos valores extremos y que las notas (observaciones) se distribuyen de la misma manera? Si se analiza ms detalladamente las notas, lo ms probable es que surjan diferencias ms o menos notables. Supongamos que en la prueba de este ao no hay nota mxima y mnima y que la gran mayora de ellas se agrupa en torno a la media.; y que en la del ao anterior si hay alumnos que merecieron la nota mnima y varios otros que hayan obtenido nota 7,0. Pareciera que el grupo de este ao es ms homogneo respecto al resultado de la interrogacin, mientras que el del ao anterior es ms heterogneo. La diferencia entre ambos grupos se manifiesta en el grado de dispersin de las observaciones individuales con relacin a la media, una de estas medidas es l: El Rango, que representa la diferencia que existe entre la menor de las observaciones y la mayor de ella y se calcula de la siguiente manera: Observacin Mxima Observacin Mnima. En nuestro ejemplo el rango de la prueba del ao anterior es mayor que el rango de la de este ao.

S2 =

(X x )
i =1 i

i =n

La Varianza, que corresponde a la expresin matemtica que indica la media de las distancias a que cada una de las observaciones se encuentra de la media., lo que se calcula estableciendo la diferencia que existe entre cada observacin y la media. Si sumamos estas diferencias, se obtiene cero, debido a que el signo de cada una de las desviaciones depende de s la observacin es mayor que la menor (+) o es menor que ella (-). Esta es una caracterstica importante: la suma de las desviaciones de cada observacin con respecto a la media de cualquier distribucin ser siempre igual a cero. Una forma que permite cuantificar estas desviaciones, es elevar al cuadrado cada una de ellas,

( xi X ) lo que elimina los signos negativos. Esto es lo que denomina la suma de los cuadrados de las desviaciones de la media. Finalmente, la varianza se calcula dividiendo por
n la suma de los cuadrados de las desviaciones.

La Desviacin estndar, corresponde a la raz cuadrada de la varianza:


S = S2
En algunas oportunidades es de inters del investigador el cuantificar el grado de dispersin de las observaciones con respecto a la media, en funcin de esta ltima. Esto se logra mediante el clculo del coeficiente de variacin, que expresa a la desviacin estndar como proporcin (o porcentaje) de la media:

Coef .de var iacin =

S X

La Distribucin Normal La expresin grfica de los datos de una distribucin de una variable continua, en que las mediciones que se obtiene se expresan en el eje de la abscisa, y la frecuencia en que se encuentran representadas estas observaciones, en el eje de la ordenada, se denomina histograma. Por ejemplo, si quisiramos graficar el resultado de la interrogacin a la que hacamos referencia, construiramos un grfico en que en la abscisa (eje x) ubicaramos las notas de 1 a 7, y en la ordenada (eje y) una medida de la frecuencia de estas notas. Como seguramente las notas no son todas enteros, sino que estn expresadas con al menos un decimal, deberemos distinguir intervalos de frecuencia, es decir, deberemos agrupar aquellas notas que estn comprendidas en intervalos predeterminados (ejemplo: entre 4,5 y 4,9; entre 5,0 y 5,4; etc. En una distribucin la gran mayora de las observaciones se ubica en torno a la media, y en la medida que nos alejamos de ella (hacia ambos extremos), las observaciones son cada vez menos numerosas. En la medida que las observaciones se aproxima a infinito (= un milln), los intervalos de frecuencia se hacen ms pequeos porque todas las posibilidades de mediciones se encontrarn bien representadas. Consecuentemente, cada barra ser una lnea y si se unen los puntos ms altos de las barras, construidas con este nmero infinito de observaciones, se obtendr una curva continua. Esta curva que se asemeja al perfil de una campana, se denomina curva normal. Es un hecho muy notable y til, que muchas variables de fenmenos naturales se ajustan a este tipo de curva, cuando las observaciones son numerosas. La curva normal es sin duda uno de los instrumentos tericos ms tiles que hayan sido descubiertos.

Caractersticas de la Curva Normal: Los extremos de la curva tienden hacia el eje de la abscisa, aunque nunca lo tocan y se dirigen hacia un punto en el infinito. En la prctica, sin embargo, se trabaja con lmites finitos. La media de la distribucin es la perpendicular levantada en el centro de la base de la campana y divide a la distribucin en dos partes iguales (es simtrica). Debido a esto coincide con la mediana y la moda. El rea bajo la curva se puede expresar sobre la base de cierto nmero de desviaciones estndar. Las Desviaciones hacia la derecha: de la media tienen signo positivo. Las desviaciones hacia la izquierda de la media tienen signo negativo. Por ejemplo, aproximadamente el 68% del rea bajo la curva se encuentra aproximadamente entre: X 1S X + 1S ; el 95% del rea se encuentra entre: X 2S X + 2S ; y el 99% del rea se encentra entre: X 3S X + 3S .

Esta relacin entre desviaciones estndar y el rea de la curva de la distribucin, es una propiedad de la curva normal y se cumple de ese modo, lo que significa que no existe una explicacin para ello. Sin embargo, esta relacin es verdadera, y la hace un instrumento muy til en estadstica. El rea bajo la curva representa la suma de las frecuencias de cada una de las observaciones, por lo que se puede decir, que el 50% de las observaciones se encontrar por sobre la media y el otro 50% representar a las observaciones que se encuentran por debajo de ella. De este modo, el 68% de las observaciones se encontrar entre la media 1S y la media + 1S, y as respectivamente.

La Curtosis, indica cuanto ms o cuento menos pronunciada es la curva de una distribucin normal (campana). Cuando es mayor que cero indica que la distribucin es concentrada o puntiaguda, cuando menor que cero indica que la distribucin es dispersa y la curva relativamente plana. Cuando es igual a cero la distribucin es normal.

La Oblicuidad o Coeficiente de asimetra, permite saber si los datos de una muestra estn sesgados, es decir muestra el grado de asimetra de una distribucin alrededor de la media. Cuando es mayor que cero indica corrimiento de distribucin hacia la izquierda, cuando menor que indica corrimiento de distribucin hacia la derecha. Cuando es igual a cero la distribucin es perfectamente simtrica.

Das könnte Ihnen auch gefallen