Sie sind auf Seite 1von 9

La estadstica Es comnmente considerada como una coleccin de hechos numricos expresados en trminos de una relacin sumisa, y que han

sido recopilados a partir de otros datos numricos. Es definido tambien como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de determinada poblacin; es decir, una funcin de valores de muestra; es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares. Poblacin:
La poblacin, tambin llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. Una poblacin puede ser finita o infinita. Por ejemplo, la poblacin consistente en todas las tuercas producidas por una fbrica un cierto da es finita, mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, es infinita. Muestra:

Es un conjunto de medidas u observaciones tomadas a partir de una poblacin dada. A las caractersticas medibles de una muestra se les denomina estadstico. Tambin llamada muestra aleatoria o simplemente muestra es un subconjunto de casos o individuos de una poblacin estadstica. Las muestras se obtienen con la intencin de inferir propiedades de la totalidad de la poblacin, para lo cual deben ser representativas de la misma. Para cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir una tcnica de muestreo. En tales casos, puede obtenerse una informacin similar a la de un estudio exhaustivo con mayor rapidez y menor coste. Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin porque el manejo de un menor nmero de datos provoca tambin menos errores en su manipulacin. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados. El nmero de sujetos que componen la muestra suele ser inferior que el de la poblacin, pero suficiente para que la estimacin de los parmetros determinados tenga un nivel de confianza adecuado. Para que el tamao de la muestra sea idneo es preciso recurrir a su clculo. Al recoger datos relativos a las caractersticas de un grupo de individuos u objetos, sean alturas y pesos de estudiantes de una universidad o tuercas defectuosas producidas en una fbrica, suele ser imposible o nada prctico observar todo el grupo, en especial si es

muy grande. En vez de examinar el grupo entero, llamado poblacin o universo, se examina una pequea parte del grupo, llamada muestra.
Parmetros estadsticos:

Medida estadstica o parmetro poblacional a un valor representativo de una poblacin, como la media aritmtica, la proporcin de individuos que presentan determinada caracterstica, o la desviacin tpica. Un parmetro es un nmero que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadstica. El clculo de este nmero est bien definido, usualmente mediante una frmula aritmtica obtenida a partir de datos de la poblacin. Los parmetros estadsticos son una consecuencia inevitable del propsito esencial de la estadstica: modelizar la realidad. Por ejemplo, suele ofrecerse como resumen de la "juventud" de una poblacin la media aritmtica de las edades de sus miembros, esto es, la suma de todas ellas, dividida por el total de individuos que componen tal poblacin. Un parmetro estadstico es, como se ha dicho, un nmero que resume una cantidad de datos. Este enfoque es el tradicional de la Estadstica descriptiva.7 8 9 En este sentido, su acepcin se acerca a la de medida o valor que se compara con otros, tomando una unidad de una determinada magnitud como referencia. Por su parte, la faccin ms formal de la Estadstica, la Estadstica matemtica y tambin la Inferencia estadstica utilizan el concepto de parmetro en su acepcin matemtica ms pura, esto es, como variable que define una familia de objetos matemticos en determinados modelos. As se habla, por ejemplo, de una distribucin Normal de parmetros y como de una determinada familia de distribuciones con una distribucin de probabilidad de expresin conocida, en la que tales parmetros definen aspectos concretos como la esperanza, la varianza, la curtosis, etc. Otro ejemplo comn en este sentido es el de la distribucin de Poisson, determinada por un parmetro, ; o la Distribucin binomial, determinada por dos parmetros, n y p. Para los ojos de la Estadstica matemtica el hecho de que estas distribuciones describan situaciones reales y los citados parmetros signifiquen un resumen de determinado conjunto de datos es indiferente. Propiedades deseables en un parmetro: Segn Yule un parmetro estadstico es deseable que tenga las siguientes propiedades:

Se define de manera objetiva, es decir, es posible calcularlo sin ambigedades, generalmente mediante una frmula matemtica. Por ejemplo, la media aritmtica se define como la suma de todos los datos, dividida por el nmero de datos. No hay ambigedad: si se realiza ese clculo, se obtiene la media; si se realiza otro clculo, se obtiene otra cosa. Sin embargo, la definicin de moda como el "valor ms frecuente", puede dar lugar a confusin cuando la mayor frecuencia la presentan varios valores distintos.

No desperdicia, a priori, ninguna de las observaciones. Con carcter general, un parmetro ser ms representativo de una determinada poblacin, cuntos ms valores de la variable estn implicados en su clculo. Por ejemplo, para medir la dispersin puede calcularse el recorrido, que slo usa dos valores de la variable objeto de estudio, los extremos; o la desviacin tpica, en cuyo clculo intervienen todos los datos del eventual estudio. Es interpretable, significa algo. La mediana, por ejemplo, deja por debajo de su valor a la mitad de los datos, est justo en medio de todos ellos cuando estn ordenados. Esta es una interpretacin clara de su significado. Es sencillo de calcular y se presta con facilidad a manipulaciones algebraicas. Se ver ms abajo que una medida de la dispersin es la desviacin media. Sin embargo, al estar definida mediante un valor absoluto, funcin definida a trozos y no derivable, no es til para gran parte de los clculos en los que estuviera implicada, aunque su interpretacin sea muy clara. Es poco sensible a las fluctuaciones muestrales. Si pequeas variaciones en una muestra de datos estadsticos influyen en gran medida en un determinado parmetro, es porque tal parmetro no representa con fiabilidad a la poblacin. As pues es deseable que el valor de un parmetro con esta propiedad se mantenga estable ante las pequeas oscilaciones que con frecuencia pueden presentar las distintas muestras estadsticas. Esta propiedad es ms interesante en el caso de la estimacin de parmetros. Por otra parte, los parmetros que no varan con los cambios de origen y escala o cuya variacin est controlada algebraicamente, son apropiados en determinadas circunstancias como la tipificacin.

Principales parmetros Habitualmente se agrupan los parmetros en las siguientes categoras:


Medidas de posicin.

Se trata de valores de la variable estadstica que se caracterizan por la posicin que ocupan dentro del rango de valores posibles de esta. Entre ellos se distinguen:

Las medidas de tendencia central: medias, moda y mediana. Las medidas de posicin no central: cuantiles (cuartiles, deciles y percentiles).

Medidas de dispersin.

Resumen la heterogeneidad de los datos, lo separados que estos estn entre s. Hay dos tipos, bsicamente:

Medidas de dispersin absolutas, que vienen dadas en las mismas unidades en las que se mide la variable: recorridos, desviaciones medias, varianza, desviacin tpica y meda. Medidas de dispersin relativa, que informan de la dispersin en trminos relativos, como un porcentaje. Se incluyen entre estas el coeficiente de variacin, el coeficiente de apertura, los recorridos relativos y el ndice de desviacin respecto de la mediana.

Medidas de forma.

Su valor informa sobre el aspecto que tiene la grfica de la distribucin. Entre ellas estn los coeficientes de asimetra y los de curtosis.
Otros parmetros.

Adems, y con propsitos ms especficos, existen otros parmetros de uso en situaciones muy concretas, como son las proporciones, los nmeros ndice, las tasas y el coeficiente de Gini.
Medidas de posicin:

Las medidas de posicin son las ms utilizadas para resumir los datos de una distribucin estadstica. Se trata de valores de la propia variable19 que, en cierto modo, sustituyen la informacin provista por los datos.
Medidas de tendencia central o centralizacin:

Son valores que suelen situarse hacia el centro de la distribucin de datos. Los ms destacados son las medias o promedios (incluyendo la media aritmtica, la media geomtrica y la media armnica), la mediana y la moda.
Media aritmtica o promedio

La estatura media como resumen de una poblacin homognea (abajo) o heterognea (arriba).
Artculo principal: Media aritmtica

La media aritmtica es, probablemente, uno de los parmetros estadsticos ms extendidos.20

Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como

Esta definicin vara, aunque no sustancialmente, cuando se trata de variables continuas. Sus propiedades son:21

Su clculo es muy sencillo y en l intervienen todos los datos. Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

Minimiza las desviaciones cuadrticas de los datos respecto de cualquier valor prefijado, esto es, el valor de es mnimo cuando . Este resultado se conoce como Teorema de Knig. Esta propiedad permite interpretar uno de los parmetros de dispersin ms importantes: la varianza.

Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si xi' = axi + b entonces , donde es la media aritmtica de los xi', para i = 1, ..., n y a y b nmeros reales.

Este parmetro, an teniendo mltiples propiedades que aconsejan su uso en situaciones muy diversas, tiene tambin algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas) su valor oscila en funcin de la cantidad y amplitud de los intervalos que se consideren. Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto menos homogneos son los datos, menos informacin proporciona. Dicho de otro modo, poblaciones muy distintas en su composicin pueden tener la misma media.22 Por ejemplo, un equipo de baloncesto con cinco jugadores de igual estatura, 1,95, pongamos por caso, tendra una estatura media de 1,95, evidentemente, valor que representa fielmente a esta homognea poblacin. Sin embargo, un equipo de estaturas ms heterogneas, 2,20, 2,15, 1,95, 1,75 y 1,70, por ejemplo, tendra tambin, como puede comprobarse, una estatura media de 1,95, valor que no representa a casi ninguno de sus componentes.

Es muy sensible a los valores extremos de la variable. Por ejemplo, en el clculo del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000 de tiene tanto peso como el de mil empleados "normales" que ganen 1.000 , siendo la media de aproximadamente 2.000 .

Moda [editar] Artculo principal: Moda (estadstica)

La moda es el dato ms repetido, el valor de la variable con mayor frecuencia absoluta.23 En cierto sentido se corresponde su definicin matemtica con la locucin "estar de moda", esto es, ser lo que ms se lleva. Su clculo es extremadamente sencillo, pues slo necesita de un recuento. En variables continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario obtener un valor concreto de la variable, se recurre a la interpolacin. Sus principales propiedades son:

Clculo sencillo. Interpretacin muy clara. Al depender slo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el parmetro ms utilizado cuando al resumir una poblacin no es posible realizar otros clculos, por ejemplo, cuando se enumeran en medios periodsticos las caractersticas ms frecuentes de determinado sector social. Esto se conoce informalmente como "retrato robot".24

Inconvenientes.

Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del nmero de intervalos y de su amplitud. Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no afectan en modo alguno a su valor. No siempre se sita hacia el centro de la distribucin. Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia (distribuciones bimodales o multimodales).

Mediana

La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que estos estn ordenados de menor a mayor.25 Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:

En caso de un nmero par de datos, la mediana no correspondera a ningn valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los anteriores:

Se toma como mediana

En este ejemplo basado en una tabla real de percentiles usada en pediatra, puede comprobarse que una nia de 24 meses con un peso de 13 kg estara en el percentil 75, esto es, su peso es superior al 75% de las nias de su edad. La mediana correspondera, aproximadamente, a 12 kg (interseccin de la lnea curva ms oscura con la lnea horizontal correspondiente al valor 12 en el eje vertical, para esa misma edad).

Existen mtodos de clculo ms rpidos para datos ms numerosos (vase el artculo principal dedicado a este parmetro). Del mismo modo, para valores agrupados en intervalos, se halla el "intervalo mediano" y, dentro de este, se obtiene un valor concreto por interpolacin. Propiedades de la mediana como parmetro estadstico:26

Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo nmero, deja a la mediana inalterada. Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no est acotado. No se ve afectada por la dispersin. De hecho, es ms representativa que la media aritmtica cuando la poblacin es bastante heterognea. Suele darse esta circunstancia cuando se resume la informacin sobre los salarios de un pas o una empresa. Hay unos pocos salarios muy altos que elevan la media aritmtica haciendo que pierda representatividad respecto al grueso de la poblacin. Sin embargo, alguien con el salario "mediano" sabra que hay tanta gente que gana ms dinero que l, como que gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos algebraicos tan bien como la media aritmtica.
Medidas de posicin no central

Directamente relacionados con la anterior, se encuentran las medidas de posicin no central, tambin conocidas como cuantiles. Se trata de valores de la variable estadstica que dejan por debajo de s determinada cantidad de los datos. Son, en definitiva, una generalizacin del concepto de la mediana. Mientras que sta deja por debajo de s al 50% de la distribucin, los cuantiles pueden hacerlo con cualquier otro porcentaje.27 Se denominan medidas de posicin porque informan, precisamente, de la posicin que ocupa un valor dentro de la distribucin de datos. Tradicionalmente se distingue entre cuartiles, si se divide la cantidad de datos en cuatro partes antes de proceder al clculo de los valores que ocupan cada posicin; deciles, si se divide los datos en diez partes; o percentiles, que dividen la poblacin en cien partes. Ejemplos: si se dice que una persona, tras un test de inteligencia, ocupa el percentil 75, ello supone que el 75% de la poblacin tiene un cociente intelectual con un valor inferior al de esa persona. Este criterio se usa por las asociaciones de superdotados, que limitan su conjunto de miembros a aquellas que alcanzan determinado percentil (igual o superior a 98 en la mayora de los casos). El ejemplo que se muestra en la imagen de la derecha es el correspondiente al clculo inverso, esto es, cuando se desea conocer el percentil correspondiente a un valor de la variable, en lugar del valor que corresponde a un determinado percentil. Otras medidas de posicin central son la media geomtrica y la media armnica que, aunque tienen determinadas propiedades algebraicas que podran hacerlas tiles en

determinadas circunstancias, su interpretacin no es tan intuitiva como la de los parmetros anteriores

Das könnte Ihnen auch gefallen