Sie sind auf Seite 1von 17

U.E.P.

COLEGIO COLON MARACAIBO EDO ZULIA

ESTADSTICA DESCRIPTIVA
DISTRIBUCIN DE FRECUENCIAS MEDIDAS DE POSICIN Y MEDIDAS DE DISPERSIN
Prof. Pedro Nava 19/09/2011

Nombre: ___________________________________________________ 5to Ao Seccin ______

ESTADSTICA DESCRIPTIVA
1. INTRODUCCIN
La investigacin cuya finalidad es: el anlisis o experimentacin de situaciones para el descubrimiento de nuevos hechos, la revisin o establecimiento de teoras y las aplicaciones prcticas de las mismas, se basa en los principios de Observacin y Razonamiento y necesita en su carcter cientfico el anlisis tcnico de Datos para obtener de ellos informacin confiable y oportuna. Este anlisis de Datos requiere de la Estadstica como una de sus principales herramientas, por lo que los investigadores de profesin y las personas que de una y otra forma la realizan requieren adems de los conocimientos especializados en su campo de actividades, del manejo eficiente de los conceptos, tcnicas y procedimientos estadsticos.

2. CONCEPTOS BSICOS
2.1. ESTADSTICA Es el conjunto de procedimientos y tcnicas empleadas para recolectar, organizar y analizar datos, los cuales sirven de base para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o naturales. En Estadstica la poblacin, tambin llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. La Muestra es el grupo de sujetos en el que se recogen los datos y se realizan las observaciones, siendo realmente un subgrupo de la poblacin muestreada y accesible. El nmero de muestras que se puede obtener de una poblacin es una o mayor de una. Uno de los problemas fundamentales de la Estadstica es el estudio de la relacin existente entre una poblacin y sus muestras. Segn la direccin de tal relacin la Estadstica puede ser: 1. Deductiva, cuando a partir del conocimiento de la poblacin se trata de caracterizar cada muestra posible. 2. Inductiva, cuando a partir del conocimiento derivado de una muestra se pretende caracterizar la poblacin.

2.2. ESTADSTICA DESCRIPTIVA E INFERENCIAL Estadstica Descriptiva se refiere a la recoleccin, presentacin, descripcin, anlisis e interpretacin de una coleccin de datos. Esencialmente consiste en resumir stos con uno o dos elementos de informacin (medidas descriptivas) que caracterizan la totalidad de los mismos. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre s mismos y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de una muestra. Estadstica Inferencial se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo, poblacin, partiendo de lo especfico, muestra, las cuales llevan implcitos una serie de riesgos. Para que stas generalizaciones sean vlidas la muestra deben ser representativa de la poblacin y la calidad de la informacin debe ser controlada, adems puesto que las conclusiones as extradas estn sujetas a errores, se tendr que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La estadstica Inferencial es el conjunto de tcnicas que se utiliza para obtener conclusiones que sobrepasan los lmites del conocimiento aportado por los datos, busca obtener informacin de un colectivo mediante un metdico procedimiento del manejo de datos de la muestra. 2.3. ANALISIS ESTADSTICO El anlisis estadstico es todo el proceso de organizacin, procesamiento, reduccin e interpretacin de datos para realizar inferencias. 2.4. DATOS Y VARIABLES Cuando se consideran los mtodos de organizacin, reduccin y anlisis de datos estadsticos, se hace necesario aclarar los siguientes conceptos. Datos: son medidas o valores de las caractersticas susceptibles de observar y contar, se originan por la observacin de una o ms variables de un grupo de elementos o unidades. Variables: es toda caracterstica que vara de un elemento a otro de la poblacin.

Las variables pueden clasificarse en: categricas o cualitativas (atributos), no tienen ningn grado de comparacin numrica, ejemplo: sexo, estado civil; y numricas o cuantitativas, son caractersticas factibles de expresar por medio de nmeros, estas pueden ser Discretas, que solo pueden tomar ciertos valores aislados en un intervalo, y Continuas, que pueden tomar cualquier valor en un intervalo. 2.5. REPRESENTACIN DE DATOS Los datos son colecciones de un nmero cualquiera de observaciones relacionadas entre s, para que sean tiles se deben organizar de manera que faciliten su anlisis, se puedan seleccionar tendencias, describir relaciones, determinar causas y efectos y permitan llegar a conclusiones lgicas y tomar decisiones bien fundamentadas; por esa razn es necesario conocer lo mtodos de Organizacin y Representacin, la finalidad de stos mtodos es permitir ver rpidamente todas las caractersticas posibles de los datos que se han recolectado. 1. Representacin Tabular: Presenta las variables y las frecuencias con que los valores de stas se encuentran presentes en el estudio. 2. Representacin Grfica : Se llaman grficas a las diferentes formas de expresar los datos utilizando los medios de representacin que proporciona la geometra.

3. DISTRIBUCIN DE FRECUENCIAS (REPRESENTACIN TABULAR)


Una distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. A continuacin se describen los diferentes tipos de frecuencia. 3.1. Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por . La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega lee suma o sumatoria:

que se

3.2. Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de una determinada variable y el nmero total de datos. Se representa por .

La suma de las frecuencias relativas es igual a 1.

3.3. Frecuencia relativa porcentual. La frecuencia relativa porcentual es la frecuencia relativa de un determinado valor expresada en tanto por ciento. Se representa por .

La suma de las frecuencias relativas porcentuales es igual al 100 %. 3.4. Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por .

3.5. Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se representa por .

3.6. Frecuencia relativa porcentual acumulada. La frecuencia relativa porcentual acumulada es la frecuencia relativa acumulada de un determinado valor expresada en tanto por ciento. Se representa por .

La ltima de las frecuencias relativas porcentuales acumuladas es igual al 100 %.

4. DISTRIBUCIN DE FRECUENCIAS EN DATOS AGRUPADOS.


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores diferentes o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma o diferente amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Para la construccin de una tabla de datos agrupados debemos determinar los siguientes parmetros: 1. Dato mayor ( ) y dato menor ( ) de la distribucin.

2. Amplitud total de la distribucin: Se representa por , y la determinamos mediante la siguiente frmula:

3. Nmero de clases. El nmero de intervalos de clase es el nmero total de grupos en que se clasifica la informacin, se recomienda que no sea menor que 5 ni mayor que 15. Se representa con la letra .

4. Amplitud de la clase: Se representa por , y se determina mediante:

Se aproxima al entero inmediato superior. 5. Lmites de la clase: Cada clase est delimitada por el lmite inferior de la clase ( clase ( . ) y el lmite superior de la

El lmite inferior de la primera clase es el menor de los datos de la distribucin. Cada lmite superior lo determinamos mediante la frmula:

El lmite inferior de las clases siguientes se halla sumando 1 al superior de la anterior. 6. Limites reales de la clase. Los lmites reales de cada intervalo de clase se determinan para darle continuidad a la distribucin. El lmite real inferior y el lmite real superior lo determinaremos mediante:

7. Marca de clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros. Las marcas de clase se calcularan mediante la frmula:

5. REPRESENTACIONES GRAFICAS DE UNA DISTRIBUCIN DE FRECUENCIAS.


Los grficos son tiles porque ponen en relieve y aclaran las tendencias que no se captan fcilmente en la tabla, ayudan a estimar valores con una simple ojeada y brinda una verificacin grfica de la veracidad de las soluciones. 5.1. Diagrama de barras. Para su construccin colocamos en el eje horizontal las marcas de clase de cada intervalo de clase y en el eje vertical la frecuencia absoluta, y levantamos una lnea gruesa preferiblemente coloreada hasta la frecuencia que corresponda a dicha clase. Se utiliza tanto para datos agrupados como para no agrupados. 5.2. Polgono de Frecuencias. Se puede obtener uniendo cada punto medio (marca de clase) de los rectngulos del histograma con lneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del reas. Se puede obtener tambin uniendo cada punto superior del diagrama de barras. Para su construccin colocamos en el eje horizontal las marcas de clase de cada intervalo de clase y en el eje vertical la frecuencia absoluta. Se utiliza tanto para datos agrupados como para no agrupados. 5.3. Histograma: Est formado por rectngulos cuya base es la amplitud del intervalo y tiene la caracterstica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada

tramo de valores, puede construirse con clases que tienen el mismo tamao o diferente (intervalo variable). La utilizacin de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos, de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho mayor que la de los dems, logrando as que las observaciones se hallen mejor repartidas dentro del intervalo. Para su construccin colocamos en el eje horizontal los lmites reales de cada clase y en el eje vertical la frecuencia absoluta. Se utiliza solo para datos agrupados. 5.4. Ojivas Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estndar, la frecuencia relativa. La ojiva representa grficamente la forma en que se acumulan los datos y permiten ver cuntas observaciones se hallan por arriba o debajo de ciertos valores. Para su construccin colocamos en el eje horizontal los lmites superiores reales de cada intervalo de clase y en el eje vertical la frecuencia relativa acumulada. Se utiliza solo para datos agrupados. 5.5. Diagrama de Sectores. Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de cada sector es proporcional a la frecuencia absoluta correspondiente. Para determinar el ngulo multiplicamos la frecuencia relativa por 360

El diagrama circular se construye con la ayuda de un transportador de ngulos.

6. MEDIDAS DESCRIPTIVAS
Con estas medidas se persigue reducir en pocas cifras significativas el conjunto de observaciones de una variable y describir con ellas ciertas caractersticas de los conjuntos, logrando una comparacin ms precisa de los datos que la que se puede conseguir con tablas y grficas.

6.1. MEDIDAS DE POSICIN (TENDENCIA CENTRAL): PROMEDIOS Los promedios son una medida de posicin que dan una descripcin compacta de cmo estn centrados los datos y una visualizacin ms clara del nivel que alcanza la variable, pueden servir de base para medir o evaluar valores extremos o raros y brinda mayor facilidad para efectuar comparaciones. Es importante poner en relieve que la notacin de promedio lleva implcita la idea de variacin y que este nmero promedio debe cumplir con la condicin de ser representativo de conjunto de datos. El promedio como punto tpico de los datos es el valor alrededor del cual se agrupan los dems valores de la variable. 6.1.1. LA MEDIA ARITMTICA Es una medida matemtica, un nmero individual que representa razonablemente el comportamiento de todos los datos. Se representa por . Para datos no agrupados la media aritmtica la calculamos mediante la expresin:

Para datos agrupados la media aritmtica la calculamos mediante la expresin:

Donde

es la marca de clase para cada intervalo y 6.1.2. LA MODA

es la frecuencia de clase.

Es el valor de un conjunto de datos que ocurre ms frecuentemente, se considera como el valor ms tpico de una serie de datos. Se representa por .

Para datos no agrupados la moda el dato de mayor frecuencia.

10

Para datos agrupados se define como Clase Modal el intervalo que tiene ms frecuencia. Para obtener la moda en datos agrupados se usa la siguiente frmula: ( )

Dnde: : Lmite real inferior de la clase modal. : Diferencia entre la frecuencia absoluta modal menos la frecuencia absoluta de la clase contigua inferior. : Diferencia entre la frecuencia absoluta modal menos la frecuencia absoluta de la clase contigua superior. : Amplitud de clase

La moda puede no existir o no ser nica, las distribuciones que presentan dos o ms mximos relativos se designan de modo general como bimodales los primeros o multimodales los segundos. 6.1.3. LA MEDIANA Es el valor de la observacin que ocupa la posicin central de un conjunto de datos ordenados segn su magnitud. Es el valor medio o la media aritmtica de los valores medios. La mediana es un valor de la variable que deja por debajo de l un nmero de casos igual al que deja por arriba. Se representa mediante .

Para datos no agrupados su determinacin depende si el nmero de datos es par o impar. a) Si N es impar:
( )

b) Si N es par:
( ) ( )

11

Para datos agrupados primero determinamos la clase medianal, que ser aquella que contenga el dato
( )

y luego determinamos la mediana mediante la expresin: ( )

Donde: : Lmite real inferior real de la clase medianal. : Frecuencia acumulada de la clase anterior a la clase medianal. : Frecuencia absoluta de la clase medianal. : Amplitud de clase. 6.2. MEDIDAS DE DISPERSIN Un rasgo principal de los datos es su dispersin o amplitud, que se refiere a su variabilidad, a la evaluacin de cun separados o extendidos estn estos datos o bien cuanto difieren unos de otros. Variacin: es el grado en que los datos numricos tienden a extenderse alrededor de un valor, generalmente el valor medio 6.2.1. RANGO Mide la dispersin de la totalidad de los datos. Es la ms obvia de las mediadas ya que es la distancia entre los valores mximo y mnimo. El rango o recorrido da alguna idea del grado de variacin que ocurre en la poblacin, pero con frecuencia los resultados pueden ser engaosos, pues este depende de los valores extremos e ignora la variacin de las dems observaciones. Est afectado por ocurrencias raras o extraordinarias. Se representa por y se determina mediante:

12

6.2.2. DESVIACIN MEDIA La desviacin Media o Desviacin absoluta promedio, es la media aritmtica de las desviaciones absolutas de cada una de las observaciones con respecto a su valor central, la media aritmtica, o la mediana. Cuanto mayor es su valor, mayor es la dispersin de los datos. Se designa por Para datos no agrupados: | | .

Para datos agrupados 6.2.3. VARIANZA

se sustituye por

Otro tratamiento para evadir la suma cero de las desviaciones de las observaciones respecto a su Media Aritmtica, consiste en recurrir al proceso de elevar al cuadrado estas desviaciones y sumar los cuadrados, dividiendo la suma por el nmero de casos, a esta cantidad se le denomina varianza, y es la ms importante de las medidas de variacin porque tiene la ventaja de no prescindir de los signos de las desviaciones, pero al igual que la desviacin media los valores extremos pueden distorsionarla. Se desina mediante para las muestras y para las poblaciones.

Para determinar la varianza para datos no agrupados empleamos la expresin: . Para datos agrupados sustituimos 6.3.4. DESVIACION ESTANDAR Cuando se utiliza la varianza como medida de dispersin, para salvar el problema de trabajar con distintas dimensiones en la media y en la medida de variabilidad es necesario definir la Desviacin estndar o tpica como la raz cuadrada de la varianza. Se desina mediante para las poblaciones. para las muestras y por

13

Con una desviacin estndar se forma un intervalo en el cual se encuentra el 68.27% de los valores centrales de la variable. (

Con dos desviaciones estndar, se forma un intervalo donde se encuentra el 95.43% de los valores centrales. (

Con tres desviaciones estndar, se forma un intervalo que contiene el 99.73% de los valores centrales. (

6.3.- OTRAS MEDIDAS DE POSICIN NO CENTRALES: CUANTILES. Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un nmero alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella, se puede dividir la distribucin en cuatro, en diez o en cien partes. Los ms usados son los cuartles, cuando dividen la distribucin en cuatro partes; los decles, cuando dividen la distribucin en diez partes y los centles o percentles, cuando dividen la distribucin en cien partes. Los cuartles, como los decles y los percentles, son en cierta forma una extensin de la mediana. 6.3.1.- CUARTILES Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados usualmente . El segundo cuartil es precisamente la

mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

14

Para datos no agrupados su determinacin depende si el nmero de datos es par o impar. c) Si N es impar:
* +

d) Si N es par:
( ) ( )

Para datos no agrupados primero determinamos la clase del cuartil contenga el dato (

, que ser aquella que

) y luego determinamos el cuartil


( )

mediante la expresin:

Donde: Limite real inferior de la clase del cuartil k Nmero de datos Frecuencia de la clase del cuartil k Frecuencia acumulada de la clase que antecede a la clase del cuartil k Amplitud del intervalo de la clase del cuartil k 6.3.2.- DECILES Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Los deciles se denotan que se leen primer decil, segundo decil, etc. Para datos no agrupados su determinacin depende si el nmero de datos es par o impar. e) Si N es impar:
* +

15

f) Si N es par:
( ) ( )

Para datos no agrupados primero determinamos la clase del decil contenga el dato (

, que ser aquella que

) y luego determinamos el decil


( )

mediante la expresin:

Donde: Limite real inferior de la clase del decil k Nmero de datos Frecuencia de la clase del decil k Frecuencia acumulada de la clase que antecede a la clase del decil k Amplitud del intervalo de la clase del decil k 6.3.2.- PERCENTILES Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles , ledos primer percentil,..., percentil 99.

Para datos no agrupados su determinacin depende si el nmero de datos es par o impar. g) Si N es impar:
* +

h) Si N es par:
( ) ( )

16

Para datos no agrupados primero determinamos la clase del percentil contenga el dato (

, que ser aquella que

) y luego determinamos el percentil


( )

mediante la expresin:

Donde: Limite real inferior de la clase del percentil k Nmero de datos Frecuencia de la clase del percentil k Frecuencia acumulada de la clase que antecede a la clase del percentil k Amplitud del intervalo de la clase del percentil k

Das könnte Ihnen auch gefallen