Sie sind auf Seite 1von 43

TALLER DE ESTADISTICA SALUD OCUPACIONAL

ALUMNOS: RICARDO ALBERTO CORTES QUIMBAYA LUZ MARYERY CARMONA PUENTES HERNANDO OVIEDO POLO FRADY STELLA PLAZAS ALMARIO LUIS FELIPE CASTIBLANCO NUBIA CAPERA VANEGAS

SEMESTRE: 8 A DE ADMINISTRACION PBLICA

ESAP ESCUELA SUPERIOR DE ADMINISTRACION PUBLICA NEIVA - HUILA 2009

TALLER DE ESTADISTICA SALUD OCUPACIONAL

ALUMNOS: RICARDO ALBERTO CORTES QUIMBAYA LUZ MARYERY CARMONA PUENTES HERNANDO OVIEDO POLO FRADY STELLA PLAZAS ALMARIO LUIS FELIPE CASTIBLANCO NUBIA CAPERA VANEGAS

SEMESTRE: 3 A DE ADMINISTRACION PBLICA

PROFESOR: PEDRO PARAMO QUINTERO

ESAP ESCUELA SUPERIOR DE ADMINISTRACION PUBLICA NEIVA - HUILA 2009

CONTENIDO

Pg INTRODUCCIN.......................................................................................................5 1. OBJETIVOS...........................................................................................................6 1.1 OBJETIVO GENERAL.........................................................................................6 1.2 OBJETIVOS ESPECFICO..................................................................................6 TALLER ESTADSTICA SALUD OCUPACIONAL....................................................7 14. Cules son las clases de variables y defnalas?...............................................15 19. Que entiende por Quartiles, Deciles y Percentiles? .........................................18 Desviacin media para datos agrupados: Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:........................................20 23. Ejercicio ............................................................................................................24 CONCLUSIONES....................................................................................................41 BIBLIOGRAFA........................................................................................................43

INTRODUCCIN El propsito de este trabajo es introducir las ideas principales de esta metodologa, haciendo nfasis en el papel fundamental que cumple la Estadstica a la hora de su implementacin. La estadstica es ampliamente reconocida en el desarrollo de investigaciones, en la educacin de los diversos campos; cada vez son ms los profesionales de diferentes disciplinas como biologa, sismologa, economa, medicina, psicologa, pedagoga y sociologa que requieren de mtodos estadsticos para la recoleccin, compendio y anlisis de datos y su interpretacin. La estadstica es el conjunto de indicadores numricos que caracterizan diferentes aspectos de la vida social, incluyendo la produccin, las relaciones polticas, culturales de la vida cotidiana, es la recopilacin, presentacin anlisis e interpretacin de los datos numricos, las colecciones sistemticas de datos relativos a un fenmeno. Tiene muchas aplicaciones y a travs de ella se pueden expresar, mediante indicadores, aspectos de gran utilidad en lo econmico, social y natural. Adems la estadstica constituye un instrumento de suma importancia para que se conozca el comportamiento de la economa a diferentes niveles ya sea en una empresa, municipio, provincia, nacin, as como a escala internacional. Permite apoyar la toma de decisiones para la aplicacin de la poltica econmica que se proponen los pases para conducir la sociedad, as como para trazar la estrategia de desarrollo acorde con los programas que se consideran segn las condiciones imperantes en cada nacin. Mediante la estadstica se descubren los estmulos del desarrollo de la produccin sobre la base del progreso tcnico y se estudia como satisfacer cada vez ms las necesidades materiales de la sociedad y las posibilidades reales de satisfaccin de ellas. Teniendo claro la importancia de la estadstica y sus implementacin de sus diferentes mtodos para la recopilacin y anlisis de datos para un buen resultado de la investigacin del fenmeno a estudiar, se llevo a cabo el desarrollo de un ejercicio sobre unos datos para estudio, siguiendo estos pasos vistos.

1. OBJETIVOS 1.1 OBJETIVO GENERAL

o Obtener un concepto claro sobre la estadstica en todo su campo de estudio.

1.2 OBJETIVOS ESPECFICO . o Conocer la importancia de la Estadstica como una buena herramienta en los diferentes campos de estudio e investigaciones. o Aprender a emplear los diferentes procesos de la estadstica para unos buenos resultados de estudio. o Desarrollar estos conocimientos adquiridos en clases y en la investigacin de este trabajo mediante un ejercicio.

TALLER ESTADSTICA SALUD OCUPACIONAL 1. Concepto estadstica (con sus propias palabras)? Es una ciencia que estudia procedimientos; organiza, tabula, recopila, presenta y analiza datos, experimentos aleatorios, informacin. Para la deduccin de conclusiones como para tomar decisiones de acuerdo con el anlisis. 2. Con sus propias palabras diga cul es la importancia de la estadstica? La estadstica tiene una gran importancia, ya que con ella se pueden estudiar gran cantidad de datos y analizarlos de manera mas fcil dependiendo el objetivo que se quiera lograr por ejemplo: se confeccionan los planes de desarrollo de la economa nacional, se supervisa el control de su cumplimiento y se determinan las necesidades de recursos por territorios, as como las reservas con que cuenta la economa a cualquier nivel. Adems la estadstica constituye un instrumento de suma importancia para que se conozca el comportamiento de la economa a diferentes niveles ya sea en una empresa, municipio, provincia, nacin, as como a escala internacional. 3. Donde se aplica la estadstica? La estadstica se emplea en aquellos casos en los que tenemos una gran cantidad de observaciones y cuya aparicin se rige por las leyes del azar. Es decir, se aplica a fenmenos cuya medicin requiere una coleccin de observaciones, pues hay algunos fenmenos que se presentan en masa, pero para los que no se requiere observacin alguna, pues se conocen a priori. Para saber el porcentaje de hombres mayores de un metro setenta en una poblacin, son necesarias una serie de medidas. En cambio no es necesaria ninguna observacin para saber la cantidad que integran un matrimonio. 4. Cuales son los hechos que abarca la estadstica? Hechos que continuamente suelen suceder presentan ciertas caractersticas tales como las de ser observados y manifestarse al exterior mediante registros, al mismo tiempo el de cuantificarse y aun el de poder determinar la intensidad con que se produce cierto fenmeno. El campo de accin de la Estadstica es muy amplio, sin embargo, no todos los fenmenos son abarcados. nicamente aquellos que renen ciertas condiciones a saber: 1. 2. 3. 4. 5. 6. Fenmenos colectivos o de grupos. Fenmenos de frecuente repeticin. Fenmenos de distinta frecuencia. Fenmenos distantes en el espacio. Fenmenos distantes en el tiempo. Fenmenos cualitativos que puedan cuantificarse.

5. Cules son los hechos que no abarca la estadstica? Quedan fuera del campo de accin de la Estadstica, los enumerados a continuacin: 1. Fenmenos individuales.

2. Fenmenos que no se exteriorizan. 3. Fenmenos accidentales en el tiempo y en el espacio. 4. Fenmenos cualitativos que no puedan cuantificarse. 6. Segn sus conocimientos que entiende por poblacin? Es el conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin sobre el fenmeno que se estudia. Por ejemplo, si estudiamos el precio de la canasta familiar en una ciudad, la poblacin ser el total de las familias de dicha ciudad. 7. Segn sus conocimientos que entiende por muestra? Es un subconjunto de la poblacin elegido aleatoriamente. 8. Segn sus conocimientos que entiende por caractersticas en la estadstica? Es una de las variables estadstica; es una de las caractersticas o cualidades que poseen los individuos de una poblacin. 9. Para que sirve una tabla de frecuencia? Es una ordenacin en forma de tabla de los datos de toda la informacin que se ha recolectado sobre la variable que se estudia. 10. Que se entiende por frecuencia y defina sus clases? Frecuencia es la cantidad de veces que se repite un determinado valor de la variable. Un mtodo alternativo para calcular la frecuencia es medir el tiempo entre dos repeticiones (periodo) y luego calcular la frecuencia (f) recproca de esta manera:

1. Frecuencia absoluta: Es e l n me ro d e ve ce s qu e ap a re ce u n d e te rmin a d o val o r e n u n e stu di o e sta d sti co . Se re p re sen ta po r f i . La su ma de la s fre cu e n ci a s ab so lu ta s es i gu a l al n me ro to ta l d e d a to s, qu e se re p re se n ta p o r N .

Pa ra in di ca r re su mi d a me n te e sta s su ma s se u ti l i za l a le tra g ri e g a (si g ma ma y scu l a ) q ue se le e su ma o su ma to ri a .

2. Frecuencia relativa: La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida

til para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de la muestra. La denotaremos por fi

Donde N = Tamao de la muestra Porcentaje: La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.

3. Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces ni que ha aparecido en la muestra N un valor menor o igual que el de la variable y lo representaremos por Ni. 4. Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamao de la muestra, y la denotaremos por Fi

Porcentaje Acumulado: Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada por 100.

11. Que entiende por marca de clase? La marca de clase es el punto medio de cada intervalo y es el valor que representa a todos el intervalo. Para indicar la marca de clase en un intervalo o la modalidad obtenida en cada dato se utiliza la notacin xi; el ndice, i, expresa el orden del dato, es decir, si es el primero x1, si es el segundo x2... La expresin i = 1 n f i significa: f1 + f2 + ... + fn

La ma r ca de c la se es el va lor q ue re p re sen ta a to d o el inte r va lo pa ra e l c lc ulo d e al g u no s pa r m e tr os . Se re p re se n ta p o r c i . E je m plo: 3 , 1 5 , 24 , 28 , 3 3 , 35 , 38 , 4 2 , 43 , 38 , 3 6 , 34 , 29 , 2 5 , 17 , 7 , 34 , 36 , 3 9 , 4 4 , 3 1 , 26 , 20 , 11 , 1 3 , 2 2 , 2 7 , 47 , 39 , 37 , 3 4 , 3 2 , 3 5 , 28 , 38 , 41 , 4 8 , 1 5 , 3 2 , 13 . ci [0 , 5) [5 , 1 0 ) [1 0 , 1 5 ) [1 5 , 2 0 ) [2 0 , 2 5 ) [2 5 , 3 0 ) [3 0 , 3 5 ) [3 5 , 4 0 ) [4 0 , 4 5 ) [4 5 , 5 0 ) 2 .5 7 .5 1 2 .5 1 7 .5 2 2 .5 2 7 .5 3 2 .5 3 7 .5 4 2 .5 4 7 .5 1 3 3 3 6 7 10 4 2 40 fi Fi 1 2 5 8 11 17 24 34 38 40 ni 0 .02 5 0 .02 5 0 .07 5 0 .07 5 0 .07 5 0 .15 0 0 .17 5 0 .25 0 0 .10 0 0 .05 0 1 Ni 0 .0 2 5 0 .0 5 0 0 .1 2 5 0 .2 0 0 0 .27 7 5 0 .4 2 5 0 .6 0 0 0 .8 5 0 0 .9 5 0 1

12. Para que sirve una grafica estadstica? Sirve de herramienta que detecta la variabilidad, consistencia, control y mejora de un proceso. Tipos de grficos estadsticos - Barras - Circulares - Cartogramas - Histogramas Otros - Dispersograma - Lneas - reas - Mixtos

- Pictogramas

10

Grficos de barras verticales horizontales

Grficos de barras

Representan valores usando trazos verticales, Representan valores discretos a base de Aislados o no unos de otros, segn la variable trazos horizontales, aislados unos de otros. Se a graficar sea discreta o continua. Pueden utilizan cuando los textos correspondientes Usarse para representar: cada categora son muy extensos. - Una serie - Para una serie - Dos o ms series barras Comparativas. - Para dos o ms series

Grficos de barras proporcionales comparativas

Grficos de barras

Se usan cuando lo que se busca es resaltar la Se utilizan para comparar dos o ms series, representacin de los porcentajes de los datos para comparar valores entre categoras que componen un total. Las barras pueden ser: Las barras pueden ser: - Verticales - Verticales - Horizontales - Horizontales

11

Grficos de barras apiladas

Grficos circulares

Se usan para mostrar las relaciones entre dos Estos grficos nos permiten ver la distribucin o ms series con el total. Las barras pueden interna de los datos que representan un hecho, ser: en forma de porcentajes sobre un total. Se - Verticales suele separar el sector correspondiente al Horizontales mayor o menor valor, segn lo que se desee destacar. Pueden Ser: - En dos dimensiones - En tres dimensiones Grficos de lneas En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar: - Una serie - Dos o ms series

Grficos de Areas

Cartogramas

12

En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en datos sobre una base geogrfica. Estos tipos de grficos se utilizan para mostrar un perodo de tiempo. Pueden ser La densidad de datos se puede marcar por crculos, - Para representar una serie sombreado, rayado o color. - Para representar dos o ms series - En dos dimensiones - En tres dimensiones. Grficos Mixtos Histogramas

En estos tipos de grficos se representan dos Estos tipos de grficos se utilizan para o ms series de datos, cada una con un tipo representa distribuciones de frecuencias. Algn diferente de grfico. Son grficos ms software especfico para estadstica grafican la vistosos y se usan para resaltar las curva de gauss superpuesta con el histograma. Diferencias entre las series. Pueden ser:
En

dos dimensiones

13

En

tres dimensiones

Otros Grficos En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se los complementa con un dibujo que est relacionado con el origen de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector.

14

Dispersograma Los dispersogramas

Pictogramas

Son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es comn ver grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un pictograma. Pueden ser: - En dos dimensiones - En tres dimensiones. 13. Segn sus conocimientos que entiende por variable en la estadstica? Variable en la estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin. 14. Cules son las clases de variables y defnalas? 1. Variables cualitativas: son las caractersticas o cualidades que no pueden ser medidas con nmero. Podemos distinguir dos tipos: a. Variable cualidades nominal: Una variable cualitativa nominal presenta modalidades no numricas que no admiten un criterio de orden: Ejemplo: el estado civil, con las siguientes modalidades: soltero casado, separado, divorciado y viudo. b. Variable cualitativa ordinaria o variable cuasicuantitativa: Presenta una modalidad no numrica, en las que existe un orden.

15

Ejemplo: puesto conseguido en una prueba deportiva: 1, 2, 3, Las variables tambin se pueden clasificar en: a. Variables unidimensionales: Slo recogen informacin caracterstica (Ejemplo: edad de los alumnos de una clase).

sobre

una

b. Variables bidimensionales: Recogen informacin sobre dos caractersticas de la poblacin (Ejemplo: edad y altura de los alumnos de una clase). c. Variables pluridimensionales: Recogen informacin sobre tres o ms caractersticas (Ejemplo: edad, altura y peso de los alumnos de una clase). 1. Variable cuantitativa: Es la que se expresa mediante un numero, por tanto se puede realizar operaciones aritmticas con ella. Podemos distinguir dos tipos: a. Variable discreta: Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre valores especficos; los nmeros enteros: Ejemplo: el nmero de hermanos de 5 amigos: 2, 1, 0, 4,3. b. Variable contina: Es aquella que puede tomar valores comprendidos entre dos nmeros, decimales. Ejemplo: la altura de los 5 amigos: 1.72, 1.82, 1.77, 1.69, 1.75.

15. Cual es la diferencia entre variable discreta y continua? Una variable discreta que es puntual es decir que x=1 x=2, y una continua es que se de con los valores de entre 1 y 2, es decir, podra ser 1.1, 1,5, Raz Cuadrada de 2 o de 3, y dado que existen diversos nmeros entre 1 y 2 segn la teora infinitesimal de Newton se representa atraves de intervalos ya sea abierto <1, 2> o cerrado [1,2]. La diferencia es que en un intervalo abierto los nmeros en respuesta no son valores es decir en el ejemplo 1 no seria respuesta, ni 2, pero si un 1.5 y en el intervalo cerrado el 1 y 2 seria parte de las respuesta. La diferencia entre variable discreta y variable continua se basa en el contenido formal de la escala de medicin, que puede presentar una distribucin discreta o continua. Una variable continua es aquella para la que los individuos pueden tener, en principio, infinitos valores fraccionados, esto es valores en cualquier punto de una escala ininterrumpida. As la distancia o la edad seran variables continuas en el sentido de que entre cualquier par de mediciones o valores, por prximos que sean, es posible obtener otra medicin o valor. Por el contrario una variable discreta viene definida de tal modo que tan solo puede alcanzar un determinado conjunto de valores, ya que la escala de medicin se encuentra ininterrumpida por espacios en la escala numrica que, en un principio, no contiene casos medidos de ningn tipo. En este sentido, los ingresos o el tamao de la poblacin son variables discretas ya que los nmeros o valores correspondientes varan a saltos o escalonadamente.

16

16. Que entiende por media aritmtica? Las principales medidas de posicin central son las siguientes: 1. Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las ms utilizadas: a) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra: (X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn) Xm --------------------------------------------------------------------------------------= n (1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3) Xm= -------------------------------------------------------------------------------------------------30 Luego: Xm 1,253 = Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm. b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo estos resultados y al producto final se le calcula la raz "n" (siendo "n" el total de datos de la muestra). X = ((1,20^ 1) * (1,21^4) * (1,22^ 4) *.....* (1,29^3)* (1,30^3)) ^ (1/30) Luego: Xm 1,253 = Este ejemplo de la media aritmtica y la media geomtrica coinciden, pero no tiene siempre por qu ser as. Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores. En todo caso, la media aritmtica es la medida de posicin central ms utilizada. Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna informacin. Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores

17

anmalos podran condicionar en gran medida el valor de la media, perdiendo sta representatividad. 17. Que entiende por mediana? Es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces que se ha repetido). La mediana de esta muestra es 1,26 cm, ya que por debajo est el 50% de los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas acumuladas. Ejemplo: como el valor 1,26 se repite en 3 ocasiones, la media se situara exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la divisin entre el 50% inferior y el 50% superior 18. Que entiende por moda? Es el valor que ms se repite en la muestra. Ejemplo: vamos a utilizar la tabla de distribucin de frecuencias con los datos de la estatura de los alumnos que vimos en la leccin 2. Variable (Valor) x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 X 1 4 4 2 1 2 3 3 4 3 3 Frecuencias absolutas Simple Acumulada x 1 5 9 11 12 14 17 20 24 27 30 Frecuencias relativas Simple Acumulada x x 3,3% 3,3% 13,3% 16,6% 13,3% 30,0% 6,6% 36,6% 3,3% 40,0% 6,6% 46,6% 10,0% 56,6% 10,0% 66,6% 13,3% 80,0% 10,0% 90,0% 10,0% 100,0%

Vamos a calcular los valores de las distintas posiciones centrales: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta cuenta con 3 modas. 19. Que entiende por Quartiles, Deciles y Percentiles? Quartiles: Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Ejemplo: Vamos a calcular los quartiles de la

18

serie de datos referidos a la estatura de un grupo de alumnos. Los deciles y centiles se calculan de igual manera, aunque haran falta distribuciones con mayor nmero de datos. Variable (Valor) x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 x 1 4 4 2 1 2 3 3 4 3 3 Frecuencias absolutas Simple Acumulada x 1 5 9 11 12 14 17 20 24 27 30 Frecuencias relativas Simple Acumulada x x 3,3% 3,3% 13,3% 16,6% 13,3% 30,0% 6,6% 36,6% 3,3% 40,0% 6,6% 46,6% 10,0% 56,6% 10,0% 66,6% 13,3% 80,0% 10,0% 90,0% 10,0% 100,0%

1 quartil: es el valor 1,22 cm, ya que por debajo suya se sita el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada). 2 quartil: es el valor 1,26 cm, ya que entre este valor y el 1 quartil se sita otro 25% de la frecuencia. 3 quartil: es el valor 1,28 cm, ya que entre este valor y el 2 quartil se sita otro 25% de la frecuencia. Adems, por encima suya queda el restante 25% de la frecuencia. Atencin: cuando un quartil recae en un valor que se ha repetido ms de una vez (como ocurre en el ejemplo en los tres quartiles) la medida de posicin no central sera realmente una de las repeticiones. Deciles: Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles: Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.

19

20. Que entiende por desviacin media? Es la me di a a ri tm ti ca d e lo s val o re s a b so l u to s d e la s de svi a ci o n e s re sp e cto a la me d ia . La de svi a ci n me di a se rep re se n ta p o r

E je m plo: Ca l cul a r l a de s v ia c in m e dia d e la di stri b u ci n : 9, 3, 8, 8, 9, 8, 9, 18

De s v ia c in me dia pa r a da tos a gr upa d os : Si l o s d a to s vie n e n ag ru p ad o s e n u na ta bla de fr e c ue nc ia s , l a e xp re si n de la de sv ia c i n me dia es:

E je m plo: Ca l cul a r l a de s v ia c in m e dia d e l a di stri b u ci n : xi [10 , 15 ) [15 , 20 ) [20 , 25 ) [25 , 30 ) [30 , 35 ) 1 2 .5 1 7 .5 2 2 .5 2 7 .5 3 2 .5 fi 3 5 7 4 2 xi fi 37 .5 87 .5 1 5 7 .5 110 65 |x - x| 9 .2 8 6 4 .2 8 6 0 .7 1 4 5 .7 1 4 10 .1 7 4 |x - x| f i 27 .8 5 8 21 .4 3 4 .99 8 22 .8 5 6 21 .4 2 8

20

21

4 5 7 .5

98 .5 7

21. Que entiende por desviacin varianza y desviacin estndar? Desviacin media: Es la media de los valores absolutos de las desviaciones, y la denotaremos por d.

Varianza: Es la media de los cuadrados de las desviaciones, y la denotaremos por o tambin por .

Aunque tambin es posible calcularlo como:

Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm2. Es la raz cuadrada de la varianza, se denota por Sx o s x.

Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como veremos cuando estudiemos el tema de estimacin estadstica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente.

21

a. Cuasivarianza: Es una medida de dispersin, cuya nica diferencia con la varianza es que dividimos por N-1, la representaremos por calcularemos de la siguiente forma: o y la

b. Cuasidesviacin tpica: La raz cuadrada de la cuasivarianza y la denotaremos por SN1 o s N-1.

Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadsticos se vean a su vez modificados. Adems, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan ms dispersin. Pues no es posible comparar unidades de distinto tipo. Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de medida. Coeficiente de Variacin: Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V.

Ejemplo: Veamos por ltimo un ejemplo de cmo se calculan todas estas medidas.

45 55

6 16 35 46 50

50 60 70 80 90

300 -19,4 600 1330 880 360 3470 -9,4 0,6 10,6 20,6

116,4 94 11,4 116,6 82,4 420,8

2258,16 883,6 6,84 1235,96 1697,44 6082

15000 36000 93100 70400 32400 246900

55 65 10 65 75 19 75 85 11 85 95 4 N= 50

22

Dm=

C.V.= Desviacin estndar o Tpica: Es una medida del grado de dispersin de los datos con respecto al valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto a la media aritmtica. La desviacin estndar puede ser interpretada como una medida de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da la precisin de stas. Cuando se va a determinar si un grupo de medidas est de acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital importancia: si la media de las medidas est demasiado alejada de la prediccin (con la distancia medida en desviaciones estndar), entonces consideramos que las medidas contradicen la teora. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sera razonable esperar que ocurrieran si el modelo terico fuera correcto. La desviacin estndar es uno de tres parmetros de ubicacin central; muestra la agrupacin de los datos alrededor de un valor central (la media o promedio). Ecuacin 5-8 Para comprender el concepto de las medidas de distribucin vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varan los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente. Por lo que su media es:

La varianza sera:

23

Por lo tanto la desviacin estndar sera: Con lo que concluiramos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta informacin le permite al gerente determinar cuanto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado. 22. Que entiende por coeficiente de variacin de Pearson? Se calcula como cociente entre la desviacin tpica y la media. Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase (leccin 2) y vamos a calcular sus medidas de dispersin. Frecuencias absolutas Frecuencias relativas Simple Acumulada Simple Acumulada x x x x x 1,20 1 1 3,3% 3,3% 1,21 4 5 13,3% 16,6% 1,22 4 9 13,3% 30,0% 1,23 2 11 6,6% 36,6% 1,24 1 12 3,3% 40,0% 1,25 2 14 6,6% 46,6% 1,26 3 17 10,0% 56,6% 1,27 3 20 10,0% 66,6% 1,28 4 24 13,3% 80,0% 1,29 3 27 10,0% 90,0% 1,30 3 30 10,0% 100,0% 1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego el rango de esta muestra es 10 cm. 23. Ejercicio En la Escuela Superior de la Administracin Pblica ESAP Neiva Huila, se realizo Un examen de estadstica donde se escogieron al azar 50 alumnos los cuales se Variable (Valor)

24

calificaron con una escala numrica de 1 a 50. Los resultados obtenidos fueron los siguientes: Interpretar el 6 intervalo.

Notas que nos dan de los cincuenta (50) alumnos del examen de estadstica de la ESAP: 31 37 12 8 40 13 36 41 18 32 34 42 30 26 36 31 29 27 19 14 29 28 11 36 28 7 12 18 42 32 39 41 22 44 47 27 38 26 15 40 30 29 35 29 38 32 38 29 31 32

1. Conteo - coeficiente de precisin: 7-1 8-1 11-1 12-2 13-1 14-1 15-1 18-2 19-1 22-1 26-2 27-2 28-2 29-5 30-2 31-3 32-4 34-1 35-1 36-3 37-1 38-3 39-1 40-2 41-2 42-2 44-1 47-1

2. Ordenanza de las Notas que nos dan de los cincuenta (50) alumnos del examen de estadstica de la ESAP: 7 19 29 32 38 8 22 29 32 39 11 26 29 34 40 12 26 30 35 40 12 27 30 36 41 13 27 31 36 41 14 28 31 36 42 15 28 31 37 42 18 29 32 38 44 18 29 32 38 47

25

3. Rango:

R = Valor Max. - Valor Mini. R= Xmax Xmini. R= R= 47 - 7 40

4. Numero de intervalos (K)

K= K= K= K= K= K=

1 + 3,3 logn 1 + 3, 3 log (50) 1 + 3, 3 (1, 69) 1 + 5,577 6,577 7

26

5. Amplitud del intervalo:

R C = K

40 C = 7

C = 5,714

C =6

6. Nuevo Rango:

R = K X C R = 7 X 6 R = 42

7. Diferencia de Rangos:

D = R R D = 42 - 40 D=2

27

8. Promedio de la diferencia de rango:

D 2

2 2

9. DISTRIBUCION DE FRECUENCIAS
FRECUENCI MARC FRECUENCI FRECUENCIA A INTERVALO A DE A RELATIVA O ABSOLUTA S CLASE ABSOLUTA PORCENTUAL ACUMULAD A FRECUENCIA RELATIVA ABSOLUTA ACUMULADA MARCA DE CLASE * FRECUENCI A ABSOLUTA

yi - yi - 1 6.1 - 12

yi 9 15 21 27 33 39 45

ni 5 5 2 13 12 11 2 50

hi 5/50 = 5/50 = 2/50 13/5 0 12/5 0 11/5 0 = = = = 0,1 0 0,1 0 0,0 4 0,2 6 0,2 4 0,2 2 0,0 4

NI 5 10 12 25 37 48 50 5/50 10/5 0 12/5 0 25/5 0 37/5 0 48/5 0 50/5 0

HI = = = = = = = 0,1 0 0,2 0 0,2 4 0,5 0 0,7 4 0,9 6 1,0 0

yi * ni 45 75 42 351 396 429 90 1.428

12.1 - 18 18.1 - 24 24.1 - 30 30.1 - 36 36.1 - 42 42.1 - 48

2/50 = 1,00

28

10. Marca de Clase:

yi

yi

yi 2 12

yi

+ 2 18 2

yi

yi yi

= =

9 12 + 2 30 2 15 18

yi

yi

yi

18

+ 2 42 2

24

yi

yi

21

29

yi

24

+ 2 54 2

30

yi

yi

27

yi

30

+ 2 66 2

36

yi

yi

33

yi

36

+ 2 78 2

42

yi

yi yi

= =

39 42 + 2 90 2 45 48

yi

yi

11. Anlisis del rengln 6:

30

o El intervalo 6 est comprendido entre 36.1 42 o La segunda columna es la marca de clase que es 39 o En este intervalo se observan 11 datos que corresponde al 22% de los datos o La frecuencia acumulada del 6 rengln es 48 12. Histograma de frecuencia Un Histograma de Frecuencia es una representacin grfica de una variable en forma de barras, se utiliza en variables continuas y discretas, con un gran nmero de datos y que se han agrupados en clases. El eje abscisas se construyen unos rectngulos que tiene por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. Explicacin: En Este Histograma de Frecuencia Absoluta de los 50 estudiantes de la ESAP que presentaron el examen de Estadstica observamos que la amplitud del intervalo en las calificaciones con relacin al nmero de alumnos que sacaron la misma nota no se presenta uniformidad como bien podemos observar hay notas alta y bajas.

FRECUENCIA

INTERVALOS

31

Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).

13. Polgamo de frecuencia Para construir un Polgamo de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo.

INTERVALO

14. Polgono acumulativo u ojiva Este grfico tiene una finalidad similar al que corresponde de a las frecuencias absolutas, slo que cada frecuencia representada sobre el eje Y, consiste en la ponderacin o peso que tiene cada frecuencia simple o absoluta sobre el total, que para este ejemplo representa la proporcin de estudiantes en cada clase, con relacin al total considerado. Cada frecuencia acumulada para mayor exactitud se suele marcar en el lmite real superior del intervalo en que cae.

32

Explicacin: En Este Polgamo Acumulativo u Ojiva de los 50 estudiantes de la ESAP que presentaron el examen de Estadstica observamos que el 37% de los estudiantes sacaron menos de 33 puntos de calificacin.

F R E C U E N C I A

INTERVALOS

a. POBLACION: Los alumnos de la Escuela Superior de la Administracin Pblica ESAP Neiva Huila. b. MUESTRA: se escogieron al azar 50 alumnos de la de la Escuela Superior de la Administracin Pblica ESAP, para presentar el examen de estadstica c. VARIABLE: Puntaje o notas del examen de Estadstica de los alumnos de la Escuela Superior de la Administracin Pblica ESAP Cuantitativo- Discreta. d. ESCALA: Numrica

15. Medidas de Centralizacin Habitualmente necesitamos disponer de un valor numrico que represente la disparidad de datos de una distribucin de frecuencias. Estos valores son los llamados

33

parmetros centrales o medidas de centralizacin, ya que son valores "intermedios" que se sitan alrededor del centro de la distribucin. Se trata de la media Aritmtica, la moda y la mediana.

34

a. Media Aritmtica __ y = yi n * ni

__ y = 1.428 50 __ y = 28,56

Explicacin: Esto quiere decir que el promedio del examen de Estadstica de los 50 Alumnos de la Escuela Superior de la Administracin Pblica ESAP es de 28,56.

b. Moda :

La Moda es 29 porque es el valor que ms se repite

c. Mediana Continua : Me = n 2 Me = Me = 50 2 25

Me

35

Yi - 1 Me = 24

Explicacin: Esto quiere decir que los alumnos de la Escuela Superior de la Administracin Pblica ESAP, que presentaron el examen de Estadstica observamos que el 50% del porcentaje de los exmenes estn por encima de los 24 puntos de calificacin.

16. Medidas de posicin no central Las medidas de posicin no centrales permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles, Deciles Percentiles.

yi - yi - 1 6,1-12 12,1-18 18.1-24 24,1-30 30,1-36 36,1-42 42,1-48

ni 5 5 2 13 12 11 2 50

NI 5 10 12 25 37 48 50

a. Cuartil Segundo n = 50

= 2 ( 50 )

36

100 4

25

Q 2 = Q 2 =

yi - 1 24

Explicacin: Observamos que el 50% de las notas de los exmenes de estadstica presentados por los alumnos de la Escuela de Administracin Pblica ESAP est por debajo de 24 puntos.

b. Decil Sexto: n = 50

n = 6 ( 50 ) 10 n = 300 10 30

n =

6n

N i - 1

37

D 6

yi

- 1 + C

10 ni

D 6 =

30

30

12

25

D 6

30

5 12

D 6

30 +

2,5

D 6 =

32,5

Explicacin: El 60% de los resultados del examen de estadstica que presentaron los 50 alumnos de la Escuela Superior de Administracin Pblica ESAP estn por debajo de 32,5.

c. Percentil 75

n =

50 7 5 ( 50 ) 100

n =

38

n =

3.750 100 37,5

n =

75 n 7 P 5 = yi - 1 + 100 ni

- Ni - 1

3 75 (50) - 7 7 P 5 = 36 + 6 100 11

7 P 5 =

36

38 11

3 - 7

7 P 5 =

36

0,5 11

7 P 5 =

36

+ 0,27

7 P 5 = 36,27

39

Explicacin: El 75% de los resultado de los exmenes de estadstica de los 50 alumnos de la Escuela Superior de la Administracin Pblica - ESAP. Est por debajo de 36,27.

17. Medidas de dispersin

Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos concentrados, o ms o menos dispersos. Existen diversas medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes: Desviacin tpica- Rango- Varianza - Coeficiente de variacin de Pearson. Vamos a ver un ejemplo de desviacin tpica.

a. Desviacin tpica: yi 9 15 21 27 33 39 45 yi.ni n 45.738 50 ni 5 5 2 13 12 11 2 50 yi . ni 45 75 42 351 396 429 90 1.428 yi . ni 405 1.125 882 9.477 13.068 16.731 4.050 45.738

S =

y (28,56)

S =

S =

914,76 - 815,67

40

S =

99,09

S =

99, 09

S = 9,95 Limite Superior 28, 56 + 9, 95 = 38, 51 Limite Inferior 28, 56 - 9, 95 = 18, 61

Explicacin: El 68.3% de los resultados de los exmenes de estadstica presentado por los 50 alumnos de la Escuela Superior de Administracin Pblica - ESAP esta entre 18.61 y 38.51 aproximadamente.

CONCLUSIONES Este trabajo nos ayudo a poner en prctica los conocimientos adquiridos en la clase de estadstica y a aclarar las dudas que quedaron de los diferentes temas dictados en tan poco tiempo. Profundizamos mas los temas vistos Aprendimos la importancia que tiene la Estadstica en los diferentes campos que la utiliza como una herramienta principal, para la investigacin de los diferentes datos que desean estudiar. Nos crea un hbito de estudio para lograr adquirir nuevos conocimientos y darlos a conocer a nuevas personas que ayudaran a difundir su importancia en nuestras vidas.

41

42

BIBLIOGRAFA

Se utilizaron las siguientes maquinas de Internet para la orientacin del trabajo: www.wikipedia.com.
www.monografias.com.conceptos de Estadstica

Modulo de informtica del I semestre de la ESAP. www.aulafacil.com

43

Das könnte Ihnen auch gefallen