Sie sind auf Seite 1von 42

INTRODUCCIN

Puede afirmarse que la gran mayora de los Sistemas en los que le corresponde intervenir al ingeniero (por no decir la totalidad) son de naturaleza probabilstica, all radica la importancia del manejo apropiado de la Estadstica para cuantificar, controlar y reducir el grado de incertidumbre asociado a tales sistemas. Se pretende que el profesional que egrese de nuestra casa de estudios posea las herramientas necesarias para capturar, procesar y analizar la informacin. Asimismo debe desarrollar las competencias pertinentes para la toma de decisiones en las circunstancias que lo amerite. Con un manejo apropiado de las tcnicas estadsticas y la teora de probabilidades el ingeniero incrementa sus posibilidades de xito en los procesos de eleccin de cursos de accin. Este libro es ideal para aquellos estudiantes de ingeniera y carreras afines principiantes en cursos de Estadstica. Se caracteriza por la sencillez y la variedad de ejemplos asociados a situaciones cotidianas, con el fin de facilitar el aprendizaje de esta Ciencia. Consideramos importante que el lector se familiarice con las tcnicas de presentacin y recoleccin de informacin (Estadstica Descriptiva), asimismo aprenda a cuantificar el nivel de incertidumbre asociado a un hecho (Teora de Probabilidades) y pueda sacar conclusiones de una poblacin en base a evidencias muestrales (Proceso de Inferencia Estadstica)

Capitulo I. Estadistica Descriptiva

CAPITULO I: ESTADSTICA DESCRIPTIVA. Aspectos Generales

S TA TG R A P H IC S P lu s . ln k

Contenido del Capitulo: ESTADISTICA DESCRIPTIVA: .- Origen e Importancia .-Mtodos de Presentacin de la informacin tabular y grfica: 1.-Diagrama de Tallo y Hoja. 2.-Histograma de Frecuencias. 3.-Diagramas de Series de Tiempo. 4.-Diagrama de Pareto. .-Medidas de Tendencia Central y de Variabilidad: 1.-Media. 2.-Mediana. 3.-Moda. 4.-Rango. 5.-Varianza. 6.-Desviacin Estndar 7.-Coeficiente de Variacin. 8.-Otras Medidas 3.-Evidenciar la aplicacin de las Herramientas Bsicas de la Estadstica Descriptiva en situaciones reales 2.-Identificar las medidas de localizacin del centro y de dispersin de los datos. 1.-Identificar las herramientas de presentacin y resumen de los datos OBJETIVOS DE APRENDIZAJE:

Capitulo I. Estadistica Descriptiva

CAPITULO I: ESTADISTICA DESCRIPTIVA


1.1 Origen e Importancia Etimolgicamente el trmino estadstica se deriva del latn estatus (que significa estado). As las primeras aplicaciones de la estadstica estuvieron asociadas a la compilacin de datos y elaboracin de grficos para describir aspectos notables de un pas. La comprensin de la estadstica y la Teora de Probabilidad constituye una poderosa herramienta para el ingeniero y el cientfico en la produccin de nuevos conocimientos y generacin de tecnologas en el mundo que vivimos. Con el apoyo de la estadstica el hombre: Ha diseado nuevos productos y sistemas. Ejemplos: Diseo de Sistemas logsticos eficientes de empresas de produccin y servicio, Sistemas eficientes de Seguridad social. Ha Ha mejorado la calidad se gestin de sus para organizaciones. desarrollado tcnicas apropiadas comprender los procesos de enseanza-aprendizaje. El siguiente grfico muestra los pasos del proceso de anlisis estadstico:

Capitulo I. Estadistica Descriptiva

Grfico N1. El Anlisis Estadstico.


Recopila

ESTADSTICA

Resume DATOS

Presenta

Analiza
Fuente: Eduardo Pinto

El proceso de recopilacin, resumen y presentacin de datos forma parte de la rama de la estadstica denominada Estadstica Descriptiva y el proceso de anlisis y establecimiento de juicios sindricos en torno a esa informacin se le denomina Estadstica Inferencial. 1.2 Terminologa Bsica. Poblacin: Coleccin completa de todos los elementos a

investigar.Por ejemplo: Nmero de carros ensamblados por DaimlerChrysler en el mes de junio en su Planta de Valencia El objeto de estudio de una investigacin podra ser el rendimiento acadmico de los estudiantes que se gradan en la UNEXPO, y la poblacin sujeta a estudio puede estar conformada por el nmero de egresados con un ndice acadmico mayor o igual a 7 Pts.

Capitulo I. Estadistica Descriptiva

Muestra: En algunas investigaciones los recursos tiempo y costo constituyen factores prohibitivos por lo que resulta imprctico trabajar con la totalidad de los elementos (poblacin), y en estos casos se puede seleccionar un subconjunto de dicho universo a estudiar o muestra. La muestra debe ser un modelo representativo de la poblacin y por ende cumplir con ciertas condiciones para que sea confiable y representativa. Parmetro: Medicin numrica que describe alguna caracterstica de la poblacin de estudio. Por ejemplo: Segn el INE el 8,39 % de la poblacin de Venezuela flucta en una edad comprendida entre los 25 y 29 aos. Estadstico: Medicin numrica que describe alguna caracterstica de la muestra de estudio. Por ejemplo: Una muestra de 1397 personas arroj que el 51% de los entrevistados realiza las compras de alimentos para su hogar en Mercados pblicos populares (Fuente: Datos, i.r, Pulso Nacional, septiembre 2004) Variable: Una variable es una propiedad mesurable o atributo asociado con cada elemento o unidad de una poblacin. Las variables se denotan por letras maysculas tales como X, Y, Z etc. Datos: conjunto de observaciones recolectadas (mediciones, atributos, respuestas de un cuestionario). Los estudiosos de la estadstica frecuentemente manejan: Datos Numricos o Experimentales (Variables): Producto de conteo o mediciones. Ejemplo: Los nmeros 1, 3, 4,5 representan los accidentes laborales en los 4 primeros meses del ao en una empresa manufacturera.

Capitulo I. Estadistica Descriptiva

Datos Categricos o de Atributos: Pueden de clasificarse de acuerdo a algn criterio o caracterstica de calidad. Ejemplo: N, D, N, N, D representan los artculos defectuosos y no defectuosos cuando se inspecciona una muestra aleatoria de 5 artculos. . Donde: N: No defectuoso. D: Defectuoso El siguiente grfico muestra los diferentes tipos de datos. Grfico N 2. Tipos de Datos

Datos (Variables)

Cuantitativos (Numricos)

Cualitativos (No-numricos)

Discretos

Continuos

Nominales

Ordinales

Fuente: Vctor Bernal

Un conjunto de datos univariados constituyen observaciones de una sola variable. Por ejemplo: La siguiente muestra de consumo de energa elctrica en kw-h en los ltimos 5 meses, es un conjunto univariado de datos numricos: 769 751 827 910 960 Se habla de datos bivariados cuando se realizan observaciones de dos variables. Por ejemplo: Al realizar un estudio para medir el nivel de

Capitulo I. Estadistica Descriptiva

servicio a un cliente nuestro conjunto de observaciones puede presentarse en forma de par.Ejemplo: (precio, tiempo de entrega). Los datos multivariados se obtienen cuando se hacen observaciones de ms de dos variables. Por ejemplo un Scout est probando un grupo de prospectos para tomar la decisin de firmarlos en un equipo de Baseball de Grandes Ligas y realiza observaciones de 4 variables (potencia del brazo, velocidad promedio de home a primera, capacidad de fildeo (porcentaje de fildeo), average) asimismo debe analizar otros aspectos asociados al instinto del jugador y esa capacidad mental de resolver situaciones conflictivas. un valor. Exactitud: Expresa la cercana de las mediciones respecto Precisin: Grado de concordancias de las mediciones entre Tipos de Medicin. Nivel de Medicin Nominal: Datos consistentes exclusivamente en nombres o categoras, que no pueden ordenarse en funcin de un criterio. Ejemplo: El personal de una empresa puede ser clasificado, utilizando una escala en letras como A-B-C-D. Nivel de Medicin Ordinal: Los datos se pueden acomodar en algn orden, aunque no es posible establecer diferencias en los datos. Ejemplo: Se asignan calificaciones de A, B, C, D, o E Nivel de Medicin de Intervalo: En este caso la diferencia entre dos valores de datos cualesquiera tiene un significado. Sin embargo los datos de este nivel, no tienen un punto de partida. (El Valor cero no representa una ausencia de caracterstica).Ejemplo: La Escala de Temperatura. al valor de la magnitud que se mide. s. Medicin: Arte de dar una comparacin numrica, asignar

Capitulo I. Estadistica Descriptiva

Nivel de Medicin de Razn: A diferencia del nivel de intervalo si tiene un punto de partida o cero. Ejemplo: Los Ingresos de los trabajadores. 1.3 Mtodos de Presentacin de informacin tabular y grfica. Hay una serie de tcnicas visuales de gran utilidad en la presentacin de una coleccin de datos para facilitar su posterior anlisis. Centraremos nuestra atencin en aquellas de mayor utilidad para los estudiantes de ingeniera. Es menester destacar que estas representaciones grficas pueden realizarse de manera rpida haciendo uso de paquetes de computacin tales como el Statgraphics Plus, SPSS, MINITAB, Excel, Statistica. Tabla de Frecuencias: Sirve para exponer de manera ordenada la informacin recogida en una muestra, los datos se agrupan en clases y se registran las frecuencias observadas para cada clases. Clase: Valor (Si la Variable es discreta) o Intervalo de valores (Si la Variable es continua), por lo general los datos se distribuyen en un conjunto de clases de un ancho idntico que normalmente flucta entre 5 y 25 clases. Frecuencia: Cantidad de veces que un dato se repite Frecuencia Relativa (fr): Cociente entre el la frecuencia de la clase y el nmero de observaciones (n), al multiplicar el resultado obtenido por 100 se obtiene la frecuencia relativa porcentual (fr%) Frecuencia Acumulada (fa): Cuando se trabaja con variables ordinales y numricas la frecuencia acumulada es de gran utilidad para el clculo de percentiles. (fa) representa el nmero de datos acumulados al transitar de una clase a otra, al expresar esta frecuencia en trminos porcentuales se obtiene la frecuencia acumulada porcentual (fai%) Lmite Inferior de Clase: Cifra ms pequea de un Intervalo de clase.

Capitulo I. Estadistica Descriptiva

Lmite Superior de Clase: Cifra mxima de un Intervalo de clase. Marca de la Clase(x): Punto medio del Intervalo de clase. x= Lmite Inferior + Lmite 2 Superior

Procedimiento para la construccin de una Tabla de Distribucin de Frecuencias para Datos Agrupados Calcular el Nmero de Clases o Intervalos: Para calcular el nmero de intervalos se utiliza la siguiente frmula Nmero de Intervalos = 1 + 3.33 Log n (Frmula de Sturgges).

Nota: S al aplicar la frmula obtiene un nmero decimal redondee al entero superior. Calcular el Rango o recorrido de la distribucin: R= Valor mayor de los datos Valor Menor de los Datos. Calcular la amplitud de las clases: Ancho de Clase = Rango Nmero de Clases

El primer Intervalo de Clase tendr como lmite inferior el menor de los datos recolectados. En algunos casos por conveniencia se elige un valor menor que el mnimo dgito recolectado. El Lmite Superior de esta Clase se obtiene sumando al Lmite Inferior la Amplitud menos una unidad. Los Lmites Inferiores de las Clases siguientes se obtienen sumndole la amplitud al lmite inferior de la clase predecesora Los lmites superiores de las Clases siguientes se obtienen sumndole la amplitud menos una unidad a los lmites superiores de la clase predecesora. Ejemplo 1.

Capitulo I. Estadistica Descriptiva

10

Las ventas de helados de una pequea empresa familiar, en el ltimo mes se muestran en la siguiente tabla

Tabla N1. Ventas de Helados en el ltimo mes. 14 13 6 9 5 10 8 12 11 9 9 5 3 14 6 16 9 10 11 5 10 8 * Construya una tabla de distribucin de frecuencias Solucin: El nmero de Clases viene dado por: Nmero de Clases= 1 + 3,33.log30 =5,92 6 clases Utilizando la formula de Amplitud Ancho de la clase = 20 3 = 2,83 3 6 7 12 14 6 4 20 11 12

El lmite Inferior del primer Intervalo es: Menor Valor y el lmite Superior del primer intervalo es (Menor Valor +(Amplitud-1)=3+(3-1)=5 Siguiendo el procedimiento explicado anteriormente la Tabla queda estructurada de la siguiente manera Tabla N2. Frecuencias Absolutas para las Ventas de Helados Nmero Helados 3----5 6----8 9----11 12- -14 15---17 18---20 TOTAL de Frecuencia 5 6 10 6 2 1 30

Capitulo I. Estadistica Descriptiva

11

La informacin presentada en esta tabla puede complementarse agregando una columna con las frecuencias relativas y acumuladas Tabla N3. Distribucin de Frecuencias Nmero de Helados 3----5 6----8 9----11 12- -14 15---17 18---20 TOTAL 5 6 10 6 2 1 30 Frecuencia Frecuencia relativa 0.17 0.20 0.33 0.20 0.07 0.03 1 Frecuencia acumulada (%) 17 37 70 90 97 100 100%

Esta tabla presenta informacin ms completa y nos permite llegar a las siguientes conclusiones: El 70% de las Ventas corresponden a ventas diarias de a lo sumo 11 helados. Los Das con ventas superiores a 17 helados representan un 3% de las ventas totales. 1.3.1 Diagrama de tallo y hoja Si se tiene un conjunto de datos x1, x 2, x3...xn para el cual cada valor xi est constituido por al menos dos dgitos. Una manera rpida de presentar de forma sencilla este conjunto de datos es construir un diagrama de tallo y hojas, as el tallo constituye (el dgito ubicado en el extremo izquierdo) y la hoja (el dgito del extremo derecho)

Capitulo I. Estadistica Descriptiva

12

Ejemplo 2: En el diario Lder, el da Martes 3 de Enero de 2006, apareci la siguiente informacin en referencia a los lderes en bateo de la temporada de Bisbol Profesional de Venezuela. Tabla N 4. Lderes de Bateo de la Temporada 2005-2006 en Venezuela JUGADOR L. Rodrguez E. Chvez R. Olmedo J. Owens R Cedeo. A. Nez. M. Restovich F. Gutirrez. L. Gonzlez J. Rabe
Fuente: Diario Lder

LIDERES EQUIPO Tigres Magallanes Tiburones Tiburones Tigres Tigres Magallanes Leones Caribes Tigres

AVE. 381 361 359 356 355 354 337 337 333 333

Representaremos de manera visual en un diagrama de tallo y hoja la informacin correspondiente a los lderes de bateo. Tabla N5. Diagrama de Tallo y Hojas Tallos 33 34 35 36 37 38 3377 4569 1 1 El Procedimiento realizado para la construccin del Diagrama de Tallo y hojas fue el siguiente. Seleccionar uno o ms dgitos iniciales para los valores de los tallos (en este caso se seleccionaron los 2 primeros dgitos). En consecuencia los dgitos finales constituyen las hojas. Hojas

Capitulo I. Estadistica Descriptiva

13

Se forman filas con las hojas que tengan igual tallo (Dichas filas se ordenan en forma creciente).

1.3.2

Histograma de Frecuencias.

Definicin: Grfica de Barras en la que se representan en la escala horizontal el conjunto de clases de valores de datos y en la escala vertical la frecuencia de dicha clase.

El histograma de frecuencia es una herramienta para hacer seguimiento a la variacin de un proceso o el resultado del mismo. La forma que tome el histograma proporciona una idea sobre la distribucin de probabilidad de la variable del proceso analizado, por lo que constituye en un instrumento til de comunicacin visual. El histograma es un grfico o diagrama que muestra el nmero de veces que se repiten cada uno de los resultados cuando se realizan mediciones sucesivas. Esto permite ver alrededor de que valor se agrupan las mediciones (Tendencia central) y cual es la dispersin alrededor de ese valor central. Ejemplo 3: Construya un Histograma de Frecuencias para las Notas del Primer Parcial de Estadstica Tabla N 6. Calificaciones del Primer Parcial de Probabilidad 17 21 2 19 10 10 07 15 11 11 18 6 los estudiantes de la Seccin I de Probabilidad y

Capitulo I. Estadistica Descriptiva

14

18 13 11 4 17 19,5 9 26 5

17 14 03 05 07 03 8 18 10

7 5 17 18 7 23 9 14 5

En este caso haremos uso del paquete Statgraphics Plus 2.1, para construir el Histograma. Pasos Ingrese los datos (Untiled)

Capitulo I. Estadistica Descriptiva

15

Haga clic en el botn izquierdo del Mouse

Introduzca las notas de los estudiantes :

Capitulo I. Estadistica Descriptiva

16

Haga clic en el botn izquierdo del Mouse en este icono

Capitulo I. Estadistica Descriptiva

17

Capitulo I. Estadistica Descriptiva

18

Finalmente el Histograma de Frecuencia para las Notas de los Estudiantes en el primer Parcial es. Grfico N 3. Histograma de Frecuencias para las Notas

Histogram for Notas


10 8

frequency

6 4 2 0 0 5 10 15 20 25 30

Notas
El paquete considera por defecto 7 Clases; sin embargo el analista puede calcular el N de Clases a travs de la expresin n utilizando la Frmula

de Sturgges ( (1 + 3.33 log n) y modificar de esta forma el Histograma. 1.3.3 Diagrama de Series de Tiempo. Definicin. Es un diagrama que permite visualizar la variabilidad de los datos en el tiempo, as las observaciones se registran de forma cronolgica. En el eje vertical se ubica la variable analizada (precio del dlar, tasa de inflacin, ndice de rotacin, nmero de accidentes laborales, ventas), y en el eje horizontal se representa el tiempo. Este diagrama permite observar tendencias y es muy utilizados por los economistas.

Capitulo I. Estadistica Descriptiva

19

Ejemplo 4: En el siguiente grfico se muestra la variacin en la tasa de desempleo durante el perodo (1993 1999) por efecto de la crisis bancaria y la aplicacin de la Agenda Venezuela Grfico N 4. Tasa de Desempleo 1992-1999
Efectos de la Crisis Bancaria sobre la Tasa de Desocupacin 1993-1999
20 18 16

Tasa de Desocupacin (%)

14 12 10 8 6 4 2 0 1992

1993

1994

1995

1996

1997

1998

1999

Fuente: Instituto Nacional de Estadstica

Fuente: INE

El siguiente grfico muestra el comportamiento mensual de las importaciones y exportaciones en el perodo 2004-2005

Capitulo I. Estadistica Descriptiva

20

Grfico N5. Evolucin del Comercio Exterior 2004-2005

Fuente: INE.

1.3.4 Diagrama de Pareto El economista italiano Vilfredo Pareto (1848-1923) realiz una serie de estudios acerca de la distribucin del ingreso en Europa. En sus investigaciones Pareto encontr que unos pocos concentraban la mayor parte de la riqueza mientras que la mayora tena acceso al menor pedazo de la torta. Esta teora de Pareto de la minora vital y la mayora til ha encontrado importantes aplicaciones en diversas reas del saber. Un diagrama de Pareto es una grfica en la que se organizan de manera decreciente y de izquierda a derecha diversas categoras. En el eje Horizontal se muestran dichas categoras (Causas de Problema, Artculos,

Capitulo I. Estadistica Descriptiva

21

Tipos de Defectos, etc). Por lo general el 80% de los problemas son generados por un 20% de las causas. Este grfico permite priorizar esfuerzos en esa minora vital ahorrando tiempo y costos Aplicaciones Permite identificar oportunidades de mejoras Sistematizar los problemas. Focalizar en las causas principales y priorizar las soluciones.

Pasos para la construccin de un Diagrama de Pareto. Hacer una lista de todas las causas o categoras. Ordenar los datos de la categora de mayor frecuencia a la de menor frecuencia. Cuantificar el porcentaje del total que cada categora representa De izquierda a derecha trazar las barras para cada categora en orden descendente. Trace el grafico lineal para el porcentaje acumulativo comenzando en la barra ms alta Ejemplo 5: En un anlisis de las ltimas 100 paradas en la Maquina etiquetadora de una lnea de envasado de lquidos. Se identificaron las siguientes causas de paradas Botellas se atoran en la etiquetadora. Etiquetas en posicin incorrecta. Botellas sin etiquetas. Etiquetas Dobladas. Etiquetas sin pegamento. Otros.

Capitulo I. Estadistica Descriptiva

22

La frecuencia de tales problemas se presenta en orden descendente en la siguiente tabla. Tabla N7. Causas de Paradas en la etiquetadora.
CAUSA DE PARADA FRECUENCIA

Etiquetas en posicin incorrecta Botella se atora en la etiquetadora Etiquetas sin pegamento Botellas sin etiquetas Etiquetas Dobladas Otros

50 20 15 6 5 4

Tabla N 8. Causas de Paradas frecuencias acumuladas porcentuales


CAUSA DE PARADA FRECUENCIA FRECUENCIA ACUMULADA FRECUENCIA ACUMULADA PORCENTUAL

Etiquetas en posicin incorrecta Botella se atora en la etiquetadora Etiquetas sin pegamento Botellas sin etiquetas Etiquetas Dobladas Otros

50 20 15 6 5 4

50 70 85 91 96 100

50% 70% 85% 91% 96% 100%

A continuacin se presenta el Diagrama de Pareto para identificar las causas de problemas en la mquina etiquetadora de una lnea de llenado en una planta de envasado de lquidos

Capitulo I. Estadistica Descriptiva

23

Grfico 6. Diagrama de Pareto para causas de paradas en la Mquina etiquetadora de una lnea de envasado de lquidos-

DIAGRAMA DE PARETO PROBLEMAS EN LA ETIQUETADORA

100% 90% 85% 80% 70% 60% 50% 40% 30% 20% 10% 0%
TA A TO TA S O R S EC A M EN ET A D D Q U BL A TR R E O O S

100% 90% 96%

70%

50%

ET I

IN C

EG

ET IQ

IO N

IN

LA

IC

ET A

O S

LL A

EN

EN

TO

ET A

ET I

Fuente: Eduardo Pinto

B O

TE

LL A

SE

ET I

B O

TE

ET I

ET A

SI N

Capitulo I. Estadistica Descriptiva

24

1.4

MEDIDAS DE TENDENCIA CENTRAL. Las representaciones grficas descritas anteriormente constituyen

poderosas herramientas visuales en la interpretacin del comportamiento de un conjunto de datos. Sin embargo el anlisis detallado de la informacin requiere de medidas numricas que permitan resumir de forma precisa las principales caractersticas de una coleccin un conjunto de datos. 1.4.1 Media Aritmtica La media aritmtica es la medida de tendencia central de uso ms frecuente. Cuando la poblacin analizado posee un nmero finito de elementos y podemos manipular todos los datos se puede calcular el valor promedio poblacional (), si se trata de una poblacin infinita entonces es pertinente tomar una muestra representativa de dicha poblacional y calcular la media muestral ( x ) Para un conjunto de datos no agrupados la media viene dada por: Media Poblacional

de datos. A continuacin se

presentan una serie de medidas para describir el centro o localizacin de

x
N

Donde N representa el tamao de la poblacin analizada

Media Muestral Definicin S x1, x2, x3,,xn constituyen las observaciones de una muestra de tamao n, entonces la media muestral es:

Capitulo I. Estadistica Descriptiva

25

X = i =1 n

Xi

Nota: La media poblacional X es un estadstico

es un parmetro y la media muestral

Para un conjunto de datos agrupados o distribucin de frecuencia la media aritmtica viene dada por: X =

( x. f ) f

x Representa la marca o punto medio de la clase f Representa la frecuencia de la clase Media Ponderada Cuando todos los datos analizados no tienen el mismo peso, el promedio calculado debe tomar en cuenta el grado de importancia de cada dato. La media ponderada se obtiene asignando pesos a los valores estudiados. media ponderada = X =

(w.x)
x

w : Representa el peso de la observacin. Un caso muy frecuente de uso de la media ponderada se presenta al final de cada semestre cuando nuestros estudiantes calculan cual fue su rendimiento promedio o ndice acadmico del semestre

Capitulo I. Estadistica Descriptiva

26

Ejemplo 6: Un estudiante desea calcular su rendimiento medio durante un semestre las notas de cada asignatura con sus respectivas unidades de crdito se muestran en la siguiente tabla: Tabla N9. Notas de un estudiante en un semestre ASIGNATURA DIBUJO II ESTADISTICA INDUSTRIAL TRANSFERENCIA DE CALOR LABORATORIO DE FENOMENOS INGENIERA QUIMICA TECNOLOGA DE MATERIALES I
Fuente: Eduardo Pinto

NOTA 6,0 9,0 8,4 8,4 7,8 9,0

CR (UNIDADES DE CREDITO) 2 4 3 1 3 4

En este caso la unidad de crdito representa el peso de cada observacin, as el rendimiento medio o ndice acadmico es una media ponderada y viene dada por:

media

ponderada = X =

(w.x) = 2 x6 + 4 x9 + 3x8,4 + 1x8,4 + 3x7,8 + 4 x9,0 = 8,294


x 2 + 4 + 3 +1+ 3 + 4

As el ndice acadmico de este estudiante durante este semestre fue 8,294 Puntos Otros tipos de promedio: * Media Geomtrica: Tiene aplicaciones importantes en el campo de la economa para el clculo de tasas de crecimiento promedio y se define como:

Capitulo I. Estadistica Descriptiva

27

Sean x1, x2, x3xn un conjunto de datos (positivos), la media geomtrica viene dada por: media geometrica = n ( x1.x 2...xn)

* Media Armnica: Se utiliza para estimar el centro de un conjunto de datos que representa tasas de cambio, como la aceleracin y se calcula de la siguiente manera: media armnica = n

* Media Cuadrtica: Tiene aplicaciones importantes en los sistemas de distribucin de energa. Se calcula de la siguiente manera: media cuadrtica =

x2
n

1.4.2 La Mediana Medida de tendencia central que representa el valor que est en el centro cuando el conjunto de datos se presenta en orden creciente (o decreciente), es el punto en el que la distribucin se divide en dos partes iguales, de modo que a la izquierda y derecha de la mediana se concentra el 50% de las observaciones. La mediana se calcula de la siguiente manera: Calculo de la Mediana para datos no agrupados Ordene los datos de manera creciente ( x1, x 2, x3...xn) Si el nmero de datos es impar, la mediana es el valor que se localiza exactamente en la mitad de la lista. ~ X = X (( n +1) / 2) Ejemplo 7: La serie siguiente representa las edades de los cinco abridores del conjunto Guaros de Lara: 28, 27, 25, 32,24 Ordenando los datos de forma creciente se tiene: 24, 25, 27, 28,32

Capitulo I. Estadistica Descriptiva

28

Dado que n es impar la mediana se ubica en la mitad de la lista ordenada en este caso: 24, 25, 27, 28,32 La mediana del quinteto abridor de Guaros de Lara es 27 aos Si el nmero de datos es par, la mediana se calcula promediando los dos valores que estn a la mitad de la lista. ~ X ( n / 2) + X ( n / 2+1) X = 2 Ejemplo 8: La serie siguiente representa las notas de 10 estudiantes en una prctica de Laboratorio de Fenmenos de Transporte: 13, 16, 18, 14, 17, 16, 15, 19, 12, 11 Ordenando los datos de forma creciente se tiene: 11, 12, 13,14, 15,16, 16, 17, 18, 19 Dado que n es par la mediana es el promedio de los dos nmeros centrales de la lista ordenada, en este caso: 11, 12, 13, 14, 15, 16, 16, 17, 18, 19 ~ 15 + 16 X = = 15,5 2 Calculo de la Mediana para datos agrupados

Si se tiene una distribucin de frecuencias, la mediana se calcula localizando la clase en la que se ubique la posicin media, y posteriormente se lleva a cabo una interpolacin en dicha celda. ~ X = Lm Donde:
Lm = Lmite Inferior de la clase medianal.

n cfm (2 )i fm

Capitulo I. Estadistica Descriptiva

29

n = Nmero de observaciones. cfm = Frecuencia acumulada antes del lmite inferior de la clase medianal. fm = Frecuencia absoluta de la clase medianal. i = Intervalo de clase 1.4.3 La Moda La Moda (Mo) de un conjunto de datos es el valor que se repite con mayor frecuencia. Una distribucin de datos puede no tener Moda, puede tener un valor que se repita con ms frecuencia en ese caso se habla de una serie unimodal, si tiene dos modas se denomina bimodal y multimodal si tiene ms de dos modas. Esta medida de tendencia central encuentra importantes aplicaciones cuando se trabaja con datos categricos. Por ejemplo: para medir preferencias de los clientes con respecto a un producto; as la moda en ese caso ser el producto de mayor aceptacin. Medidas de posicin relativa (Cuartiles y Percentiles) Recordamos que la mediana divide la serie de datos en dos partes iguales. Y es una medida importante de localizacin que tiene la ventaja de no verse afectada por los valores extremosa. Sin embargo en algunos casos se requieren de medidas de localizacin ms precisas para el anlisis de datos, tales como los Cuartiles. Los Cuartiles: Dividen los datos ordenados en cuatro partes iguales, y se denotan por Q1, Q2, Q3 Primer Cuartil (Q1): Representa el valor debajo del cual se acumulan el 25% inferior de los datos ordenados. As al menos 25% de los valores ordenados son menores o iguales que el primer Cuartil. Segundo Cuartil (Q2) Representa la mediana, y divide la distribucin de datos en dos partes iguales.

Capitulo I. Estadistica Descriptiva

30

Tercer Cuartil (Q3): Al menos 75% de los datos ordenados son menores o iguales a este valor.

Nota: La mediana es el Percentil 50, o segundo cuartil 1.5 MEDIDAS DE DISPERSION. 1.5.1 El Concepto De Variabilidad. Importancia En El Control Estadstico De Procesos. Hemos estudiado algunas de las medidas de localizacin del centro de una distribucin de dato tales como (media, mediana, moda, etc), pero para tener una idea ms precisa de esa medida de tendencia central es necesario conocer la variabilidad o nivel de dispersin de los datos en torno a dicha medida. Hace unos cuantos aos un profesor nos explic de una manera muy grfica el concepto de variacin y creo til el relatrselos a ustedes: Imagnense que los invitan a una fiesta y nos indican que el promedio de edades de los invitados es 23 aos, automticamente se generan una serie de expectativas y pensamos en las veinteaeras que irn a la fiesta; sin embargo el profesor aclara la desviacin estndar es de 20 aos, as pues es probable que nos encontremos con una abuela de 50 aos y su nietecita recin nacida. Con este ejemplo sencillo el profesor aclaraba que la medida de tendencia central por si sola no da una informacin completa acerca de la coleccin de datos analizados. El concepto de variacin es ampliamente utilizado en estadstica y constituye una de las bases fundamentales para el Control Estadstica de Procesos, hoy en da las grandes empresas enfrentan el reto de eliminar la variabilidad de sus procesos y emprenden ambiciosos proyectos como los Programas 6Sigmas desarrollados por Motorota, General Electric, Xerox, etc. Que buscan llevar sus procesos a una tasa de 3,4 defectos por cada milln de oportunidades

Capitulo I. Estadistica Descriptiva

31

Segn Deming eliminar la variabilidad es la base para el control de procesos. Deming recomend a los directivos enfocarse en el fenmeno de la variabilidad de los procesos, productos o servicios. Para Deming las causas de variacin son de dos tipos: Causas Comunes: Son parte de la variacin normal inherente al proceso. Causas Especiales o atribuibles: Fuente de variacin intermitente, impredecible asignables 1.5.2 Principales Medidas De Variabilidad. Rango: Diferencia entre el mximo y el mnimo valor de una serie de datos. Cuando el conjunto de valores extremos son muy lejanos, esta medida pierde utilidad en la interpretacin de la variabilidad de los datos. Rango = Valor Mximo Valor Mnimo Ejemplo 9: Los siguientes datos representan el tiempo (min.) para procesar cinco rdenes en dos negocios de comida rpida. Calcule el rango de ambas muestras. En cual de los dos negocios comprara? Tabla 10. Tiempos de Atencin en 2 Negocios de comida rpida NEGOCIO 15 I NEGOCIO 15 II Solucin: El Rango o recorrido de la primera muestra es: R1 = 30 10 =20 min. Por otra parte el rango o recorrido de la segunda muestra es: R2= 23 13 = 10 min. 10 13 25 23 18 20 30 18 e inestable. Algunos autores las denominan causas

Capitulo I. Estadistica Descriptiva

32

Fcilmente podemos percatarnos que R2< R1, as en el negocio dos tenemos un menor grado de incertidumbre en cuanto al tiempo de procesar nuestra orden. As preferimos el negocio N 2. La siguiente grfica nos da una idea aproximada de la variabilidad en los tiempos de atencin. Puede visualizarse una mayor dispersin de los datos en los tiempos del Negocio Numero I Grfico N 7. Tiempos de Atencin

Tiempo de Atencion en dos Negocios de Comida Rpida


35 30 25 20 15 10 5 0 0 1 2 3 4 5 6 Numero de la Orden
Fuente: Eduardo Pinto

Tiempo (min)

Negocio I Negocio 2

El Negocio

I es

ms

consistente

en los

tiempos

de

procesamiento de las ordenes. Un Poco de Historia

Carl Friederich Gauss

Capitulo I. Estadistica Descriptiva

33

Contemporneo de Laplace, conocido como el Prncipe

de las matemticas. Creador del mtodo de mnimos cuadrados. Es el primero en estudiar estimadores de la variabilidad. Realiz importantes aplicaciones con la curva normal por lo que a dicha curva se le denomina la Campana de Gauss

Ejemplo 10: Los siguientes datos representan el rendimiento de dos estudiantes en los cinco parciales de una asignatura. En base al rango concluya Cul de los dos obtuvo un rendimiento ms homogneo? Tabla N 10. Notas de 2 estudiantes en 5 parciales de una asignatura 15 ESTUDIANTE I ESTUDIANTE 10 II RANGO 1= 20 -15 = 5 RANGO 2= 15 - 10 =5 En base al rango se puede concluir que ambos estudiantes presentan la misma variabilidad; sin embargo es evidente que el estudiante I obtuvo un rendimiento ms homogneo, pero el rango solo procesa los valores extremos y esta es una de sus limitantes. Se analizar a continuacin otra medida de variabilidad. Desviacin Estndar 14 11 13 15 17 17 17 20

Capitulo I. Estadistica Descriptiva

34

Medida de variacin de los datos respecto a la media. Representa una desviacin promedio en torno al valor central y se calcula de la siguiente manera:

Frmula:

( x )2
N

(Desviacin Estndar Poblacional)

Donde: N : Tamao de la Poblacin. : Media de la Poblacin

Frmula:

s=

( x x) 2
n 1

(Desviacin Estndar Muestral)

Dnde:

x : Media Muestral.

n : Tamao de la muestra. Frmula: s= n ( x 2 ) ( x ) 2 n.(n 1) (Expresin abreviada para el clculo de la

desviacin estndar de la muestra)

Nota: La desviacin estndar poblacional desviacin estndar muestral s es un estadstico

es un parmetro y la

Capitulo I. Estadistica Descriptiva

35

Ejemplo12: En base al problema anterior calcule la desviacin estndar en el rendimiento de los estudiantes anteriores y concluya Cul de los dos obtuvo un rendimiento ms homogneo? Por medio del Paquete Statgraphics Plus se tiene: S1=1,78885 puntos S2=2,07364 puntos As puede concluirse que el rendimiento del estudiante I es ms homogneo que el rendimiento del estudiante 2. No podamos percatarnos de esta diferencia de variabilidad haciendo uso del rango como medida de dispersin Coeficiente de Variacin Definicin: Se expresa como un porcentaje, y representa la desviacin estndar relativa a la media.

C.V =

.100% (Coeficiente de Variacin Muestral)

CV =

.100% (Coeficiente de Variacin Poblacional)


Nota: El Coeficiente de Variacin resuelve el problema de comparar la

desviacin estndar de diferentes poblaciones. Otros tipos de medidas de Dispersin Asimetra

Capitulo I. Estadistica Descriptiva

36

Definicin: La asimetra constituye un indicador de la falta de simetra de una coleccin de datos.

a3 = i =1

fi( Xi X )3/ n
s3 Si a3 = 0 Los Datos son simtricos. S a3 > 0 .Los Datos se inclinan a la derecha. S a3 < 0 Los Datos se inclinan a la izquierda

Curtosis Definicin: Indicador de la altura del mximo de una distribucin. Indica cuan condensada o aplanada es una distribucin de frecuencia

a4 = i =1

fi( Xi X )4/ n
s4

Si a4 = 3 La altura de la Distribucin es mesocurtica.(Normal) S a4 > 3 .La altura de la Distribucin es leptocrtica. S a4 < 3 La altura de la Distribucin es platicrtica.

Capitulo I. Estadistica Descriptiva

37

Concepto Interesante. ESTABILIDAD Ausencia de causas especiales de variacin, cuando un proceso es estable se dice que tiene la propiedad de estar bajo control estadstico

Trminos Claves :Estadstica, Datos, Poblacin, Muestra, Parmetro, Distribucin de Frecuencias, Frecuencia, Clase, Frecuencia Acumulada, Marca, Media, Moda, Histograma, Dato Distante, Sesgo

Referencias Bibliogrficas. BESTERFIELD, D (1994).Control de Calidad. Pearson, Mxico.

Capitulo I. Estadistica Descriptiva

38

DEVORE, J (2001) Probabilidad y estadstica para ingeniera y ciencias. Thomson, Mxico TRIOLA, M (2004).Probabilidad y estadstica. Pearson, Mxico. DEPOOL,R (1999).Probabilidad y Estadstica. (Trabajo de ASCENSO presentado como requisito para optar a la categora de profesor Agregado en la UNEXPO Vicerrectorado de Barquisimeto) Fundacin Polar. Ultimas Noticias .El Mundo de las Matemticas. Fascculos disponibles en lnea:http://www.fpolar.org.ve/matemtica2 www.INE.GOV.VE REVISTA DEBATES IESA. Volumen X.Nmero 3. Julio-Septiembre 2005.

PROBLEMAS PROPUESTOS

Capitulo I. Estadistica Descriptiva

39

1. Los siguientes datos representan la temperatura del fluido de descarga de una planta para el tratamiento de aguas residuales durante varios das consecutivos. 43 44 a) b) c) d) 4 7 49 5 1 46 48 51 52 49 50 45 46 44 49 50 45 48 52 50 46 49 51 50

Calcule la media y la mediana. Interprete ambos resultados. Los valores obtenidos son estadsticos o parmetros? Calcule la desviacin estndar muestral. Interprete el resultado. Construya un Histograma de Frecuencias, y concluya respecto a la informacin que este ofrece. Encuentre los percentiles 5 y 75 de la temperatura. Interprete ambos resultados

2. Considere el siguiente par de muestras Muestra I Muestra 10 10 9 6 8 10 7 6 8 8 6 10 10 8 6 6

II a) Calcule el rango de ambas muestras Es posible concluir que las dos muestras exhiben la misma variabilidad? b) Calcule la desviacin estndar de cada una de las muestras Estas cantidades indican que las dos muestras tienen la misma variabilidad? c) Escriba un planteamiento breve para contrastar el rango de la muestra y la desviacin estndar muestral como una medida de variabilidad. d) Si las muestras son tomadas de los productos de nuestros dos principales proveedores Qu proveedor preferimos? e) Calcule el Coeficiente de Variacin de ambas muestras. Concluya respecto a los valores obtenidos
3) Segn el INE El ndice de Desarrollo Humano (IDH) es el instrumento principal que mide el adelanto medio de un pas en lo que respecta a la capacidad humana bsica representada por las tres oportunidades humanas

Capitulo I. Estadistica Descriptiva

40

ms importantes y permanentes: esperanza de vida, que refleja una existencia larga y saludable; nivel educacional, que resume los conocimientos adquiridos y, el ingreso per cpita, que indica la capacidad de acceso a los recursos para vivir dignamente clculo del ndice de Desarrollo Humano se realiza a partir de las tres variables, seleccionadas a partir de la definicin de desarrollo humano. Las variables son: Esperanza de vida, logro educativo (donde estn incluidos los componentes alfabetismo y tasa combinada de matrcula) y el ingreso. A continuacin se presenta una tabla en la que se muestra la evolucin en el IDH en nuestro pas en el perodo 1960 2000. Realice la grfica que considere pertinente para analizar el comportamiento del ndice de Desarrollo Humano durante este intervalo de tiempo

Evolucin del IDH en Venezuela en el perodo (1960-2000)

Capitulo I. Estadistica Descriptiva

41

Ao

Tasa Componente Componente Tasa Componente Ingreso Componente Esperanza Esperanza Tasa Matrcula Logro $PPA Ingreso de Vida de vida Alfabetismo Combinada Educativo 1/ $PPA (CEdV)

IDH

1950 1960 1970 1980 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
(P)

55,19 58,06 63,85 67,70 71,20 71,20 71,20 71,20 71,20 72,38 72,38 72,57 72,80 72,94 73,34

0,5032 0,5510 0,6475 0,7117 0,7700 0,7700 0,7700 0,7700 0,7700 0,7897 0,7897 0,7928 0,7967 0,7990 0,8057

50,96 63,30 75,92 84,73 90,90 90,90 90,90 90,90 90,90 90,90 90,90 90,90 90,90 90,90 90,90

27,59 45,26 49,87 58,23 ... 62,31 62,56 60,86 61,24 57,94 60,35 61,63 60,12 63,38 64,12

0,4317 0,5729 0,6724 0,7590 0,7302 0,8137 0,8145 0,8089 0,8101 0,7991 0,8072 0,8114 0,8064 0,8173 0,8197

2.520 3.896 4.074 5.349 5.192 5.266 5.241 4.910 4.329 4.157 2.672 2.858 2.647 3.284 3.477

0,4474 0,7128 0,7471 0,9931 0,9628 0,9771 0,9722 0,9084 0,7963 0,7632 0,4767 0,5126 0,4720 0,5947 0,6320

0,4607 0,6122 0,6890 0,8213 0,8210 0,8536 0,8522 0,8291 0,7921 0,7840 0,6912 0,7056 0,6917 0,7370 0,7525

Fuente: INE

4) Una Tesista de la UNEXPO analizo una serie de problemas que afectaban la Gestin del Almacn de una Aduana. Luego de entrevistar a un grupo de funcionarios en referencia a los problemas que consideraban de mayor trascendencia, la lista de problemas detectados se presenta a continuacin Problemas Perdidas en el almacn Productos no codificados. Poca organizacion dentro del almacn No estan definidas reas de mantenimiento Alto porcentaje de Mercanca sin control Dificultad de bsqueda de mercanca dentro del almacn La frecuencia de aparicin de estos problemas para los entrevistados se muestra

Capitulo I. Estadistica Descriptiva

42

Das könnte Ihnen auch gefallen