Sie sind auf Seite 1von 33

UNIVERSIDAD DE MENDOZA FACULTAD DE INGENIERA SUBSEDE SAN RAFAEL PROFESORADO EN CIENCIAS DE LA COMPUTACIN

Asignatura: ESTADISTICA APLICADA II

PRACTICA N 1

Docente: Prof. Ing. Mara Valeria Cordero Alumno: Alfredo G. Rivamar -Octubre 2012-

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

1. El gerente de una empresa desea comparar el rendimiento de los operarios de produccin de los turnos Maana y Tarde, en un curso de capacitacin al que asistieron recientemente. Para ello dispone de los puntajes [de 0 a 100] obtenidos en la evaluacin final:
Turno Maana 73 88 76 70 61 60 80 86 78 74 78 39 81 66 74 71 51 48 77 69 97 74 62 80 78 53 72 76 Turno Tarde 91 72 48 57 49 54 51 52 69 66 60 71 57 95 53 59 45

68 59 73 64 84 77

60 52 74 64 59 87

41 54 94 64 71

54 60 67 70 69

76 67 59 71 69 62

79 56 56 38 60 83

54 62 47 59 67 64

47 48 62 71 81

53 58 69 73 79

79 59 52 64 64

a) Procese estos datos, elabore las tablas de frecuencias, y dibuje los diagramas correspondientes. Utilice intervalos de longitud 10, comenzando desde cero. b) Compare las dos distribuciones de frecuencias. Explique en qu se parecen, y en qu se diferencian. Comente como es el rendimiento evidenciado por los dos turnos de trabajo. c) Calcule las medidas de tendencia central y de dispersin, y compare los resultados obtenidos. I. Tabla de distribucin de frecuencias de calificaciones de operarios turno maana
Lim Inf 0 10 20 30 40 50 60 70 80 90 Lim Sup 10 20 30 40 50 60 70 80 90 100 50 Frec Abs 0 0 0 1 2 7 13 18 7 2 Frec Acum 0 0 0 1 3 10 23 41 48 50 Frec Rel 0 0 0 0,02 0,04 0,14 0,26 0,36 0,14 0,04 1 Frec Rel % Marca Clase 0,00% 5 0,00% 15 0,00% 25 2,00% 35 4,00% 45 14,00% 55 26,00% 65 36,00% 75 14,00% 85 4,00% 95 100%

Pgina 2 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Frmulas utilizadas en Excel: fi:=CONTAR.SI($A$3:$I$8;"<"&B24)-CONTAR.SI($A$3:$I$8;"<"&A24).


Aplicacin de la funcin CONTAR.SI. Cuenta la cantidad de valores (calificaciones de los operarios del turno maana) comprendidos entre los lmites superior e inferior (40 y 30 respectivamente) en este caso. Se copia la frmula para el resto de los intervalos de clase. Se utiliza $ para convertir una celda en absoluta de modo que no vare cuando se la traslada (copia).

fa: =+ valor de la frecuencia acumulada anterior y la frecuencia absoluta correspondiente al intervalo de clase analizado. fr: = frecuencia absoluta / poblacin, para cada intervalo de clase. Poblacin: 50. fr %: = valor anterior * 100 (celda con formato de %). Marca de clase: promedio de la suma de los lmites superior e inferior de cada intervalo de clase. Ej.: (30+40)/2 = 35. Poblacin: casos. =CONTAR(A3:I8) = 50 Valor mximo: mximo valor en el rango de datos =MAX(A3:I8)= 97 Valor mnimo: mnimo valor en el rango de datos =MIX(A3:I8) = 39 Amplitud 1: Rango / n = =B15/RAIZ(B12) = 8,20 Amplitud 2: Rango / (1+3,3 * log (n)) =B15/(1+3,3*LOG(B12)) = 8,78 Medidas de Tendencia Central: Media: =PROMEDIO(A3:I8) = 69,14 Mediana: =MEDIANA(A3:I8) = 70,50 Moda: =MODA(A3:I8) =74 Cuartil 1 = Q1: =CUARTIL(A3:I8;1) = 60,25 Percentil 13 = P13: =PERCENTIL(A3:I8;0,13) =54 Medidas de Dispersin: Rango: Valor mx. Valor mn. = =B13-B14 = 58 Varianza: =VAR(A3:I8) =157,18 Desviacin estndar: =DESVESTA(A3:I8) =12,54

Pgina 3 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Diagrama Frecuencia Absoluta fi vs. Marcas de Clase

Turno Maana
20 18 16 18

Frecuencia Absoluta

14 12 10 8 6 4 2 0 5 15 25 35 45 55 0 0 0 1 2 7

13

65

75

85

95

Marcas de Clase

II. Tabla de distribucin de frecuencias de calificaciones de operarios turno tarde


Lim Inf 0 10 20 30 40 50 60 70 80 90 Lim Sup 10 20 30 40 50 60 70 80 90 100 50 Frec Abs 0 0 0 1 2 7 13 18 7 2 Frec Acum 0 0 0 1 3 10 23 41 48 50 Frec Rel 0 0 0 0,02 0,04 0,14 0,26 0,36 0,14 0,04 1 Frec Rel % Marca Clase 0,00% 5 0,00% 15 0,00% 25 2,00% 35 4,00% 45 14,00% 55 26,00% 65 36,00% 75 14,00% 85 4,00% 95 100%

Pgina 4 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Frmulas utilizadas en Excel: las empleadas para el turno maana y considerando que el nuevo rango es: K3:S8 Poblacin: casos. =CONTAR(K3:S8) = 50 Valor mximo: mximo valor en el rango de datos =MAX(K3:S8)= 95 Valor mnimo: mnimo valor en el rango de datos =MIX(K3:S8) = 38 Amplitud 1: Rango / n = =B15/RAIZ(B12) = 8,06 Amplitud 2: Rango / (1+3,3 * log (n)) =B15/(1+3,3*LOG(B12)) = 8,63 Medidas de Tendencia Central: Media: =PROMEDIO(K3:S8) = 62,74 Mediana: =MEDIANA(K3:S8) = 61 Moda: =MODA(K3:S8) = 59 Cuartil 1 = Q1: =CUARTIL(K3:S8;1) = 54 Percentil 13 = P13: =PERCENTIL(K3:S8;0,13) =49,74 Medidas de Dispersin: Rango: Valor mx. Valor mn. =L13-L14 = 57 Varianza: =VAR(K3:S8) =145,42 Desviacin estndar: =DESVESTA(K3:S8) =12,06 Diagrama Frecuencia Absoluta fi vs. Marcas de Clase

Pgina 5 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

III-Anlisis comparativo entre Distribuciones de Frecuencia Tabla Resumen Parmetro Turno Maana Tarde Poblacin 50 50 VMAX 97 95 VMIN 39 38 Ampli1 8,2 8,06 Ampli2 8,78 8,63

El Polgono de Frecuencias, como representacin grfica, proporciona claramente el perfil del patrn de los datos. Dado que el propsito es comparar ambas distribuciones, esta herramienta da un buen resumen de los datos.
Histograma-Turno Maana
20 18
Frecuencia Absoluta
20

Histograma-Turno Tarde
18
Frecuencia Absoluta

18 16 14 12 10 8 6 4 2 0 0 5 15 0 25 0 35 1 45 2 55 65 75 7

18

16 14 12 10 8 6 4 2 0 5 0 15 0 25 0 35 1 45 2 55 65 75 85 95 2 7 7 13

13

2 85 95

Marcas de Clase

Marca de Clase

Se puede apreciar, comparando ambas grficas, que el perfil del patrn de los datos es similar para ambas distribuciones de frecuencia, tal como tambin se observa en la Tabla Resumen. Entonces, el gerente de la empresa al comparar el rendimiento de los operarios de produccin de los turnos Maana y Tarde, en un curso de capacitacin al que asistieron recientemente, concluir que ha sido similar para ambos grupos.

Pgina 6 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

IV-Anlisis comparativo entre Medidas de Tendencia Central y de Variabilidad para ambos Turnos Tabla comparativa de la media, mediana y la moda Media Refleja el valor de cada dato. Los valores extremos Es sencilla de calcular y entender. influyen indebidamente. Tiene propiedades matemticas valiosas, es til para otros clculos. Mediana Los valores extremos no la distorsionan. Carece de ciertas propiedades matemticas Moda Valor que aparece con ms frecuencia. Carece de ciertas propiedades matemticas. Algunos conjuntos de datos no tienen moda. Tabla Resumen Turno Maana Tarde Media 69,14 62,74 Mediana 70,5 61 Moda 74 59 Q1 60,25 54 Q3 76,25 70,5 P13 54 49,74 Rango 58 57 Varianza 157,18 145,42 Desviacin E. 12,54 12,06 Parmetro Media y Desviacin Estndar de los datos: tanto la media como la desviacin estndar de los operarios del turno maana son mayores que las de sus colegas del turno maana. Para el TM la media de las calificaciones es aproximadamente 69 pts., mejor que para el TT, aproximadamente 63 pts. La desviacin estndar es similar en ambos casos por lo que las calificaciones se distribuyen de manera similar alrededor de cada media aritmtica. Rango: similar para ambos turnos.

Pgina 7 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Coeficiente de Variacin: al expresar la desviacin estndar como un porcentaje de la media, este estadstico permite comparar la variabilidad (dispersin) en ambos conjuntos de operarios. C.V.TM = Desv.E. / Media = 12,54 / 69,14 = 0,181 = 18,1 % C.V.TT = Desv.E. / Media = 12,06 / 62,74 = 0,192 = 19,2 % La variacin relativa es mayor entre los operarios del Turno Tarde, aunque como porcentaje de sus medias, las desviaciones estndar para ambos grupos difieren en un valor muy bajo: 0,061 %. Distribuciones simtricas o sesgadas 1. Turno Maana Media: 69,14 Mediana: 70,5 Moda: 74 Para que la distribucin sea simtrica, es necesario que los tres valores indicados se localicen muy cercanos y en el valor pico de la curva representativa. La media se separa del punto ms alto de la curva hacia el extremo izquierdo de la escala. La mediana se corre hacia valores ms bajos de x (pero no demasiado) y la moda permanece en el punto ms alto de la curva. Considerando los valores de los tres estadsticos indicados, la distribucin de los rendimientos de los operarios de produccin del Turno Maana es sesgada a la izquierda. 2. Turno Tarde Media: 62,74 Mediana: 61 Moda: 59 Siguiendo el mismo anlisis anterior, se concluye que la distribucin de los rendimientos de los operarios de produccin del Turno Tarde es sesgada a la derecha. La media se aleja desde el pico de la curva hacia el sesgo. Ocurre porque la media es sensible a unos cuantos valores extremos al final de la curva. La moda es el valor de x que corresponde al punto ms alto de la curva y la mediana se localiza entre la media y la moda.

Pgina 8 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Teorema de Chebyshev: sin importar cul es la forma de la distribucin, al menos: 75% valores comprendidos entre la media de la distribucin y +- 2 desviaciones estndar: para una poblacin=50 con Media= 69,14 y Desv.E. = 12,54 en el turno maana; 37 casos estarn comprendidos entre [44,06;94,22]. Para el turno tarde, Media = 62,74 y Desv.E = 12,06; 37 casos estarn comprendidos entre [38,62;74,80]. 80% valores comprendidos entre la media de la distribucin y +- 3 desviaciones estndar: para el turno maana, 40 casos estarn comprendidos entre [31,52;106,76]. Para el turno tarde, 40 casos estarn comprendidos entre [26,56;98,92]. Cuartiles Q1, Q2 (mediana) y Q3: indican los valores de la variable por debajo del cual quedan , o respectivamente de los elementos de las series estudiadas (para los TM y TT). Cuartiles TM TT Q1 60,25 54 Q2 70,5 61 Q3 76,25 70,5 2. Los siguientes datos muestran la longitud (en centmetros) de cilindros fabricados por una mquina:

239 253 245 251 259 257 256 239

254 248 251 253 250 249 243 241

255 250 247 241 246 247 256 255

248 258 250 251 252 251 255 250

246 252 248 249 238 246 247 237

249 251 250 252 251 245 248 259

242 250 259 25 238 243 251 252

250 253 249 250 236 250 254 249

249 247 249 247 259 249 250 237

244 243 250 251 249 242 239 258

236 246 254 238 240 259 237 252

a) Construya una distribucin de frecuencias para los datos agrupados. b) Calcula las frecuencias relativas, acumuladas, relativa porcentual y distribucin de porcentajes acumulados. c) Construya un histograma y un polgono de frecuencias. d) Determine: P73 y P17. e) Calcula la media aritmtica, la moda y la mediana. f) Calcula la varianza y la desviacin estndar. g) Interpreta los resultados obtenidos.

Pgina 9 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Resolucin Ejercicio N 2 a) Construya una distribucin de frecuencias para los datos agrupados. b) Calcula las frecuencias relativas, acumuladas, relativa porcentual y distribucin de porcentajes acumulados.
Lim Inf 0 30 60 90 120 150 180 210 240 270 Lim Sup 30 60 90 120 150 180 210 240 270 300 Frec Abs 1 0 0 0 0 0 0 11 76 0 Frec Acum 1 1 1 1 1 1 1 12 88 88 Frec Rel Frec Rel % Marca Clase 0,01136 1,14% 15 0,00000 0,00% 45 0,00000 0,00% 75 0,00000 0,00% 105 0,00000 0,00% 135 0,00000 0,00% 165 0,00000 0,00% 195 0,12500 12,50% 225 0,86364 86,36% 255 0,00000 0,00% 285

Tabla Resumen Cilindro Poblacin 88 VMAX 259 VMIN 25 RANGO 234 Ampli1 24,94 Ampli2 31,55 Utilizando las funciones de Excel: Poblacin = CONTAR(A3:K10) VMAX = MAX(A3:K10) VMIN=MIN(A3:K10) Rango= VMAX VMIN Amplitud1= RANGO/RAIZ(POBLACION) Amplitud2= RANGO/(1+3.3*LOG(POBLACION))

Pgina 10 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

c) Construya un histograma y un polgono de frecuencias.

Pgina 11 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

d) Determine: P73 y P17. Utilizando la funcin PERCENTIL en Excel: Devuelve el k-simo percentil de los valores de un rango. Esta funcin permite establecer un umbral de aceptacin. Por ejemplo, aceptar los cilindros cuya longitud sea superior al percentil 73. Sintaxis: PERCENTIL(matriz;k) Siendo: Matriz: es la matriz o rango de datos que define la posicin relativa. K: es el valor de percentil en el intervalo de 0 a 1, inclusive. P73: P73 = PERCENTIL(rango;0,73) = 251,51 P17: P17= PERCENTIL(rango;0,73) = 241,79 e) Calcula la media aritmtica, la moda y la mediana y f) Calcula la varianza y la desviacin estndar. Tabla Resumen Parmetro Media Mediana Moda Varianza Desviacin E. Longitud Cilindros 245,95 249 250 603,08 24,56

Pgina 12 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Utilizando las funciones de Excel: Media: =PROMEDIO(rango) Mediana: =MEDIANA(rango) Moda: =MODA(rango) Varianza: =VAR(rango) Desviacin Estndar: =DESVEST(rango)

g) Interpreta los resultados obtenidos. Distribuciones simtricas o sesgadas Media: 245,95 Mediana: 249 Moda: 250 Para que la distribucin sea simtrica, es necesario que los tres valores indicados se localicen muy cercanos y en el valor pico de la curva representativa. Se observa que esto no ocurre y, considerando los valores de los tres estadsticos indicados, la distribucin de las longitudes de los cilindros es sesgada a la izquierda. La media se separa del punto ms alto de la curva hacia el extremo izquierdo de la escala. La mediana se corre hacia valores ms bajos de x (pero no demasiado) y la moda permanece en el punto ms alto de la curva. Coeficiente de Variacin C.V. = Desv.E. / Media = 24,56 / 245,95 = 0,0998 = 9,98 % Rango: en este caso no es una buena medida de variabilidad ya que la distribucin contiene un valor extremo, por lo que el rango indicar una variacin excesiva. Media y Desviacin Estndar: la longitud promedio de los caos es de 245,95 y la variacin en la longitud respecto de la media es de 24,56.

Pgina 13 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

3. Una universidad pequea utiliza el sistema de calificacin de 0 a 4.0, donde 4.0 es la mxima calificacin posible. Las calificaciones que se presentan a continuacin, son los promedios de las calificaciones de los estudiantes inscritos en la licenciatura de psicologa en esa universidad.

2.6 3.4 3.7 2.4 2.7 1.4 3.2 2.8

1.7 2.0 3.0 3.2 1.5 2.6 3.1 3.8

1.0 3.2 3.5 3.3 2.7 2.9 1.6 1.4

3.1 3.1 3.0 2.7 2.4 2.1 2.5 1.9

1.5 3.4 2.4 3.5 3.4 2.6 2.3 3.2

1.6 2.2 3.0 3.2 3.3 1.5 2.8 2.9

2.1 1.6 3.4 3.1 3.0 2.8 3.2 2.1

3.9 3.1 2.4 3.3 3.8 2.3 2.8 3.2

a) Construya una distribucin de frecuencias para las calificaciones agrupadas con 10 intervalos. b) Construya un histograma y el polgono de frecuencias para la distribucin de frecuencias obtenida en el punto anterior. c) Determine: P80 y P20. d) Calcula la media aritmtica, la moda y la mediana. e) Calcula la varianza y la desviacin estndar. f) Interpreta los resultados obtenidos. Resolucin Ejercicio N 3 a) Construya una distribucin de frecuencias para las calificaciones agrupadas con 10 intervalos.
Lim Inf 0 1 2 3 4 5 6 7 8 9 Lim Sup 1 2 3 4 5 6 7 8 9 10 Frec Abs 0 11,0 24,0 29,0 0,0 0,0 0,0 0,0 0,0 0,0 Frec Acum 0 11 35 64 64 64 64 64 64 64 Frec Rel Frec Rel % Marca Clase 0,00 0,00% 0,5 0,17 17,19% 1,5 0,38 37,50% 2,5 0,45 45,31% 3,5 0,00 0,00% 4,5 0,00 0,00% 5,5 0,00 0,00% 6,5 0,00 0,00% 7,5 0,00 0,00% 8,5 0,00 0,00% 9,5

Pgina 14 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Tabla Resumen Calificaciones Poblacin 64 VMAX 3,9 VMIN 1,0 RANGO 2,9 Ampli1 0,36 Ampli2 0,42 Poblacin: =CONTAR(rango) Valor Mximo: =MAX(rango) Valor Mnimo: =MIN(rango) Rango: Valor Mximo Valor Mnimo Amplitud 1: =Rango/RAIZ(Poblacin) Amplitud 2: =Rango/(1+3,3*LOG(Poblacin))

b) Construya un histograma y el polgono de frecuencias para la distribucin de frecuencias obtenida en el punto anterior.

Calificaciones Estudiantes
35 30

Frecuencia Absoluta

25 20 15 10 5 0 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 9,5 Marcas de Clase

Pgina 15 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Calificaciones Estudiantes
35 30 Frecuencia Absoluta 25 20 15 10 5 0 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 9,5 Marcas de Clase

c) Determine: P80 y P20. Utilizando la funcin PERCENTIL en Excel: Devuelve el k-simo percentil de los valores de un rango. Esta funcin permite establecer un umbral de aceptacin. Sintaxis: PERCENTIL(matriz;k) Siendo: Matriz: es la matriz o rango de datos que define la posicin relativa. K: es el valor de percentil en el intervalo de 0 a 1, inclusive. P80: P20: P73 = PERCENTIL(rango;0,80) = 3,24 P17= PERCENTIL(rango;0,20) = 2,1

Pgina 16 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

d) Calcula la media aritmtica, la moda y la mediana y e) Calcula la varianza y la desviacin estndar. Tabla Resumen Calificaciones Alumnos Media 2,69 Mediana 2,80 Moda 3,20 Varianza 0,49 Desviacin E. 0,70 Parmetro f) Interpreta los resultados obtenidos. Modo en que se distribuyen los valores del conjunto de datos: distribucin sesgada a la izquierda. Para que la distribucin sea simtrica, es necesario que los tres valores indicados se localicen muy cercanos y en el valor pico de la curva representativa. Se observa que esto no ocurre y, considerando los valores de los tres estadsticos indicados, la distribucin de las longitudes de los cilindros es sesgada a la izquierda. La media se separa del punto ms alto de la curva hacia el extremo izquierdo de la escala. La mediana se corre hacia valores ms bajos de x (pero no demasiado) y la moda permanece en el punto ms alto de la curva. Rango: no afectado por un valor extremo por lo que, en este caso, es una buena medida de variabilidad. Media y Desviacin Estndar: la cantidad en la que los valores del conjunto de datos difieren de la media es 0,70, un valor muy pequeo, por lo que se concluye que los valores del conjunto de datos tienden a estar muy cerca de la media. Coeficiente de Variacin: C.V. = Desv.E. / Media = 0,70/2,69 = 0,260 = 2,60 %

Pgina 17 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

4. La variable aleatoria X, que representa el nmero de errores por 100 lneas de cdigo de programacin, tiene la siguiente distribucin de probabilidad: x 2 3 4 5 6 f(x) 0,01 0,25 0,4 0,3 0,04 Encuentre la varianza de X. Entonces: A-

u = 2 * 0,01 + 3 * 0,25 + 4 * 0,4 + 5 * 0,3 + 6 * 0,04 => u = 4,11


E(X)2 = 17,63

B- E(X)2 = (2)2 * 0,01 + (3)2 * 0,25 + (4)2 * 0,4 + (5)2 * 0,3 + (6)2 * 0,04 =>

C- 2 = E(X)2 u => 2 = 17,63 (4,11)2 => 2 = 17,63 16,89 => 2 = 0,74 = 0,74 => = 0,86 5. En una tarea de laboratorio1, si el equipo est funcionando, la funcin de densidad del resultado observado, X, es:

Encuentre la varianza y la desviacin estndar de X. Media de X () (variable continua):


1 1 x2 x3 x2 x3 1 1 1 = 2 x1-xdx=2 x-x2dx=2 - dx= 2 - =2 - 0 => = 2 3 2 3 2 3 0 0 0 0 1

www.wolframalpha.com

Pgina 18 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

E (X)2 :

2= 1/6 (1/3)2 => 2 = 1/18 = 2 => = 1/18 => = 0,236 6. Una variable aleatoria X tiene una media y una varianza ,y una distribucin de probabilidad desconocida. Usando el teorema de Chebyshev, estime: a) : k: (u k . ) = 12 k . 9 = 6 => k = (12-6) / 3 => k = 2 1 1 / k2 = 1-1/22 = 3/4 Entonces: P(6<X<18) = P(12 - 2 . 3 < X < 12 + 2 . 3) >= 3/4 (la probabilidad es de al menos 3/4) b) k: (u k . ) = 12 k . 9 = 3 => k = (12-3) / 3 => k = 3 1 1 / k2 = 1-1/32 = 8/9 Entonces: P(6<X<18) = P(12 - 3 . 3 < X < 12 + 3 . 3) >= 8/9 (la probabilidad es de al menos 8/9)

Pgina 19 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

7. Una variable aleatoria X tiene una media y una varianza . Utilizando el teorema de Chebyshev (se entiende distribucin de probabilidad desconocida), encuentre: a) = 1-P(X-10<3) = 1-P(-3<X-10<3) => 1-P[-3+10 <X<3+10] = 1-P[7<X<13] Entonces: k: (u k . ) = 10 k . 4 = 7 => k = (10-7) / 2 => k = 3/2 1 1 / k2 = 1-1/(3/2)2 = 5/9 Finalmente: -P(X-10>=3) >= -1 +1-1/k2 => -P(X-10>=3) >= - 1/(9/4) = -5/9 => P(X-10>=3) <= 5/9 (la probabilidad es a lo sumo 5/9) b) 1-P(X-10<3) = 1-P(-3<X-10<3) => 1-P(-3+10<X<3+10) = 1-P(7<X<13) Entonces: k: (u k . ) = 10 k . 4 = 7 => k = (10-7) / 2 => k = 3/2 1 1 / k2 = 1-1/(3/2)2 = 5/9

Pgina 20 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Finalmente: -P(X-10< 3) >= -1 +1-1/k2 => -P(X-10< 3)>=-1/(9/4) = -5/9 => P(X-10<3) < 5/9 (la probabilidad es a lo sumo 5/9) c) k: (u k . ) = 10 k . 4 = 5 => k = (10-5) / 2 => k = 5/2 1 1 / k2 = 1-1/(5/2)2 = 21/25 Finalmente: >= 21/25 (la probabilidad es de al menos 21/25) 8. El gerente de una empresa est analizando el tiempo que le insume realizar diariamente una cierta tarea, con el objeto de planificar adecuadamente el resto de sus actividades. En base al anlisis descriptivo realizado sobre los datos disponibles de la variable, el gerente pudo determinar que la duracin promedio de esa tarea es de 45 minutos, con un desvo de 5 minutos, teniendo dicha variable una distribucin Normal. Considere las siguientes situaciones: a) Si la tarea dura menos de 40 minutos, el gerente puede planificar otras actividades extras para ese da. Calcule la probabilidad de que esto suceda. u= 45 = 5 x=40 Entonces: z = (x-u) / => z = (40-45)/5 => z = -1 Utilizando z = + 1 e ingresando en la Tabla de reas bajo la curva normal estndar de acuerdo al tipo de distribucin, y se obtiene: P (x<40) = 0,15866 = 15,87 %

Pgina 21 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

b) Si la tarea dura ms de 60 minutos, el gerente debe suspender otras tareas posteriores. Calcule el porcentaje de veces que ocurre esta situacin. u= 45 = 5 x=60 Entonces: z = (x-u) / => z = (60-45)/5 => z = 3 Utilizando z = 3 e ingresando en la Tabla de reas bajo la curva normal estndar de acuerdo al tipo de distribucin, y se obtiene: P (x>60) =0,99865 = 99,865% c) Calcule la probabilidad de que la tarea dure entre 50 y 60 minutos. u= 45 = 5 z1 = (50-45)/5 => z1 = 1 => P(x>50)= 0,34134 = 34,134% x1=50
Zona no permitida

u= 45 = 5 z2 = (60-45)/5 => z2 = 3 => P(x<60)= 0,49865 = 49,865% x2=60 Finalmente: P(50<x<60) = z2 z1 = 0,49865 0,34134 => P(50<x<60) = 0,15731 = 15,731%

Pgina 22 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

d) Determine el valor de duracin de la tarea que es superado el 10% de las veces que se ejecuta la misma. Se desconoce el valor de duracin de la tarea: 10% = 0,1 => se ingresa con ese valor a la tabla normalizada, primera columna, y el valor de x que se aproxima a 0,1 es 0,10027 al que le corresponde z=1,28. Con este valor de z y utilizando z= (x-u)/ se determina el valor de x como duracin de la tarea que es superado el 10 % de las veces que se ejecuta la misma: x = u + z . = (45 + 1,28 *5) => x = 51,40 9. Un analista de mercado accionario registr durante varios aos el precio diario de venta de una accin particular. La distribucin resultante de los datos tiene forma normal, con una media =$84,10 y una desviacin estndar =$7,62. a) Determine el porcentaje de precios de venta que estuvieron por debajo de $95,00. u=$84,10 =$7,62 x=$95,00 z = (95-84,10)/7,62 => z = 1,43 => P(x<95,00)= 0,92364 = 92,364%

b) Qu porcentaje de precios de venta estuvieron entre $76,00 y $88,00? u=$84,10 =$7,62 x1=$76,00 x2=$88,00 z1 = (76-84,10)/7,62 => z1 = -1,063 => P(x>$76,00)= 0,35543 = 35,543% z2= (88-84,10)/7,62 => z2= 0,51 => P(x<$88)= 0,19497 = 19,497 % P($76<x<$88) = 0,35543 + 0,19497 => P($76<x<$88) = 0,5504 = 55,04%
Pgina 23 de 33 rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

c) Qu porcentaje de precios de venta estuvieron por arriba de $70,00? u=$84,10 =$7,62 x=$70,00 z = (70-84,10)/7,62 => z = -1,8504 => z = 0,03216 = 3,216% P(x>$70,00) = 1- 0,03216 => P(x>$70,00) = 0,9678 = 9,678 % d) Qu precio de venta divide a la distribucin de modo que el 2,5% de los datos estn por arriba de l? u=$84,10 =$7,62 x=$?? P(x) = 0,025 => z = 1,96 => x = u + z . => x = 84,10 + 1,96 . 7,62 => x = $ 98,996 => x = $ 99 (el precio de venta que divide la distribucin de modo que el 25 % de los datos se encuentre por encima de l es $ 99). 10. La vida media de una mquina para elaborar pasta es de 7 aos, con una desviacin estndar de 1 ao. Suponiendo que las vidas de estas mquinas siguen aproximadamente una distribucin normal, encuentre la probabilidad de que la vida media de una muestra aleatoria de 9 de estas mquinas caiga entre 6.4 y 7.2 aos. u=7 aos =1 ao x1=6,4 aos x2=7,2 aos n=9 Z1 = (6,4-7)/1/9 => z1 = -1,8 => P1 = 0,46407 Z2= (7,2-7)/1/9 => z2= 0,6 => P2 = 0,22575 P(6,4 < X < 7,2) = 0,46407 + 0,22575 => P(6,4 < X< 7,2) = 0,68982 = 69,98%
Pgina 24 de 33 rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

ANEXO I Tpicos de Teora Parte 1 A-Introduccin Estadstica: Ciencia que aplica tcnicas para recopilar, consolidar y analizar informacin representativa, con el fin de evaluar la incertidumbre en el proceso de la toma de decisiones. Estadstica Descriptiva: comprende a los procesos de consolidacin, resumen y descripcin de los datos recopilados, a travs de tablas, grficos o de ndices. Variable: caracterstica que se observa en una poblacin o muestra, y a la cual se desea estudiar, y susceptible de ser medida. Por definicin, se trata de un elemento de inters que puede tomar muchos valores numricos diferentes. Variable cuantitativa: aquella cuyos valores se pueden expresar como cantidades numricas. Variable cuantitativa discreta: cuando entre dos valores consecutivos no puede tomar ningn otro, es decir, toma valores enteros, por ejemplo los puntajes obtenidos por los operarios de produccin en el curso de capacitacin, el n de hijos de una familia, n de alumnos de un curso, n de caballos que hay en varios rodeos. Variable cuantitativa continua: cuando entre dos valores consecutivos puede tomar infinitos ms, correspondientes a cualquier valor intermedio, son valores reales. Ej. Peso, estatura, sueldos Poblacin: el conjunto completo de sujetos u objetos de inters. En este caso, conjunto finito, dado que tenemos dos poblaciones de 50 personas cada una (participantes en un curso de capacitacin: operarios de produccin turnos maana y tarde). Distribucin: un conjunto, un arreglo o grupo de valores numricos. Distribucin de frecuencias: mtodo de presentacin de datos que muestra una lista de varias clases o categoras de datos junto con el nmero de valores (frecuencia de aparicin) que caen dentro de cada una. En este caso, la lista de calificaciones de los operarios de cada turno con su frecuencia de aparicin. Distribucin de frecuencias de datos agrupados: un arreglo que facilita visualizar la forma de la distribucin y su tendencia central. Los datos individuales se agrupan por lo general en intervalos de clase. Se requiere un compromiso en la amplitud del intervalo entre perder informacin y tener una presentacin visual significativa. Mientras ms amplio sea el intervalo, se perder ms informacin. Si es demasiado angosto, la distribucin se aproxima a una de datos individuales, con sus inconvenientes (valores con frecuencia nula y una forma poco clara de la forma de la distribucin y su tendencia central).
Pgina 25 de 33 rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Tabla de Distribucin de frecuencias: la distribucin de frecuencias presentada en forma de tabla. La informacin all presentada es la siguiente: o Lmite inferior del intervalo de clase: valor inferior del IC. o Lmite superior del intervalo de clase: valor superior del IC. o Frecuencia Absoluta (fi): cantidad de veces que se repite un determinado valor de la variable. o Frecuencia Relativa (fr): es la fraccin del total que representa cada valor de la variable. o Frecuencia Acumulada (fa): es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. o Frecuencia Relativa Porcentual (fr%): al multiplicar por 100% la frecuencia relativa expresada en decimal, se obtiene el porcentaje de la variable. o Marca de clase: promedio entre los LI-IC y LS-IC; (LI +LS) / 2. I-Medidas de localizacin (Tendencia Central): estudia la disposicin de los datos para agruparse alrededor del centro o de ciertos valores numricos. Se consideran: Media Aritmtica, Mediana, Moda, Cuantiles. 1. Media aritmtica: se define como la suma de todos los valores dividido por su nmero. Siendo Xi los valores de la serie y n su nmero total, su expresin simblica es:

Su valor puede verse afectado de manera desproporcionada por la existencia de algunos valores extremos. 2. Mediana: de un conjunto de observaciones es el valor para el cual, cuando todas las observaciones se ordenan de manera creciente, la mitad de stas es menor que este valor y la otra mitad mayor. Para n impar, es el valor de observacin que se encuentra a la mitad del conjunto ordenado. Si el nmero es par, su valor es el promedio aritmtico de las dos observaciones que se encuentren a la mitad del conjunto ordenado. Tambin puede determinarse a partir de la distribucin acumulativa, es el percentil cincuenta. 3. Moda: de un conjunto de observaciones, es el valor de la observacin que ocurre con mayor frecuencia en el conjunto (el valor de la variable con mayor frecuencia absoluta).
Pgina 26 de 33 rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

4. Cuantiles: permite dividir la serie estudiada en partes. En principio, tres son los cuantiles ms importantes: cuartiles, deciles y percentiles (medida de Posicin). Cuartiles: son tres valores con las siguientes caractersticas: Q1 = Primer cuartil: es el valor de la variable por debajo del cual queda de los elementos de la serie estudiada.

Q2 = Segundo Cuartil = Mediana. Q3 = Tercer cuartil: es el valor de la variable por debajo del cual quedan los de los elementos que constituyen la serie. Q4 = Cuarto Cuartil: es el valor de la variable por debajo del cual queda el total de los elementos de la serie estudiada. No tiene sentido su definicin. Deciles: dividen a toda la serie en DIEZ partes iguales. El decil 1 = D1, deja el 10% de los valores de la serie por debajo de l. Anlogamente ocurre con los deciles D2, D3, D4, D5, D6, D7, D8 y D9. El decil 8, por ejemplo, deja el 80% de la masa de datos investigada por debajo de l. Las frmulas para calcularlos son tambin anlogas a las de la mediana:

Percentiles: dividen a la distribucin en 100 partes iguales. Se denotan: P1, P2, P3, , P98, P99. As P90, por ejemplo, deja por debajo de l el 90% de los elementos. El cuartil inferior es el percentil 25 y la mediana el percentil 50. La frmula para realizar el clculo del percentil 45, por ejemplo, sera:

Pgina 27 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

II- Medidas de variabilidad (Dispersin): estudian la dispersin de las observaciones en el conjunto. Se consideran: Rango, Varianza (S2) y Desviacin Estndar (S). 1. Rango: la diferencia entre el ltimo valor de la variable y el primero; es decir, el campo de variacin de la variable medido numricamente. Si bien es una medida de dispersin imperfecta, en determinadas situaciones resulta ser til. 2. Varianza (S2): la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media). Se obtiene sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan. Puede ser afectado, an ms que la media, por la existencia de algunos valores extremos al conjunto.

3. Desviacin estndar (S): permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Se expresa en las mismas unidades fsicas de las observaciones.

B-Variable discreta Una variable es discreta cuando entre dos valores consecutivos no puede tomar ningn otro, es decir, toma valores enteros, por ejemplo los puntajes obtenidos por los operarios de produccin en el curso de capacitacin, el n de hijos de una familia, n de alumnos de un curso, n de caballos que hay en varios rodeos. Esperanza matemtica, Media o Valor Esperado: es el nmero promedio o valor esperado de la variable aleatoria X. Si X es una variable aleatoria, su distribucin de probabilidad es f(x). La media o valor esperado de una variable aleatoria X describe el lugar donde se centra la distribucin de probabilidad.

Pgina 28 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Para variable X discreta:

Para variable X continua:

Varianza: es una medida de variabilidad. La media no ofrece una descripcin adecuada de la forma de la distribucin. Para variable X discreta:

Para variable X continua:

Una manera alternativa:

Desviacin Estndar de X: Desviacin de una observacin respecto a su media: (x

u)

Pgina 29 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

Teorema de Chebyshev: analiza: Varianza: variabilidad de observaciones alrededor de la media (tanto observaciones continuas como discretas). Si es pequea, los valores se agrupan alrededor de la media. Probabilidad en trminos de rea: Distribucin continua con valores grandes de , la variabilidad es mayor (rea ms extendida). Distribucin continua con valores pequeos de , la variabilidad es menor (rea ms cercana a u). Distribuciones discretas: ocurre lo mismo. La probabilidad de que cualquier variable aleatoria X tome un valor dentro de k desviaciones estndar de la media es al menos: Entonces:

C-Distribuciones de probabilidad continuas Variable aleatoria discreta: cada observacin puede tomar slo ciertos valores predeterminados. Se busca la probabilidad de que la variable tome un valor especfico. Por ejemplo: cul es la probabilidad de que el nmero de personas que pasen por la caja registradora durante los prximos 30 sea exactamente dos?. Variable aleatoria continua: cada observacin puede tomar cualquier valor dentro de un intervalo. Se mide en una escala numrica (de intervalos o de razn). Ejemplo: nmero promedio de kilmetros recorridos por litro de combustible consumido por un automvil. Se busca la probabilidad de que la variable caiga dentro de un intervalo especfico. Por ejemplo: cul es la probabilidad de que la vida til de un interruptor electrnico est entre cuatro y seis aos?. Distribucin de probabilidad continua.

Pgina 30 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

1. Distribucin uniforma continua: apropiada cuando se observan variables aleatorias continuas y cuando es igualmente probable que ocurran los resultados de una observacin dentro de cualquier segmento de igual tamao dentro de un intervalo especificado. Grficamente:

[a,b]: intervalo en el que puede aparecer la variable aleatoria. Altura uniforme lo que sugiere probabilidades iguales de la variable aleatoria que aparece dentro de cualquier segmento de una anchura dada en este intervalo. Probabilidad: rea bajo la curva de densidad. El rea o probabilidad del rectngulo es igual a 1. P(c<=x<=d) = (d-c) / (b-a) Media y desviacin estndar de la distribucin uniforme Media: el promedio de los lmites del intervalo. Desviacin estndar: 2. Distribucin Normal Una distribucin continua que tiene forma de campana y que est determinada por su media y su desviacin estndar. Simtrica respecto a su media. Cada combinacin de media y dispersin especifican una distribucin normal nica. Se extiende, de manera asinttica se aproxima hacia el eje horizontal, hasta el infinito a partir de la media en ambas direcciones. Se mide en una escala continua. La probabilidad de obtener un valor preciso es cero.
Pgina 31 de 33 rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

rea total bajo la curva = 1 o 100 %. 50 % del rea est a la derecha de la media y el 50% restante a la izquierda. Probabilidad de que una variable aleatoria tenga un valor entre dos puntos cualesquiera es igual al rea bajo la curva entre esos puntos. Este valor se puede determinar mediante una frmula o mediante la tabla normal estndar.

La moda, que el punto sobre el eje horizontal donde la curva es un mximo, ocurre en x = u. La curva tiene sus puntos de inflexin en x = u , es cncava hacia abajo si u - < X < u + , y es cncava hacia arriba en cualquier otro caso. 3. Distribucin normal estndar La que surge de transformar todas las distribuciones normales en la distribucin normal estndar que tiene media = 0 y desviacin estndar = 1. Valores o puntajes estndar Z: dato normal transformado que indica la distancia en desviaciones estndar entre la media o centro de la curva normal y el valor x de inters. 4. Distribuciones muestrales Distribucin muestral: una distribucin que incluye todos los valores posibles que puede tomar un estadstico, como una media muestral, para un tamao de muestra dado. Teorema del lmite central: establece que si se selecciona una muestra aleatoria suficientemente grande de n observaciones, a partir de cualquier poblacin, la distribucin muestral de las medias de las muestras se aproximar a una distribucin normal. n = 30: regla emprica, indica el tamao mnimo de la muestra necesario para asegurar la forma normal aproximada de la distribucin muestral.

Pgina 32 de 33

rivamara@yahoo.com

Universidad de Mendoza Estadstica Aplicada II Prof. Ing. Valeria Cordero

Profesorado en Ciencias de la Computacin 2013

Prctica N 1

Alumno: Alfredo G. Rivamar

La media de la distribucin muestral x es igual a la media de la poblacin (u). La desviacin estndar de la distribucin muestral de las medias es igual a la desviacin estndar de la poblacin dividida la raz cuadrada del tamao de la muestra (si n tiende a infinito, la distribucin muestral se aproxima a la distribucin normal estndar).
(desviacin estndar de la distribucin muestral)

Varianza de la distribucin: 2 = / n

Pgina 33 de 33

rivamara@yahoo.com

Das könnte Ihnen auch gefallen