Sie sind auf Seite 1von 61

CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P.

Reyes / Noviembre 2007

CURSO TALLER DE
ESTADSTICA Y PROBABILIDAD

Elabor: Dr. Primitivo Reyes Aguilar


Noviembre de 2007

Mail: primitivo_reyes@yahoo.com
Tel. 58 83 41 67 / Cel. 044 55 52 17 49 12

Pgina 1
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

CONTENIDO

MDULO 1. ESTADSTICA DESCRIPTIVA 4

MDULO 2. HERRAMIENTAS ESTADSTICAS 15


PARA SOLUCIN DE PROBLEMAS

MDULO 3. PROBABILIDAD Y DISTRIBUCIONES 36


DE PROBABILIDAD

MDULO 4. DISTRIBUCIN NORMAL 44

MDULO 5. ESTADSTICA INFERENCIAL 51

Pgina 2
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

MDULO 1. ESTADSTICA DESCRIPTIVA


La Estadstica descriptiva es la rama de las matemticas que comprende la recopilacin,
tabulacin, anlisis e interpretacin de datos cuantitativos y cualitativos, para tomar decisiones que
se requieran a fin de que el comportamiento de los datos se mantenga dentro de los parmetros de
control establecidos.

Poblacin (N) Es el conjunto de todos los elementos de inters para determinado estudio

Parmetro Es una caracterstica numrica de la poblacin, se identifica con letras griegas


(Media = , Desviacin estndar = , Proporcin = , Coeficiente de correlacin = )

Muestra (n) Es una parte de la poblacin, debe ser representativa de la misma.

Estadstico Es una caracterstica numrica de una muestra, se identifica con letras


latinas (Media = X, Desviacin estndar = s, Proporcin = p, Coeficiente de correlacin = r)

La Estadstica descriptiva proporciona un criterio para lograr mejoras, debido a que sus tcnicas
se pueden usar para describir y comprender la variabilidad.

La estadstica inferencial se refiere a la estimacin de parmetros y pruebas de hiptesis acerca


de las caractersticas de la poblacin en base a los datos obtenidos con una muestra.

1.1 MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIN PARA DATOS


SIMPLES.

Medidas de tendencia central

Media: ( x ) Es el promedio aritmtico de todos los valores que componen el conjunto de datos.
Se calcula mediante la siguiente frmula:

Para una muestra y para una poblacin se tiene respectivamente:


xi xi
x
n n

Ejemplo 1: En un equipo de ftbol, una muestra de estaturas de sus integrantes son las
siguientes:

1.70,1.79,1.73,1.67,1.60,1.65,1.79,1.84,1.67,1.82, 1.74. Calcule la media.

xi 19
x 1.73
n 11

Pgina 3
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Mediana: ( ~ x ) Los datos de "n" observaciones son ordenados del ms pequeo al ms


grande, Si el tamao de la muestra es "non" la mediana es el valor ordenado en la posicin
(n+1)/2,
Cuando el tamao de la muestra es "par" la mediana es el promedio de los dos valores que se
encuentran al centro del conjunto de valores. Se puede calcular mediante:

n 2 n 2 1
2

Ejemplo 2: Para el ejemplo anterior cul es la mediana?

Ordenando los datos de mayor a menor se obtiene:

1.60,1.65,1.67,1.67,1.70,1.73,1.74,1.79,1.79,1.82,1.84;

Como tenemos 11 datos el nmero es non por lo que (n+1)/2 = 12/2 = 6, buscando el nmero
que ocupa la sexta posicin en los datos ordenados encontramos el valor de la mediana
~
x 1.73

Media acotada (Truncated Mean): Determinado porcentaje de los valores ms altos y bajos
de un conjunto dado de datos son eliminados (tomando nmeros enteros), para los valores
restantes se calcula la media.

Ejemplo 3: Para la siguiente serie de datos calcule la media acotada al 20%:

68.7,34.3,97.9,73.4,8.4,42.5,87.9,31.1,33.2,97.7,72.3,54.2,80.6,71.6,82.2,

Como tenemos 11 datos, el 20% de 11 es 2.2, por lo cual eliminamos 2 datos el ms bajo y el
ms alto, ordenado los datos obtenemos:

8.4,31.1,33.2,34.3,42.5,54.2,68.7,71.6,72.3,73.4,80.6,82.2,87.9,97.7,97.9, los valores a eliminar


~
x ,.20 63.82
son: 8.4 y 97.9; calculando la media de los datos restantes obtenemos

Medidas de dispersin
Para comprender el concepto de varianza, supngase que tenemos los datos siguientes de los
cuales queremos saber que tan dispersos estn respecto a su media:

2, 3, 4, 5, 6 con media = 20/5 = 4

Si tomamos la suma de diferencias de cada valor respecto a su media y las sumamos se tiene:

(-2) + (-1) + (0) + (1) +(2) = 0

Por lo que tomando diferencias simples no es posible determinar la dispersin de los datos.

Si ahora tomamos esas mismas diferencias al cuadrado y las sumamos se tiene:


Pgina 4
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

4 + 1 + 0 + 1 + 4 = 10

Varianza de los datos

Es una medida que nos ayuda a comprender la variabilidad de los datos, que tan distanciados estn
de la media

Poblacional ( 2 ) Se obtiene dividiendo el valor anterior entre n = 5, o sea el promedio de


la suma de las diferencias al cuadrado, tomando n datos.

( xi x ) 2
2
n

Poblacional (s 2 ) Se obtiene dividiendo el valor anterior entre n - 1 = 4, o sea el promedio


de la suma de las diferencias al cuadrado, tomando n -1 datos.

( xi x ) 2
s
2

n 1

Desviacin estndar: Es la raz cuadrada de la varianza:

( xi x ) 2
Para el caso de una poblacin n

( xi x ) 2
Para el caso de una muestra s n 1

Rango ( R ): es la diferencia positiva entre el valor mayor y el valor menor de un conjunto


de datos. Por ejemplo para el conjunto de datos siguiente:
2.0,2.1,2.4,2.5,2.6,2.8,2.9,2.9,3.0,3.1,3.6,3.8,4.0,4.0

Su rango es R = 4.0 2.0 = 2.0

Coeficiente de Variacin (CV): Se utiliza para comparar la dispersin de dos conjuntos de


datos que tienen unidades diferentes, ya que representa una medida relativa de dispersin.
s
Coeficiente.de. var iacin CV (100)
X

Por ejemplo si la media de tiempos de respuesta es de 78.7 y su desviacin estndar es 12.14, el


CVt:

12.14
CVt (100) 12.05%
78.7
Por otra parte si la media de temperaturas es de 10 y su desviacin estndar de 2, el CVs de las
temperaturas es:

Pgina 5
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

2
CVs (100) 20%
10

Por tanto la dispersin de las temperaturas es mayor que la de los tiempos de de respuesta, es
posible comparar estas dispersiones con el CV aunque los dos conjuntos de datos sean
completamente dismbolos.

Ejemplo 4: La resistencia al rompimiento de dos muestras de botellas es la siguiente:

Muestra 1: 230 250 245 258 265 240


Muestra 2: 190 228 305 240 265 260

Calcule el rango, la desviacin estndar y coeficiente de variacin para ambas muestras.

Muestra 1: Muestra 2

x 248 x 248

Suma(Xi - x )2 = 790 Suma(Xi - x )2 = 7510

n-1=5 n-1 = 5

790 7510
s= = 12.56 s= = 38.75
5 5

Rango = 265 230 = 35 Rango = 305 190 = 115

CV = 12.56/248*100= 5.06% CV = 38.75/248*100 = 15.625

Aunque la media en ambas muestras es la misma, la desviacin estndar (s), rango y coeficiente de
variacin, son menores en la muestra 1, por lo cual deducimos que es presenta menor variabilidad.

Ejemplo 5:

Se desea hacer un estudio estadstico de la temperatura del agua, para esto es necesario tomar una
muestra y calcular la media, mediana, media acotada al 15%, desviacin estndar, rango y
coeficiente de variacin. Se realizan 14 observaciones arrojando los siguientes resultados en C:
2.11, 3.8, 4.0, 4.0, 3.1, 2.9, 2.5, 3.6, 2.0, 2.4, 2.8, 2.6,2.9, 3.0.

1) Calcular la media, mediana, desviacin estndar, media acotada al 5%, desviacin estndar,
rango y coeficiente de variacin.

Pgina 6
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

1.2 OTRAS MEDIDAS DE DISPERSIN: PERCENTILES, DECILES Y


QUARTILES
Cada conjunto de datos ordenado tiene tres cuartiles que lo dividen en cuatro partes iguales. El
primer cuartil es ese valor debajo del cual clasifica el 25% de las observaciones y sobre el cual se
encuentra el 75% restante. El segundo cuartil divide a los datos a la mitad similar a la mediana.

Los deciles separan un conjunto de datos ordenado en 10 subconjuntos iguales y los percentiles en
100 partes, la ubicacin de un percentil se encuentra en:

P
L p (n 1)
100
Donde:

Lp es el sitio del percentil deseado en una serie ordenada


n es el nmero de observaciones
P es el percentil deseado

Por ejemplo para el conjunto de datos siguiente:

3 10 19 27 34 38 48 56 67 74
4 12 20 29 34 39 48 59 67 74
7 14 21 31 36 43 52 62 69 76
9 15 25 31 37 45 53 63 72 79
10 17 27 34 38 47 56 64 73 80

La localizacin del percentil 35 se halla en:

35
L35 (50 1) 17.85
100

O sea que el percentil 35 est al 85% del trayecto comprendido entre la observacin 17 que es 29 y
la observacin 18 que es 31 o sea L35 = 29 + (0.85)(31-29) = 30.7. Por tanto el 35% de las
observaciones estn por debajo de 30.7 y el 65% restante por encima de 30.7.

De la misma forma los percentiles 25, 50 y 75 proporcionan la localizacin de los cuartiles Q1, Q2 y
Q3 respectivamente.

Q1: es el nmero que representa al percentil 25 (hay 25% de los datos por debajo de este).

Q2 o Mediana: es el nmero que representa al percentil 50 (hay 50% de los datos por
debajo de este).

Q3: es el nmero que representa al percentil 75 (hay 75% de los datos por debajo de este).

Pgina 7
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Rango o Recorrido intercuartlico: es la diferencia entre Q1 y Q3.

DIAGRAMA DE CAJA

Es la representacin grfica de los datos en forma de caja:

1 10 4

1050

Mximo

Q3
Weight

950

Q2 Mediana

Q1
850

Mnimo

Rango
Intercuartlico =
RIC = Q3 Q1 Valores atpicos Bigotes

Figura 1. Diagrama de caja con sus cuarteles y bigotes

1.3 DISTRIBUCIN DE FRECUENCIAS E HISTOGRAMAS

Cuando tenemos una cantidad grande de datos es difcil poder analizarlos, a menos que hagamos
uso de herramientas que nos permitan hacerlo con mayor facilidad y claridad. El histograma es una
de ellas, consiste en un diagrama de barras donde las bases corresponden a los intervalos y las
alturas a las frecuencias. Para construir un histograma es necesario tener un mnimo de 50 a 100
datos. Se tienen las siguientes definiciones:

Distribucin de frecuencias: es un resumen tabular de un conjunto de datos que muestra


el nmero o frecuencia de artculos en cada una de varias clases que no se traslapan.

Frecuencia relativa (f): Es la frecuencia de la clase dividida entre el total n de datos. Se


puede representar en porcentaje.

Distribucin de frecuencias porcentuales: es la representacin de las frecuencias


relativas porcentuales.

Pgina 8
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Frecuencia acumulada (F): es la acumulacin secuencial de las frecuencias de cada


clase.

Ejemplo 6

Construir un histograma con la siguiente serie de datos:

2.41 17.87 33.51 38.65 45.70 49.36 55.08 62.53 70.37 81.21
3.34 18.03 33.76 39.02 45.91 49.95 55.23 62.78 71.05 82.37
4.04 18.69 34.58 39.64 46.50 50.02 55.56 62.98 71.14 82.79
4.46 19.94 35.58 40.41 47.09 50.10 55.87 63.03 72.46 83.31
8.46 20.20 35.93 40.58 47.21 50.10 56.04 64.12 72.77 85.83
9.15 20.31 36.08 40.64 47.56 50.72 56.29 64.29 74.03 88.67
11.59 24.19 36.14 43.61 47.93 51.40 58.18 65.44 74.10 89.28
12.73 28.75 36.80 44.06 48.02 51.41 59.03 66.18 76.26 89.58
13.18 30.36 36.92 44.52 48.31 51.77 59.37 66.56 76.69 94.07
15.47 30.63 37.23 45.01 48.55 52.43 59.61 67.45 77.91 94.47
16.20 31.21 37.31 45.08 48.62 53.22 59.81 67.87 78.24 94.60
16.49 32.44 37.64 45.10 48.98 54.28 60.27 69.09 79.35 94.74
17.11 32.89 38.29 45.37 49.33 54.71 61.30 69.86 80.32 96.78

Paso 1: Contar el nmero de datos n = 130

Paso 2: Calcular el rango R = Valor mayor Valor menor, R = 96.78-2.41 = 94.37.


Generalmente los datos no estn ordenados por lo cual resulta conveniente ordenarlos de menor a
mayor para tener una mejor visualizacin. En el ejemplo los datos ya han sido previamente
ordenados.

Paso 3: Seleccionar el nmero de columnas, mediante n = 130 11 .4 11 . Por lo cual el


histograma se compone de 11 columnas

Paso 4: Calcular el tamao del intervalo de clase ( C ), dividiendo el rango entre el nmero de
94.37
columnas: C = 8.58 9 , resultando el tamao del intervalo 9.
11

Otra manera de calcular el tamao del intervalo es el siguiente:


Dividir el valor del rango entre un cierto nmero de clases (K). La tabla de abajo es una gua que nos
muestra para diferentes cantidades de datos el nmero recomendado de clases a utilizar.

Nmero de datos (N) Nmero de clases (K)


Menos de 50 57
50 a 100 6 10
100 a 250 7 12
Ms de 250 10 20

Pgina 9
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Paso 5: Calcular los limites de clase de cada intervalo: [0-8], [ 9-17], etc., considerando que el
tamao del intervalo representa la diferencia entre dos lmites de clase adyacentes ya sean
inferiores o superiores.

Paso 6: Contar el nmero de valores que caen en cada intervalo utilizando una hoja de registro,
de esta manera se obtiene la frecuencia para cada intervalo.

Tabla 1.
Columna Intervalo Registro de frecuencias
1 0 -8 IIIII 5
2 9-17 IIIII IIII 9
3 18-26 IIIII I 6
4 27-35 IIIII IIIII I 11
5 36-44 IIIII IIIII II 17
6 45-53 IIIII IIIII IIIII IIIII IIIII III 28
7 54-62 IIIII IIIII IIIII III 18
8 63-71 IIIII IIIII III 13
9 72-80 IIIII IIIII 10
10 81-89 IIIII III 8
11 90-98 IIIII 5

Histograma

30
25
20
Frecuencia

15 Frecuencia
10
5
0
9 18 27 36 45 54 63 72 81 90 99
Clase

Paso 7: Basndose en los datos anteriores construya el histograma.

1.4 USO DE MINITAB y EXCEL

Para la obtencin de las estadsticas descriptivas con Minitab las instrucciones son:
Stat > Basic statistics > Display descriptive statistics

Indicar las variables de las cuales se quieren obtener las estadsticas bsicas y la variable categrica
si se desean varios grupos.

Pgina 10
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Seleccionar las grficas opcionales para los datos: Histograma, diagrama de caja y de puntos.

Seleccionar los estadsticos especficos que se desean obtener:

Los resultados son los siguientes:

Descriptive Statistics: Peso en gr


Variable Lnea N N* Mean SE Mean StDev Minimum Q1 Median
Peso en gr 1 250 0 3999.6 3.14 49.6 3877.0 3967.8 3999.5
2 250 0 4085.6 3.32 52.5 3954.0 4048.8 4087.0

Variable Lnea Q3 Maximum


Peso en gr 1 4040.0 4113.0
2 4121.5 4202.0

Diagramas de caja en Minitab:

1. Capture datos en la hoja de trabajo: 7 8 9 9 11 12 12 13 14 15 16 17 18 19 20 22


2. Seleccione la opcin: Graph> Boxplot
3. Seleccione la variable C1 como se muestra en la pantalla y presione clic en ok
4. A continuacin se muestra el diagrama de caja:

Pgina 11
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Boxplot of Caja
22.5

20.0

17.5

15.0
Caja

12.5

10.0

7.5

5.0

Histograma en Minitab:

1. Capture los datos del ejemplo 6 en la hoja de trabajo:


2. Seleccione la opcin: Graph> Histogram (simple)
3. Seleccione la variable C1 como se muestra en la pantalla y presione clic en ok
4. En Options se puede cambiar el nmero de celdas con Number of intervals (6 8)
5. A continuacin se muestra el Histograma:

Histogram of DATOS
40

30
Frequency

20

10

0
-10 20 50 80 110
DATOS

Prueba de normalidad en Minitab:

1. Capture los datos del ejemplo 6 en la hoja de trabajo:


2. Seleccione la opcin: Stat > Basic statistics
3. Seleccione la variable C1 como se muestra en la pantalla y presione clic en ok
4. Seleccione la prueba de Anderson Darling
Pgina 12
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

5. A continuacin se muestra la grafica normal, si P value > 0.05 los datos son normales.

Probability Plot of DATOS


Normal
99.9
Mean 50.05
StDev 22.50
99 N 130
AD 0.380
95 P-Value 0.399
90
80
70
Percent

60
50
40
30
20
10
5

0.1
0 30 60 90 120
DATOS

USO DE EXCEL
1. En el men Herramientas seleccione la opcin Anlisis de datos. Datos de ejemplo 6.
2. Seleccione la opcin Estadstica descriptiva.
3. Seleccione el rango de entrada, estos corresponden a los datos numricos de la tabla.
4. Seleccione Resumen de estadsticas.
5. En opciones de salida seleccione en Rango de salida, una celda de la hoja de calculo
que este en blanco (a partir de est celda sern insertados los resultados).

La hoja mostrar las siguientes medidas estadsticas de los datos presentados:

Columna1

50.053769
Media 2
Error tpico 1.9738137
Mediana 49.345
Moda 50.1
Desviacin 22.504938
estndar 8
Varianza de la
muestra 506.47227
Curtosis -0.4466339
Coeficiente de
asimetra -0.0352296
Rango 94.37
Mnimo 2.41
Mximo 96.78
Suma 6506.99

Pgina 13
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Cuenta 130

Pgina 14
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

EJERCICIOS:

1. Las empresas est interesada en los hbitos de consumo de los clientes para obtener pronsticos
exactos de las demandas de energa. Una muestra de consumidores de 90 hogares con calefaccin
de gas arroj lo siguiente (FURNACE.MTW):

BTU.In_1
2.97 7.73 9.60 11.12 13.47
4.00 7.87 9.76 11.21 13.60
5.20 7.93 9.82 11.29 13.96
5.56 8.00 9.83 11.43 14.24
5.94 8.26 9.83 11.62 14.35
5.98 8.29 9.84 11.70 15.12
6.35 8.37 9.96 11.70 15.24
6.62 8.47 10.04 12.16 16.06
6.72 8.54 10.21 12.19 16.90
6.78 8.58 10.28 12.28 18.26
6.80 8.61 10.28 12.31
6.85 8.67 10.30 12.62
6.94 8.69 10.35 12.69
7.15 8.81 10.36 12.71
7.16 9.07 10.40 12.91
7.23 9.27 10.49 12.92
7.29 9.37 10.50 13.11
7.62 9.43 10.64 13.38
7.62 9.52 10.95 13.42
7.69 9.58 11.09 13.43

a) Determinar los estadsticos de tendencia y dispersin

b) Construir un diagrama de caja e histograma

c) Realizar una prueba de normalidad de los datos

d) Establecer conclusiones

Pgina 15
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

MDULO 2. HERRAMIENTAS ESTADSTICAS ESTADSTICAS Y


ADMINISTRATIVAS PARA SOLUCIN DE PROBLEMAS

HERRAMIENTAS ESTADSTICAS

2.1 HOJA DE REGISTRO O VERIFICACIN

2.2 DIAGRAMA DE PARETO

2.3 LLUVIA DE IDEAS

2.4 DIAGRAMA DE ISHIKAWA

2.5 CARTA DE TENDENCIAS

2.6 DIAGRAMA DE FLUJO

2.7 DIAGRAMA DE DISPERSIN

Pgina 16
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

2.1 HOJA DE REGISTRO O VERIFICACIN

Bsicamente es un formato que facilita que una persona pueda tomar datos en una forma ordenada
y de acuerdo al estndar requerido en el anlisis que se est realizando.

Pasos para la elaboracin de una hoja de verificacin:

1. Determinar claramente el proceso sujeto a observacin.


2. Definir el perodo de tiempo durante el cul sern recolectados los datos (horas a semanas).
3. Disear una forma que sea clara y fcil de usar.
4. Obtener los datos de una manera consistente y honesta. Dedicar el tiempo necesario.

Ejemplo de hoja de verificacin

DIA
DEFECTO 1 2 3 4 TOTAL
Tamao errneo IIIII I IIIII IIIII III IIIII II 26
Forma errnea I III III II 9
Depto. Equivocado IIIII I I I 8
Peso errneo IIIII IIIII I IIIII III IIIII III IIIII IIIII 37
Mal Acabado II III I I 7
TOTAL 25 20 21 21 87

Consejos para la elaboracin e interpretacin de las hojas de verificacin

1. Asegrese de que las observaciones sean representativas.


2. Asegrese de que el proceso de observacin es eficiente de manera que las personas tengan
tiempo suficiente para hacerlo.
3. La poblacin (universo) muestreada debe ser homognea, en caso contrario, el primer paso es
utilizar la estratificacin (agrupacin) para el anlisis de las muestras/observaciones las cuales
se llevarn a cabo en forma individual.

EJERCICIO: Colectar el intervalo de tiempo en que ingresan personas a un departamento.

Pgina 17
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

2.2 DIAGRAMA DE PARETO

Herramienta utilizada para el mejoramiento de la calidad para identificar y separar en forma crtica
las pocas causas que provocan la mayor parte de los problemas de calidad. El principio enuncia que
aproximadamente el 80% de los efectos de un problema se debe a solamente 20% de las causas
involucradas.

El diagrama de Pareto es una grfica de dos dimensiones que se construye listando las causas de
un problema en el eje horizontal, empezando por la izquierda para colocar a aquellas que tienen un
mayor efecto sobre el problema, de manera que vayan disminuyendo en orden de magnitud. El eje
vertical se dibuja en ambos lados del diagrama: el lado izquierdo representa la magnitud del efecto
provocado por las causas, mientras que el lado derecho refleja el porcentaje acumulado de efecto de
las causas, empezando por la de mayor magnitud.

Diagrama de Pareto en Minitab


1. Capture los datos en la columna C1 (tipo de defecto), en la columna C2 (frecuencias)
2. Stat>Quality Tools>Pareto Chart
3. Seleccionar la opcin Chart defects table , en el campo labels in seleccione: C1 y en
Frequencies in seleccione: C2. Combine defects after the first 80%. OK

El sistema despliega la grfica de Pareto:

PARETO CHART

70 100

60
80
50
Percent

60
Count

40

30 40
20
20
10

0 0

rs
Defect A B C D E F G
Ot
he

Count 25 23 7 6 3 2 1 3
Percent 35.7 32.9 10.0 8.6 4.3 2.9 1.4 4.3
Cum % 35.7 68.6 78.6 87.1 91.4 94.3 95.7 100.0

En la grfica se observa que aprox. el 80% de los efectos es debido a los defectos A, B y C.

A continuacin se muestra un diagrama de Pareto considerando una variable categrica.

Pgina 18
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Pareto Chart of Flaws by Period


Peel Scratch Other Smudge
Period = Day Period = Evening Flaws
20
Peel
Scratch
15 Other
Smudge
10

5
Count

0
Period = Night Period = Weekend
20

15

10

0
Peel Scratch Other Smudge
Flaws

EJERCICIO: Realizar un diagrama de Pareto con las fallas de un equipo.

2.3 LLUVIA DE IDEAS DE IDEAS (BRAINSTORMING)

En las sesiones de lluvia de ideas se generan nuevas ideas mediante la participacin de


todo el equipo.

Para comenzar con el proceso de tormenta de ideas, en el cual se genera informacin la gente se
rene en una sala en la cual se recomienda la disposicin de las mesas en forma de U para facilitar
el debate. La gente que participa en la sesin deber de pertenecer a diferentes reas o tener
puntos de vista diferentes, esto con el objeto de enriquecer la sesin.

El facilitador debe de contar con experiencia en la conduccin de sesiones de tormentas de ideas, o


al menos haber tenido experiencias previas. Para conducir un grupo se lleva a cabo la siguiente
metodologa:

1. Seleccionar el problema a tratar.


2. Pedir a todos los miembros del equipo generen ideas para la solucin del problema, las cuales
se anotan en el pizarrn sin importar que tan buenas o malas sean estas.
3. Ninguna idea es evaluada o criticada antes de considerar todos los pensamientos concernientes
al problema.
4. Aliente todo tipo de ideas, ya que al hacerlo pueden surgir cosas muy interesantes, que motivan
a los participantes a generar ms ideas.
5. Apruebe la naturalidad y el buen humor con informalidad, en este punto el objetivo es tener
mayor cantidad de ideas as existirn mayores posibilidades de conseguir mejores ideas.
6. Se les otorga a los participantes la facultad de modificar o mejorar las sugerencias de otros.
7. Una vez que se tengan un gran nmero de ideas el facilitador procede a agrupar y seleccionar
las mejores ideas por medio del consenso del grupo de trabajo.
8. Las mejores ideas son discutidas y analizadas con el fin del proponer una solucin.

Pgina 19
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

La tcnica tormenta de ideas puede ser aplicada con gran frecuencia al llevar a cabo otras
herramientas, como por ejemplo, diagramas causa-efecto (Ishikawa), Diagrama de relaciones,
Diagrama de rbol, planes con 5W-1H, Diseo de experimentos, pruebas de confiabilidad, etc.

EJERCICIO: Realizar una lluvia de ideas para solucionar el problema de llegar a tiempo a algn
lugar.

2.4 DIAGRAMA CAUSA-EFECTO (ISHIKAWA)

El diagrama causa-efecto, tambin llamado espina de pescado por la semejanza de su forma,


tambin es conocido por diagrama de Ishikawa. Es utilizado para explorar e identificar todas las
causas posibles y relaciones de un problema (efecto) o de una condicin especfica en las
caractersticas de un proceso.

Los pasos para elaborar el diagrama de causa- efecto son los siguientes:

1. Seleccione el efecto (problema) a analizar. Se puede seleccionar a travs de un consenso, un


diagrama de Pareto, otro diagrama o tcnica.
2. Realice una lluvia de ideas para identificar las causas posibles que originan el problema.
3. Dibuje el diagrama:
4. Clasifique las causas derivadas de la lluvia de ideas, de la siguiente manera:
Causas principales.
Preguntando despus por que suceden obtener Causas secundarias
Volviendo a preguntar de nuevo las razones obtener Causas terciarias,
Se continua este proceso de preguntas de por qu?, por qu? hasta agotar las
respuestas.
5. El equipo analiza cada causa estratificada (secundaria o terciaria) y por medio de eliminacin y
consenso determina cuales son las causas potenciales relevantes del problema.
6. Elabore y ejecute un programa de verificacin de las causas relevantes por medio de un
diagrama 5W-1H para identificar las causas reales o causas raz.

Ejemplo 1
Se detectaron fallas en la soldadura de partes, por lo cual se procedi a realizar una
investigacin utilizando el diagrama causa-efecto.

El problema es soldadura defectuosa, siendo el efecto que se va a analizar.


Se construye el diagrama espina de pescado con las causas primarias (Ms), a partir de estas
causas se agrupan las causas secundarias y terciarias derivadas de la lluvia de ideas.

1
Tomado de: Alberto Galgano, Los siete instrumentos de la Calidad Total, ediciones Daz de Santos,1995
Pgina 20
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

MEDICIONES MAQUINAS MANO DE OBRA

DIMENSIONES
VELOCIDAD DE
INADECUADAS FORMACION
FUERA DE AVANCE
DIMENSIONES
TEMPERATURA HABILIDAD
ESPECIFICADS
ANGULO LIMITES
INCORRECTO DE PUNTA OXIDADA ERGONOMICOS
FORMA
LA FLAMA
PUNTA

SOLDADURA DEFECTUOSA

UNION
SUPERFICIE SOLDADURA
S CON LACA DE
POLVO E SECUENCIA PROTECCION
IMPUREZAS SOLDADURA
TIEMPOS DE TERMINALES
ESPERA DESOXIDANTE

CORTOS OXIDADOS
MEDIO AMBIENTE MTODOS MATERIALES

Diagrama de Causa Efecto en Minitab

1. Llenar las columnas C1 a C5 con las diferentes causas correspondientes a los conceptos de
Personal, Mquinas, Materiales, Mtodos, Mediciones y Medio ambiente.
2. Stat>Quality Tools>Cause and Effect Diagram
3. Introducir los datos en la pantalla de entrada, indicando el problema en Effect y aceptar con
OK.

AMBIENTE MATLS. PERSONAL MTODO MAQUINAS


Polvo Forma Salud Ajuste Mantto.
Vibraciones Dureza Habilidad Velocidad Deformacin
Humedad Almacn Humor Abrasin
Temperatura Herramental

FORMA ALMACN HABILIDAD HUMOR


Dimetro Tiempo Seleccin Horas
Curvatura Ambiente Formacin Moral
Experiencia Cansancio

Pgina 21
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Cause-and-Effect Diagram
Measurements Material Personnel

Polv o
F orma Salud

V ibraciones
Dureza H abilidad
H umedad

A lmacn Humor
Temperatura

Problema de
soldadura
Herramental
V elocidad
A brasin

Deformacin
A juste
M antto.

Methods Machines

EJERCICIO: Realizar un Diagrama de Causa Efecto para el problema de llegara tiempo al trabajo.

2.5 CARTA DE TENDENCIAS


Definicin:
Es una ayuda grfica para el control de las variaciones de los procesos administrativos y de
manufactura.

Usos:
Saber el comportamiento de un sistema o proceso durante el tiempo.
Tomar las acciones correctivas a tiempo si la tendencia afectar en forma negativa.
Ejemplo: Se tienen los datos siguientes de errores de planeacin de la produccin durante 15
semanas:

Semana % Errores Semana % Errores


1 0.15 8 0.03
2 0.04 9 0.04
3 0.08 10 0.05
4 0.07 11 0.07
5 0.04 12 0.04
6 0.05 13 0.02
7 0.01 14 0.03
15 0.01

USO DE MINITAB
1. Stat> Time Series > Trend Anlisis Variable: % de errores
2. Time > Stamp Semana OK

La grfica se muestra a continuacin:

Pgina 22
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Trend Analysis Plot for % Errores


Linear Trend Model
Yt = 0.0869524 - 0.00478571*t
0.16 Variable
A ctual
0.14 F its

A ccuracy Measures
0.12
MA PE 62.6253
MA D 0.0193
0.10
% Errores

MSD 0.0007

0.08

0.06

0.04

0.02

0.00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Semana

Comportamiento de los datos durante un periodo de tiempo determinado.

EJERCICIO: Hacer una carta de tendencias con datos reales de alguna situacin particular.

Pgina 23
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

2.6 MAPA DE PROCESOS / DIAGRAMA DE FLUJO

Ventajas de los diagramas de flujo

Proveen una secuencia grfica de cada uno de los pasos que componen una operacin desde el inicio hasta el
final. Permitiendo una mejor visualizacin y comprensin del proceso.
Los diagramas de flujo pueden minimizar grandes volmenes de documentacin, como la del ISO 9000.
Facilitan el desarrollo de Procedimientos Estndar de Operacin.
Al tener un procedimiento de operacin estndar se reduce en gran medida la variacin y el tiempo de ciclo.
Los diagramas de flujo permiten detectar reas de mejora en los procesos.

Descripcin de smbolos
En la construccin de diagramas de flujo de procesos se utilizan los smbolos descritos a continuacin:

Operacin de transformacin: de la cual resulta un cambio fsico o


qumico del producto.

Inspeccin: Verificacin de alguna caracterstica mediante un estandar de calidad


prestablecido.

Transporte: Movimiento fsico del producto o un componente.

Demora: Indica la necesidad de un periodo de inactividad en espera de operacin


inspeccin o transporte.

Almacenamiento: Mantener un producto en almacenamiento hasta


que contine su procesamiento o sea vendido.

Pasos para la elaboracin de un diagrama de flujo


1. Describir el proceso a evaluar: Es importante seleccionar un proceso relevante.

2. Definir todos los pasos que componen el proceso: el equipo de trabajo anota en tarjetas los diferentes
pasos que conforman el proceso, con este mtodo el equipo puede arreglar y ordenar los pasos del proceso.

3. Conectar las actividades: Cuando los pasos que componen el proceso han sido descritos se construye el
diagrama de flujo, conectando las actividades mediante flechas, cada smbolo debe describir la actividad que
se realiza con pocas palabras.

4. Comparar el proceso actual con el proceso considerado como ideal las siguientes preguntas pueden
servir de gua:
Existen pasos demasiado complejos? Existe duplicidad o redundancia? Existen puntos de control para
prevenir errores? deberan de existir? El proceso funciona en la manera en la cual debera de hacerse? Se
puede realizar el proceso de diferente manera?

5. Mejoras del proceso: Una vez que se contestan las preguntas mediante tormenta de ideas se realizan
mejoras. Definiendo los pasos que agregan valor y los que no agregan se puede llevar a cabo una
simplificacin sustancial del proceso. Las mejoras son priorizadas y se llevan a cabo planes de accin.

6. Implementar el nuevo procedimiento: Una vez realizadas las mejoras se dan a conocer a las personas
involucradas en el proceso y se verifica su efectividad.

Pgina 24
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Diagrama de Flujo Fsico

Pasos para realizarlo:


Dibuje el esquema fsico de su rea de trabajo, incluyendo estaciones de trabajo, reas de espera,
reas de mquinas, etc.
Use flechas para delinear el flujo de la parte dentro del rea. Cada flecha debe delinear un paso del
proceso.

Ventajas
Muestra el nmero de movimientos para completar el proceso.
Muestra la complejidad del flujo y las curvas.
Puede aadir tiempo a cada paso, para mostrar cuellos de botella y tiempo sin valor agregado Vs
tiempo con valor agregado.

EJERCICIO: Realizar un diagrama de flujo de un proceso

Pgina 25
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

El Mapa de la cadena de valor actual


Simbologa utilizada

Los iconos y smbolos para el mapeo del estado actual y futuro se dividen en tres
categoras: conos de material, conos de informacin e conos generales.
Figura 3.1 Simbologa utilizada para el mapeo de la cadena de valor
Iconos de material
Representan Notas

Proceso de manufactura Una casilla de proceso es igual a un


Ensamble
rea de flujo. Todos los
procesos
deberan estar etiquetados.
Utilizados tambin por departamentos
tales como control de produccin.

Utilizado para mostrar clientes,


Empresa ABC
Fuentes externas Proveedores, y procesos de
manufactura externos

||||||
C/T= 145 seg Utilizada para registrar informacin
C/O= 90 min Celda de datos respecto a proceso de manufactura,
3 turnos Departamento, cliente, etc.
4% desperdicio

Se deben anotar la cantidad y el


tiempo
I
Inventario de trabajo que representa.

300 piezas 1 da
300 Piezas diarias

Lunes +
Viernes Envo de camin Anotar la frecuencia de embarques

Movimiento de Material que es producido y movido


material de produccin hacia adelante antes de la necesidad
(empujar) del siguiente proceso; usualmente
Automatizado basado en una programacin.
Pgina 26
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Movimiento de
producto terminado
al cliente

Supermercado Inventario controlado de partes que


son utilizadas para programar la
produccin en un proceso anterior

Retiro de material Retiro de materiales, normalmente


del
supermercado

Transferencia de Indica un dispositivo para limitar la


cantidades controladas cantidad y asegurar el flujo de
de materiales entre materiales de primeras entradas
procesos en secuencia primeras salidas entre procesos.
primeras entradas- Debe indicarse la cantidad mxima.
primeras salidas

Iconos de informacin

Flujo manual de Por ejemplo:


informacin programa de produccin o programa de
Embarque

Flujo de infor - Por ejemplo:


macin electrnica Intercambio de datos va electrnica

Kanban de produc- Tarjeta o


cin (la lnea pun- dispositivo que dice al proceso anterior
teada indica el flujo qu puede producir y otorga
kanban) permiso para hacerlo.

Kanban de retiro Tarjeta o dispositivo que jala el producto,


indica al manipulador de material que obtenga y transfiera piezas
(por ejemplo desde el supermercado hasta el proceso de
consumo).

Pgina 27
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Kanban de seal El kanban indica cuando se


encuentre un punto de reorden y otro lote
necesita ser producido. Utilizado donde el
proceso proveedor debe producir en lotes.

Pelota de Da instrucciones para producir inmediata-


Secuencia mente un tipo y cantidad predeterminados
de retiro tpicamente una unidad. Un sistema de
jalar para procesos de subensambles
sin utilizar un supermercado.

Poste Kanban Colocado donde el kanban est siendo


recolectado y mantenido para su transporte

Llegada de tarjetas Kanban


en lotes

Nivel de carga Herramienta para planear lotes de


kanban y nivelar el volumen y mezcla de
ellos sobre un periodo de tiempo

Ve a ver Ajustar programas basados en los niveles de


Programa de de inventario verificados fsicamente.
produccin

Iconos generales

Iluminacin de Resaltar necesidades de mejora en procesos


Unir
Kaizen especficos que son crticos para alcanzar la
cambio
Visin de cadena de valor. Puede utilizarse
para crear talleres de trabajo kaizen

Amortiguador El inventario de seguridad o amortiguador


o inventario de que debe ser establecido.
seguridad

Operador Representa una persona vista desde


arriba

Pgina 28
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

conos de Manufactura Lean

Administracin visual Cuando ya se han aplicado stas


-v= tcnicas

D A Prueba de Error Cuando ya se han aplicado stas


tcnicas

QC Cambios rpidos Cuando ya se han aplicado stas


tcnicas

Estndares de proceso Cuando ya se han aplicado estas


tcnicas
Estndar

Extensin Objetivos extendidos Cuando ya se han establecido para la


mejora

Pizarrones de desempeo Cuando muestran los objetivos y


resultados en esta zona

Operacin cuello de botella Muestra cuales operaciones restringen


o
Limitan el avance de la cadena de
valor

Pgina 29
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

Pgina 30
CURSO TALLER DE ESTADISTICA Y PROBABILIDAD P. Reyes / Noviembre 2007

2.7 DIAGRAMAS DE DISPERSIN


El diagrama de dispersin es una tcnica estadstica utilizada para estudiar la relacin entre dos
variables. Por ejemplo, entre una caracterstica de calidad y un factor que le afecta.
La ventaja de utilizar este tipo de diagramas es que al hacerlo se tiene una comprensin ms
profunda del problema planteado.

La relacin entre dos variables se representa mediante una grfica de dos dimensiones en la que
cada relacin est dada por un par de puntos (uno para cada variable).
La variable del eje horizontal x normalmente es la variable causa, y la variable del eje vertical y es la
variable efecto.

La relacin entre dos variables puede ser: positiva o negativa. Si es positiva, significa que un
aumento en la variable causa x provocar una aumento en la variable efecto y y si es negativa
significa que una disminucin en la variable x provocar una disminucin en la variable y.

Por otro lado se puede observar que los puntos en un diagrama de dispersin pueden estar muy
cerca de la lnea recta que los atraviesa, o muy dispersos o alejados con respecto a la misma. El
ndice que se utiliza para medir ese grado de cercana de los puntos con respecto a la lnea recta es
el ndice de correlacin r. En total existen cinco grados de correlacin: positiva evidente (r = 1),
positiva, negativa evidente (r = -1), negativa y nula (r = 0).

Correlacin Positiva Correlacin Negativa


25
Evidente 25
Evidente
20 20

15 15

10
Y

10
5
5
0
0 5 10 15 20 25 Sin Correlacin 0
0 5 10 15 20 25
X 25 X
20

15

Correlacin 10
Y

5
Correlacin
25
Positiva 0 Negativa
0 5 10 15 20 25 25
20
X 20
15
15
Y

10
Y

10
5
5
0
0 5 10 15 20 25 0
0 5 10 15 20 25
X
X

Pgina 31
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Son dos herramientas para investigar la dependencia de una variable dependiente Y en funcin de
una variable independiente X. Y = f(X)

Y = Variable dependiente que se desea explicar o predecir, tambin se llama regresor o respuesta
X = Variable independiente, tambin se llama variable explicativa, regresor o predictor

Regresin lineal - La relacin entre X y Y se representa por medio de una lnea recta
Regresin curvilinea - La relacin entre X y Y se representa por medio de una curva.

La ecuacin de la recta es la siguiente:

Se identifican tres medidas de desviacin como sigue:

Y
Yest = 4.4 + 1.08 X

Desviacin no
Yi = 23 * explicada
Error = (Yi - Yest) =
1.32
Variacin total
(Yi-
Ymedia)=5.13 Desviaci explicada
(Yest-Ymedia) = 3.81
Ymedia =17.87

X = 16 X

Pgina 32 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Ejemplo: Se sospecha que el tiempo requerido para hacer un mantenimiento preventivo est
relacionado con su nmero. Calcular el coeficiente de correlacin y graficar. Los datos de tiempo
tomados para n = 25 servicios se muestran a continuacin:

X Servicios Y Tiempo (Xi-X)*(Yi-Y) (Xi-X)^2 (Yi-Y)^2 Yest Error


2 9.95 119.076672 38.9376 364.1533 10.9199 0.9408
8 24.45 1.099872 0.0576 21.0021 28.3362 15.1022
11 31.75 7.499472 7.6176 7.3832 37.0443 28.0292
10 35.00 10.502272 3.0976 35.6075 34.1416 0.7369
8 25.02 0.963072 0.0576 16.1026 28.3362 10.9969
4 16.86 51.612672 17.9776 148.1771 16.7253 0.0181
2 14.38 91.433472 38.9376 214.7045 10.9199 11.9721
2 9.60 121.260672 38.9376 377.6337 10.9199 1.7422
9 24.35 -3.558928 0.5776 21.9286 31.2389 47.4563
8 27.50 0.367872 0.0576 2.3495 28.3362 0.6991
4 17.08 50.679872 17.9776 142.8694 16.7253 0.1258
11 37.00 21.989472 7.6176 63.4763 37.0443 0.0020
12 41.95 48.568672 14.1376 166.8541 39.9470 4.0121
2 11.66 108.406272 38.9376 301.8142 10.9199 0.5477
4 21.65 31.303072 17.9776 54.5057 16.7253 24.2523
4 17.89 47.245472 17.9776 124.1620 16.7253 1.3564
20 69.00 470.014272 138.2976 1,597.3771 63.1686 34.0052
1 10.30 135.625472 52.4176 350.9178 8.0172 5.2111
10 34.93 10.379072 3.0976 34.7770 34.1416 0.6216
15 46.59 118.686672 45.6976 308.2553 48.6551 4.2646
15 44.88 107.127072 45.6976 251.1337 48.6551 14.2512
16 54.12 194.676672 60.2176 629.3676 51.5578 6.5649
17 56.63 241.751472 76.7376 761.6054 54.4605 4.7068
6 22.13 15.462272 5.0176 47.6486 22.5307 0.1606
5 21.15 25.540272 10.4976 62.1385 19.6280 2.3164
206 725.82 2,027.7132 698.5600 6,105.9447 220.0926
Sxy Sxx Syy = SST SSE
X promedio Y Promedio
Sxy Sxx Syy

Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera
y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que se
minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de cuadrados
siguientes se muestran a continuacin:

Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94

Las ecuaciones para el clculo manual son las siguientes:

Pgina 33 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

b1 1
( Xi X )(Yi Y ) S XY
= 2.902704421
( Xi X ) 2
S XX

b0 0
Y i 1 X i
Y X = 5.114515575
n

Las sumas de cuadrados son:

SST (Yi Y ) 2 6,105.9447

SSE (Yi Yi ) 2 (Yi (bo b1 * X i )) 2 220.0926

SSR SST SSE 5,885.8521

El coeficiente de determinacin r 2 y el coeficiente de correlacin r se calculan a continuacin:

SSE ( SST SSE ) SSR


r2 1 = 0.9639
SST SST SST

El coeficiente de determinacin indica el porcentaje de la variacin total que es explicada por la


regresin.

r r 2 = 0.9816

El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea recta
indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es un nmero
entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r = 0 indicara
correlacin nula.

El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente evidencia estadstica para
afirmar que el tiempo de atencin esta relacionado con el nmero de servicios atendidos.

USO DE MINITAB

Para determinar la funcin de regresin y correlacin en Minitab se siguen los pasos siguientes
(despus de cargar los datos correspondientes a X y a Y en las columnas C1 y C2):

Stat >Regresin ... Indicar la columna de Respuestas Y y la de predictores X y aceptar con


OK. Observar el valor del coeficiente de correlacin y de determinacin.

Para obtener la lnea de mejor ajuste de la regresin, se procede como sigue en Minitab:
Stat >Fitted Line Plot ... Indicar la columna de Respuestas Y y la de predictores X,
seleccionar si se quiere ajustar con los datos con una lnea, una funcin cuadrtica o cbica
y aceptar con OK. Observar el mayor valor del coeficiente de correlacin que indica el mejor
ajuste.
En Options: seleccionar Display Confidence (para media en X) y Prediction Intervals para
X.
Pgina 34 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

En Graphs: Seleccionar Residual for plots Standardized y Normal Plot of residuals


La grfica de residuos debe apegarse a la recta y tener siempre un valor P value >0.05.
Fitted Line Plot
Y Tiempo = 5.115 + 2.903 X Servicios
Regression
70
95% CI
95% PI
60
S 3.09342
R-Sq 96.4%
50 R-Sq(adj) 96.2%
Y Tiempo

40

30

20

10

0
0 5 10 15 20
X Servicios

Regression Analysis: Y Tiempo versus X Servicios


The regression equation is
Y Tiempo = 5.115 + 2.903 X Servicios
S = 3.09342 R-Sq = 96.4% R-Sq(adj) = 96.2%
Analysis of Variance
Source DF SS MS F P
Regression 1 5885.85 5885.85 615.08 0.000
Error 23 220.09 9.57
Total 24 6105.94

La regresin tiene una r^2 de 96.4% y la influencia de una variable X en Y es significativo.

Los intervalos de confianza para la media y el intervalo de prediccin para un punto especfico
X son los siguientes:

Pgina 35 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

EJERCICIOS:

1. La energa consumida en un proceso depende del ajuste de mquinas, realizar una regresin
cuadrtica con los datos siguientes y responder las preguntas.

Ajuste
Cons_energa Mq.
Y X
21.6 11.15
4 15.7
1.8 18.9
1 19.4
1 21.4
0.8 21.7
3.8 25.3
7.4 26.4
4.3 26.7
36.2 29.1

a) Trazar un diagrama de dispersin


b) Obtener la ecuacin de regresin lineal y cuadrtica y comparar
c) Estimar el consumo de energa para un ajuste de mquina de 20 con regresin cuadrtica
d) Obtener los intervalos de prediccin y de confianza para
un ajuste de mquina de 20
e) Obtener el coeficiente de correlacin y de determinacin

2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas en una lnea
area. Las quejas son por cada 100000 pasajeros.

%puntos Quejas
Aerolinea X Y
A 81.8 0.21
B 76.6 0.58
C 76.6 0.85
D 75.7 0.68
E 73.8 0.74
F 72.2 0.93
G 70.8 0.72
H 68.5 1.22

a) Trazar un diagrama de dispersin


b) Obtener la ecuacin de regresin lineal
c) Estimar las quejas para un porcentaje de puntualidad de 80%
d) Obtener los intervalos de prediccin y de confianza para una altura de 63"
e) Obtener el coeficiente de correlacin y de determinacin

Pgina 36 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

MDULO 3. PROBABILIDAD Y DISTRIBUCIONES DE


PROBABILIDAD

3.1 INTRODUCCIN

La probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre en cuaqlquier situacin


donde podra ocurrir uno de varios resultados posibles. En algunos casos se utiliza de manera
informal como por ejemplo: hay un 50% de probabilidad de que llueva.
DEFINICIONES

Probabilidad: es la posibilidad numrica de ocurra un evento. Se mide con valores


comprendidos entre 0 y 1, entre mayor sea la probabilidad, ms se acercar a uno.
Experimento: es toda accin bien definida que conlleva a un resultado nico bien definido
como el lanzamiento de un dado. Es el proceso que produce un evento.
Espacio muestral: es el conjunto de todos los resultados posibles de un experimento. Para
un dado es SS = (1,2,3,4,5,6)
Evento: es cualquier coleccin de resultados contenidos en el espacio muestral. Es simple
si slo tiene un resultado y compuesto si tiene varios resultados.

Definicin Clsica de Probabilidad. Modelo de frecuencia relativa


La probabilidad de un evento (E), puede ser calculada mediante la relacin de el nmero de
respuestas en favor de E, y el numero total de resultados posibles en un experimento.

# Favorable E
P E
# Total resultados
1
Ejemplo 1: La probabilidad de que salga 2 al lanzar un dado es: .16
6
1
Ejemplo 2: La probabilidad de lanzar una moneda y que caiga cara es: .5
2
Ejemplo 3: La probabilidad de sacar 1,2,3,4,5, o 6 al lanzar un dado es:

1 1 1 1 1 1
1
6 6 6 6 6 6

La probabilidad de un evento est comprendida siempre entre 0 y 1. La suma de las


probabilidades de todos los eventos posibles (E) en un espacio muestral S = 1
Un espacio muestral (S): Es el conjunto Universal; conjunto de todos los n elementos
relacionados = # Total de resultados posibles.

Probabilidad Compuesta
Es la probabilidad compuesta por dos eventos simples relacionados entre s.
En la composicin existen dos posibilidades: Unin o Interseccin .

Unin de A y B
Si A y B son eventos en un espacio muestral (S), la unin de A y B A B contiene todos los
elementos de el evento A o B o ambos.

Pgina 37 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Interseccin de A y B
Si A y B son eventos en un espacio muestral S, la interseccin de A y B A B est compuesta
por todos los elementos que se encuentran en A y B.

Relaciones entre eventos


Existen tres tipos de relaciones para encontrar la probabilidad de un evento: complementarios,
condicionales y mutuamente excluyentes.

1. Eventos complementarios: El complemento de un evento A son todos los elementos en un


espacio muestral (S) que no se encuentran en A. El complemento de A es: A 1 P A

Ejemplo 4: En el evento A (da nublado), P(A) = .3, la probabilidad de tener un da despejado ser
1-P(A) = .7

P A .7

P(A)=.3

1. Se dice que dos eventos A y B son independientes si: P(A/B) = P(A) o P(B/A) = P(B).
La probabilidad de la ocurrencia de uno no est afectada por la ocurrencia del otro. De otra
manera los eventos son dependientes.

Un ejemplo de evento independiente es: Cul es la probabilidad de que llueva en lunes?


El ejemplo de evento dependiente es el ejemplo 5.

2. Eventos mutuamente excluyentes.

Cuando un evento A no contiene elementos en comn con un evento B, se dice que estos son
mutuamente excluyentes.
A B

Eventos mutuamente excluyentes.

Ejemplo 7. Al lanzar un dado: a) cual es la probabilidad de que salga 2 o 3? B) Calcule P A B


?

1 1 1
a) P A B .33
6 6 3

Pgina 38 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

b) P A B = 0, ya que al ser conjuntos mutuamente excluyentes la interseccin no existe, es


imposible que salga 2 y 3 al mismo tiempo.

Ley aditiva:
Cuando dos eventos no son mutuamente excluyentes:
P A B P A P B P A B

Cuando los eventos son mutuamente excluyentes:


P A B P A P B

Ley multiplicativa:
Si los eventos A y B son dependientes:
P A B P A P B A

Si los eventos A y B son independientes:


P A B P A P B

3.2 DISTRIBUCIONES DE PROBABILIDAD

Variable aleatoria: Para un determinado espacio muestral SS una variable aleatoria (VA) es
cualquier regla que relaciona un nmero con cada resultado en SS.

Variable aleatoria de Bernoulli: Es cualquier variable aleatoria con valores 0 y 1.

Variable aleatoria discreta: Es una variable aleatoria cuyos posibles valores son enteros.

Variable aleatoria continua: Es una variable aleatoria cuyos valores posibles son los reales.

Distribucin de probabilidad o funcin de masa de probabilidad: Establece en una tabla,


frmula o grfica como se distribuye la probabilidad P(y) asociada a los posibles valores de la
variable aleatoria y.

Debe cumplir con las reglas siguientes:

1. 0 <= P(y) <= 1

2. Suma (P(y)) = 1

Pgina 39 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Su frmula es la siguiente:

Valor esperado:

Funcin de distribucin acumulativa:


FX ( x ) P ( X x)

Con propiedades:

0 F ( x) 1
Lim x F ( x ) 1
Lim x F ( x ) 0

Valor esperado de una distribucin de probabilidad discreta

La media o valor esperado de una variable aleatoria discreta X , denotada como E(X), es

X E ( X ) xf X ( x) xP( X x)
x x

La media es el centro de la masa del rango de los valores de X.

Varianza de una distribucin de probabilidad discreta

Sea Y una variable aleatoria discreta con distribucin de probabilidades P(X=x). Entonces , la
varianza de Y es:

X E[( X X ) 2 ] ( x X ) 2 P ( X x )
2

DISTRIBUCIONES DISCRETAS

DISTRIBUCIN HIPERGEOMTRICA

Se aplica cuando la muestra (n) es una proporcin relativamente grande en relacin con la poblacin
(n > 0.1N). El muestreo se hace sin reemplazo

P(x,N,n,D) es la probabilidad de exactamente x xitos en una muestra de n elementos tomados de


una poblacin de tamao N que contiene D xitos. La funcin de densidad de distribucin
hipergeomtrica:

C xD CnNxD n!
P ( x ) C xn
Pgina 40 de 61 x!( n x)!
CnN
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Con

La media y la varianza de la distribucin hipergeomtrica son:

Ejemplo: De un grupo de 20 productos, 10 se seleccionan al azar para prueba. Cul es la


probabilidad de que 10 productos seleccionados contengan 5 productos buenos? Los productos
defectivos son 5 en el lote.

N = 20, n = 10, D = 5, (N-D) = 15, x = 5

P(x=5) = 0.0183 = 1.83%

USO DE EXCEL:
N = Tamao de Poblacin, n = Tamao de muestra, D= xitos en la poblacin; x = xitos en la
muestra.
En Fx Estadsticas seleccionar
=distr.hipergeom(x, n, D, N)

USO DE MINITAB:
Calc > Probability distributions > Hypergeometric
Probability (densidad) o Cumulative probability (acumulada)
N, D, n y en Input constant introducir x.

EJERCICIO:
1. Se compran 10 transformadores y se toma una muestra de 4. Si se encuentra uno o ms
defectuosos se rechaza el lote de 10.
a) Si el lote tiene un defectuoso, Cul es la probabilidad de que se acepte el lote?
b) Cul es la probabilidad de aceptar el lote si contiene 3 defectuosos.

DISTRIBUCIN BINOMAL

Ensayo Bernoulli. Es un experimento aleatorio que solo tiene dos resultados. xito o fracaso.
Donde la probabilidad de xito se denota por p

Suponga se realizan n experimentos Bernoulli independientes. Suponga que la variable X de inters


es el numero de xitos. X toma valores 0,1,2,...,n

La distribucin binomial se utiliza para modelar datos discretos y se aplica para poblaciones grandes
(N>50) y muestras pequeas (n<0.1N). El muestreo binomial es con reemplazamiento.
Pgina 41 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Es apropiada cuando la proporcin defectiva es mayor o igual a 0.1.


La binomial es una aproximacin de la hipergeomtrica
La distribucin normal se paroxima a la binomial cuando np > 5

La variable aleatoria x tiene una distribucin binomial como sigue:

Con media y varianza:

Ejemplo: Un equipo requiere a lo ms 10% de servicios en garanta. Para comprobarlo se compran


20 de estos equipos y se someten a pruebas aceleradas de uso para simular el uso durante el
periodo de garanta. Obtener la probabilidad para P(x<=4).

Rechazar la afirmacin de que falla menos del 10% si se encuentra que X>=5.

P(X>=5) = 1- P(X<=4) =1 - distr.binom(4,20,0.1,1) = 1 0.9568 = 0.0432 lo cual es bajo.

USO DE EXCEL:
x = xitos en la muestra, p = probabilidad de xito, n = tamao de muestra.
En Fx Estadsticas seleccionar
=distr.binom(x, n, p, 0 o 1 dependiendo si es puntual o acumulada)

USO DE MINITAB:
Calc > Probability distributions > Binomial
Probability (densidad) o Cumulative probability (acumulada)
n = number of trials, p = probability of success y en Input constant introducir x.

EJERCICIOS:

1. Un panel solar tiene una vida til de 5 aos con una probabilidad de 0.95. Se toman 20 pneles
solares y se registr la vida til.

a) Cul es la probabilidad de que exactamente 18 tengan su vida til de 5 aos?

b) Cul es la probabilidad de que cuando mucho 10 tengan esa vida til?

c) Si solo 10 paneles tienen una vida til de 5 aos, que debera pensarse sobre el valor verdadero
de P?

DISTRIBUCIN DE POISSON

Pgina 42 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

La distribucin de Poisson se utiliza para modelar datos discretos como aproximacin a la Binomial
dada la dificultad que exista de encontrar tablas Binomiales adecuadas cuando n es grande y p
pequea. La distribucin de probabilidad de Poisson proporciona buenas aproximaciones cuando np
<= 5.

Se aproxima a la binomial cuando p es igual o menor a 0.1, y el tamao de muestra es grande (n >
16) por tanto np > 1.6.

Una Variable aleatoria X tiene distribucin Poisson si toma probabilidades con.

Con media y varianza:

Ejemplo 1. Suponga que una compaa de seguros asegura las vidas de 5000 hombres de 42 aos
de edad. Si los estudios actuariales muestran que la probabilidad de que un hombre muera en cierto
ao es 0.001, entonces la probabilidad de que la empresa pague exactamente 4 indeminizaciones
y= 4 en un cierto ao es:

5000!
P ( y 4) p(4) (0.001) 4 (0.999) 4996
4!*4996!

El valor de esta expresin no aparece en tablas y su clculo era difcil, no as con Excel.

Aproximando con la distribucin de Poisson, se toma la tasa media de sucesos = np =


(5000)*(0.001)= 5, teniendo:

4 e 5 4 e 5
P ( y 4) 0.1745
4! 4!

Ejemplo 2. Una planta tiene 20 mquinas, si la probabilidad de que falla una en cierto da es 0.05.
Encuentre la probabilidad de que durante un da determinado fallen dos mquinas.

np = 20 *0.05 = 1.0
12 e 1
P ( y 2) 0.184
2!

Si se calcula con la distribucin Binomial se tiene:

Pgina 43 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

20!
P ( y 2) p (2) (0.05) 2 (0.95)18 0.188
2!*18!

La aproximacin es mejor conforme se aproxima a np = 5.

USO DE EXCEL:
x = xitos en la muestra, np = media.
En Fx Estadsticas seleccionar
=Poisson(x, np, 0 o 1 dependiendo si es puntual o acumulada)

USO DE MINITAB:
Calc > Probability distributions > Poisson
Probability (densidad) o Cumulative probability (acumulada)
n*p = mean y en Input constant introducir x.

EJERCICIOS:

1. El 20% de los choferes son mujeres, si se seleccionan 20 al azar para una encuesta:
Usando la distribucin binomial y la distribucin de Poisson
a) Cul es la probabilidad de que dos choferes sean mujeres ?
b) Cul es la probabilidad de que al menos cuatro sean mujeres?

2. Se tienen 8 recepcionistas, estan ocupadas en promedio el 30% del tiempo, si 3 clientes llaman
la prob. De que estn ocupadas es mayor al 50%?

3. Un proveedor de partes de bicicleta tiene 3% de defectos. Se compran 150 partes y si la


probabilidad de que 3 o ms partes sean defectuosas excede al 50%, no se hace la compra.
Qu sucede en este caso?.

4. En una universidad las llamadas entran cada 2 minutos


a) Cul es la cantidad esperada de llamadas en una hora?
b) Cul es la probabilidad de 3 llamadas en los sig. 5 minutos?
c) Cul es la probabilidad de no llamadas en los sig. 5 minutos?
d) cul es la prob. de recibir 10 llamadas en los sig. 15 minutos?

5. Un proceso de manufactura produce 1.2 defectos por cada 100 unidades producidas,
Cul es la probabilidad de que las siguientes 500 unidades presenten X=3 defectos?

Pgina 44 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

MDULO 4. LA DISTRIBUCIN NORMAL


La distribucin normal es una de las distribuciones ms usadas e importantes. Se ha desenvuelto
como una herramienta indispensable en cualquier rama de la ciencia, la industria y el comercio.

Muchos eventos reales y naturales tienen una distribucin de frecuencias cuya forma es muy
parecida a la distribucin normal.

La distribucin normal es llamada tambin campana de Gauss por su forma acampanada.

La Funcin de Distribucin de Probabilidad (PDF) normal tiene forma de una campana con simetra
sobre su media definida por la siguiente ecuacin:
1 1 t 2
f (t ) exp
2 2

Pgina 45 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Propiedades de la distribucin normal estndar

La distribucin normal o Distribucin Gaussiana tiene forma de campana y es la ms conocida.


La distribucin normal estndar tiene media = 0 y desviacin estndar = 1. Su Media =
Mediana = Moda
El rea bajo la curva o la probabilidad desde menos infinito a ms infinito vale 1.
La distribucin normal es simtrica, es decir cada mitad de curva tiene un rea de 0.5.
La escala horizontal de la curva se mide en desviaciones estndar.
La forma y la posicin de una distribucin normal dependen de los parmetros , , en
consecuencia hay un nmero infinito de distribuciones normales.
Existe una relacin del porcentaje de poblacin a la desviacin estndar. En la figura observamos
por ejemplo que el rea bajo la curva para 1 tiene un porcentaje de 68.26%, 2 = 95.46%
y 3 99.73%

-3s -2s -1s +1s +2s +3s

68.26%
95.46%

99.73%

Pgina 46 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

La distribucin de probabilidad f (Z) es una distribucin normal estndar con media 0 y desviacin
estndar 1; esto es Z se distribuye normalmente con media cero y desviacin estndar = 1
Z~N(0,1): La grfica de densidad de probabilidad se muestra en la figura.
F(z)

La distribucin f (Z) se encuentra tabulada en la tabla de distribucin normal estndar o se puede


determinar con Excel. En esta tabla podemos determinar los valores de Z o la probabilidad de
determinado valor Z.

Nota: Excel proporciona el valor del rea bajo la curva desde menos infinito hasta un valor dado de
Z.

F(z)=pr(Z z)
1.0

0.5

.01
Z
-4 -3 -2 -1 0 1 2 3 4

Forma de la Distribucin Normal acumulada


Poblacin Muestra

La poblacin incluye todos los datos,


la muestra es una porcin de la poblacin.

x- 3s x-2s x-s x x+s x+2s x+3s


El valor de z
Pgina 47 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Determina el nmero de desviaciones estndar entre algn valor X y la media de la poblacin


Para calcular el valor de Z usamos la siguiente frmula.

X
Z

Calculo de Probabilidades normales

1. Identificar la variable de inters.


2. Identificar los parmetros de la variable (su media y desv. estndar).
3. Cual es la pregunta sobre el rea bajo la curva de probabilidad normal?
4. Convertir los valores a la distribucin normal estndar ( estandarizacin Z = (X-Media)/S) .
5. Encuentre la probabilidad en tabla de la normal estndar o por Excel.

Ejemplo 1: El gerente de personal de una gran compaa requiere que los solicitantes a un puesto
efecten cierta prueba y alcancen una calificacin de 500. Si las calificaciones de la prueba se
distribuyen normalmente con media 485 y desviacin estndar 30 Qu porcentaje de
los solicitantes pasar la prueba?

Calculando el valor de Z obtenemos:

X 500 485
Z = 0.5
30
Buscamos el valor correspondiente Z en las tablas de distribucin normal estndar o por medio de
Excel (=distr.norm.estand(0.05). Z0.5 = 0.69146 = 69.146%. siendo esta la probabilidad de que la
calificacin sea menor a 500 P (X<500). Dado que el porcentaje pedido es P ( X 500) la solucin
es 1-.69146 =0.3085 , 30.85% de los participantes pasarn la prueba.
485

3 0 .8 5 %

Z.0 5
Ejemplo 2:
Encuentre las probabilidades siguientes usando la tabla Z.

a) P(-1.23 < Z > 0)

-1.23 Z

Solucin: Buscamos el valor Z1..23 en las tablas siendo este =0.89065. restando 0.89065-0.5 =
0.3905, este valor es la probabilidad de 0 a 1.23 que es exactamente la misma de 1.23 a 0 por
simetra. Por lo tanto la probabilidad es 0.3905
Pgina 48 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

USO DE EXCEL

Para calcular la probabilidad dado un valor Z procedemos de la siguiente manera:

En la barra de herramientas seleccione el icono de funciones


fx>Estadsticas>Distr.Norm.Estand. OK

Seleccione la celda que contiene el valor de Z, que en este caso es Z= 1.3 , de clic en
aceptar y aparecer la probabilidad buscada f(z)= 0.903199
Para calcular Z dada una probabilidad f(z)
En la barra de herramientas seleccione el icono de funciones
fx>Estadsticas>Distr.Norm.Estand.inv OK

De clic en aceptar. Procedemos de la misma manera que en el caso anterior, pero en esta
ocasin seleccionamos la probabilidad 0.93319

El valor Z = 1.4999

Cuando no tenemos valores de Z ni probabilidad.

Ejemplo 3 : Suponga que una distribucin normal dada tiene una media de 20 y una desviacin
estndar de 4. Calcule la probabilidad P (X > 24).

En la barra de herramientas seleccione el icono de funciones


fx>Estadsticas>Distr.Norm.Estand. OK

El sistema muestra la siguiente ventana, en la cual llenamos los siguientes datos:

El resultado de la frmula = 0.8413. , dado que esta es la probabilidad P(X 24), la probabilidad
buscada es:
Pgina 49 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

P (X > 24) = 1-.8413= .1587

USO DE MINITAB

Para clculos utilizando el paquete Minitab, usar:

1. Calc >Probability Distributions >Normal

DISTRIBUCIN NORMAL ESTNDAR (con Z):

2. Indicar Cumulative Distribution o inverse Cumulative Distribution (dando valores de Z


se obtienen valores de rea) o Inverse Cumulative Distribution (dando reas proporciona los
valores de Z).

3. Dejar los parmetros de Mean Mu=0 y Estndar deviation Sigma = 1.

4. En Input constant indicar el valor de Z (cumulative) para obtener el rea bajo la curva o
proporcionar el rea bajo la curva (Inverse cumulative) para obtener el valor de Z. OK

5. Si se especifica una columna Cx para almacenamiento de los resultados, estos no se


muestran automticamente, para verlos es necesario ejecutar la opcin >Manip >Display
Data

DISTRIBUCIN NORMAL (con datos reales y X):

6. Indicar Cumulative Distribution o inverse Cumulative Distribution (dando valores de X


se obtienen valores de rea) o Inverse Cumulative Distribution (dando reas proporciona los
valores de X).

7. Introducir los valores de los parmetros de la media en Mean y la sigma en Estndar


deviation.

8. En Input constant indicar el valor de X (cumulative) para obtener el rea bajo la curva o
proporcionar el rea bajo la curva (Inverse cumulative) para obtener el valor de X. OK

9. Si se especifica una columna Cx para almacenamiento de los resultados, estos no se


muestran automticamente, para verlos es necesario ejecutar la opcin >Manip o Data
>Display Data

Pgina 50 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

EJERCICIOS:

1. Qu porcentaje del rea bajo la curva normal estndar est incluido dentro de los siguientes
rangos?

a) P(1.2 <= Z <= 2.2):


b) P(-2.1 <= Z <= -0.4)
c) P( -1.3 <= Z <= 2.7)
d) P( Z >= 2.4)
e) P( Z<-2.9) + P(Z>3.1)
f) P(Z>= 1.9)

2. El tiempo de vida de las bateras del conejito tiene una distribucin aproximada a la normal con
una media de 85.36 horas y una desviacin estndar de 3.77 horas.

a) Qu porcentaje de las bateras se espera que duren 80 horas o menos?


b) Cul es la probabilidad de que una batera dure entre 86.0 y 87.0 horas?
c) Cul es la probabilidad de que una batera dure ms de 88 horas?

3. Considere una media de peso de estudiantes de 75 Kgs. con una desviacin estndar de 10Kgs.

a) Cul es la probabilidad de que un estudiante pese ms de 85Kgs.?


b) Cul es la probabilidad de que un estudiante pese menos de 50Kgs.?
c) Cul es la probabilidad de que pese entre 60 y 80 Kgs.?.
d) Cul es la probabilidad de que pese entre 55 y 70 Kgs.?
e) Cul es la probabilidad de que pese entre 85 y 100Kgs.?

4. Una mquina llenadota de refresco se ajusta para servir 10 onzas de lquido por vaso, si la
desviacin estndar es de 0.12 onzas. Cul es la probabilidad o porcentaje de las veces de que la
mquina sirva:
a. 10.2 onzas o ms?
b. Entre 10.1 y 10.3 onzas?
c. Entre 9.7 y 10.3 onzas?
d. Menos de 9.8 onzas?
e. Entre 9.8 y 9.9 onzas?

Pgina 51 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

MDULO 5. ESTADSTICA INFERENCIAL


INTERVALOS DE CONFIANZA Y PRUEBAS DE HIPTESIS

5.1 INTRODUCCIN

La inferencia estadstica es el proceso mediante el cual se utiliza la informacin de los datos de una
muestra para extraer conclusiones acerca de la poblacin de la que se seleccion la muestra. Las
tcnicas de inferencia estadstica se dividen en dos reas principales: Estimacin de intervalos de
confianza y Pruebas de hiptesis.

En cada prueba estadstica, se comparan algunos valores observados contra algunos esperados u
otro valor observado comparando estimaciones de parmetros (media, desviacin estndar,
varianza).
Estas estimaciones de los verdaderos parmetros son obtenidos usando una muestra de datos y
calculando los estadsticos.

La capacidad para detectar una diferencia entre lo que es observado y lo que es esperado depende
del desarrollo de la muestra de datos.
Incrementando el tamao de la muestra mejora la estimacin y la confianza en las conclusiones
estadsticas.

5.2 INTERVALOS DE CONFIANZA

Las medias o desviaciones estndar calculadas de una muestra se denominan estadsticos, podran
ser consideradas como un punto estimado de la media y desviacin estndar real de la poblacin o
de los parmetros.

Cuando no deseamos obtener nmeros sencillos como la media basada en una muestra, utilizamos
los intervalos de confianza, los cuales nos dan un margen con algn tipo de error.

Para obtener un intervalo de confianza usamos:

Punto estimado + error estimado


Para calcular el error estimado:

Desviacin estndar multiplicador de CI (nivel de confianza) deseado.

Pgina 52 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

5.3 PRUEBAS DE HIPTESIS DE UNA POBLACIN

Una hiptesis es una afirmacin a comprobar, por ejemplo:

Un proveedor de bebidas afirma que sus botellas contienen 16 onzas; un productor de software dice
que su rechazo promedio es de 3%; etc.

La hiptesis planteada que contiene el signo de igualdad se denomina hiptesis nula ho (=, >=, <=) y
su complemento es la hiptesis alterna ha. se puede iniciar planteando cualquiera de las dos
por ejemplo si se indica probar si las ventas son mayores que $1000 o ..las ventas son
menores a $1000, se inicia planteando ha y como complemento se plantea ho (ventas<=1000 o
ventas>=1000).
Ho : , 2 , , , parametro de la hipotesis

Ha : , 2 , , , parametro de la hipotesis

Las conclusiones al final siempre son contra la Ho.

Los trminos surgen de las investigaciones agrcolas quienes probaban la efectividad de fertilizantes,
lo nulo era sin efecto

Las hiptesis nulas no se rechazan o si se rechazan (aceptndose la ha) con base en datos
muestrales y un valor alfa.

Prueba estadstica: es un procedimiento para probar una afirmacin o creencia sobre el proceso.

Hiptesis nula (Ho) - usualmente es una afirmacin representando una situacin status quo.
generalmente deseamos rechazar la hiptesis nula.
puede ser por ejemplo ho: , , = 5
slo puede ser rechazada o no rechazada

Hiptesis alterna (Ha) - es lo que aceptamos si podemos rechazar la hiptesis nula. Ha es lo que
queremos probar es el complemento de Ho.

Por ejemplo 5 para prueba de dos colas


< 5 para prueba de cola izquierda
> 5 para prueba de cola derecha
Esta hiptesis se acepta cuando se rechaza Ho

Estadstico de prueba: Calculado con datos de la muestra (Z, t, X 2 or F).

Regin de Rechazo: Indica los valores de la prueba estadstica para que podamos rechazar la
Hiptesis nula (Ho). Esta regin esta basada en un riesgo deseado, normalmente 0.05 o 5%.

Las pruebas de hiptesis pueden ser de dos colas, de cola derecha o de cola izquierda,
dependiendo del signo de la hiptesis alterna, a continuacin se esquematizan cada una de ellas.

Pgina 53 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

PROCEDIMIENTO PARA REALIZAR PRUEBAS DE HIPTESIS

1. Definir el Problema ( Problema Prctico).


2. Sealar los Objetivos ( Problema Estadstico).
3. Determinar tipo de datos: Atributo o Variable.
4. Si son datos Variables: Prueba de Normalidad.

5. Establecer las Hiptesis: Hiptesis Nula (Ho lleva signo =, <=, >=), Hiptesis Alterna (Ha
lleva signo >, < o <>).
6. Seleccionar el nivel de significancia Alfa (normalmente 0.05 o 5%) o el nivel de confianza
1 - alfa.

7. Establecer el tamao de la muestra, 10 .


8. Desarrollar el Plan de Muestreo.
9. Seleccionar Muestras y Obtener Datos.
10. Decidir la prueba estadstica apropiada y calcular el estadstico de prueba (Z, t, X 2 o F)
a partir de los datos.

11. Obtener el estadstico correspondiente de tablas o Excel.


12. Determinar la probabilidad P de que el estadstico de prueba calculado ocurra al azar.
13. Comparar el estadstico calculado con el de tablas y ver si cae en la regin de rechazo o
ver si la probabilidad es menor a alfa, rechace Ho y acepte Ha. En caso contrario no
rechace Ho.
14. Con los resultados interprete una conclusin estadstica para la solucin prctica.

Pgina 54 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Las frmulas para calcular el estadstico de prueba en base a la muestra son las siguientes:

Para el caso de muestras pareadas se calculan las diferencias d individuales como sigue:

USO DE MINITAB PARA PRUEBA DE HIPTESIS DE LA MEDIA

Stat > basic statistics > 1-sample z o 1-sample t


Variable -- indicar la columna de los datos en simples in columns o summarized data
(indicando en simple size el tamao de muestra y en mean la media). para el caso de la
prueba z adems se indica en standard deviation la desviacin estndar.
Indicar en test mean la media de la hiptesis a probar.
Indicar el signo de la hiptesis alterna: less than, not equal, greater than
OK

Pgina 55 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

EJERCICIOS

1. Se midi la temperatura de fusin de un aceite vegetal hidrogenado en n=16 muestras y se


encontr una media de 94.32. Si la temperatura de fusin sigue una distribucin normal con sigma =
1.20.

a) Probar a un 95% de nivel de confianza de que la media se ha mantenido en 95.

2. La duracin promedio de cierto foco es de 750 horas. El cliente cambiara de marca slo que se
demuestre que de manera concluyente que la vida de los focos es menor que la anunciada. Se elige
una muestra aleatoria de 20 focos, se determina su duracin y se obtiene una vida media de 738.44
con una desviacin estndar de 38.20.

a) Cul sera la conclusin a un 95% de nivel de confianza?

3. Despus de ciertas horas de trabajo se determin el desgaste de flechas en 0.0001 para cada
una de las n=8 mquinas que tienen plomo y cobre como material de soporte, y se obtuvo como
resultado que la media fue de 3.72 con desviacin estndar de 1.25.

a) Se desea probar si el desgaste es mayor a 3.5 a un 95% de nivel de confianza.

3. Las lecturas de radiacin de Radn tomadas en 12 lugares fueron como sigue:


105.6, 90.9, 91.2, 96.9, 96.5, 91.3, 100.1, 105, 99.6, 107.7, 103.3 y 92.4.

a) A un alfa de 5%, indican las lecturas que difieren de 100?.

4. Se prueban 100 bateras de Ni-H para celdas de prueba y se determina que 14 de ellas se
ampoyan en sus placas fallando. Para un 5% de nivel de significancia.

a) Proporciona lo anterior una evidencia de que ms del 10% de las bateras fallan?

Pgina 56 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

5.6 PRUEBAS DE HIPTESIS PARA DOS POBLACIONES

Supongamos que tenemos muestras de dos calderas que producen el mismo rendimiento. Se desea
ver si hay diferencia significativa en el rendimiento de Caldera A y Caldera B.
Caldera A Caldera B
89.7 84.7
81.4 86.1
84.5 83.2
84.8 91.9
87.3 86.3
79.7 79.3
85.1 82.6
81.7 89.1
83.7 83.7
84.5 88.5

Estadsticas Descriptivas
Variable Caldera N Media Desv.Std
Rendimiento A 10 84.24 2.90
B 10 85.54 3.65

Pregunta Prctica: Existe diferencia entre las Calderas?

Pregunta Estadstica La media de la caldera B (85.54) es significativamente diferente de la media


de la Caldera A (84.24)? o su diferencia se da por casualidad en una variacin de da a da.

Ho: Hiptesis Nula: No existe diferencia entre las Calderas.

Ha: Hiptesis Alterna: Las medias de las Calderas son diferentes.


H 0 : a b
H a : a b
Se busca demostrar que los valores observados al parecer no corresponden al mismo proceso, se
trata de rechazar Ho.

Representan las Calderas dos procesos diferentes?


Representan las mismas condiciones como un solo proceso?

Pgina 57 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Lo anterior se contesta con pruebas de hiptesis para dos poblaciones como se explica a
continuacin.

USO DE MINITAB
Stat > Basic statistics > 2 Variances Samples in different columns
Seleccionar las columnas de datos
En Options: Confidence level 97.5%, Test Mean = 0.0; Alternative = Not equal
OK

Test for Equal Variances: Tipo 1, Tipo 2

97.5% Bonferroni confidence intervals for standard deviations

N Lower StDev Upper


Tipo 1 10 5.89483 9.4187 20.8295
Tipo 2 10 6.27256 10.0222 22.1643

F-Test (normal distribution)


Test statistic = 0.88, p-value = 0.856

Conclusin: Como Fc de 0.88 es mayor a F1-alfa/2 de 0.248 y Pvalue de 0.856 es mayor a Alfa de
0.05, no se rechaza Ho, las varianzas son similares.

PRUEBAS DE HIPTESIS SOBRE LA IGUALDAD DE DOS MEDIAS.

USO DE EXCEL
Seleccionar Anlisis de datos en el men herramientas.
En funciones para anlisis elija la opcin : Prueba z para medias de dos muestras.

Prueba z para medias de dos muestras


Mquina 1 Mquina 2
Media 16.015 16.005
Varianza (conocida) 0.000225 0.000324
Pgina 58 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Observaciones 10 10
Diferencia hipottica de las medias 0
z 1.34962722
P(Z<=z) una cola 0.08856779
Valor crtico de z (una cola) 1.95996398
Valor crtico de z (dos colas) 0.17713559
Valor crtico de z (dos colas) 2.24140273

Conclusiones: No se rechaza Ho (Medias iguales) ya que Zc de 1.349 < Zalfa/2 de 1.96; el valor P
de 0.177 es mayor a Alfa = 0.05.

USO DE MINITAB
Stat > Basic statistics > 2 Sample t seleccionar Summarized data
Seleccionar Assume equal variantes
En Options: Confidence level 95%, Test Difference 0.0; Alternative Not equal
En Graphs: Boxplot of data OK

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean


1 10 16.0150 0.0150 0.0047
2 10 16.0050 0.0180 0.0057

Difference = mu (1) - mu (2)


Estimate for difference: 0.010000
95% CI for difference: (-0.005567, 0.025567)
T-Test of difference = 0 (vs not =): T-Value = 1.35 P-Value = 0.194 DF
= 18
Both use Pooled StDev = 0.0166

Conclusiones: No se rechaza Ho (Medias iguales) ya que Zc de 1.35 < Zalfa/2 de 1.96; el valor P
de 0.194 es mayor a Alfa = 0.05 y el cero se encuentra en el IC para la diferencia de medias de
(-0.005567, 0.025567).

RESUMEN DE LAS PRUEBAS DE HIPTESIS

Pruebas de medias:

Pgina 59 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

Prueba Z para medias (varianza conocida): Prueba si dos medias de muestras son iguales.
Prueba t para medias (varianza desconocida): Prueba si dos medias de muestras son iguales.
Se tienen dos casos: varianzas iguales y varianzas diferentes
Prueba t pareadas para medias: prueba si dos medias de muestras (por pares) son iguales.

Pruebas de varianza:
Prueba F para varianzas: Prueba si dos varianzas de muestras son iguales.

Pruebas de proporciones:
Prueba Z para proporciones: Prueba si dos proporciones de muestras son iguales.

EJERCICIOS:

1. Determinar a un nivel de confianza del 90% si hay diferencia entre las medias de tiempos de
limpieza de mquina A y mquina B. Se toman muestras para comprobar la afirmacin.

Mquina A Mquina B
25.2 18.0
17.4 22.9
22.8 26.4
21.9 24.8
19.7 26.9
23.0 17.8
19.7 24.6
23.0 21.0
19.7
16.9
21.8
23.6

2. Los tiempos de terminacin del programa para dos departamentos se muestran a continuacin:
Probar a un 90% de nivel de confianza si sus varianzas y promedios son iguales.

Depto. A Depto. B
300 276
280 222
344 310
385 338
372 200
360 302
288 317
321 260
376 320
290 312
301 334
283 265

Pgina 60 de 61
TALLER DE ESTADSTICA Y PROBABILIDAD P. REYES / SEPT. 2006

3. Los tiempos de terminacin para la tarea con un mtodo mejorado y actual son, para el mismo
empleado son los siguientes. Probar a un 90% de nivel de confianza si los mtodos dan los mismos
resultados.

Mtodo 1 Mtodo 2 Dif.


6.0 5.4 0.6
5.0 5.2 -0.2
7.0 6.5 0.5
6.2 5.9 0.3
6.0 6.0 0.0
6.4 5.8 0.6
Ho: Dif. Prom = 0 0.3 Dprom
Ha: Dif. Prom. <> 0 0.3347 Sdif

4. Un participante es calificado antes y despus de un curso. Probar a un 8% de nivel de


significancia si el curso tuvo impacto.

Antes Despus
5 6
4 6
7 7
3 4
5 3
8 9
5 7
6 6

5. A dos grupos de personas se les pidi que indicaran el porcentaje de recortatorio de dos avisos:
Probar a un 5% si son iguales los dos grupos.

Aviso Lo vieron Lo recordaron


A 150 63
B 200 60

6. Se hizo una encuesta para determinar el porcentaje de personas que usaban Internet en el
trabajo: En Mxico se encontr que el 40% de los adultos usa Internet de una muestra de 240.
En Monterrey el 32% de los adultos usaba Internet de una muestra de 250.
Para un nivel de significancia del 10%, es mayor la proporcin que usa Internet en Mxico que en
Monterrey?

Pgina 61 de 61

Das könnte Ihnen auch gefallen