Sie sind auf Seite 1von 29

Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov.

2007

MINITAB 15 MÓDULO 3. ESTADÍSTICA DESCRIPTIVA

3.1      Estadísticos de una muestra


3.2      Histogramas
3.3      Diagramas de caja y diagramas de tallo y hojas
3.4      Distribución normal estándar y distribución normal
3.5      Prueba de normalidad
3.6      Aplicaciones

MÓDULO 3. ESTADÍSTICA DESCRIPTIVA

3.1      Estadísticos de una muestra


Ver archivo Estadistica Descriptiva.doc anexo para una explicación de los conceptos teóricos

Se usa el archivo DETERGENTE.MTW anexo en Archivo Datos Módulo 3:


Contiene datos de peso en gramos de 500 paquetes de detergente con peso nominal
de 4 grs. indicando en cuál de las 2 líneas se ha llenado:
0.00620967
Estudio estadístico básico: 0.89473684
0.84210526
Stat > Basic statistics > Display descriptive sta 0.89473684
Variables y variable categórica

Gráficas de los datos

Selección de estadísticos específicos

NOTA: Para que las columnas no se desplazen al copiar de Minitab a Excel cambiar a letra COURIER

Página 1 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Descriptive Statistics: Peso en gr


Variable Línea N N* Mean SE Mean StDev Minimum Q1 Median
Peso en gr 1 250 0 3999.6 3.14 49.6 3877.0 3967.8 3999.5
2 250 0 4085.6 3.32 52.5 3954.0 4048.8 4087.0
Variable Línea Q3 Maximum
Peso en gr 1 4040.0 4113.0
2 4121.5 4202.0

Las gráficas obtenidas de la estadística descriptiva son las siguientes:

Histogram (with Normal Curve) of Peso en gr by Línea de llenado


3900 3960 4020 4080 4140 4200
1 2 1
50 Mean 4000
StDev 49.60
N 250
40 2
Mean 4086
StDev 52.51
Frequency

30 N 250

20

10

0
3900 3960 4020 4080 4140 4200
Peso en gr
Panel variable: Línea de llenado

Individual Value Plot of Peso en gr vs Línea de llenado

4200

4150

4100
Peso en gr

4050

4000

3950

3900

1 2
Línea de llenado

Boxplot of Peso en gr by Línea de llenado

4200

4150

4100
Peso en gr

4050

4000

3950

3900

1 2
Línea de llenado

3.2      Diagrama de caja y diagrama de tallo y hojas

Para estos ejemplos se utiliza el archivo PULSE.MTW de Minitab


File > Open Worksheet > Pulse.m o copiar los datos del archivo anexo

Página 2 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Diagrama de caja

Graph > Boxplot

Hacer una columna con el incremento del Pulso = Pulse 2 - Pulse 1


Calc > Calculator
Store result in variable Incremento
Expression Pulse2 - Pulse1

Gráfica de caja sencillo

Boxplot of Pulse1

100

90

80

Pulse1 70

60

50

Gráfica de caja por grupos

Boxplot of Incremento vs Ran, Sex


50

40

30
Incremento

20

10

-10

-20
Sex 1 2 1 2
Ran 1 2

El diagrama de caja muestra los cuartiles Q1, Q2 (mediana) y Q3, el rango


intercuartílico es Q3 - Q1 y los bigotes se encuentran en Q1 + 1.5RIC y
Q3 - 1.5RIC. Los valores que exceden estos rangos se muestran en asteriscos.

Los valores similares se desplazan horizontalmente para que se puedan apreciar.

Página 3 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Diagrama de tallo y hojas

Graph > Stem and Leaf


o Stat > EDA > Stem and Leaf

Variable

Estratificación opcional por otra variable

Destacar valores que exceden ± 1.5 RIC


de Q1 y Q3

Definición del ancho de la "celda" de números

Stem-and-Leaf Display: Weight


Stem-and-leaf of Weight N = 9Leaf Unit = 1.0
Tallo Hojas
1 9 5 Con Increment = 20
4 10 288 Leaf Unit = 10
13 11 002556688 Tallo Hojas
24 12 00012355555 1 0 9
37 13 0000013555688 13 1 000111111111
(11) 14 00002555558 37 1 222222222223333333333333
44 15 000000000035555555555(33) 1 444444444445555555555555555555555
22 16 000045 22 1 666666777777
16 17 000055 10 1 888899999
10 18 0005
6 19 00005 HI 21 Valor anómalo destacado

HI 215 Línea de profundidad (frec. Acumulada hasta la mediana () )

Diagrama de puntos Graph > Dotplot

Se tienen varias alternativas para estos diagramas desde el simple hasta estratificado.
Identificando el incremento en el pulso para quienes han corrido o no y por sexo.

Dotplot of Incremento vs Ran, Sex

Ran Sex

1 1
2

2 1

2
-9 0 9 18 27 36 45
Incremento

Minitab 15 Gráfica de valores individuales

Página 4 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

1. Open worksheet Shippingdata.mtw en carpeta Minitab Sample Data / Meet Minitab


2. Graph > Individual value plot
3. One Y with groups OK
4. Variable Day
5. Categorical variable Center
6. Data View Mean connect
7. OK

Individual Value Plot of Days


8

5
Days

0
Central Eastern Western
Center

3.3      Histogramas o distribuciones de frecuencia

Se usa el archivo PULSE.MTW anexo en Archivo Datos Módulo 3:


Existen diferentes opciones para esta herramienta:

Indicando como variable Pulse1 se tiene:

Histogram of Pulse1
25

20

15
Frequency

10

0
50 60 70 80 90 100
Pulse1

Se pueden hacer cambios en la escala de los ejes horizontal y vertical haciendo click
sobre estos, de la misma forma para el marco del histograma.

La apariencia de las barras se puede cambiar haciendo clcik en estas.

Para cambiar los intervalos del histograma, se da doble click sobre la escala horizontal
del histograma y se selecciona la pestaña Binning

Se definen los intervalos a través de sus


puntos de corte

Se indica el nuevo número de intervalos

Página 5 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Histogram of Pulse1
30

25

20
Frequency

15

10

0
48.00 56.66 65.33 74.00 82.66 91.33 100.00
Pulse1

Con doble click en la escala horizontal se puede modificar la escala de valores

Una vez creada esta gráfica, se puede hacer otra muy similar dejando el histograma
original como ventana activa, por ejemplo para Pulse2:

Editor > Make Similar Graph

Histogram of Pulse2

30

25

20
Frequency

15

10

0
60 80 100 120 140
Pulse2

Para comparar los histogramas según se haya corrido o no se tiene:

Graph > Histogram: Simple


Multiple Graphs:
Multiple Variable:
In separate panels of the same graph; Same scales for graphs X, Y
By Variable:
Ran

Histogram of Pulse1
50 60 70 80 90 100
1 2
16

14

12
requency

10

8
Página 6 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Histogram of Pulse1
50 60 70 80 90 100
1 2
16

14

12
Frequency

10

0
50 60 70 80 90 100
Pulse1
Panel variable: Ran

Minitab 15 Histogramas por grupo


1. Open worksheet Shippingdata.mtw en carpeta Minitab Sample Data / Meet Minitab
2. Graph >Histogram
3. With fits and groups
4. Graph Variable Day
5. Categorical variable Center
6. Data View Mean connect
7. OK

Histogram of Days
Normal
0.4 C enter
C entral
Eastern
W estern
0.3 Mean StDev N
3.984 1.280 99
4.452 1.252 101
2.981 1.090 102
Density

0.2

0.1

0.0
1 2 3 4 5 6 7
Days

1. Open worksheet Shippingdata.mtw en carpeta Minitab Sample Data / Meet Minitab


2. Graph > Histogram
3. With fit
4. Graph Variable Day
5. Multiple graphs
6. By variables With groups in separate panels Center
7. OK Histogram of Days
Normal

1 2 3 4 5 6 7
Central Eastern Central
20
Mean 3.984
15 StDev 1.280
N 99
10 Eastern
Mean 4.452
Frequency

5 StDev 1.252
N 101
0
Western W estern
20
Mean 2.981
15 StDev 1.090
N 102
10

0
1 2 3 4 5 6 7
Days
Panel variable: Center

Página 7 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Gráfica de dispersión entre dos variables Day y Distance


1. Graph Scatterplot > with regression
2. Y var Day X var Distance
3. Multiple graphs
4. By variables
5. By variable with groups en separate panels Center
6 OK

Scatterplot of Days vs Distance


0 120 240 360 480
Central Eastern
8

2
Days

0
Western
8

0
0 120 240 360 480
Distance
Panel variable: Center

Arreglo del Layout

1. Editor > Layout Tool Mover las gráficas con este botón

3.4      Distribución normal estándar y distribución normal

Página 8 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

La teoria se puede consultar en el archivo de Word anexo: Distribución Normal.doc

Calc > Probability distributions > Normal

Da la ordenada de probabilidad
en un punto del eje horizontal

Da la probabilidad acumulada
o área desde menos infinito hasta
los valores indicado en Input
Column o el valor indicado en
Input Constant

Da el valor para el cual se obtiene


la probabilidad acumulada que se
indica

Media cero y desv. Estándar uno


indica una distribución normal
estándar, con otros valores
se trata de la distribución normal

El área total de probabilidad es de 1.0


La media es de cero y la desv. Estandar 1
Ejemplos:
Densidad de probabilidad
Calc > Probability distributions > Normal
Seleccionar Probability Density
En Input Constant poner 1.5

Normal with mean = 0 and standard deviation = 1


x f( x )
1.5 0.129518

Probabilidad acumulada
Calc > Probability distributions > Normal
Seleccionar Cumulative Probability
En Input Constant poner 1.5

Normal with mean = 0 and standard deviation = 1


x P( X <= x )
1.5 0.933193

Probabilidad acumulada inversa

Calc > Probability distributions > Normal


Seleccionar Inverse Cumulative Probability
En Input Constant poner 0.9332

Normal with mean = 0 and standard deviation = 1


P( X <= x ) x
0.9332 1.50006

Dibujo de la gráfica de densidad normal (entre -4 a +4 con incrementos de 0.1)

Calc > Make Patterned data > Simple set of numbers


Store patterned data in C1

Página 9 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Columna para guardar los datos

Primer valor

Último valor
Incremento

Listar cada valor


Listar toda la lista

Calc > Probability distributions > Normal

Columna de datos fuente


Columna de datos distribuidos normalmente

Graph > Scatter plot (With connect line)


Indicar en Y C1 y en X C1

En la gráfica quitar los puntos dejando solo la línea con doble click sobre la curva:
Attributes Symbols > seleccionar Custom y en Type None

Scatterplot of C2 vs C1

0.4

0.3

0.2
C2

0.1

0.0

-5 -4 -3 -2 -1 0 1 2 3 4
C1

Para la parte sombreada bajo la campana se dibuja un polígono:

Editor > Annotation > Graph annotation tools


Seleccionar para el interior el color gris
Scatterplot of C2 vs C1

0.4

0.3

0.2
C2

0.1

0.0

-5 -4 -3 -2 -1 0 1 2 3 4
C1

Página 10 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Para las distribuciones de densidad de Weibull se tiene (entre 0 y 4 con incrementos de 0.01):

Calc > Make Patterned data > Simple set of numbers


Store patterned data in C1

Calc > Probability distributions > Weibull

se repiten los valores del 1 al 4 en el parámetro de forma

Graph > Scatterplot (With connect Line)


En la gráfica seleccionar los puntos con doble click
Attributes, Symbols, Custom, Type None, Color Black

Con Editor > Annotation > Graph annotation tools


Con T escribir el texto de las opciones de las gráficas de Weibull

Scatterplot of C2, C3, C4, C5 vs C1


1.6 Variable
a = 1, b=1
C2
a = 1, b=2
1.4 C3
a = 1, b=3 C4

1.2 a = 1, b=4 C5

1.0
Y-Data

0.8

0.6

0.4

0.2

0.0

0 1 2 3 4
C1

Areas bajo la curva normal

Excel =Distr.norm.estand( valor de Z)

Minitab Calc > Probablity distributions > Normal


Cumulative probability, Mean 0, standar deviation 1
Input constant (valor de Z)
Media = 0
Optional storage (K1 o K2)
Data> Display data K1 K2
K2 Calc > Calculator Store result in C1 Expresion K2 - K1

K1 Minitab Excel
K2 K1 Área Área
Área entre ± Z = 1 sigmas 0.933193 0.0668072 0.8663858 0.8663856

Área entre ± Z = 2 sigmas 0.97725 0.0227501 0.9544999 0.95449974

Área entre ± Z = 3 sigmas 0.99865 0.0013499 0.9973001 0.9973002

Área antes de Z = -1.5 0.0668072 0.0668072 0.0668072

Área después de Z = 0.8 0.211855 0.211855 0.2118554


Restar a 1 o dar - Z

Área entre Z=-1.5 y Z=0.6 0.725747 0.0668072 0.6589398 0.65893968

Para cambiar el número de decimales mostrado en las columnas seleccionándolas y


Editor > Format column > Numeric Fixed decimal with 8 u otro

Página 11 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Minitab 15 FUNCIONES DE PROBABILIDAD

1. Función de densidad de probabilidad

Se tiene un paquete de 4 baterias, cada una dura al menos 100 horas con una probabilidad
del 95%
¿Cuál es la probabilidad de que 4 baterias duren al menos 100 horas, 3 baterias, 2 y 1 baterias?

Este es un problema de distribución binomial:

1    En la columna Data poner 1, 2, 3, and 4 en la Worksheet


2    Calc > Probability Distributions > Binomial.
3   Probability.
4    En Number of trials, poner 4. In Event probability, poner 0.95.
5    Seleccionar Input column Data. Click OK.

Probability Density Function


Binomial with n = 4 and p = 0.95
x P( X = x )
1 0.000475 Esto representa la probabilidad de que 1, 2, 3, o 4 baterias duren
2 0.013538 al menos 100 horas
3 0.171475
4 0.814506

2. Función de distribución normal acumulada (obtener el área bajo la curva en función de un estadístico)

Calc > Probability Distributions > Normal


Calcula la densidad de probabilidad, probabilidades acumuladas, probabilidades acumuladas inversas
para la distribución normal.

Para el caso de una probabilidad o área bajo la curva normal, con media de 28 y desviación estándar de 1
Si se quiere el área entre 0 y 27 se tiene:

1    Calc > Probability Distributions > Normal.


2    Seleccionar Cumulative probability.
3    En Mean, poner 28. En Standard deviation, poner 1.
4    Seleccionar Input constant y poner 27. Click OK.

Si se selecciona una columna para guardar los resultados,


solo con la instrucción:
Display > Display Data
Cumulative Distribution Function
x
Normal
P( X <= x with mean = 28 and standard deviation = 1
 )
27
0.158655

Suponiendo que se quiere el valor P del estadístico F de un análisis de regresión con grados de
libertad de la regresión de 3 y grados de libertad del error de 2, y un estadístico F de 4.86

El valor P es igual a 1 - Función acumulada de F

1    Calc > Probability Distributions > F.


2    Seleccionar Cumulative probability.
3    En Numerator degrees of freedom, poner 3. En Denominator degrees of freedom, poner 2.
4    Seleccionar Input constant and enter 4.86.
5    En Optional storage, poner K1. Click OK.
K1 contiene la función de distribución acumulada. Usar la Calculator para restar el valor P de 1.
6    Calc > Calculator.
7   En Store result in variable, poner P-value.
8   En Expression, 1-K1. Click OK.

P_Value
0.1753693 No es significativo a un 0.05 de nivel de significancia.

3. Cálculo de la probabilidad acumulada inversa (se da el área y se obtiene el estadístico).

Página 12 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

En el inciso 2 se encontró que el áre abajo la curva en X = 27 es de 0.1587, en base a esto se quiere
determinar al revés el estadístico normal que genera el área de 0.1587.

1   Calc > Probability Distributions > Normal.


2    Seleccionar Inverse cumulative probability.
3    En Mean, poner 28. En Standard deviation, poner 1.
4    Seleccionar Input constant y poner 0.1587, click OK.

Inverse Cumulative Distribution Function


Normal with mean = 28 and standard deviation = 1
P( X <= x ) x
0.1587 27.0002

4. Determinación de valores críticos (que definen zonas de rechazo) para pruebas de hipótesis
Por ejemplo para una distribución Chi cuadrada con alfa = 0.02 y 12 grados de libertad.
El valor alfa de 0.02 corresponde a una distribución acumulada de 0.98.

1    Calc > Probability Distributions > Chi-Square.


2    Seleccionar Inverse cumulative probability. En Degrees of freedom, poner 12.
3    Seleccionar Input constant y poner 0.98. Click OK.

Inverse Cumulative Distribution Function


Chi-Square with 12 DF
P( X <= x ) x Si el estadístico de prueba con datos de la muestra es mayor que este
0.98 24.0540 valor, se rechaza la hipótesis nula.

Minitab 15 Graficas de probabilidad

1. Obtener la distribución lognormal con una localización de 8, escala de 0.5, y un threshold de 0.


1    Graph > Probability Distribution Plot.
2    Seleccionar View Single, y click OK.
Distribution Plot
3    De la Distribution, seleccionar Lognormal. Lognormal, Loc=8, Scale=0.5, Thresh=0

4    En Location, poner 8. 0.00030


5    En Scale, poner 0.5.
0.00025
6    Click OK.
0.00020
Density

0.00015

0.00010

0.00005

0.00000
0 2000 4000 6000 8000 10000 12000
X

2. Suponer que se está analizando la tasa en el cual los bulbos de una máquina tiended a quemarse,
se asume que la distribución de Weibull modela este proceso.

1    Graph > Probability Distribution Plot.


2    Seleccionar Vary Parameters, click OK.
3    De la Distribution, seleccionar Weibull.
4    En Shape, teclear 1 1.5 2 2.5 3 3.5.
5    En Scale, poner 1.
6    Click Multiple Graphs.
7    En Show Distributions, seleccionar In separate panels of the same graph.
8    Click OK en cada cuadro de diálogo

Distribution Plot
Weibull, Scale=1, Thresh=0
0 2 4
Shape=1 Shape=1.5 Shape=2
1.5

1.0

0.5
Density

0.0
Shape=2.5 Shape=3 Shape=3.5
1.5
Página 13 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Distribution Plot
Weibull, Scale=1, Thresh=0
0 2 4
Shape=1 Shape=1.5 Shape=2
1.5

1.0

0.5
Density

0.0
Shape=2.5 Shape=3 Shape=3.5
1.5

1.0

0.5

0.0
0 2 4 0 2 4
X

Para el caso de distribuciones normales con medias 100 130 150 180 y desv.estándar 20

1    Graph > Probability Distribution Plot.


2    Seleccionar Vary Parameters, click OK.
3    De la Distribution, seleccionar Normal.
4    En Means, teclear 100 130 150 180
5    En Estándar deviation, poner 20.
6    Click Multiple Graphs.
7    En Show Distributions, seleccionar Overlaid in the same graph
8    Click OK en cada cuadro de diálogo

Distribution Plot
Normal, StDev=20
Mean
0.020
100
130
150
180
0.015
Density

0.010

0.005

0.000
50 100 150 200 250
X

Para el caso de distribuciones de Poisson con medias 2 4 6 8 10 15 20 25

1    Graph > Probability Distribution Plot.


2    Seleccionar Vary Parameters, click OK.
Distribution Plot
3    De la Distribution, seleccionar Poisson Poisson
4    En Means, teclear 2 4 6 8 10 15 20 25 0 20 40

5    Click Multiple Graphs. M ean=2 M ean=4 M ean=6

6    En Show Distributions, 0.2

seleccionar In separate panels of the same graph. 0.1

7    Click OK en cada cuadro de diálogo 0.0


M ean=8 M ean=10 M ean=15
Probability

0.2

0.1

0.0
Mean=20 M ean=25 0 20 40

0.2

0.1

0.0
0 20 40
X

3. Comparar dos distribuciones


El número de llamadas de clientes a un Call center es modelada por una distribución de Poisson
con una media de 25.75, se quiere comparar si sigue una distribución normal con parámetros estimados
de la muestra.

Página 14 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

1    Graph > Probability Distribution Plot.


2    Seleccionar Two Distributions, click OK.
3    De la Distribution 1, seleccionar Poisson.
4    En Mean, poner 25.75.
5    De la Distribution 2, seleccionar Normal.
6    En Mean, poner 25.75.
7    En Standard Deviation, poner 4.95.
8    Click OK.

Distribution Plot
0.09 Distribution Mean
Poisson 25.75
0.08 Distribution Mean StDev
Normal 25.75 4.95
0.07

0.06
Density

0.05

0.04

0.03

0.02

0.01

0.00
10 15 20 25 30 35 40 45
X

La distribución normal casi aproxima a la de Poisson

4. Mostrar áreas bajo la curva de probabilidad

Se trata de ver el área que incluye al 10% de los alumnos que obtuvieron las calificaciones más altas
a partir del 90%, con una media de 1211 y una desviación estándar de 320, y ver si la calificación de
1738 entra en esta zona.

1    Seleccionar Graph > Probability Distribution Plot.


2    Seleccionar View Probability, click OK.
3    De la Distribution, Seleccionar Normal.
4    En Mean, poner 1211. En Standard deviation, poner 320.
5    Click en Shaded area. En Define Shaded Area By, seleccionar X Value.
6    Click Right Tail. En X value, poner 1738.
7    Click OK en cada cuadro de diálogo

Distribution Plot
Normal, Mean=1211, StDev=320
0.0014

0.0012

0.0010

0.0008
Density

0.0006

0.0004

0.0002
0.0498
0.0000
1211 1738
X

O para un 10% del área:


5    Click en Shaded area. En Define Shaded Area By, seleccionar Probab., Right Tail, 0.10.

Distribution Plot
Normal, Mean=1211, StDev=320
0.0014

0.0012

0.0010

0.0008
Density

0.0006 Página 15 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Distribution Plot
Normal, Mean=1211, StDev=320
0.0014

0.0012

0.0010

0.0008
Density

0.0006

0.0004

0.0002
0.1

0.0000
1211 1621
X

El valor de 1738 si entra en la zona.

Solo como demostración para el caso de dos colas:


5    Click en Shaded area. En Define Shaded Area By, seleccionar Probab., Both Tails, 0.10.

Distribution Plot
Normal, Mean=1211, StDev=320
0.0014

0.0012

0.0010

0.0008
Density

0.0006

0.0004

0.0002
0.05 0.05
0.0000
685 1211 1737
X

3.5      Prueba de normalidad


Es una prueba de hipótesis de una población para determinar si la muestra se extrae de una
población normal, que es la hipótesis nula. La hipótesis alterna es que no es normal.

Se puede hacer por diversos métodos:

1. Método gráfico
Se trata de probar la flamabilidad de una fibra y ver si sigue una distribución normal,
además se quiere observar su valor en el percentll 87avo.

1    File > Open worksheet FLAMERTD.MTW.


2    Graph > Probability Plot.
3    Seleccionar Single, click OK.
4    En Graph variables,seleccionar Fabric.
5    Click Scale, y click el Percentile Lines .
6    En Show percentile lines at Y values, teclear 87. Click OK en cada cuadro de diálogo.

Probability Plot of Fabric


Normal - 95% CI
99
Mean 3.573
StDev 0.5700
95 N 15
AD 0.310
90
P-Value 0.517
80
70
Percent

60
50
40
30
20

10

1
2 3 4 5 6
Fabric Página 16 de 29
Probability Plot of Fabric
Mintab V15 Normal - 95% CI Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007
99
Mean 3.573
StDev 0.5700
95 N 15
AD 0.310
90
P-Value 0.517
80
70

Percent
60
50
40
30
20

10

1
2 3 4 5 6
Fabric

Los puntos no salen del intervalo de confianza del 95%


El IC del 87% se encuentra entre los valores 3.84295 y 4.58790

2. Prueba de hipótesis con prueba de Anderson Darling


Esta prueba compara la función de distribucion acumulada empirica de los datos
de la muestra con la distribución esperada si los datos fueran normales
Si la diferencia observada es suficientemente grande, se rechaza la hipótesis nula
de normalidad de la población.

Utilizando el archivo de datos de DETERGENTE.MTW anexo


Copiar los datos del archivo a Minitab

Las hipótesis son las siguientes:

Ho: Los datos SI provienen de una población distribuida normalmentePvalue de prueba >0.05
Ha: Los datos NO provienen de una población distribuida normalmen Pvalue de prueba <= 0.05

Stat > Basic statistics > Normality Test


en Variable indicar la columna de Pesos
Seleccionar la prueba de Anderson Darling

Probability Plot of Peso en gr


Normal AD - El estadístico de Anderson
99.9
Mean 4043 Darling está en función de las
StDev 66.76
99 N
AD
500
0.426
distancias entre los puntos y la
95
90
P-Value 0.314 recta es mejor un valor menor
80
70
Percent

60
50
40
P Value indica la probabilidad
30
20 de equivocarnos al rechazar el
10
5
supuesto de normalidad cierto
1

0.1 Un valor P de menos de 0.05


3800 3900 4000 4100 4200 4300
Peso en gr indica que los datos no son
normales, en este caso si lo son.

Otra forma de hacerlo es con:

Graph > Probability Plot: Single Probability Plot of Peso en gr


Normal - 95% CI

en Graph Variable indicar la columna de Pesos 99.9


Mean 4043
StDev 66.76
99 N 500
AD 0.426
En la gráfica se deben observar 95
90
P-Value 0.314

la gran mayoría de puntos dentro 80


70
Percent

60
del intervalo de confianza y 50
40
30
obtener un P value mayor a 0.05 20
10
para indicar que los datos siguen 5

una distribución normal 1

0.1
3800 3900 4000 4100 4200 4300
Peso en gr

Probability Plot of AtoBDist


Minitab 15 Ejemplo con el archivo CRANKSH.MTW Normal
99.9

1    File > Open worksheet CRANKSH.MTW. 99


Mean
StDev
0.4417
3.491
N 125

2    Stat > Basic Statistics > Normality Test. 95


90
AD
P-Value
0.891
0.022

80
70
Percent

60
50
40
30
20
10
5

0.1

Página
-10 17 -5de 29 0 5 10
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007
Probability Plot of AtoBDist
Normal
99.9
Mean 0.4417
StDev 3.491
99
N 125
AD 0.891
95 P-Value 0.022
90

3    En Variable, seleccionar AtoBDist. Click OK. 80


70

Percent
60
50
40
30

AtoBDist 20
10

-0.44025 El valor P es menor a 0.05 5

5.90038 por tanto los datos no siguen 1

0.1
2.08965 una distribución normal -10 -5 0 5 10
AtoBDist
0.09998
2.01594
4.83012
Etc.

3. Con otras pruebas de hipótesis


Prueba de normalidad de Ryan Joiner
Esta prueba evalúa la normalidad calculando la correlación entre los datos de
la muestra y datos normales. Si el coeficiente de correlación es cercano a uno,
la población es normal. Es similar a la prueba de Shafiro Wilk.
Se compara el coeficiente de correlación con el valor crítico, si es menor se rechaza la normalidad.

Prueba de normalidad de Kolmogorov Smirnov


Esta prueba compara la función de distribución acumulada de la muestra con la
distribución esperada de los datos si fueran normales. Si la diferencia obervada es
suficientemente grande, la prueba rechaza la hipótesis nula de normalidad.
Si el valor P se esta prueba es menor al alfa seleccionado se rechaza la
hipótesis nula de normalidad.

Prueba del lápiz grueso


Es una prueba informal de normalidad, aplicando la punta de un lapiz grueso a la línea de datos
en la gráfica normal, si cubre todos los puntos, la gráfica es probable que sea normal.

Minitab 15 Prueba de Bondad de ajuste de datos con la Distribución de Poisson


Sirve para determinar si un modelo estadístico se ajusta a los datos, analizando las
diferencias entre los valores observados y los valores esperados en el modelo.
Para datos continuos, se puede visualizar con una gráfica de probabilidad, o
cuantitativamente con una prueba de hipótesis tal como la de Anderson Darling,
para datos categóricos, se puede usar la prueba Chi cuadrada o con Minitab la prueba
de bondad de ajuste para datos de Poisson o logística.

Las hipótesis son:

Ho: El modelo adecuadamente describe los datos


Ha: El modelo no describe adecuadamente los datos.

Para el caso de Poisson:


1. File > Open Worksheet ACCIDENT.MTW

Accidents
2 3 3 4 4
0 0 1 4 0
2 3 3 3 4
2 3 2 2 1
4 1 4 4 0
1 2 4 1 2
4 3 3 2 2
0 0 4 0 4
4 1 2 1 1
2 2 3 3 2

2    Stat > Basic Statistics > Goodness-of-Fit Test for Poisson.


3    En Variable, seleccionar Accidents.
4    Click OK.

Goodness-of-Fit Test for Poisson Distribution


Data column: Accidents
Poisson mean for Accidents = 2.24

Página 18 de 29
Mintab V15 Módulo 3. Estadítica Descriptiva P. Reyes / Nov. 2007

Poisson Contribution
Accidents Observed Probability Expected to Chi-Sq
0 7 0.106459 5.3229 No se rechaza Ho, los datos si siguen
1 8 0.238467 11.9234 la Distribución de Poisson
2 13 0.267083 13.3542 0.00939
Chart of Observed and Expected Values
3 10 0.199422 9.9711 0.00008
14 Expected
O bserv ed

>=4 12 0.188569 9.4285 0.70136


12

N N* DF Chi-Sq P-Value 10

50 0 3 2.53020 0.470 8

Value
6

0
Accidents 0 1 2 3 >=4

3.6      Aplicaciones

Realizar los ejercicios del Módulo 3 incluidos en el archivo CursoTallerMinitabEjercicios

Página 19 de 29
ARCHIVO DETERGENTE.MTW

Contiene datos de peso en gramos de 500 paquetes de detergente con peso nominal de 4 grs.
indicando en cuál de las 2 líneas se ha llenado:

Peso en gr Línea de llenado


3996 2
3935 1
4093 2
3993 1
4041 1
4034 2
4047 1
4085 2
4096 2
3971 1
4036 1
3951 1
4068 2
4051 2
4079 2
4042 2
4082 2
4128 2
4082 1
3895 1
3954 1
4022 1
4091 2
4113 1
4082 2
3995 1
3986 1
4065 1
4057 2
4179 2
4022 2
4057 2
4099 2
3980 1
4054 1
4162 2
4113 2
4048 2
4061 2
4142 2
4008 2
4100 2
3892 1
3965 1
4105 2
4034 1
4173 2
4109 2
4104 2
4143 2
3959 1
3975 1
4009 1
3968 1
4008 1
4014 1
4121 2
3903 1
4096 2
4160 2
3954 1
4176 2
4039 2
3952 1
4170 2
3988 1
4064 2
3948 1
3992 1
4106 2
3956 1
4146 2
3971 1
4040 1
3980 1
4060 2
4090 2
4003 1
4038 1
3925 1
4048 1
4145 2
3982 1
3899 1
4128 2
3927 1
4174 2
4023 1
3938 1
3986 1
4046 2
4115 2
4096 2
3965 1
3926 1
3988 1
3946 1
4154 2
3976 1
4009 2
3943 1
4107 2
4070 1
4119 2
4016 2
3995 1
4021 2
4027 2
3957 1
4094 2
4031 2
4008 2
4062 1
3978 1
3928 1
4057 1
4052 1
3969 1
4065 2
4062 1
4090 2
4063 2
4131 2
3973 2
4059 2
3980 1
4090 2
4015 1
4005 2
4017 1
4028 2
4043 1
4078 2
4069 2
4058 1
4032 2
4005 2
4098 2
4047 1
4097 2
4021 1
3925 1
3960 1
4157 2
4026 1
3930 1
3969 1
4070 1
3935 1
4022 2
4040 1
4126 2
4120 2
4065 2
4034 2
4076 1
4025 2
4090 2
4052 1
4117 2
4086 2
4142 2
4118 2
4183 2
4112 2
4055 1
4012 2
3976 1
3973 1
4148 2
4121 2
3958 1
4020 1
4036 1
4000 1
4067 1
4075 2
3981 1
3997 1
4008 1
4036 1
4079 2
3986 1
4123 2
3994 2
4158 2
4002 1
4042 2
4023 2
4111 2
4187 2
3970 1
4046 1
4086 2
4040 2
4039 1
3934 1
3984 2
3993 1
4042 1
3927 1
3928 1
4041 1
3987 1
3982 1
4095 2
4073 2
4196 2
4078 2
4068 1
4078 1
4143 2
3977 1
4069 2
4088 1
3956 2
4033 1
4088 2
4046 1
4044 2
4085 2
4029 1
4011 2
4173 2
4052 1
4105 1
4132 2
4094 2
4036 2
4009 2
4008 1
4063 1
4092 2
4030 1
4042 1
4008 1
4087 2
4002 1
4074 2
4050 2
4106 1
4092 2
4056 2
4064 1
4068 2
3969 1
4061 1
4138 2
4125 2
3997 2
3944 1
4047 2
4020 1
3896 1
4119 2
4005 1
3903 1
4143 2
4085 1
4041 1
3971 1
4087 2
4097 1
3945 1
4077 2
4044 2
4098 2
4069 2
4056 2
4015 1
3982 2
4181 2
4046 1
4061 2
3958 1
4018 1
4173 2
4020 1
4097 2
4029 1
4107 2
3957 1
4158 2
4098 2
3975 2
4042 1
4024 1
4111 2
4048 2
4015 1
4050 1
4076 2
4134 2
4047 2
4041 2
4055 2
4080 2
4008 1
4082 2
3958 1
3965 2
4038 1
4070 1
3967 1
4094 2
4006 2
4130 2
4047 1
4069 1
4172 2
3979 1
3997 1
4123 2
4188 2
4118 2
4033 2
4043 1
3966 1
4162 2
4035 2
4057 2
3889 1
3987 1
4050 1
3973 1
4067 2
4159 2
4022 1
4134 2
3978 1
4002 1
3991 1
4069 1
4059 2
3953 1
4156 2
4077 2
4030 2
3975 1
4133 2
4030 2
4070 2
3983 1
4025 1
4115 2
4135 2
4085 2
3980 1
4015 1
4091 2
4110 2
3957 1
3962 1
3983 1
4069 1
4073 2
4054 2
4016 1
4143 2
4032 2
3998 1
3968 1
4004 2
4083 2
4019 1
4185 2
3988 2
3952 1
4120 2
4025 2
4053 2
3998 1
3982 1
4160 2
4153 2
4120 2
3962 1
4093 2
4155 2
4086 2
4006 1
4035 2
4056 2
4088 2
4060 2
3877 1
4060 1
4027 1
3954 2
3968 1
4083 2
3999 1
4125 2
4036 1
3914 1
3964 2
3976 1
4031 1
4015 1
4141 2
4101 2
4043 1
3946 1
3989 1
3956 1
3977 1
4053 1
3977 1
4082 2
4119 2
3971 1
4009 1
4098 2
3948 1
3983 1
4064 1
4022 2
4102 1
3894 1
3985 1
3961 1
4195 2
4066 1
4018 1
4126 2
3988 1
4103 2
4070 1
4158 2
4083 2
4049 2
3999 2
4094 2
4070 2
4000 2
4151 2
4013 1
4013 1
4067 1
3978 1
3982 1
4080 2
4096 2
4202 2
3975 1
4021 1
4004 1
4080 2
4136 2
4063 2
4139 2
4016 1
4047 1
4068 1
4067 2
4114 2
3993 1
4018 1
3890 1
3927 1
4059 1
4004 2
4048 1
3989 1
4027 1
4024 1
3923 1
4081 2
4103 2
4013 2
4094 1
3933 1
4101 2
4134 2
3892 1
4175 2
3927 1
3984 1
3898 1
4109 2
4100 2
4073 1
4101 2
4005 1
4125 2
4036 1
4146 2
4029 1
4102 2
4019 2
4074 2
3962 1
3925 1
4039 2
3929 1
4008 1
4064 2
4001 1
3992 1
4029 2

Das könnte Ihnen auch gefallen