Sie sind auf Seite 1von 76

MANUAL DE MEGASTAT

Departamento: Ciencias

Área: Estadística

Autores: Docentes de Estadística

2014

1
Contenido

1. Procedimientos básicos…………………………………………………………………………4

2. Tutorial Ejemplos………...........................................................................................................13

Tema 1: ¿Cómo agregar el complemento megastat a excel? …….……..……...………...........13


Tema 2: Cuadros de distribución de frecuencias y estadística gráfica ………..………............17
Tema 3: Cálculo de medidas de resumen – tendencia central………………...……….............27
Tema 4: Cálculo de medidas de resumen – medidas de variabilidad ………...……….............29
Tema 5: V.A. y distribución de probabilidad discreta.. ………….……..……...………...........32
Tema 6: Distribución de probabilidad continua…………….. ………..……...………..............40
Tema 7: Muestreo y tamaño de muestra……………………..………………...………............43
Tema 8: Determinación de una muestra aleatoria……..……..………………...………............46
Tema 9: Estimación intervalica……….……………………..………………...……….............47
Tema 10: Estimación intervalica para diferencia de medias y proporciones…..………............50
Tema 11: Prueba de hipótesis para la media y proporción..…………………...………............58
Tema 12: Prueba de hipótesis para la diferencia de medias…………………...………............62
Tema 13: Prueba de hipótesis para la diferencia de proporciones…...………...………............67
Tema 14: Regresión Lineal Simple…..……………………..………………...………..............70
Tema 15: Aplicación Chi-Cuadrado……………………..………………...………..................74

2
Introducción a MegaStat

MegaStat12 es un complemento de Excel que realiza los análisis estadísticos dentro de un libro de
Excel. Una vez instalado aparece en el menú de Excel y funciona como cualquier otra opción
Excel. El propósito de este documento es presentar cómo funciona MegaStat. En el primer capítulo
se describen los procedimientos generales de operación y convenciones que son comunes en toda
MegaStat. En el segundo capítulo se trabajará a través de un par de tutoriales. La sección de
referencia muestra los cuadros de diálogo de todas las opciones y señala brevemente lo que se
espera de datos / entrada y los aspectos únicos de cada opción.

Mientras MegaStat es una excelente herramienta para el aprendizaje de las estadísticas, este
documento se centra en el uso de MegaStat y no está diseñado para enseñar estadística. De hecho,
se supone que sabe lo que hacen los distintos procedimientos y está familiarizado con la
terminología. También asume que usted tiene un conocimiento básico de trabajo de Excel.

1
MegaStat tiene derechos de autor y es una marca comercial registrada de JB Orris.
2
Este documento es escrito para la versión 10 de MegaStat, sin embargo, la mayor parte serán relevantes para otras
versiones.

3
1. Procedimientos Básicos

Cuando hacemos clic sobre MegaStat del menú principal de Excel (Figura 1). La mayoría de las
opciones de menú muestran sub-menús. Si un elemento del menú es seguido de puntos suspensivos
(...) de hacer clic mostrará el cuadro de diálogo para esa opción.

Barra Menú de Excel para MegaStat


de Sub menú MegaStat
Sub menú MegaStat

Menú principal de MegaStat

Figura 1. Menú MegaStat

Un cuadro de diálogo le permite especificar los datos que se utilizarán y otros insumos y opciones.
La Figura 2 muestra un cuadro de diálogo típico. Una vez que haya seleccionado los datos y las
opciones que hace clic en Aceptar, el cuadro de diálogo desaparece y MegaStat realiza el análisis.

Antes de ver los cuadros de diálogo específicos tomemos un minuto para mirar a algunos
problemas que son comunes a todas las opciones. Uso MegaStat es intuitivo y muy parecido a otras
operaciones de Excel, sin embargo, hay algunas características únicas para MegaStat y algunas
maneras de hacer uso más eficiente por lo que valdrá la pena su tiempo para ver el siguiente
material.

4
Figura 2. Caja de diálogo MegaStat
Botones

Cada caja de diálogo tiene los cuatro botones mostrados en la figura 2.

OK Este botón también puede ser etiquetado como "Calculate", "Go", "Execute" o "Do it". Le
decimos a MegaStat que se ha terminado de especificar las entradas y que se tiene el
control sobre las cosas que se hacen. En primer lugar, los valores ingresados son validados
y luego desaparece el cuadro de diálogo y se muestra la hoja de trabajo de salida. Cuando
desaparece la caja de diálogo, está todavía en memoria y contendrá las mismas entradas si
recordó más tarde.

Clear Este botón elimina todos los valores de entrada y restablece todas las opciones por defecto
de forma.

Cancel Este botón podría ser etiquetado como "Never mind". Simplemente oculta el cuadro de
diálogo. El cuadro de diálogo no se borra o elimina de la memoria. Los formularios de uso
no toman la cantidad de memoria y no hay problema con tener varios de ellos en la
memoria. Sin embargo, si usted realmente desea descargar el formulario, haga clic en la
"X" en la esquina superior derecha del formulario.

Help Este botón muestra la ayuda contextual para el formulario de uso activo. Si desea ver el
sistema de ayuda completo, utilice la selección Help en el menú principal.

5
Selección de datos

La mayoría de los cuadros de diálogo MegaStat tienen campos donde se selecciona rangos de
entrada que contienen los datos que se utilizarán. Los rangos de entrada se pueden seleccionar
cuatro formas:
1. Señalar y arrastrar con el ratón (el método más común).
Desde la caja de diálogo “pops-up” en la pantalla se puede bloquear algunos de sus datos.
Puede mover los cuadros de diálogo por la pantalla colocando el puntero del ratón sobre la
barra de título (el área de color en la parte superior), haciendo clic y manteniendo pulsado el
botón izquierdo del ratón mientras arrastra el cuadro de diálogo para una nueva ubicación.
Incluso puede arrastrar parcialmente fuera de la pantalla.

También se dará cuenta de que cuando se inicia la selección de datos arrastrando el puntero
del ratón, el cuadro de diálogo se transformará en un tamaño más pequeño para ayudarle a
ver los datos subyacentes. Se volverá automáticamente a tamaño completo cuando se suelta
el botón del ratón. También puede colapsar y no colapsar el cuadro de diálogo de forma
manual haciendo clic en el botón Cerrar en el extremo derecho del campo. Al hacer clic en
el botón de nuevo no se colapsa el formulario. (No utilice el botón "X" para no colapsar un
formulario).

2. Usando características de las AutoExpand del MegaStat

Señalar y arrastrar para seleccionar los datos puede ser tedioso, si usted tiene una gran
cantidad de datos. Cuando se arrastra el ratón hacia abajo es fácil la selección y entonces
tienes que arrastrar el ratón hacia atrás hasta llegar al área seleccionada correctamente.

AutoExpand permite la selección rápida de datos sin tener que arrastrar a través de toda la
columna de datos. He aquí cómo funciona:

 Asegúrese de que la caja de entrada tenga el foco. (Haga Click en ella o Tab en ella).
La caja de entrada tiene el foco cuando el puntero de inserción parpadea en ella.
 Seleccione una fila de datos haciendo clic en una celda de la columna que desee. Si
se selecciona más de una columna, arrastre el ratón a través de las columnas.
 El rango de datos se ampliará para incluir todas las filas de la región en la que ha
seleccionado una fila cuando se cumpla una de las siguientes:
o Doble click sobre el campo de entrada
o Click derecho sobre el campo de entrada
o Click izquierdo en la etiqueta junto al cuadro de entrada.
Con un poco de práctica se dará cuenta de que es una forma muy eficiente para seleccionar
datos. La única vez que no se puede utilizar es cuando desea utilizar una columna parcial de
los datos. También debe ser consciente de que la AutoExpand se detiene cuando encuentra
una celda en blanco; así cualquier suma u otros cálculos en la parte inferior de una columna
serían seleccionados. Es una buena práctica dejar una celda en blanco en la parte inferior de
cada columna antes de insertar fórmulas.

6
Nota: Al utilizar los métodos anteriores de selección de datos, puede seleccionar variables
en una secuencia alterna manteniendo pulsada la tecla CTRL mientras realiza varias
selecciones.

3. Tipeando el nombre de un rango con nombre


Si usted ha identificado previamente un rango de celdas utilizando el cuadro de nombre de
Excel, puede utilizar ese nombre para especificar un rango de datos en un formulario de
usuario MegaStat. Este método puede ser muy útil si usted está utilizando los mismos datos
de varios procedimientos estadísticos diferentes.

4. Tipeando una dirección de rango


Usted puede escribir cualquier dirección de rango de Excel válida, por ejemplo, B5: B43.
Esta es la forma menos eficiente para especificar rangos de datos, pero ciertamente
funciona.

Introducción de valores

Si un cuadro de entrada requiere un valor único, puede hacer uno de lo siguiente (asegúrese de que
el cursor de inserción parpadea en el cuadro):
 Escriba un valor en la caja.
 Haga click en cualquier celda de Excel que contiene un valor. Al hacer clic en una celda, la
dirección de la celda se muestra en el cuadro de entrada. Si hace doble-click en el cuadro de
entrada de la dirección va a cambiar con el valor en la celda.
 Escriba cualquier fórmula que usted pueda introducir en una celda. Usted no tiene que escribir
el signo ' = ' como lo haría en una celda de Excel.
 Escriba una dirección de celda, por ejemplo, B6, o el nombre de una celda nombrada.

Etiquetas de datos
Para la mayoría de los procedimientos de la primera celda en cada rango de entrada puede ser una
etiqueta. Si la primera celda de un rango es texto se considera una etiqueta; si la primera celda es un
valor numérico que es datos que se consideran. Si desea utilizar números como etiquetas de
variable debe introducir los números como texto por ellos precede con una simple comilla, por
ejemplo '2. A pesar de que Excel almacena horas y fechas como números, MegaStat reconocerán
como etiquetas si están formateados como valores de hora / fecha.

Si las etiquetas de datos no son parte de la gama de entrada, el programa utiliza automáticamente la
celda inmediatamente por encima del rango de datos como una etiqueta si contiene un valor de
texto.

Si una opción puede considerar toda la primera fila (o columna) de un rango de entrada como
etiquetas, cualquier valor numérico en la fila hará que toda la fila sea tratada como datos.

7
Si el programa detecta enteros secuenciales (1, 2, 3, ...) en un lugar donde es posible que desee
etiquetas se mostrará un mensaje de advertencia de lo contrario, la regla es: celdas de texto son las
etiquetas, las celdas numéricos son datos3.

Salida
Al hacer clic en OK en el cuadro de diálogo MegaStat se realiza un análisis estadístico y necesita
un lugar para poner su salida. Busca una hoja de cálculo denominada output. Si encuentra uno que
va al final de la misma y añade su salida; si no encuentra una hoja Output crea uno. MegaStat
nunca hará ningún cambio en las hojas de trabajo del usuario, sólo se envía la salida a su hoja de
Output.

MegaStat hace un buen intento de dar formato a la salida, pero es importante recordar que la hoja
Output es sólo una hoja de cálculo estándar de Excel y puede ser modificado de ninguna manera
por el usuario. Usted puede ajustar los anchos de columna y cambiar cualquier formato que usted
piensa que necesita mejorar. Puede insertar, eliminar y modificar las células. Puede copiar todo o
parte de la producción a otra hoja de cálculo o de otra aplicación, como un procesador de textos.

Gráficos MegaStat obtienen sus valores de celdas de la hoja Output (o una de las hojas de cálculo
en el caso del Diagrama de dispersión). Puede hacer clic en un gráfico y seleccione " Source Data"
para ver que valores son mostrados.

Al hacer click en un gráfico de la opción del menú MegaStat desaparecerá de la barra de menú
principal desde el menú gráfico se activa. Haga click fuera de la tabla para traer de vuelta al menú
principal que contiene el elemento del menú MegaStat.

Cuando el programa genera una salida que se ajusta ancho de las columnas para la salida corriente.
Si usted tiene salida previa a partir de una opción diferente ya en la hoja Output, los anchos de
columna para la salida anterior pueden quedar en mal estado. Usted puede tratar de solucionar este
problema ajustando manualmente los anchos de columnas o por siempre a partir de una nueva hoja
de salida.

El menú Utilities tiene opciones para borrar la hoja Output o hacer una copia de ella y comenzar
una nueva.

Repeat Last Option


Una vez que ha realizado una opción MegaStat, esta selección del menú le permitirá volver a
mostrar el último cuadro de diálogo sin tener que pasar por las selecciones de menú. Esto puede ser
útil si usted necesita hacer un cambio o cuando se necesita para repetir la misma operación con los
diferentes conjuntos de datos.

Generate Random Numbers


Esta opción le permite crear números aleatorios.

3 Una excepción es la opción Tabla de contingencia (Crosstabulation) que pueden contar con los datos de
texto.

8
Utilities
El menú Utilities contiene algunos elementos que realizan funciones útiles.

Insert descriptive information


Esta opción se utiliza para identificar la salida. Se insertará filas con etiquetas para
Descripción, Nombre, fuente de datos, hora y versión. A continuación, utiliza las celdas
adyacentes a escribir la información apropiada. Figura 7 en el próximo capítulo muestra una
hoja Output después de hacer clic esta opción.

La línea de la fuente de datos mostrará el nombre y la ubicación del libro activo y la hoja de
trabajo accedido más recientemente. La entrada de tiempo con espectáculo de la fecha actual /
hora y la versión de MegaStat.

Esta opción no se limita a las hojas de salida MegaStat - puede ser utilizado en cualquier hoja
de cálculo de Excel.

ChartDataSheet utilities
Con el fin de mostrar una salida gráfica (por ejemplo, un gráfico) Excel debe hacer referencia a
los valores en una hoja de cálculo. Si los valores no están disponibles como una parte de la
hoja de salida, MegaStat los almacena en una hoja de cálculo oculto llamado
"ChartDataSheet_". Si MegaStat necesita un ChartDataSheet crea uno menos que ya existe, en
cuyo caso se añade sus valores hasta el final.

Las siguientes opciones usan ChartDataSheets:


Descripitive Statistics – BoxPlot
Regression Analysis – Plot residuals by X values
Regression Analysis – Normal Probability Plot
Quality Control Process Charts

En general, usted no necesita preocuparse por ChartDataSheets; sin embargo, existen las
siguientes utilidades para los usuarios avanzados.

View

Existen ChartDataSheets sólo como valores de las cartas y por lo tanto la salida no está
etiquetado. Sin embargo, en la parte superior de cada sección de salida es una etiqueta
diciendo qué tipo de gráfico es usado para un sello de fecha / hora. En el gráfico
correspondiente también hay una marca de fecha / hora para que pueda asociar los datos
con un gráfico.

Si cambia o elimina cualquiera de los valores en los ChartDataSheet se cambiará el gráfico


correspondiente.

Hide

Esto ocultará la ChartDataSheet después de verlo. También puede utilizar Formato de


Excel | Hoja de comando para ver / ocultar ChartDataSheets.
9
Delete

Usted podría utilizar esta opción si desea eliminar un ChartDataSheet que ya no tiene
gráficos asociados. Si se elimina un ChartDataSheet que tiene un gráfico existente, seguirá
existiendo la tabla, pero no tendrá ningún valor graficado. No se puede deshacer, así que
asegúrate antes de hacer clic en OK.

Start new output sheet


Si hay una hoja Output existente que pasará a llamarse Output(2) para que su próxima salida
será en una hoja Output fresca. Puede cambiar el nombre Output(2) a lo que quieras haciendo
doble click en el nombre de la pestaña.

Delete output sheet


Esta opción elimina la hoja Output actual. Se presentará un mensaje de advertencia porque no
hay manera de recuperar una hoja una vez que se elimina.

Deactivate MegaStat
Esta opción se utiliza para eliminar el elemento 'MegaStat' desde el menú principal. No
elimina los archivos o desinstalar MegaStat. Para restaurar el elemento de menú 'MegaStat'
click en Archivo | Opciones | Complementos | Ir en la barra de menú principal del Excel y
luego marque la opción MegaStat que podrás ver en la lista de complementos disponibles.

Uninstall MegaStat
Este elemento de menú en realidad no desinstalar MegaStat. Se muestra un cuadro de diálogo
que le pide sobre cómo iniciar el proceso de desinstalación se describe a continuación.

La desinstalación es el proceso de eliminación de los archivos instalados MegaStat de su


sistema. No elimina los archivos de datos ni eliminar el archivo que utilizó para instalar
MegaStat. Usted puede eliminar el archivo de instalación (MegaStat_Setup.exe) si todavía
está en el sistema.

Pasos para desinstalar:


1. Desactivar MegaStat usando el menú Utilities.
2. Salir del Excel.
3. Click: Start | Settings | Control Panel | Add/Remove Programs.
4. Encuentra MegaStat en la lista de programas, haga click en él y luego haga clic en el
botón Add / Remove
[Si ha instalado MegaStat manualmente sin necesidad de utilizar un programa de instalación
de desinstalarlo mediante la búsqueda y eliminación: Megastat.xla y Megastat.hlp.]

Help/Information

Help System
Esta opción muestra el programa completo de ayuda MegaStat.

10
La sección '¿Cómo funciona? (Procedimientos generales de funcionamiento)’ contiene toda la
información en este tutorial. Puede hacer clic en los temas específicos o buscar un elemento
en particular, haga clic en Índice.

Figura 3 MegaStat Help System

Acerca del MegaStat

Esta opción muestra información corriente de la versión. Hay también links para el sitio web
MegaStat y e_mail para soporte técnico. Estos links sólo funcionarán si usted tiene una conexión a
Internet activa y su sistema está configurado para responder adecuadamente a Internet y correo
electrónico enlaces.

El formulario también contiene un botón System Information, lo que hace que la forma de ampliar
y mostrar algo de información técnica sobre los parámetros del sistema y las ubicaciones de los
archivos. Si hace click en el botón Insert, la información se colocará en la hoja Output actual. Si
hace click en Hide System Information, el formulario volverá a su tamaño original.

11
2. Ejemplos Tutorial

Aunque MegaStat realiza muchas opciones estadísticos diferentes los diversos cuadros de diálogo
de todas funcionan de la misma manera y tienen objetos estándar de Excel (cuadros de entrada,
botones, casillas de verificación, etc.). Por lo tanto, no es necesario para mostrar ejemplos gráficos
de cada opción MegaStat. En este capítulo se trabajará a través de algunos ejemplos detallados y se
señalan algunas cosas que son únicas para MegaStat. El siguiente capítulo proporcionará una fuente
de referencia para las distintas opciones.

TEMA 1: ¿CÓMO AGREGAR EL COMPLEMENTO MEGASTAT A EXCEL?

1. Ir al aula virtual del curso y guardar el archivo: MegaStat (saber dónde se guardó el archivo, solo
guardar y no abrir)
2. Abrir una hoja de Excel.

12
13
14
TEMA 2: CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS Y ESTADÍSTICA
GRÁFICA

1. Descargar el archivo Base_de_datos_Lab1 – Microsoft Excel del aula virtual y guardar el


archivo en el escritorio.
2. Trabajar con el Ejemplo 1,
VARIABLE CUALITATIVA NOMINAL (Los pasos para trabajar las variables cualitativas tanto
nominales como ordinales son los mismos)

Paso1. Identificar la variable de estudio: Tipo de Metal


Paso2. Escribir las modalidades de la variable de estudio (posibles respuestas)

Paso3. Ir a la pestaña COMPLEMENTOS, clic en MEGASTAT, seleccionar Frecuency


Distributions, clic en Qualitative.

15
Se presenta el siguiente cuadro:

Donde:
 Input Range: datos de origen
 Specification range: modalidades de la variable de estudio
Paso4: Seleccionamos los datos a estudiar y clic en OK

Se ingresan los datos


considerando la
primera fila de “La
etiqueta de la variable”

Obtenemos una nueva hoja llamada Output, donde se presenta un CDF (Cuadro de Distribución de
Frecuencias) resumido y un gráfico de barras.

16
Paso5: Completar el CDF, agregando número de cuadro, título, fuente, elaboración, hi%, Pi.

Paso6: Completar el gráfico de barras agregando número de gráfico, título, fuente, elaboración.

Paso7: Dado que es una variable cualitativa, también se puede realizar un gráfico circular, agregar dicho
gráfico, usando los gráficos de Excel.
Primero: Seleccionamos las modalidades del Tipo de Metal y los datos de Pi.

Segundo: Colocar el número de gráfico, título, fuente y elaboración.

17
3. Trabajar con el Ejemplo 2,
VARIABLE CUANTITATIVA DISCRETA (se siguen los mismos pasos que para una VARIABLE CUALITATIVA)
Paso1. Identificar la variable de estudio: números de imperfecciones observadas en los componentes de
computadoras
Paso2. Escribir las modalidades de la variable de estudio (posibles respuestas)

Paso3. Ir a la pestaña COMPLEMENTOS, clic en MEGASTAT, seleccionar Frecuency Distributions, clic en


Qualitative.

18
Paso4: Seleccionamos los datos a estudiar y clic en OK

Se ingresan los
datos
considerando
la primera fila
de “La
etiqueta de la
variable”

Obtenemos una nueva hoja llamada Output, donde se presenta un CDF (Cuadro de Distribución de
Frecuencias) resumido y un gráfico de barras.

Paso5: Completar el CDF, agregando número de cuadro, título, fuente, elaboración, Fi, Hi%.

19
Paso6: Completar el gráfico de barras agregando número de gráfico, título, fuente, elaboración.

Paso7: Dado que es una variable cuantitativa discreta, se puede realizar un gráfico de bastones, agregar
dicho gráfico, usando los gráficos de Excel.
Primero: Seleccionamos los datos fi o hi%

Segundo: Hacemos clic en Insertar, Gráficos, Línea, Líneas.

Tercero: Hacer clic en Herramientas de Gráficos, Diseños de Gráficos, seleccionar el Diseño 1

Cuarto: Colocar el número de gráfico, título, fuente y elaboración.

20
Quinto: Modificar las modalidades del eje X: nro de imperfecciones
Click en el gráfico, Seleccionar datos

En la segunda columna clic en Editar, seleccionar las modalidades del nro de imperfecciones,
Aceptar, Aceptar

21
Hacer clic en el gráfico, ir a la pestaña Herramientas de gráficos, Presentación, Análisis, Líneas,
Líneas de Unión

Hacer clic en la línea azul, anticlic, dar formato a serie de datos, Color de línea, Sin línea.

22
1
2

Otro tipo de gráfico para variable cuantitativa discreta,


es el gráfico de escalones, pero que por el momento no
Obtenemos el gráfico de bastones para frecuencias absolutas simples. hay una opción para construirlo en el Excel.

4. Trabajar con el Ejemplo 3,


VARIABLE CUANTITATIVA CONTINUA (INTERVALOS)
Paso1. Identificar la variable de estudio: Fuerza de Tirantez
Paso2. Dado que es una variable cuantitativa continua, hallar:

23
Paso3. Ir a la pestaña COMPLEMENTOS, clic en MEGASTAT, seleccionar Frecuency Distributions, clic en
Quantitative

Se presenta el siguiente cuadro:

Se ingresan los datos


considerando la
primera fila de “La
etiqueta de la variable”

Donde:
 Input Range: datos de origen
En Equal width intervals
 Interval width: amplitud
 Lower boundary of first interval: valor mínimo

En Options

24
Obtenemos una nueva hoja llamada Output, donde se presenta un CDF (Cuadro de Distribución de
Frecuencias), un histograma, un polígono y el gráfico de la Ojiva.

25
Paso5: Completar el CDF, agregando número de cuadro, título, fuente, elaboración.
Histograma de Frecuencia
Ojiva

Ogive

100.0
75.0
50.0
25.0
0.0
169 182 195 208 221 234 247 260
Fuerza de Tirantez

35.0 Polígono de Frecuencia


30.0
25.0
Percent

20.0
15.0
10.0
5.0
0.0
169182195208221234247260
Fuerza de Tirantez

Paso6: Completar los gráficos agregando número de gráfico, título, fuente, elaboración.

26
TEMA 3: CALCULO DE MEDIDAS DE RESUMEN – TENDENCIA CENTRAL

1. Descargar el archivo Base de Datos_Lab2 – Microsoft Excel del aula virtual y guardar el archivo en el
escritorio.
2. Trabajar con el Ejercicio 1:

VARIABLE: Nº de tornillos defectuosos por lote

Paso1. Ir a la pestaña COMPLEMENTOS, clic en MEGASTAT, seleccionar Descriptive Statistics

Ingresamos a la siguiente ventana de diálogo, que me permite seleccionar las opciones para determinar las
medidas de resumen

27
En la opción Input Range: Ingresar los datos de origen

Paso 2. Seleccionamos los datos a estudiar, activamos la opción Median, quartiles, mode, outliers
y click en OK

28
Obtenemos una nueva hoja llamada Output, donde se presentan un conjunto de resultados

Nº de datos=
Promedio

Valor mínimo=
Valor máximo=
Rango

Mediana

Moda

Realizar el mismo procedimiento para las demás variables de estudio.

TEMA 4: CALCULO DE MEDIDAS DE RESUMEN – MEDIDAS DE VARIABILIDAD

1. Trabajar con el Ejercicio 1 (archivo Base de Datos Clase3_Lab):

VARIABLE : Nº de tornillos defectuosos por lote

Paso1. Ir a la pestaña COMPLEMENTOS, clic en MEGASTAT, seleccionar Descriptive Statistics

Ingresamos a la siguiente ventana de diálogo, que me permite seleccionar las opciones para determinar las
medidas de resumen

29
En la opción Input Range: Ingresar los datos de origen

Paso 2. Seleccionamos los datos a estudiar, activamos la opción Median, quartiles, mode, outliers
y clic en OK

Obtenemos una nueva hoja llamada Output, donde se presentan un conjunto de resultados

30
Nº de datos=
Varianza
Desv. Estándar

Valor mínimo=
Valor máximo=
Rango

Realizar el mismo procedimiento para las demás variables de estudio.

31
TEMA 5: VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD
DISCRETA
Seguimos utilizando MEGASTAT que es un complemento avanzado de funciones estadísticas,

de la hoja de cálculo EXCEL. y en esta oportunidad


trabajaremos Distribuciones de Probabilidad Discreta.

DISTRIBUCION BINOMIAL

Ejercicio 1:
Un almacenero de laboratorio, reporta que el 25% de puntas de un dosificador electrónico
están malogradas. Si se extrae una muestra aleatoria de cinco de estas puntas.

Encuentre la probabilidad de que:

a) Ninguna esté malograda.

b) Exactamente una esté malograda.

c) Menos de dos están malogradas.

Solución 1:

Se procede a desarrollar el ejercicio en una hoja de cálculo de Excel donde ya se


tiene disponible el complemento megastat.

Seleccionamos la
opción de
Distribuciones de
Probabilidades Discreta

32
Luego de ello accedemos a la siguiente ventana de diálogo, donde seleccionamos a
la Distribución Binomial

n = número de ensayos
2

p = probabilidad de
éxitos o de ocurrencia

Reemplazando los datos del ejercicio Nº 1, donde n = 5 y p = 0.25

33
Como resultado tenemos las siguientes probabilidades
Probabilidades acumuladas (≤)
de la Distribución Binomial
Probabilidades puntuales de
la Distribución Binomial

Encuentre la probabilidad de que:


En nuestro ejercicio X = Nº de puntas malogradas.

a) Ninguna esté malograda P ( X = 0)

Soluciòn

Dado que es una probabilidad puntual su resultado será:

P (X = 0) = 0.2373

La probabilidad de seleccionar 5 puntas y que ninguna resulte malograda es de 0.2373.

34
b) Exactamente una esté malograda. P (X = 1)

Solución

Dado que es una probabilidad puntual su resultado será:

P (X = 1) = 0.3955

La probabilidad de seleccionar 5 puntas y que una resulte malograda es de 0.3955.

c) Menos de dos están malograda. P (X < 2)

Solución

Estamos frente a una probabilidad acumulada, que equivale a:

P ( X < 2) = P ( X ≤ 1) = P ( X = 0) + P ( X = 1)

su resultado será:

P (X < 2) = P ( X ≤ 1) =0.6328

La probabilidad de seleccionar 5 puntas y que menos de dos resulten


malogradas es de 0.6328.

35
2. Un estudiante se presenta a un examen de selección múltiple que contiene 8
preguntas, cada una con tres respuestas opcionales. Sí, el estudiante está
adivinando al responder cada pregunta y además se sabe que para aprobar el
examen debe responder correctamente 6 o más preguntas. ¿Cuál es la
probabilidad de aprobar el examen?

Solución 2:

Definimos la variable aleatoria X.

X= Número de respuestas correctas en las 8 preguntas


5
p = 1/3 = 0.33 q = 2/3 = 0.67

¿Cuál es la probabilidad de aprobar el examen?

P(X≥6)= 1-P(X≤5) =

Luego ingresamos en el Mega Stat, los valores de n= 8 y p = 0.33

Como resultado
obtenemos las
siguientes
probabilidades. P(X≤5)

P ( X ≥ 6 ) = 1 - P ( X ≤ 5 ) = 1 – 0.98134229 = 0.01865771 aprox 0.02


La probabilidad de aprobar el examen es del 0.02.

36
DISTRIBUCION POISSON

Ejercicio 1:

Si como promedio un tablero electrónico recibe 0.05 llamadas por segundo, ¿Cuál
es la probabilidad de que en un determinado minuto:

a. Reciban exactamente dos llamadas. 6

b. Reciban no más de dos llamadas.

Solución de Ejercicio 1:

Paso1. Ir a la pestaña COMPLEMENTOS, clic en MEGASTAT, seleccionar “PROBAILITY”---


Discrete Probability Distributions

Paso 2. Ir a la siguiente ventana de diálogo y seleccionar “ POISSON”

37
Paso 3. Asignar el valor de lambda

X = Nº de llamadas por minuto


Se tiene que λ = 0.05 llamadas por segundo Entonces: λ = 0.05(60) = 3 llamadas por minuto.

Luego se obtienen las siguientes probabilidades

a. Reciban exactamente dos llamadas. P ( X = 2 ) = 0.2240

La probabilidad de que se reciban dos llamadas en un minuto es


de0.1140

b. Reciban no más de dos llamadas P ( X ≤ 2 ) = 0.4232

La probabilidad de que se reciban no más de dos llamadas es de


0.4232.

Ejercicio 2:
Supongamos que estamos investigando la seguridad de una peligrosa área de trabajo, los registros indican
una media de 5 accidentes mensuales.
a) El departamento de seguridad desea que calculemos la probabilidad de que en cualquier mes ocurran
38
exactamente 3 accidentes.

Solución 2:

Realizamos el mismo procedimiento que en el ejercicio 1.

X = Nº de accidentes mensuales

Se tiene que λ = 5 accidentes en un mes Utilizando MegaStat, se obtienen las siguientes probabilidades

a) El departamento de seguridad desea


que calculemos la probabilidad de que en
cualquier mes ocurran exactamente 3
accidentes. P(X = 3)
La probabilidad de que en cualquier mes ocurran
exactamente 3 accidentes es de 0.1404.

b) ¿Cuál sería la probabilidad de que


sucedan como máximo 2 accidentes en
un mes? P (X ≤ 2)

En este caso sería:

P ( x ≤ 2 ) = P( x= 0) + P( x= 1) + P( x= 2)

P ( x ≤ 2 ) =0.1247

39
TEMA 6: DISTRIBUCION DE PROBABILIDAD CONTÍNUA UTILIZANDO MEGASTAT

DISTRIBUCION NORMAL

Ejercicio 1:
La calificaciones de los 500 aspirantes presentados a un examen para contratación laboral, se distribuye
normalmente con media 7 y varianza de 4
Encuentre:
a) La probabilidad de que un aspirante obtenga 8 puntos o más.
b) El porcentaje de aspirantes con calificaciones inferiores o iguales a 5
puntos.
c) Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 8
puntos

Solución 1:
Se procede a desarrollar el ejercicio en una hoja de cálculo de Excel donde ya se tiene disponible el complemento
megastat.

Seleccionamos la opción
de Distribuciones de
Probabilidad Continua

Luego de ello accedemos a la siguiente ventana de diálogo, donde seleccionamos a la Distribución Continua

40
Ahora procedemos a encontrar las probabilidades.

a) La probabilidad de que un aspirante obtenga 8 puntos o más. P ( X ≥ 8 )


Utilizando el MegaStat, se asignan los datos y se tiene:

La probabilidad de que un aspirante obtenga 8 puntos o más es de 0.3085.

41
b) El porcentaje de aspirantes con calificaciones inferiores o iguales a 5 puntos.
P (X ≤ 5) =

Utilizando el Mega Stat, se asignan los datos y se tiene:

El porcentaje de aspirantes con calificaciones inferiores o iguales a 5 puntos es de 0.1587

c) Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 8 puntos.

Tipificando P (5≤ X ≤ 8) = P (X ≤ 8) - P (X ≤ 5) = 0.6915 – 0.1587 0 = 0.5328

Luego como nos piden cuantos aspirantes se encuentran en este intervalo multiplicamos la probabilidad por el total de
aspirantes: 500 * 0.5328=266.40 aproximadamente 267 aspirantes.

42
TEMA 7: MUESTREO Y TAMAÑO DE MUESTRA
MUESTREO ALEATORIO SIMPLE:

Se debe disponer en una columna los números asignados a cada observación, luego

1. En la barra de herramientas elija la opción Datos / Análisis de Datos.


2. Selecciona la opción Muestra.
3. Pulse en el botón Aceptar
4. Seleccione el marco muestral: Rango de Entrada (columna de números asignados a cada observación)
5. Seleccione la opción Aleatorio.
6. Indique el tamaño de la muestra. Número de muestra
7. Seleccione la opción de salida de resultados. Si se desea seleccionar la opción Rango de Salida e indicar la celda
donde desea que se empiecen a grabar los resultados.
8. Pulse el botón Aceptar.

Ejemplo:

Se tienen 45 bolillas enumeradas, seleccionar 6 bolillas aleatoriamente y determinar sus medidas resumen. Interpretar

Solución:

Enumerar las bolillas del 1 al 45 en vertical:

Ir a la barra de herramientas, desplegar Datos, click en Análisis de Datos:

43
Click en Muestra, luego Aceptar:

Seleccionar los datos:

Finalmente, la muestra aleatoria es:

Las medidas de tendencia central son:

44
Seleccionar los datos:

Seleccionar la
muestra aleatoria.

Seleccionar medidas
de resumen.

Finalmente las medidas son:

TEMA 8: DETERMINACION DE UNA MUESTRA ALEATORIA: POBLACION INFINITA

VARIABLE CUANTITATIVA:

45
Ejemplo:

Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria.
Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribución
normal. Si se supone que la desviación estándar del peso es de 0.5 kg. Determine el tamaño de muestra
aleatoria necesaria con un nivel de confianza del 95% y el error máximo permitido en menos de 0.1 kg.

Solución:
Datos:
E=0.1
S=0.5
Nivel de Confianza: 95%

Finalmente, se necesita de 97 sacos.

VARIABLE CUALITATIVA:

Ejemplo:

Se desea estimar la proporción de trabajadores de una empresa minera está de acuerdo con la actual gestión del nuevo
superintendente, con un error máximo de 0.5% y con una confianza del 95%. Por estudios similares, se cree que la
proporción será cerca al 1%. ¿Cuál será el tamaño de muestra requerido?

46
Solución:

Datos:
E=0.005
p=0.01
Nivel de Confianza: 95%
Seleccionar: Sample size – p, Ingresar los datos:

Finalmente, se necesita a 1522 personas para consultar su opinión

TEMA 9: ESTIMACIÓN INTERVÁLICA

CASO A: ESTIMACIÓN INTERVÁLICA PARA LA MEDIA POBLACIONAL () CON CONOCIDO:

Ejemplo:
Una muestra aleatoria de 120 cigarrillos de una marca determinada dio un contenido promedio de nicotina de 4
miligramos. Suponga que el contenido de nicotina de estos cigarrillos sigue una distribución normal con una desviación
estándar de 1.6 miligramos. Obtenga e interprete un intervalo de confianza del 95% para el verdadero contenido
promedio de nicotina en estos cigarrillos.

47
Solución:
Se tienen los siguientes datos:
n = 120
𝑋̅ = 4
 = 1.6
Nivel de confianza: 95%

Ingresando los datos en MEGASTAT:

Ingresar el promedio: 4
Seleccionar: intervalo
para la media

Ingresar la desviación estándar: 1.6

Finalmente OK

Seleccionar la estimación z

Luego, el intervalo de confianza es:


𝜖 <3.714, 4.286>

Interpretación:
El verdadero contenido promedio de nicotina en estos cigarrillos se encuentra entre 3.714 y 4.286 miligramos con un
nivel de confianza del 95%.

CASO B: ESTIMACIÓN INTERVÁLICA PARA LA MEDIA POBLACIONAL () CON DESCONOCIDO:

Ejemplo:
Un fabricante de llantas desea investigar la durabilidad de sus productos. Una muestra de 10 llantas para recorrer
50000 millas reveló una media muestral de 0.32 pulgadas de cuerda restante con una desviación estándar de 0.09
pulgadas. Construya un intervalo de confianza de 99% para la media poblacional.

Solución:
Se tienen los siguientes datos:
n = 10
𝑋̅ = 0.32
s = 0.09
Nivel de confianza: 99%
48
Ingresando los datos en MEGASTAT:
Ingresar el promedio: 0.32
Seleccionar: intervalo
para la media

Ingresar la desviación estándar: 0.09

Finalmente OK

Indicar el nivel de confianza


Seleccionar la estimación t

Luego, el intervalo de confianza es:

𝜖

Interpretación:
La verdadera durabilidad promedio de cuerda restante de las llantas se encuentra entre 0.228 y 0.412 pulgadas
con un nivel de confianza del 99%.

C. ESTIMACIÓN INTERVÁLICA PARA LA PROPORCIÓN POBLACIONAL (π):


Ejemplo:
Un genetista se interesa en la proporción de estudiantes universitarios que tienen cierto trastorno sanguíneo.
En una muestra aleatoria de 100 estudiantes, se encuentra que 24 lo padecen. Calcule e interprete un intervalo
del 97% de confianza para la proporción de estudiantes que padecen este trastorno sanguíneo.

Solución:
Se tienen los siguientes datos:
n = 100
p = a/n = 24/100 = 0.24
Nivel de confianza: 97%

49
Ingresando los datos en MEGASTAT:

Seleccionar: intervalo Ingresar la proporción 0.24


para la proporción

Finalmente OK

Indicar el nivel de confianza

Luego, el intervalo de confianza es:


π𝜖 <0.147, 0.333>

Interpretación:

La proporción de estudiantes que padecen este trastorno sanguíneo se encuentra entre 14.7% y 33.3% con un nivel de
confianza del 97%.

TEMA 10: ESTIMACIÓN INTERVÁLICA PARA LA DIFERENCIA DE MEDIAS Y


PROPORCIONES POBLACIONALES

CASO A: INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS (σ12 y σ22 conocidas)


Ejemplo 1:

Se llevan a cabo pruebas de resistencia a la tensión sobre dos diferentes clases de largueros de
aluminio utilizados en la fabricación de alas de aeroplanos comerciales. De la experiencia pasada
con el proceso de fabricación de largueros y del procedimiento de prueba, se supone que las
desviaciones estándar de las resistencias a la tensión son conocidas. Los datos obtenidos se
presentan en la siguiente tabla:

Media muestral de la
Clase de Tamaño de
resistencia a la Desviación Estándar
larguero la muestra
tensión

1 n1 =10 𝑥1
̅̅̅=87.6 (kg/mm 2) 𝜎1 = 1 (kg/mm2)

2 n2=12 𝑥2
̅̅̅=74.5 (kg/mm 2) 𝜎2 = 1.5(kg/mm2)

Si µ1 y µ2 indican los verdaderos promedios de las resistencias a la tensión para las dos clases de
largueros, hallar un intervalo del 90% de confianza para la diferencia de las medias µ1 y µ2.

50
Solución Ejemplo 1:

Ingresando los datos en MEGASTAT:

Indicar que se ingresaran la identificación de grupo, medidas de resumen como media, desviación estándar y
además n

Ingresar el nivel de confianza


que se requiere el intervalo

Se selecciona la prueba Z (Distribución Normal), dado que se conocen las varianzas de las poblaciones.
Resultados

𝜖 < 12.22, 13.98 >

Interpretación:
Con un nivel de confianza del 90%, se tiene que la resistencia a la tensión del larguero 1 es mayor que la resistencia a
la tensión del larguero 2, en una cantidad que oscila entre 12,22 y 13,98 kg/mm 2.
51
CASO B: INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES
DESCONOCIDAS PERO HOMOGÉNEAS (𝝈12 = 𝝈 22 )

Ejemplo 2:

Una empresa fabrica un mismo producto en dos máquinas. Una muestra aleatoria de 9 productos de la máquina 1, ha
dado los siguientes tiempos de fabricación en segundos:
12, 28, 10, 25, 24, 19, 22, 33, 17
Mientras que una muestra aleatoria de 8 productos de la máquina 2, ha dado los siguientes tiempos de fabricación en
segundos:
16, 20, 16, 20, 16, 17, 15, 21

Construir un intervalo al 95% de confianza para la diferencia de los tiempos de fabricación para todos los productos de
la fábrica 1 y 2.
Suponga que las varianzas poblacionales son homogéneas pero se desconocen.
Solución Ejemplo 2:
Si X1 y X2 son los tiempos empleados para las máquinas 1 y 2 respectivamente, de las muestras se tiene:

Ingresando los datos en MEGASTAT:

52
Indicar que se ingresaran los datos sin agrupar, luego insertar los datos en el detalle siguiente:

Se selecciona la prueba t (Distribución t de Student) ( t –test (pooled variance), dado Ingresar el nivel de confianza
que no se conocen las varianzas de la población, pero se sabe que son homogéneas. que se requiere el intervalo

Resultados
𝜖 < -2.365, 9.337 >

Interpretación:
Como el intervalo incluye al cero, entonces los tiempos medios de fabricación de ambas máquinas son iguales.

CASO C: INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES


DESCONOCIDAS PERO HETEROGÉNEAS (𝝈12 ≠ 𝝈 22 ).

Ejemplo 3:

El jefe de planta de una fábrica ensambladora de camiones, realiza un estudio comparativo de la eficacia de dos
métodos de ensamblaje, el jefe piensa que el primer método es menos eficaz, dado que reporta un mayor tiempo para
ensamblar los camiones.
Para ello tomó el tiempo en horas empleado en ensamblar 12 camiones con el método A y 12 camiones con el método
B. Los datos son:
¿Los datos apoyan la postura del jefe de planta?.
Método A Método B
Hallar un intervalo al 98% de confianza, para la diferencia de los
Media 128.34167 42.64167 tiempos de ensamblado para todos los camiones ensamblados
Desv. Estándar 25.396848 6.7398806 con el método A y B. Supóngase que las varianzas
n= 12 12 poblacionales son desconocidas y diferentes.

Solución Ejemplo 3:
Ingresando los datos en MEGASTAT:

53
Indicar que se ingresaran la identificación de grupo, medidas de resumen como media, desviación estándar y
además n

Ingresar el nivel de confianza


que se requiere el intervalo

Se selecciona la prueba t (Distribución t de Student) (t –test (unequal variance)), dado que no se conocen las varianzas
de la población, pero se sabe que son heterogéneas.

Resultados

𝜖 < 65.3640, 106.0359 >


Interpretación:
Con un nivel de confianza del 95%, se tiene que los datos apoyan la postura del jefe de planta,
dado que el intervalo no contiene al cero, entonces al tiempo promedio de ensamblado del método
A, es mayor al tiempo promedio de ensamblado del método B.

CASO D: INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS PARA DATOS


PAREADOS:
Un fabricante desea comparar el proceso de armado común para uno de sus productos con
un método propuesto que supuestamente reduce el tiempo de armado. Se seleccionaron ocho
trabajadores de la planta de armado y se les pidió que armaran las unidades con ambos
procesos. Los siguientes son los tiempos observados en minutos.
Trabajador Proceso actual Proceso propuesto
1 38 30
2 32 32
3 41 34
4 35 37
5 42 35
6 32 26
7 45 38
8 37 32
54
Con un nivel de confianza del 95%, ¿A qué conclusión llega para ambos procesos?

SOLUCION:
Los datos ingresados:

Seleccionar en prueba de hipótesis la opción: “Paired Observations” (datos pareados)

Como los datos que se tienen son para cada variable, seleccionar: “data input”

Finalmente click en
OK

Seleccionar intervalo
de confianza

55
Salida:

El intervalo es:
 D 1  2     1.662; 7838

Interpretación:
Con un nivel de confianza del 95% se concluye que el proceso actual es mejor que el proceso propuesto.

56
CASO E: INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES

Ejemplo 3:
Una firma distribuye dos marcas de cerveza. En una reciente encuesta se encontró que 60 de 120 prefieren la marca A
y 50 de 80 prefieren la marca B. obtenga un intervalo de confianza para la diferencia de las proporciones poblacionales,
con una confianza del 99%, para determinar si ambas marcas tienen la misma preferencia.

Solución Ejemplo 3:
Ingresando los datos en MEGASTAT:

Ingresar los
datos para la
marca B,
Ingresar los p = 0.625 y
datos para la n=120
marca A,
p = 0.5 y n=120

Ingresar el nivel de confianza


que se requiere el intervalo

Resultados

𝜋𝐴 − 𝜋𝐵 𝜖 < - 0.3074, 0.0574>


Interpretación:
Como el intervalo contiene al cero, se concluye que ambas marcas tienen la misma preferencia.

57
TEMA 11: PRUEBA DE HIPÓTESIS PARA LA MEDIA Y PROPORCIÓN POBLACIONAL

CASO A: PRUEBA DE HIPÓTESIS PARA LA MEDIA CON MUESTRAS GRANDES


Ejemplo 1:
Una fábrica de pernos para la industria automotriz, ha conseguido elaborar sus productos en un plazo medio de 22
días. Este promedio se considera un estándar para medir la eficiencia de una máquina. Sin embargo, un chequeo
aleatorio de 81 pernos dio como resultado un promedio de 24 días, con una desviación estándar de 9 días.
Es este resultado significativamente diferente al estándar, a un nivel de 3%?
Solución Ejemplo 2:
1. El tiempo para elaborar sus productos por la industria automotriz.
2. Ho: µ = 22 (la elaboración de los pernos se realiza en el tiempo estándar)
3. H1: µ ≠ 22 (la elaboración de los pernos se realiza en un tiempo diferente al estándar)
4. El nivel de significancia: α = 0.03
5. Estadístico de prueba: Z
6. Regla de decisión: rechazar Ho si Z > Z1-α/2 o p-value < 0.03
Ingresando los datos en MEGASTAT:

Seleccionar las estadísticas Seleccionar el rango


resúmenes de datos

Finalmente OK

Seleccionar la
Escribir el valor de
Ho:  = 22 H1: Not equal: ≠
Indicar prueba Z si
Escribir el nivel de
n es grande y
confianza dado.
conocida.

58
Decisión:

Como p-value=0.0455 > 0.03, entonces no se rechaza


Ho y se concluye con un nivel de significancia del 3%
que no existe suficiente evidencia estadística para creer
que el tiempo para la elaboración de los pernos es
diferente al estándar.

CASO B: PRUEBA DE HIPÓTESIS PARA LA MEDIA CON MUESTRAS PEQUEÑAS:

Ejemplo 2:
El gerente del laboratorio químico Britishs S.A. quiere determinar si cierto producto aumenta la velocidad de
sedimentación de partículas en una solución. Para este fin, selecciona aleatoriamente una muestra de 10 soluciones y
registra la velocidad de sedimentación de las partículas (mm/s) ganadas al aplicar el producto. Los resultados fueron
los siguientes:

Solución 1 2 3 4 5 6 7 8 9 10
Velocidad de Sedimentación 1.2 1.3 1.7 0.9 1.4 0.8 1.0 1.8 1.0 1.1

Suponiendo que la velocidad de sedimentación de partículas ganadas con el producto en cada una de las soluciones
es una variable aleatoria con distribución normal.
Con un α del 1% hay prueba de que el producto aumenta la velocidad de sedimentación?
Solución Ejemplo 2:
1. Velocidad de sedimentación de partículas ganadas con el producto.
2. Ho: µ = 0 (el producto no aumenta la velocidad de sedimentación)
3. H1: µ > 0 (el producto aumenta la velocidad de sedimentación)
4. El nivel de significancia: α = 0.01
5. Estadístico de prueba: T
6. Regla de decisión: rechazar Ho si T > t1-α/2,n-1 o p-value < 0.01
Ingresando los datos en MEGASTAT:

59
Seleccionar si hay datos
sin agrupar de la
muestra

Finalmente OK
Seleccionar el
rango de datos

Seleccionar la

H1: Greather than: >


Escribir el valor de
Ho: H0 = 0
Indicar prueba T si Escribir el nivel de
n es pequeña y confianza dado.

Decisión:

Como p-value < 0.01;


(0.000000515 < 0.01), entonces
se rechaza H0 y se concluye con
un nivel de significancia del 1%
que existe suficiente evidencia
estadística de que el producto
químico aumenta la velocidad de
sedimentación de las partículas.

CASO C: PRUEBA DE HIPÓTESIS PARA UNA PROPORCIÓN

Ejemplo 3:
El consumidor de cierto tipo de producto, acusó al fabricante, diciendo que más de 20% de las unidades que fabrica
son defectuosos. Para confirmar su acusación, el consumidor uso una muestra aleatoria de tamaño 50, donde 27% de
las unidades eran defectuosos. Qué conclusión puede extraer usted? Use un nivel de confianza del 10%

Solución Ejemplo 3:
1. Unidades defectuosas.
2. Ho: p ≤ 0.20 (la producción defectuosa es inferior al 20%)
3. H1: p > 0.20 (la producción defectuosa es más de 20%)
4. El nivel de significancia: α = 0.10
5. Estadístico de prueba: Z
6. Regla de decisión: rechazar Ho si Z > Z o p-value < 0.10

Ingresando los datos en MEGASTAT:

60
Escribir el valor de la Escribir el valor
muestra: proporción Ho: p = 0.2

Escribir la muestra: n
Finalmente OK

Escribir el nivel de
confianza dado. Seleccionar la H1:
Greather than: >

61
Decisión:

Como p-value > 0.10 ; (0.1080 > 0.10),


entonces no se rechaza Ho y se concluye
con un nivel de significancia del 10%, de
que no existe suficiente evidencia
estadística para creer que la muestra no
da evidencia para apoyar al consumidor.

TEMA 12: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS


CASO A: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES
CONOCIDAS Y MUESTRAS GRANDES:
Ejemplo 1:
Dos fabricantes A y B producen un artículo similar, cuyas vidas útiles tienen desviaciones estándar respectivas de 120
horas y 90 horas. Para comparar el promedio de vida útil de estos artículos se extrae una muestra aleatoria de 60 artículos
de cada fabricante encontrándose la duración media de 1230 horas para la marca A y de 1190 horas para la marca B. ¿Se
puede concluir a un nivel de significación del 5% que los artículos de marca A tienen mayor duración media que los
artículos de marca B?
Solución Ejemplo 1:
7. Vida útil de artículos producidos por dos fabricantes.
8. Ho: µ1 = µ2 (Vida útil promedio de los artículos del fabricante A es igual al del fabricante B)
9. H1: µ1 > µ2 (Vida útil promedio de los artículos del fabricante A es mayor al del fabricante B)
10. El nivel de significancia: α = 0.05
11. Estadístico de prueba: Z
12. Regla de decisión: rechazar Ho, si p < 0.05

62
Ingresando los datos en MEGASTAT:

Fabricante A Fabricante B

Medidas estadísticas
resumidas

Valor de la H1:1-2>0 Signo de la desigualdad


de la H1:1-2 > 0

Prueba
Resultados Estadística: Z
Valor de confianza: 1-=0.95

Conclusión: Como el p-value es


menor a 0.05, existe suficiente
evidencia estadística para
rechazar la hipótesis nula, es
decir, con un nivel de
significancia del 5% se puede
concluir que los artículos de la
marca A tienen mayor duración
media que los artículos de la
marca B.

63
CASO B: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES
DESCONOCIDAS PERO IGUALES (HOMOGENEAS)

Ejemplo 2:
Se realizó un experimento para comparar la dureza de lingotes de dos tipos de acero, obteniéndose los siguientes resultados:

Suponga que son muestras aleatorias independientes y que provienen de


poblaciones normales con varianzas poblacionales desconocidas, suponer
iguales.

Pruebe con 5% de significancia que la dureza de los lingotes del tipo de Acero
1 excede a la dureza del tipo 2 en dos unidades .
Solución Ejemplo 2:
1. Dureza de lingotes de dos tipos de Acero.
2. Ho: µ1 - µ2=0 (La dureza de los lingotes del tipo de Acero 1 es igual a la dureza del tipo de Acero 2)
3. H1: µ1 - µ2 >2 (La dureza de los lingotes del tipo de Acero 1 excede a la dureza del tipo 2 en dos unidades).
4. El nivel de significancia: α = 0.05
5. Estadístico de prueba: T
6. Regla de decisión: rechazar Ho, si p < 0.05
Ingresando los datos en MEGASTAT:

64
Medidas estadísticas
resumidas

Acero 1 Acero 2

Valor de la H1:1-2>2

Signo de la desigualdad
de la H1:1-2 > 2
Prueba Estadística:
T-student con varianzas
desconocidas e iguales Valor de confianza: 1-=0.95

Resultados

Conclusión: Como el p-value es mayor a 0.05, no existe suficiente evidencia estadística para rechazar la hipótesis
nula, es decir, con un 5% de significancia no existe suficiente evidencia estadística para rechazar la hipótesis nula, es
decir, la dureza promedio del Acero 1 es igual al del Acero 2.

65
CASO C: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS CON VARIANZAS POBLACIONALES
DESCONOCIDAS PERO DIFERENTES (HETEROGÉNEAS)
Ejemplo 3:
Se realizó un experimento para comparar la resistencia de dos materiales, obteniéndose los siguientes resultados:

Suponga que son muestras aleatorias independientes y


que provienen de poblaciones normales con varianzas
desconocidas, suponer diferentes. Pruebe con un nivel de
confianza de 95% para la diferencia de las medias
poblacionales la hipótesis nula: 1 > 2 frente 1 < 2
Solución Ejemplo 3:
1. Resistencia de dos materiales.
2. Ho: µ1 > µ2 (Resistencia promedio de material 1 es mayor que la del material 2.)
3. H1: µ1 < µ2 (Resistencia promedio de material 1 es menor que la del material 2.)
4. El nivel de significancia: α = 0.05
5. Estadístico de prueba: T
6. Regla de decisión: rechazar Ho, si p < 0.05
Ingresando los datos en MEGASTAT:

Material 1 Material 2
Medidas estadísticas
resumidas

Valor de la H1:1-2 <0

Signo de la desigualdad
de la H1:1-2 < 0

Valor de confianza:
1-=0.95
Prueba Estadística: T-student con
varianzas desconocidas y diferentes

66
Conclusión: Como el p-value es mayor a 0.05, no existe suficiente evidencia estadística para rechazar la
hipótesis nula, es decir, con un nivel de confianza del 95% la resistencia promedio del material 1 es mayor que
la resistencia promedio del material 2.

No existe la suerte. Sólo hay preparación


adecuada o inadecuada para hacer frente a una
estadística.
Robert Heinlein

“Nunca es demasiado tarde para ser la persona que querías haber sido”-
George Eliot

67
TEMA 13: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES
CASO A: PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE PROPORCIONES

Ejemplo 1:

Una muestra aleatoria de 300 tornillos de la Marca A y otra de 400 tornillos de la marca B, de
una determinada producción, reveló que 120 tornillos cumplían con las normas de calidad en la
marca A y 120 tornillos en la marca B. ¿Se puede concluir a un nivel de significación del 5% que
la proporción de tornillos que cumplen con las normas de calidad en la marca A es mayor que la
proporción de la marca B?

Solución Ejemplo 1:

Valor de la H1:p1-p2>0

Signo de la desigualdad
de la H1:p1-p2 > 0

Valor de confianza:
1-=0.95

68
Resultados

Conclusión: Como el p-value es menor a 0.05, existe suficiente evidencia estadística para rechazar la
hipótesis nula, es decir, la proporción de tornillos en la Marca A que cumplen con las normas de calidad
es mayor a la proporción de los de la marca B.

No existe la suerte. Sólo hay preparación


adecuada o inadecuada para hacer frente a una
estadística.
Robert Heinlein

“Nunca es demasiado tarde para ser la persona que querías haber sido”-
George Eliot

69
TEMA 14: REGRESIÓN LINEAL SIMPLE. ESTIMACIÓN DEL MODELO DE REGRESIÓN
LINEAL SIMPLE.

Ejemplo 1:

El procesamiento de carbón sin tratar implica el "lavado", en donde se elimina la ceniza de carbón (no
orgánico, material incombustible).
Una revista proporciona los datos relacionados con los porcentajes de ceniza y el volumen de una partícula de
carbón. Se midieron los porcentajes promedio de ceniza para diez volúmenes de partículas de carbón. Los
datos son los siguientes:

a) Trace el diagrama de dispersión é indicar la tendencia.


b) La ecuación de regresión lineal simple Porcentaje de Ceniza, en
función del volumen del carbón.
c) Utilizando el modelo pronostique el porcentaje de ceniza para
3
partículas con un volumen de 5,0 cm
d) Interpretar coeficientes de Regresión

Solución Ejemplo 1:

a) Trace el diagrama de dispersión é indicar la tendencia.


Se procede a utilizar el complemento de Excel – Megastat, de la siguiente manera:

70
Resultados

Se puede verificar que los datos, se ajustan a una recta.

b) La ecuación de regresión lineal simple del Porcentaje de Ceniza, en función del volumen
del carbón.

71
72
Resultados

Coeficientes del
Modelo de
Regresión.

c) Utilizando el modelo pronostique el porcentaje de ceniza para partículas con un volumen de 5,0
cm3

El porcentaje de ceniza para partículas con un volumen de 5,0 cm 3 es de 8.77%.

d) Interpretar coeficientes de Regresión

a= Es el porcentaje de Ceniza, independiente del Volumen del carbón (X= 0).

b= El valor 0.838594, representa el incremento promedio en el porcentaje de Ceniza, por cada


variación unitaria del volumen del carbón.

73
TEMA 15: APLICACIÓN CHI-CUADRADO

A. PRUEBA DE BONDAD DE AJUSTE:


Una consultora recibió el encargo de realizar una investigación sobre el clima organizacional en
entidades bancarias de todo el país. Una clasificación anterior del tiempo de permanencia en el
banco reveló que el 60% son trabajadores con 4 años o menos en el banco, 30% con 5 a 14 años en
el banco y el restante 10% con 15 a más años en el banco. ¿Considera usted que esta distribución ha
cambiado? α=0.04.

Pi Oi Ei=n*Pi
0.6 293 300
0.3 144 150
0.1 63 50
Total = 1 Total n = 500 Total = 500
Solución:
Ho: p<4 = 0.6; p5-14 = 0.3; p 15 a+= 0.1
H1: Tiempo de permanencia no sigue la distribución en mención.

74
Conclusión:

El tiempo de permanencia si sigue la distribución en mención en la H o con un nivel de


significancia del 4%.

B. TABLAS DE CONTINGENCIA: PRUEBA DE INDEPENDENCIA:


Para probar la efectividad de un nuevo insecticida por 100 consumidores, se tiene la
siguiente información:
Ubicación
Clasificación
Urbano Rural
> Promedio 20 11
Promedio 40 8
< Promedio 15 6
Las hipótesis a probar son:
Ho: La clasificación y la ubicación son independientes.
H1: La clasificación y la ubicación no son independientes. Use α = 0.10
Solución:

75
Conclusión:

Por lo tanto no se rechaza Ho y la Ubicación y Clasificación son independientes, con un nivel de


significancia del 10%.

76