Sie sind auf Seite 1von 28

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

INFERENCIA ESTADISTICA

ACTIVIDAD FASE INTERMEDIA 2

Tutor
Fabin Molina

Preparado por
Cesar Andrey Lpez C
Javier Andrs Bautista
Jimmy Doumer Sotelo
Yilmer Hernndez

Curso 100403_93

Colombia
2015

2
INTRODUCCIN

En el contenido de este trabajo trataremos la temtica propuesta en la gua de


actividades para lo cual se propuso un foro de trabajo con el fin de desarrollar los
ejercicios y discutir los resultados obtenidos.
En este trabajo hemos desarrollado ejercicios tericos y prcticos los cuales tratan
de las siguientes temticas: PRUEBAS DE HIPTESIS Que consiste en realizar un
diagrama y un ejercicio prctico en donde se muestren los pasos requeridos.
ANLISIS DE VARIANZA Es un valor que se supone es verdadero y se pone a
prueba a travs de la evidencia lo que permite probar que tan dispersos estn los
datos y permite aceptar o rechazar una hiptesis teniendo los criterios de evaluacin
para tal fin. Se refiere a la probabilidad.
Tambin se realiza el ANOVA que sirve para probar hiptesis a travs de analizar la
varianza y la prueba de Tukey con el fin de probar todas las diferencias entre medias
de tratamientos de una experiencia y para evaluar las hiptesis.

3
OBJETIVOS

GENERAL
Realizar Comprender los temas de la unidad dos desarrollando la propuesta que
permite fomentar el trabajo en equipo cumpliendo con las expectativas del curso y de
cada uno de nosotros como estudiantes
ESPECIFICOS

Describir los pasos para realizar una prueba de hiptesis.

Aplicar el anlisis de varianza en los ejercicios propuestos

Realizar la ANOVA

Comprender y realizar la Prueba de Tukey

Comprobar por medio de la prueba Ji cuadrado el margen de error.

4
ASPECTOS TEORICOS PARA EL DESARROLLO DE LA ACTIVIDAD

Prueba de hiptesis para la media


Es un procedimiento basado en la evidencia muestral y en teora de probabilidad que
se emplea para determinar si la hiptesis es un enunciado racional y de rechazarse o
es irracional y debe ser rechazadoEn un trabajo de investigacin se plantea dos tipos
de hiptesis mutuamente excluyente, la hiptesis nula y la hiptesis alternativa de
investigacin.
El anlisis estadsticos de los datos servir para determinar si se puede o no aceptar
o no la hiptesis nula. H0. Cuando se rechaza la hiptesis nula H0 significa que el
valor estudiado ha influido significativamente en los resultados y aceptan la hiptesis
alternativa H1
Es importante tener en cuenta que la hiptesis de investigacin debe coincidir con H1
Plantear una hiptesis de investigacin que conocida con H0 Supondra una
ampliacin incorrecta del racionamiento estadstico.
La hiptesis es el elemento que condiciona el elemento de investigacin y responde
provisionalmente al problema verdadero motor de la investigacin.El propsito de la
prueba de hiptesis es determinar si el valor supuesto hipottico de aceptarse como
verosmil con base a la evidencia muestral.
Pasos de la prueba de hiptesis
Paso 1 Planteamiento de la hiptesis nula o alternativa

3 situaciones

1) H0: X =
H1: X
Hiptesis nula H0 El promedio obtenido en la muestra = promedio de poblacin.
Hiptesis nula asociado siempre al signo de igualdad, primera de ellas media muestral
aproximada poblacional.
Hiptesis alternativa H1 excluyente el promedio que obtenemos en la media es diferente al
promedio que obtenemos en la poblacin.

5
Tratamos en esta hiptesis
Si tenemos un total de pacientes del Hospital de Bucaramanga y planteamos una
hiptesis de inters de que su edad sea diferente, ejemplo 20 aos la hiptesis nula
va a plantear que es igual basada en una muestra de 40 pacientes y la alternativa
totalmente lo contrario.
2) H0: X
H1: X >
Otra forma de es que nos interese a nosotros conocer que la edad sea determinada
valor
H1: X > y la hiptesis nula que esta excluyente ser menor o igual.
Nota: la hiptesis nula siempre va a coincidir por un valor 1)
H0: X
3) H0: X
H1: X <
La tercera forma es la opuesta a la anterior aqu nos interesa saber si la edad es
menor y la hiptesis nula ser totalmente excluyente.
Tambin se va a dar para las proporciones
1) H0: P= P
H1: P P
2) H0: P P
H1: P > P

3) H0: P P
H1: P < P

6
Paso 2: Elegir el nivel de significancia
Se define as la mxima cantidad de error que estamos dispuestos a aceptar para
dar como vlida la hiptesis de investigacin.
En sistemas biolgicos siempre trabajamos con =0.05 o en su forma 5%.
Paso 3 Determinar la zona de aceptacin y rechazo de la hiptesis nula H0.
Caso 1

95%

1) H0: P= P

2.5%

2.5%

H 1: P P

El rea de sombreo
depende de la hiptesis
nula, en este caso
cuando es diferente
decimos que es de dos

Curva de distribucin
Esta curva en este caso est relacionada con la primera hiptesis

Caso 2

2) H0: P P
H1: P > P

5%

2=+1.64

7
Caso 3

1) H0: P P
H1: P < P

5%

2=-1.64

rea negativa

Paso 4 Determinar la funcin pivotal


La determinacin pivotal es la frmula que va a involucrar el anlisis de los datos que
se obtienen de la muestra.
z=

x
o n

Promedio de la muestra menos promedio de la poblacin, sobre la varianza de la


poblacin y si no se conoce la varianza de la poblacin sobre la raz cuadrada de la
muestra.
n = muestra
Si n lo tomamos menor que 30 tenemos ya no una distribucin Z sino una
distribucin t.
t=

x
o n

Cuando n 30

Cuando es para proporciones


z=

p p
pq /n

Proporcin de una muestra menos proporcin poblacional sobre la raz cuadrada de


p, la posibilidad de que ocurra este evento q sobre n.

Paso 5 calcule la funcin pivotal


Se remplaza en la formula correcta la informacin obtenida y se obtiene un valor por
ejemplo si deseamos realizar una prueba de hiptesis para la media poblacional de
los pacientes del Hospital de Bucaramanga y planteamos la hiptesis de inters que
la edad sea diferente a 25 aos, posteriormente cogemos una muestra de 30
pacientes y encontramos que el promedio de su edad es de 46.9 aos con una
desviacin estndar de 24,7 aos. La funcin pivotal elegida seria.
Se toma una muestra aleatoria de 30 pacientes con las siguientes edades
Paciente
Paciente 1
Paciente 12
Paciente 100
Paciente 101
Paciente 103
Paciente 117
Paciente 118
Paciente 133
Paciente 1002
Paciente 1004
Paciente 1006
Paciente 1008
Paciente 1011
Paciente 1013
Paciente 1015
Paciente 1017
Paciente 1019
Paciente 1020
Paciente 1022
Paciente 1024
Paciente 1026
Paciente 1028
Paciente 1032
Paciente 1034
Paciente 1036
Paciente 1041

Edad Aos
22
78
81
72
77
78
24
14
77
43
79
18
45
25
25
40
49
57
22
63
67
49
20
22
67
85

9
Paciente 1054
Paciente 1071
Paciente 1090
Paciente 1107

56
30
22
0

Se saca una promedio de edad sumando las edades y dividindolo por la media
resultado 46.9
Se saca una desviacin estndar de 24,7
z=

x
o n

Cuando n > 30

Porque vamos a comprar un promedio y por qu n es mayor a 30. Si remplazamos


los valores tendremos.

z=

46.925
24.7 30

z=

21.9
4.50

4.8

X= 46.9 Promedio de la muestra


= 25 Promedio de la poblacin
o= 4 24.7

Desviacin estndar

30 = n= Tamao de la muestra
Paso 6 Ubicar el valor obtenido en el clculo de la funcin pivotal obtenido en la
regin de rechazo (RR) o de aceptacin (RA) de H0

(RR)

H0

2.5
%

95%
(RA)
H0

2.5

Regin
Regin de
de aceptacin
rechazo en los
(RR)
H0
extremos

10

Z=1.9
6

Z=1.96

Linea donde se ubica el valor


3.5

Paso 7 conclusiones
Se rechaza la hiptesis nula esto se da porque 4.8 cae en la regin nula

DESARROLLO DE LA PROPUESTA

Paso 1. Pruebas de Hiptesis. En una Subseccin llamada Pruebas de hiptesis,


plantear y desarrollar los 5 pasos de una prueba, debe por lo menos plantear 4
pruebas.
1. Indique la variable y desde luego el parmetro que quiere llegar a probar que es
igual o mayor a un 0 : A continuacin un (1) ejemplo de planteamiento de
prueba de hiptesis para probar si el tiempo de espera es mayor a una hora.
Ho: x =1 hora
Ho: x > 1hora
x : Promedio de tiempo que se tarda un paciente en ser atendido
x :Variable tiempo que un paciente se tarda en ser atendido

2. Establecer el nivel de significancia alfa


3. Calcular los estadsticos de prueba
4. Establecer la regla de decisin a partir del estadstico de terico.

11

12
Se toman los conocimientos del trabajo colaborativo 1

Tenemos los clculos en Excel gracias a los datos explicados en la imagen


anterior generando as los 5 pasos:

13

Pruebas de hiptesis: Tiempo que tardan en atender


1. Variable cuantitativa: Tiempo que tardan en atender
medida en: Segundos
Taba de datos
Media poblacional

=3295

Varianza poblacional

= 44

Tamao de muestra

n=365

Media Muestral

x =3294

Paso 1: Planteamiento de hiptesis

Planteamiento de la hiptesis nula: la media poblacional es 3295

Planteamiento de la hiptesis alternativa: La media poblacional es diferente a


3295.
Estas hiptesis se expresan como sigue:
H 0 : =3295
H 1 : >3295
Esta es una prueba de dos colas, debido a que la hiptesis alternativa

H 0 es

planteada en palabras de diferencia, es decir, la hiptesis no indica si la media es


mayor o menor que 3295.
Paso 2: Nivel de significancia
El nivel de significancia es de 0.05 que es el alfa , la probabilidad de cometer el
error de tipo uno, es decir la probabilidad de rechazar la hiptesis siendo verdadera.
Para ste tipo de problema se utiliza la distribucin normal estandarizada en Z.
Paso 3: Estadstico de prueba (o calculado)
El valor estadstico de prueba para este tipo de problema es utilizando la distribucin
normal estandarizada en Z:
x 32943295
z=
=
=0,4342

44
n
365

14
Paso 4: Estadstico terico (o tabulado) y regla de decisin.
La formulacin de la regla de decisin consiste en hallar el valor crtico de Z con una
prueba de dos colas. En la tabla de la normal estndar se identifica el valor de Z
correspondiente a una probabilidad igual 1 =10,05=0,95. El valor ms
cercano a 0,95 es 0,950528532 que corresponde a un valor de Z igual a 1.65, que es
el valor crtico para la prueba de hiptesis. Dado que es una prueba de una cola, se

tendrn el valore crtico as:


La regla de decisin es aceptar la hiptesis nula (Ho), puesto que el valor estadstico
de prueba (-0,4342) ha cado en la zona de aceptacin de dicha hiptesis.
Paso 5. Tomar la decisin.
Se concluye que el tiempo de espera promedio es de 3295 segundos (00:54:55) y
que la diferencia de promedios se atribuye a variaciones aleatorias.

Pruebas de hiptesis: Genero


Variable cualitativa: genero.

Parmetro: Proporcin.

Probar al nivel de significancia del 0.01 la aseveracin que el 51% de los


pacientes
que asisten a la unidad de urgencias de la clnica FOSCAL Bucaramanga en
el mes de agosto de 2014 son mujeres. Para mi estudio tome una muestra
aleatoria de 365 pacientes, de los cuales 186 son mujeres.
Paso 1: Planteamiento de hiptesis

15
La hiptesis nula se plantea diciendo que el 51% de los pacientes que asisten a
urgencias en la FOSCAL son mujeres.
H 0 : =51
H 1 : 51

Paso 2: Nivel de significancia.


La distribucin de probabilidad a utilizar es la normal estandarizada en Z, con un
nivel de significancia del 1%, con dos colas. Debido a que la hiptesis alternativa
H 0 es planteada en palabras de diferencia.

Paso 3. Estadstico de prueba (o calculado).


186
0,51
PP
365
0,0004
z=
=
=
=0,57
P(1P)
0,51(10,51) 0,0007
n
365

Paso 4: Estadstico terico (o tabulado) y regla de decisin.La regla de decisin


se toma sobre la base del siguiente grfico:

Paso 5. Tomar la Decisin


La hiptesis nula que la proporcin verdadera es del 51% no es rechazada a un nivel
de significancia del 1%. Concluyendo que el 51% de los pacientes que asisten a la
unidad de urgencias de la clnica FOSCAL Bucaramanga en el mes de agosto de
2014 son mujeres.

Prueba hiptesis unilateral para la media

16

Una muestra aleatoria de 100 muertes registradas en Bucaramanga el ao pasado


muestra una vida promedio de 71.8 aos. Supongamos una desviacin estndar
poblacional de 8.9 aos. Se quiere probar si la vida media hoy en da es mayor de
70 aos con base en esa muestra. Cul es la probabilidad de que la media de la
muestra no refleje la verdadera media de la poblacin?.

1. Datos
=70 aos

S = 8.9 aos
x =71.8 aos
n = 100
=0.05

2. Establecemos la hiptesis
H0;

=70 aos

H1; >70 aos


3. Nivel de significancia
=0.05, Z =1.645

4. Regla de decisin
Si z 1.645 no se rechaza H 0
Si z 1.645 se rechaza H 0

17
5. Clculos
Z R=

X R 71.870
=
=2.02

8.9
n
100

6. Decisin y justificacin
Como 2.02 > 1.645 se rechaza H0 y se concluye con un nivel de significancia del
0.05 que la vida media hoy en da es mayor que 70 aos.
Prueba de hiptesis unilateral para la proporcin
Una encuesta realizada por salud total a 70 pacientes indic que un poco ms del 44
% tenan gripa de ms de 5 das. Si esto es cierta salud total tomara medidas de
prevencin para evitar menos contagios. Salud total quiere determinar si es mayor
del 30 % antes de crear una estrategia para evitar los contagios. Los resultados
mostraron que el 44.3 % de los paciente encuestados reportaron tener gripa de ms
de cinco das.
1. Especifica la hiptesis nula y alternativa.
Hiptesis Nula

H 0=P .30

Hiptesis Alternativa

H =P>.30

Donde P = la proporcin de pacientes con gripa de ms de cinco das.


2. Especifica el nivel de significacin,
valor de tabla de Z para una prueba

, permitido. Para una

=0.5,

de una sola cola es igual a 1.64.

3. Calcula el error estndar de la proporcin especificada en la hiptesis nula.

s p=

p (1 p)
0.30( 10.30)
0.21
=
=
=0.05
n
70
70

4. Calcula la estadstica de prueba

z=

0.4430.30
=2.86
0.05

el

18
5. La hiptesis nula se rechaza por que el valor de Z calculada es mayor que el
valor critico Z. Salud total puede concluir con un 95 por ciento de confianza
(1- = .95), que ms del 30 % de sus pacientes tienen gripa de ms de
cinco das o ms. Salud total puede proceder a crear un estrategia para evitar
el alto porcentaje de contagio.
Prueba de hiptesis para diferencias entre dos proporciones.
Pensemos que la administracin del hospital de Bucaramanga cree, sobre la base de
una investigacin, que el porcentaje de hombres que visitan su sede o ms veces al
mes es mayor que el porcentaje de mujeres que haces lo mismo.
1. La hiptesis nula y alternativa son las siguientes:
H 0=P H P M 0, La proporcin de hombres que reportan 9 o ms visitas por mes
es la misma o menor que la proporcin de mujeres que hacen lo mismo.
H 0=P H P M > 0, La proporcin de hombres que reportan 9 o ms visitas por mes
es mayor a la proporcin de mujeres que hacen lo mismo.
La informacin proporcionada es:
n H =45 n M =71
PH =.58 P M =.42
PH P M

= .58 -.42 = .16

2. Especifica el nivel de significacin de

=.05 . El valor crtico para la prueba

de una sola cola 1.64.


3. Estima el error estndar de la diferencia de la dos proporciones:

S Phm = P ( 1P )(

Donde
n P +n P
P= H H M M
nH +n M

1
1
+ )
nH nM

19
PH =proporcin muestra de hombres ( H )
PM =proporcin muestra de mujeres ( M )
N H =tamao de muestra hombres
N M =tamao de muestra mujeres
Por lo tanto:
P=

45 ( .58 ) +71(.42)
=0.48
45+ 71

s Phm = .48 ( 1.48 )

( 451 + 711 )=0.10

4. Calcula la prueba estadstica

z=

( .58.42 )(0)
=1.60
.10

La hiptesis nula es aceptada por que el valor de la z calculada es menor que el


valor critico Z. La administracin no puede concluir con un 95 % de confianza que
la proporcin de hombres que visita 9 o ms veces la sede del hospital de
Bucaramanga es mayor que la proporcin de mujeres.

20
ANOVA

1. En

una Subseccin llamada Anlisis de varianza tomar una variable


cualitativa y contrastar 3 categoras de esa variable con los resultados de una
cuantitativa. Por ejemplo: la variable nombre de EPS (seleccionar tres EPS
en la muestra) y contrastar con la variable tiempo que se demora en ser
atendido el paciente. Hacer lo mismo con otra variable cualitativa comparada
contra otra cuantitativa a travs de un ANOVA.

Nota: para hacer este ejercicio ms interesante con 3 categoras sera bueno tener
el gnero GTDY. Ya que al hacer la prueba de TUKEY no genera la comparacin con
tres variables si no con dos dejando las dems como error.

21

Uso de la herramienta

D:\TRABAJO ESCRITORIO\SOCIAL\MATERIALES UNAD\SEMESTRE 1


2015\INFERENCIA ESTADISTICA\APRENDIZAJE PRACTICO\Actividad 2\Ejemplo
tutora\ver 2 punto 2 con edad\Trabajo_colaborativo2_DATOS : 10/04/2015 - 08:03:49
p.m. - [Versin : 31/03/2015]

22
Anlisis de la varianza
Variable N R R Aj CV
EDAD 556 0.01 0.01 66.48
Cuadro de Anlisis de la Varianza (SC tipo III)
F.V.
SC gl CM F p-valor
Modelo. 3387.13 1 3387.13 5.58 0.0186
GENERO 3387.13 1 3387.13 5.58 0.0186
Error 336546.85 554 607.49
Total 339933.98 555
Test:Tukey Alfa=0.05 DMS=4.11648
Error: 607.4853 gl: 554
GENERO Medias n E.E.
Hombre 34.39 255 1.54 A
Mujer 39.35 301 1.42 B
Medias con una letra comn no son significativamente diferentes (p > 0.05)

2. En la clnica Foscal de Bucaramanga se atienden distintas enfermedades que


sufren los pacientes que asisten a la sala de urgencias. El director de la clnica
desea verificar los siguientes datos:
Se tomaron 3 EPS: ALLIANZ SEGURO POLIZA MEDICAL, EPS COLPATRIA
MEDICINA PREPAGADA Y SEGURO DE RIESGOS PROFESIONALES
SURAMERICANA SA, se fitr por EPS y se copiaron los valores de las edades de los
pacientes de las tres EPS. Luego se organizaron en una tabla con tres columnas
donde el rtulo de cada columna era el nombre de la EPS y en las casillas las
edades correspondientes de todos los pacientes.
A continuacin se presentan los resultados obtenidos

23

24
Prueba no paramtrica Ji-Cuadrado
En una Subseccin llamada Pruebas no paramtricas escoja entre las variables
del problema analizado una variable de tipo cuantitativo y demuestre o desmienta a
travs de una prueba ji-cuadrado que los datos de esta variable se distribuyen como
una normal estndar.

Manualmente con conocimientos anteriores

25
Con Histograma

Buscando en la tabla

Valor del estadstico terico


14.067
Calculado
268.93
Tenemos que el calculado es mayor al terico entonces tomamos la decisin de
rechazar la idea de que los datos se distribuyen como una normal.
COMPROBACION POR OTRO MTODO
Ho: Los datos provienen de una muestra al azar de una poblacin distribuida normal
de acuerdo a un modelo terico.
Ha: Los datos no provienen de una poblacin distribuida normal de acuerdo al
modelo terico.

26
(O iE i)2
x =
Ei
i=1
2

La prueba se hizo para la variable edad

Se concluye que la edad no se distribuye normal ya que el estadstico cae en la


regin de rechazo y el valor p es menor a 0.05 entonces se rechaza la hiptesis
nula( los datos provienen de una distribucin normal.
Otras pruebas de normalidad

27
CONCLUSIN
Envi mejoras trabajo individual con nota importante sobre punto dos donde para
hacer el ejercicio ms interesante para comparar con tres categoras de esa variable,
por ejemplo en sexo tener adems hombre y mujer, GTDY y as poder hacer el
ejercicio ya que en el ejemplo el tipo de EPS si hay varias categoras pero en los
dems datos de esa base de datos del hospital de urgencias no las hay, espero de
esta manera quede sustentado porque he trabajado solo con dos, atenta a
observaciones y mejoras.
Concluimos que el uso y formulacin correcta de las hiptesis le permiten al
investigador poner a prueba aspectos de la realidad, disminuyendo la distorsin que
pudieran producir sus propios deseos o gustos. Pueden ser sometidas a prueba y
demostrarse como probablemente correctas o incorrectas sin que interfieran los
valores o creencias del individuo. Las pruebas estadsticas en el cualquier campo
son aplicables para todo, ya que estas son estudios realizados con el fin de convertir
una idea en un hecho, muchas veces el resultado que arroja este experimento puede
ser verdadero o errneo, es all donde entran los distintos tipos de hiptesis a raz
del resultado que esta muestra.
El ANOVA se fundamenta en el estudio de las varianzas. Como establece diferencia
entre las medias poblacionales, es un mtodo matemtico creado para probar la
hiptesis de que las medias aritmticas de ms de dos grupos poblacionales son
iguales.
En el rea profesional se puede decir que es de gran importancia poner en prctica
la formulacin de hiptesis porque esto nos lleva a aplicarla en cualquier situacin
que se nos presente y de esta manera sacar la mejor conclusin en beneficio de una
poblacin

28
REFERENCIAS BIBLIOGRFICAS

Sierra Hernndez, J J. (2013). Mdulo Inferencia Estadstica Vol. 2. Universidad


Nacional Abierta y a Distancia- UNAD. Ibagu.
BVC. (2015) Bolsa de valores de Asociacin Hotelera y Turstica de Colombia.
Recuperado
el
30
de
Marzo
de
2015
de:
http://www.bvc.com.co/pps/tibco/portalbvc/Home/Empresas/Listado+de+Emiso
res.
UNAD (2015). Asesora prueba de hiptesis. You Tube, Tutoriales en la web.
Recuperado el 27 de Abril de 2015 de: https://www.youtube.com/watch?
v=Hg4-Lfiw-DQ&feature=youtu.be&t=3m5s
UNAD (2015). Prueba ji cuadrado. You Tube, Tutoriales en la web. Recuperado el 27
de Abril de 2015 de: https://www.youtube.com/watch?v=i2M8k0uQZQI