Beruflich Dokumente
Kultur Dokumente
Estadstica Inferencial
Observacin
Contextualizar
el
tema
integrador
en
base a:
Las
expectativas
educativas en el
presente
semestre y al
momento
de
egresar
del
bachillerato.
Consultar
la
presente
gua
didctica para
argumentar su
solucin y otras
bibliografas.
Se
considera
conveniente
realiza
un
ejercicio similar
en tu escuela,
como tarea.
Matemticas aplicadas
Estadstica Inferencial
Cmo le haras para conocer el grado de aceptacin de una bebida refrescante, entre los
integrantes de tu grupo escolar?
____________________________________________________________________________
________________________________________________
Cmo le haras si quisieras saber lo anterior, pero ahora, entre los estudiantes del plantel?
____________________________________________________________________________
________________________________________________
Cmo le haras si quisieras saber lo mismo, pero entre los integrantes de la comunidad donde
esta ubicado tu plantel?
____________________________________________________________________________
________________________________________________
Cmo le haras si quisieras saber lo mismo, pero entre los habitantes de la capital de tu
estado?
____________________________________________________________________________
________________________________________________
Ahora observa, la siguiente imagen
Si la observas muy de cerca, es equivalente a tomar una
pequea muestra de la imagen; en principio solo tienes en tu
mente, un conjunto de datos que no te dicen nada.
Sin embargo, si te alejas unos 3 a 5 metros y observas de nuevo
la imagen, empezars a extraer ms informacin de la imagen o
poblacin y posiblemente, adivines qu representa sta imagen.
Si logras lo anterior, habrs hecho una inferencia de los datos
muestrales, para tener una imagen del conjunto.
Esto es en resumidas cuentas, el objeto de la Estadstica
Inferencial. Obtener muestras, e inferir datos sobre la poblacin.
Al dar respuesta a las preguntas anteriores, es momento de iniciar otra aventura en el mundo
de la Estadstica Inferencial. ADELANTE Y CON MUCHO ENTUSIASMO.
Matemticas aplicadas
Estadstica Inferencial
INTRODUCCIN:
na diferencia importante entre la estadstica y probabilidad es que:
En la Probabilidad se razona a partir de la poblacin hasta llegar a la muestra.
En la Estadstica el razonamiento parte de la muestra para llegar al conocimiento de
toda la poblacin.
El estudio de una poblacin tomando como base las muestras, se llama ESTADSTICA
INFERENCIAL o INDUCTIVA, algunos autores la citan como teora de muestras.
La inferencia estadstica trata de conocer o explicar el comportamiento de la poblacin,
mediante los datos obtenidos de una muestra. Como no podemos estar absolutamente seguros
de la veracidad de las inferencias obtenidas, las llamaremos probabilidades. Ahora, para
predecir a partir de una muestra, es necesario haberla seleccionado y recopilado
cuidadosamente; si la muestra no se selecciona adecuadamente, o si la recoleccin es
incorrecta o hay desviaciones en los datos, con ningn anlisis estadstico que se aplique, se
llegar a buenas conclusiones.
POR LO TANTO ES NECESARIO ESTUDIAR LA
TEMA: ----------------
TEORA DE MUESTREO
a teora de muestreo es el estudio de las relaciones existentes entre una poblacin y las
muestras extradas de ellas. Es de gran utilidad en muchos campos; por ejemplo, para
ESTIMAR caractersticas desconocidas de poblaciones (como la media y la varianza
poblacionales), denominadas parmetros de la poblacin o simplemente parmetros, a partir del
conocimiento de las caractersticas muestrales correspondientes, nombradas estadsticos de la
muestra o, en forma sencilla, estadsticos. Esto es
A los valores
(mu) y
Matemticas aplicadas
Parmetros de la
poblacin
Parmetros
Estadsticos de la
muestra
Estimadores
Estadstica Inferencial
Smbolo
Nombre
Media poblacional
Desviacin estndar
poblacional
Media muestral
Desviacin estndar
muestral
Frmula
X
i
N
(X
)2
x
S
(X
X )2
n 1
La teora del muestreo tambin sirve para determinar si las diferencias observadas entre dos
muestras se deben a variaciones por el azar o si en realidad son significativas. Dichas
cuestiones surgen, por ejemplo, al probar un nuevo suero para el tratamiento de una
enfermedad o al decidir si un proceso de produccin es mejor que otro. Sus respuestas
involucran el uso de las denominadas pruebas significativas y de hiptesis, que son importantes
en la teora de decisiones, la cual estudiaremos ms adelante.
Una forma de obtener una muestra representativa, es por medio del proceso denominado
MUESTREO ALEATORIO SIMPLE, en el cual cada miembro de una poblacin tienen las
mismas probabilidades de ser incluido en la muestra. Una tcnica de obtencin de una muestra
aleatoria es la asignacin de nmeros a cada miembro de la poblacin, anotar estos nmeros
en pedazos de papel, colocarlos en una urna y despus sacar nmeros de dicha urna, teniendo
cuidado de mezclarlos muy bien antes de cada extraccin.
Otro concepto importante es si la poblacin es finita o infinita. Una poblacin es FINITA, si
consta de un nmero finito o fijo de elementos, medidas u observaciones. En cambio, una
poblacin es INFINITA, al menos hipotticamente, porque contienen una infinidad de
elementos, medidas u observaciones.
Resumiendo
Una muestra de tamao n de una poblacin finita de tamao N, es una
variable aleatoria si se selecciona de manera tal que cada una de las (N Cn)
muestras posibles, tiene la misma probabilidad, 1/N Cn de ser seleccionada
Recordemos con un ejemplo Cuntas muestras distintas de n, podemos tomar de una
poblacin finita de tamao N ?.
Matemticas aplicadas
Estadstica Inferencial
NMEROS ALEATORIOS
Otro mtodo alternativo al muestreo aleatorio o al azar, es el uso de una tabla de NMEROS
ALEATORIOS, especialmente elaborados para dicho propsito (como la tabla de la pgina
seis), que contienen nmeros entre cero y uno, distribuidos uniformemente.
Para obtener una muestra aleatoria, escogemos un nmero cualquiera de stos, digamos que
elegimos el sptimo nmero de la quinta columna (.266194) y a partir de l, tomamos tantos
nmeros como tenga la muestra. Para elegir una muestra de 6 de 20 individuos nos fijamos en
los siguientes cinco nmeros, los multiplicamos por 20, (el tamao de la poblacin), y
redondeamos a nmeros enteros.
En la siguiente tabla tenemos estos clculos:
ri
20 x ri
Redondeado
.246194
4.92388
5
.361474
7.22948
7
.721938
14.43876
14
.874239
17.48478
17
.588587
11.77174
12
.987107
19.74214
20
Esto significa que la muestra que obtuvimos, consiste de los individuos 5, 7, 14, 17, 12 y 20. En
caso de que despus de redondear, obtengamos un nmero repetido simplemente lo ignoramos
y tomamos un nmero aleatorio ms de la tabla. Existen tablas extensas de nmeros aleatorios
que pueden consultarse en caso necesario, o bien, es posible generar secuencias de nmeros
aleatorios en hojas de clculo para computadoras personales.
Las poblaciones son finitas o infinitas. Si, por ejemplo, se extraen 10 bolas sucesivamente sin
reemplazamiento de una urna con 100 bolas, se hace un muestreo de una poblacin finita;
mientras que si se lanza una moneda 50 veces y se cuenta el nmero de caras, el muestreo es
Matemticas aplicadas
Estadstica Inferencial
de una poblacin infinita. Una poblacin finita en la que se realiza un muestreo con
reemplazamiento, puede considerarse tericamente infinita, ya que es posible extraer cualquier
nmero de muestras sin agotar la poblacin. Para muchos propsitos prcticos, efectuar el
muestreo de una poblacin finita muy grande, llega a tomarse como muestreo de una poblacin
infinita.
.562823
.002301
.232042
.266617
.131461
.320635
.782180
.352716
.077187
.627016
.905239
.796922
.451598
.292421
.828471
.385775
.831441
.967543
.725393
.781755
.122307
.788578
.714261
.753031
.565886
.086846
.724832
.542868
.545621
.578796
.450445
.015705
.916486
.207688
.365034
.748739
.221169
.588587
.937687
.002736
.941812
.319317
.987107
.689820
.946318
.905990
.466664
.647365
.818804
.035611
.550117
.081688
.173754
.740821
.655810
.183213
.246194
.646875
.989363
.381565
.187656
.361474
.284028
.644515
.742813
.316564
.721938
.239494
.080688
.305726
.111104
.874239
.749584
.916764
.226729
.603410
.715715
.597542
.006625
.396010
.390122
.919611
.913490
.790428
.023133
.967842
.240272
.279269
.639912
.876266
.731978
.415541
.744025
.390941
.060652
.355516
.054394
.428829
.434190
.657453
.915298
.571107
.629999
.780697
.311012
.250148
.670640
.275269
.425575
.687109
.385909
.167211
.350164
.713078
.276703
.755674
.600667
.421401
.005809
.720998
.693671
.658730
.723064
.959250
.359282
.840188
.616694
.151870
.723322
.805228
.733594
.813899
.171769
.880411
.389532
.825936
.322635
.637507
.993144
.862456
.944366
.078211
.150843
.258811
.823710
.361341
.787992
.260049
.133291
.282315
.741072
.858724
.685027
.071528
.280507
.885559
.482054
.714028
.855181
.999352
.412858
.657293
.737552
.346466
.456042
.592425
.249104
.078762
.111000
.301013
.158577
.947260
.699915
.089797
.916413
.007733
.022476
.513055
.055481
.496661
.097627
.390369
.293689
.962412
.653221
.463281
.680906
.945228
.844186
.211123
.989519
.980937
.773218
.223863
.308422
.249058
.144735
.530463
.442014
.366574
.416967
.259332
.874892
.148786
.482655
.078323
.732924
.316023
.976778
.932723
.179296
.346352
.237563
.433333
.210948
.801952
.591400
.810613
.635090
.277263
.157172
.813805
.752123
.281786
.956223
.019341
.890398
.232516
.337549
.032354
.287353
.363413
.696245
.696245
.380662
Guillermo Pastor. Estadstica Bsica. Editorial trillas, Conalep. 1 Edicin 12 reimpresin enero 2003.
DISEOS DE MUESTRAS
as clases de muestras que hasta ahora hemos estudiado, son las muestras aleatorias
simples y nmeros aleatorios y no hemos considerado la posibilidad, de que en ciertas
condiciones, puede haber muestras que son ms fciles de obtener, ms econmicas o
ms informativas que las muestras aleatorias y no hemos entrado en detalles sobre la pregunta
de lo qu, podra hacerse, cuando el muestreo aleatorio es imposible.
Matemticas aplicadas
Estadstica Inferencial
Hay muchas otras maneras de seleccionar una muestra de la poblacin y hay gran cantidad de
bibliografa sobre el tema de los procedimientos del diseo del muestreo.
A continuacin estudiaremos brevemente, algunos diseos de muestras que no es ms que un
plan determinado, antes de recopilar cualquier dato, para tomar una muestra de una poblacin.
MUESTREO SISTEMTICO
En algunos casos, la manera ms prctica de efectuar un muestreo, consiste en seleccionar,
digamos, cada vigsimo nombre de una lista, cada decimosegunda casa de un lado de una
calle y as sucesivamente. Esto se conoce como muestreo sistemtico. En este caso, se
divide la poblacin en subconjuntos de tamao igual, segn la frmula que a continuacin
analizaremos, despus se toma al azar, la unidad en la que se debe comenzar, que ocupa el
lugar K y el resto de los elementos de la muestra, ocupan los siguientes lugares.
N
N
, K 2 , K ... Hagamos un ejemplo para comprender mejor este muestreo
n
n
N 1200
60 , a continuacin seleccionamos un
n
20
elemento, AL AZAR, entre el 1 y el 60, supongamos que el seleccionado es el 27(este ser K),
entonces, el primer nmero ser 27; el segundo nmero ser 27+60 = 87; el tercer nmero
seleccionado ser 27+ 2(60) = 147; el cuarto nmero 27+ 3(60)= 207 y as sucesivamente sern
el 267, 327, 387, 447, 507, 567, 627, 687, 747, 807, 867, 927, 987, 1047, 1107, 1167. Se han
seleccionado a 20 personas, a las que les corresponden los nmeros citados.
Cuando el resultado de N/n no es entero, se redondea al entero menor, esto puede producir
una pequea dificultad que no afecta y debe despreciarse cuando n > 50.
MUESTREO ESTRATIFICADO
En este muestreo, la poblacin se divide en estratos homogneos internamente y lo ms
heterogneos externamente entre s.
Si tenemos informacin acerca de la constitucin de una poblacin (es decir, su composicin) y
sta es importante para nuestra investigacin, podemos mejorar el muestreo aleatorio por
medio de la ESTRATIFICACIN. Este es un procedimiento, que consiste en estratificar (o
dividir) en un nmero de subpoblaciones o estratos que no se traslapen y luego tomar una
muestra de cada estrato. Si los artculos, personas o cosas seleccionados de cada estrato
Matemticas aplicadas
Estadstica Inferencial
52
110
300
Se contina con el muestreo aleatorio, para seleccionar las personas de cada estrato que van a
hacer motivo de la investigacin.
La ventaja del muestreo estratificado, es que permite obtener informacin, sobre las
caractersticas motivo de estudio y aumenta la precisin de las estimaciones sobre toda la
poblacin; y en general, da mejores resultados que el muestreo aleatorio, mientras ms
diferentes sean los estratos entre s y sean ms homogneos internamente.
Sus desventajas son: dificultad para decidir a qu estrato se asigna cada uno de los elementos
de la poblacin y cmo elegir el tamao de la muestra de cada estrato, para que el total sea n.
Este mtodo, se utiliza cuando resulta muy costoso elaborar una lista completa, de todos los
elementos de la poblacin. El inconveniente se presenta, cuando los conglomerados no son
homogneos entre s, ya que la muestra final, puede no ser representativa de la poblacin.
Sin embargo, tiene la ventaja de simplificar, el levantamiento de la poblacin
Tanto en el muestreo estratificado como en el de conglomerados, la poblacin se divide en
grupos bien definidos. Usamos el muestreo estratificado, cuando cada grupo tiene una pequea
Matemticas aplicadas
Estadstica Inferencial
variacin dentro de s mismo, pero hay una amplia variacin dentro de los grupos. Usamos el
muestreo por conglomerados en el caso opuesto: cuando hay una variacin considerable dentro
de cada grupo, pero los grupos son esencialmente similares entre s.
ERRORES AL MUESTREAR.
ecordemos que la muestra descansa, en el principio de que las partes representan al
todo y, por tal, refleja las caractersticas que definen a la poblacin de la cual fue
extrada, lo cual nos indica, que es representativa. Es decir, que para hacer una
generalizacin exacta de una poblacin, es necesario tomar una muestra representativa. Por lo
tanto, la validez de la generalizacin, depende de la validez y tamao de la muestra.
Cuando una muestra es aleatoria o probabilstica, es posible calcular sobre ella, el error
muestral. Este error, indica el porcentaje de incertidumbre, es decir, el riesgo que se corre que
la muestra elegida no sea representativa. Si trabajamos con un error calculado en 5%, ello
significa que existe un 95% de probabilidades de que el conjunto muestral, represente
adecuadamente, al universo del cual ha sido extrado.
A medida que incrementamos el tamao de la muestra, el error muestral tiende a reducirse,
pues la muestra va acercndose ms al tamao del universo. Del mismo modo, para una
muestra determinada, su error ser menor cuanto ms pequeo sea el universo a partir del cual
se la ha seleccionado. As, para un universo de 10,000 casos, una muestra de 200 unidades
tendr un error mayor que una de 300; esto es; N = 10,000 y n = 200 por lo tanto su fraccin
de muestreo n/N = 200 / 10,000 = 0.02 y N = 10,000 y n = 300 por lo que su fraccin de
muestreo n/N = 300 / 10,000 = 0.03, por lo tanto la fraccin de muestreo ms chica (0.02), ser
la que tenga mayor error muestral.
De manera similar, si vara el tamao del universo con igual tamao de muestra, se confirma
tambin la anterior afirmacin; por ejemplo para una muestra de n = 200 casos, se tendr un
error mayor, si el universo tiene 10,000 unidades, que si el universo posee solamente 2,000
unidades.
Matemticas aplicadas
Estadstica Inferencial
Hagamos los clculos, n = 200 y N = 10,000; la fraccin de muestreo es n/N = 0.02; en la otra
poblacin N = 2,000 y n = 200, n/N = 0.1 se confirma que la primera fraccin de muestreo que
es la ms chica, tendr un error de muestreo mayor, ya que disminuy el universo de la
poblacin, con una misma muestra.
Para fijar el tamao de la muestra adecuado a cada investigacin, es preciso primero
determinar el porcentaje de error que estamos dispuestos a admitir.
Una vez hecho esto, debern realizarse las operaciones estadsticas correspondientes, para
poder calcular el tamao de la muestra, que nos permite situarnos dentro del margen de error
aceptado. Dichos clculos se estudiarn en otro apartado; sin embargo, si el tamao de la
muestra queda determinado previamente por consideraciones prcticas; no hay otra alternativa
que aceptar el nivel de error, que su magnitud acarree.
Aceboman, espero
me ayudes a salir
adelante Sale?
SAETA-
Si tienes dudas, vuelve a leer los temas, pregunta a tus compaeros del grupo,
consulta otros libros o artculos, relacionados con los temas, etc.
TU PUEDES SI QUIERES.
10
Matemticas aplicadas
Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE:
Contesta correctamente las siguientes preguntas
1. Escribe el nombre y smbolo de los dos principales parmetros de la poblacin, as como sus
dos estadsticos de la muestra.
Respuesta: _________
3. Cuntas muestras distintas de tamao n =3, podemos tomar de una poblacin finita de
tamao N = 110?,
Respuesta: _________
4. Cuales son los tipos de errores que se pueden cometer cuando se trabaja con muestras?
___________________________ y ______________________ explcalos brevemente con tus
palabras.
5. Asigna a cada uno de los integrantes de tu grupo un nmero y utiliza la tabla de nmeros
aleatorios de la pgina 5, a partir del elemento 21 de la sexta columna hacia la derecha
determina una muestra aleatoria de seis estudiantes. Realiza tus clculos aqu o aun lado de la
hoja, por favor.
____________________________________________________________________
11
Matemticas aplicadas
Estadstica Inferencial
8. De la lista de tus compaeros del grupo, anota en un pedazo de papel el nmero que
corresponde a cada uno de ellos. Mezcla bien todos los papelitos en una caja o urna y extrae
sin reemplazamiento 6 estudiantes para un muestra aleatoria simple. Anota aqu tu resultado.
__________________
_________________
_________________
__________________
_________________
_________________
9.- De la misma manera que el ejercicio anterior, Extrae una muestra aleatoria simple de 5
estudiantes con reemplazamiento. Anota aqu tus resultados.
__________________
_________________
__________________
_________________
_________________
10. En la colonia 2 de agosto de Tepic, Nayarit, de 1980 habitantes, se pretende realizar una
encuesta y seleccionar a 16 personas entre 180 seoras, para conocer el grado de aceptacin
de un nuevo producto de limpieza. De acuerdo al tipo de muestreo sistemtico, calcula, cuales
sern las 16 personas seleccionadas para ser entrevistadas?
Realiza tus clculos a un lado de la hoja, por favor.
11. La Universidad Autnoma de Nayarit, tiene una poblacin aproximada de 12,500
estudiantes, profesores y trabajadores y de los cuales 8500 son estudiantes, 1990 son
profesores y 2010 son trabajadores. Calcula el tamao de la muestra de cada estrato. si se
desea saber la opinin de 500 personas de la universidad, sobre la gestin del actual rector.
Realiza tus clculos aun lado de la hoja, por favor.
12. Un CBTA tiene inscritos a 550 estudiantes, de los cuales 290 cursan el 1er ao, 188 el 2do
ao y 72, 3er. ao. Calcula el tamao de la muestra de cada estrato, si se desea saber la
opinin de slo 100 estudiantes, sobre la eficiencia de la infraestructura del plantel.
Realiza tus clculos aun lado de la hoja, por favor.
13. A medida que se incrementa el tamao de la muestra, Se incrementa el error muestral?
SI___ NO____ Porque? _______________________________________________________
14. Observa detenidamente los siguientes datos y contesta Cul tendr mayor error muestral?
Poblacin 1 Universo (N = 350) y Muestra (n = 150)
Poblacin 2 Universo (N = 350) y Muestra (n = 250)
Qu poblacin tiene mayor error muestral? ______
15.
Poblacin 1 N = 70 y n = 15
Poblacin 2 N = 800 y n = 150
Qu poblacin tiene mayor error muestral? ______
12
Matemticas aplicadas
Estadstica Inferencial
DISTRIBUCIONES MUESTRALES:
l concepto de distribucin muestral, es el concepto ms bsico de la inferencia estadstica
y se puede definir como una distribucin de probabilidad, que consta de todos los
valores posibles de un estadstico de la muestra de tamao n (con o sin reemplazo). En
cada muestra, se suele calcular un estadstico, como la media o la desviacin estndar, que
vara de una muestra a otra. De esta forma se obtiene una distribucin del estadstico
denominada distribucin muestral. Si por ejemplo, el estadstico utilizado es la MEDIA
MUESTRAL, entonces la distribucin se llama distribucin del muestreo de medias o
distribucin muestral de la media. De forma similar, se puede obtener distribuciones muestrales
de las desviaciones estndar, las varianzas, las medianas, etctera.
este tamao simplemente tomamos las alturas de los cinco nios, las sumamos, dividimos entre 5 y se
acab.)
Altura
1.20
1.18
1.32
1.23
1.28
13
Matemticas aplicadas
Estadstica Inferencial
Nio
( altura )
1 ( 1.20 )
2 (1.18)
3 (1.32)
4 (1.23)
5 (1.28)
(1.20; 1.18)
(1.20; 1.32)
(1.20; 1.23)
(1.20; 1.28)
(1.18;1.32)
(1.18; 1.23)
(1.18; 1.28)
(1.32; 1.23)
(1.32; 1.28)
2 ( 1.18 )
3 ( 1.32 )
4 ( 1.23 )
(1.23; 1.28)
5 ( 1.28 )
Para cada una de estas muestras, tenemos una media x . Por ejemplo, para la muestra {1,2}, su
media es x = (1.20 + 1.18) / 2 = 1.19 y para la muestra {3,5} su media es x = (1.32 + 1.28)/2 =
1.30, etc. Segn se muestra en la siguiente tabla de medias.
MEDIAS DE LA DISTRIBUCIN MUESTRAL DE MEDIAS
Nio
(altura)
2 (1.18)
3 (1.32)
4 (1.23)
5 (1.28)
Total
1 ( 1.20 )
(1.20+1.18)
= 1.19
(1.20+1.32)
= 1.26
(1.20+1.23)
= 1.215
(1.20+1.28)
= 1.24
4.905
(1.18+1.32)
= 1.25
(1.18+1.23)
= 1.205
(1.18+1.28)
= 1.23
3.685
(1.32+1.23)
= 1.275
(1.32+1.28)
= 1.30
2.575
(1.23+1.28)
= 1.255
1.255
5.025
12.42
2 ( 1.18 )
3 ( 1.32 )
4 ( 1.23 )
Total =
1.19
2.51
3.695
Ahora calculemos dos aspectos importantes de esta variable aleatoria, como son la MEDIA Y
LA DESVIACIN ESTNDAR de la distribucin muestral de medias.
La media que denotamos por
que es la media de las medias
Su frmula es
x
x
12.42
1.24 resultado es igual a la media poblacional obtenida.
10
14
Matemticas aplicadas
Estadstica Inferencial
{1,2}
{1,3}
{1,4}
{1,5}
{2,3}
{2,4}
{2,5}
{3,4}
{3,5}
{4,5}
1.19
1.26
1.215
1.24
1.25
1.205
1.23
1.275
1.30
1.255
12.42
Total =
Medias al 2
cuadrado x
1.4161
1.58761
1.476225
1.5376
1.5625
1.452025
1.5129
1.625625
1.69
1.575025
15.4356
Con los datos anteriores, podemos utilizar una frmula y obtener el error estndar de la media
2
que es.
N ( x ) ( x )2
10(15.4356) (12.42)2
x
N2
0.03156
100
Las medias
y las desviaciones
x
n
N n
n N 1
15
Matemticas aplicadas
Estadstica Inferencial
Para el ejemplo que venimos desarrollando, utilizaremos la ltima frmula para estimar la
desviacin estndar de las medias muestrales o el error estndar de la media.
N n 0.05154 5 2 0.05154 3
.
.
0.03156
5 1
4
n N 1
2
2
Coincide con el valor que obtuvimos antes para la desviacin estndar de la distribucin
muestral de medias.
Pero es preciso indicar que el factor
N n
de la segunda frmula, se conoce como factor de
N 1
correccin de la poblacin finita (cpf), ya que sin ste, las dos frmulas (para poblaciones
infinitas y finitas) son las mismas.
Una regla de uso muy frecuente, establece que el factor de correccin de poblacin finita (cpf),
se puede pasar por alto cuando n/N es menor o igual a 0.05, esto es, cuando la muestra
contiene el 5% o menos de la poblacin.
Por lo tanto, si la poblacin es infinita; o el muestreo se hace de una poblacin infinita con
reemplazamiento; o cuando N > 20n la frmula para encontrar el error estndar se reduce a
Para encontrar el error estndar de la media cuando la poblacin es finita y el muestreo se hace
sin reemplazo; o cuando N <20n es:
N n
.
n N 1
En la siguiente pgina
Realiza un ejercicio de sntesis de lo que se ha estudiado, donde debes completar los
espacios, para que escribas lo que consideres ms conveniente.
Yo voy a ponerle ganas,
para que aceboman,
tambin me ayude.
16
Matemticas aplicadas
Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE:
Contesta adecuadamente las siguientes preguntas y completa los espacios correctamente:
El tamao de la muestra se denota como?_____________
El tamao de la poblacin se denota como?____________
La media poblacional se denota como?____________
La desviacin estndar poblacional se escribe como?____________
La media de la distribucin muestral de medias se denota?__________
El error estndar de la media se denota como? _________________
_________________________________
(2) Para poblaciones _______________o muestreo _______________ su frmula es
(Finitas o infinitas)
__________________________________
Cuando N > 20n se utiliza la frmula _________________para poblaciones______________
Gracias
Aceboman, me
caes bien
17
Matemticas aplicadas
Estadstica Inferencial
El trmino error estndar se utiliza porque da a entender que la variabilidad en los estadsticos
de la muestras, provienen de un error de muestreo debido al azar; es decir, hay diferencias
entre cada muestra y la poblacin, y adems entre las diversas muestras debido nicamente a
los elementos que decidimos escoger para las muestras. Por lo tanto, mide el grado en el que
se puede esperar que flucten o varen los estadsticos de una muestra como consecuencia del
azar, pero no solo mide el error de azar que se ha cometido, sino tambin la probable precisin
que obtendremos si utilizamos una estadstica de muestra para estimar un parmetro de
poblacin.
Si el error estndar es bajo, hay buenas posibilidades de que el estadstico de una muestra se
aproxime al de la poblacin; en cambio
Si el error estndar es alto es ms probable que obtengamos una muestra que difiera
considerablemente de la poblacin.
Compaeros,
urge hacer un
ejercicio para
practicar
Entonces
analicemos un
problema, para
comprender mejor
todo lo estudiando
hasta aqu sale?
Mmmmm. Est
bien nimo!
3
a) Con reemplazamiento x 68.0pu lg .
y
x
0.6 pu lg.
n
25
b) Sin reemplazamiento x 68.0 pu lg
N n
3 3000 25
.
.
0.59759 0.6 pu lg
n N 1
25 3000 1
18
Matemticas aplicadas
Estadstica Inferencial
ste ltimo resultado, es slo ligeramente menor que 0.6 pulg. y puede, para propsitos
prcticos, considerarse igual que el muestreo con reemplazamiento.
Por lo tanto, se esperara que la distribucin muestral de medias est distribuida
aproximadamente de manera normal, con media de la distribucin muestral x 68.0 pulg. y el
error estndar de la media x 0.6 pulg.
A darle;
A los caballos;
rale o
Ipso facto
DISTRIBUCIN NORMAL
1 x 2
1
exp
2
2
e = la constante 2.71828
La curva normal, es una curva en forma de campana que se extiende indefinidamente en
ambos extremos, cada vez, pegndose ms al eje horizontal sin llegarlo a tocarlo. Algunas
caractersticas importantes de la distribucin normal, son las que se mencionan a continuacin:
1. El rea total comprendida bajo la curva y por encima del eje horizontal, es igual a 1 (unidades
cuadradas).
2. La distribucin es simtrica al respecto de su media. Es decir, el 50% del rea est a la
derecha de la media y el 50% a la izquierda.
3. La media, la mediana y la moda son todas iguales.
19
Matemticas aplicadas
Estadstica Inferencial
4. La distancia horizontal, que hay desde el punto de inflexin de la curva (el punto donde la curva
deja de ser cncava hacia abajo y empieza a ser cncava hacia arriba ), hasta una perpendicular levantada
sobre la media, es igual a la desviacin estndar , como se muestra en la siguiente figura:
Distribucin normal con media y desviacin estndar
Punto de inflexin
5. La distribucin normal, es realmente una familia de distribuciones, puesto que existe una
distribucin diferente para cada valor de y . En la siguiente figura se pueden ver tres
distribuciones normales con la misma desviacin estndar, pero diferente media. Las
distribuciones que tienen diferentes medias, se sitan en diferentes posiciones sobre el eje
horizontal.
Tres distribuciones normales con desviaciones estndar iguales pero diferentes medias
Ahora se muestran, tres distribuciones normales con la misma media, pero con diferentes
desviaciones estndar. Aqu nos muestra, cmo mientras ms grande sea la distribucin
estndar, ms plana y ms extendida es la grfica de la distribucin.
Tres distribuciones normales con medias iguales pero desviaciones estndar diferentes
= 0.7071
=1
=1.5
20
Matemticas aplicadas
Estadstica Inferencial
, esta
nueva escala o valor de Z simplemente, nos indica en cuntas desviaciones estndar por
encima o por debajo de la media de su distribucin, se desva el valor correspondiente de X.
3
-3
Escala X
- 2 -
-2
+ + 2 + 3
Escala Z
-1
68.27%
95.45
%%%
99.73
%
%
%%%
0.83
1.07
21
Matemticas aplicadas
Estadstica Inferencial
Por tanto, la probabilidad de que esta variable tome valores mayores a 1.07 es de 0.1423 o
14.23%
c) Encuentra el rea bajo la curva normal estndar entre 0.24 y 1.18 o P(0.24 Z < 1.18)
Si el rea entre 0 y 1.18 le restamos el rea
entre 0 y 0.24 obtenemos el rea que
buscamos. El rea entre 1.18 y 0.24 es
0.3810 0.0948 = 0.29
1.18
d) Encuentra el rea bajo la curva normal estndar entre 1.70 y 0.93 o P(-1.70Z<-0.93)
Debemos observar primero que el nmero 1.70 est a la izquierda del -0.93. El rea que
deseamos calcular es el rea de -1.70 a 0,
menos el rea de 0.93 a 0, esto es, 0.4554
0.3238 = 0.1316
22
Matemticas aplicadas
Estadstica Inferencial
.00
.0000
.0398
.0793
.1179
.1554
.1915
.01
.0040
.0438
.0832
.1217
.1591
.1950
.02
.0080
.0478
.0871
.1255
.1628
.1985
.03
.0120
.0517
.0910
.1293
.1664
.2019
.04
.0160
.0557
.0948
.1331
.1700
.2054
.05
.0199
.0596
.0987
.1368
.1736
.2088
.06
.0239
.0636
.1026
.1406
.1772
.2123
.07
.0279
.0675
.1064
.1443
.1808
.2157
.08
.0319
.0714
.1103
.1480
.1844
.2190
.09
.0359
.0753
.1141
.1517
.1879
.2224
0.6
0.7
0.8
0.9
1.0
.2257
.2580
.2881
.3159
.3413
.2291
.2611
.2910
.3186
.3438
.2324
.2642
.2939
.3212
.3461
.2357
.2673
.2967
.3238
.3485
.2389
.2704
.2995
.3264
.3508
.2422
.2734
.3023
.3289
.3531
.2454
.2764
.3051
.3315
.3554
.2486
.2794
.3078
.3340
.3577
.2517
.2823
.3106
.3365
.3599
.2549
.2852
.3133
.3389
.3621
1.1
1.2
1.3
1.4
1.5
.3643
.3849
.4032
.4192
.4332
.3665
.3869
.4049
.4207
.4345
.3686
.3888
.4066
.4222
.4357
.3708
.3907
.4082
.4236
.4370
.3729
.3925
.4099
.4251
.4382
.3749
.3944
.4115
.4265
.4394
.3770
.3962
.4131
.4279
.4406
.3790
.3980
.4147
.4292
.4418
.3810
.3997
.4162
.4306
.4429
.3830
.4015
.4177
.4319
.4441
1.6
1.7
1.8
1.9
2.0
.4452
.4554
.4641
.4713
.4772
.4463
.4564
.4649
.4719
.4778
.4474
.4573
.4656
.4726
.4783
.4484
.4582
.4664
.4732
.4788
.4495
.4591
.4671
.4738
.4793
.4505
.4599
.4678
.4744
.4798
.4515
.4608
.4686
.4750
.4803
.4525
.4616
.4693
.4756
.4808
.4535
.4625
.4699
.4761
.4812
.4545
.4633
.4706
.4767
.4817
2.1
2.2
2.3
2.4
2.5
.4821
.4861
.4893
.4918
.4938
.4826
.4864
.4896
.4920
.4940
.4830
.4868
.4898
.4922
.4941
.4834
.4871
.4901
.4925
.4943
.4838
.4875
.4904
.4927
.4945
.4842
.4878
.4906
.4929
.4946
.4846
.4881
.4909
.4931
.4948
.4850
.4884
.4911
.4932
.4949
.4854
.4887
.4913
.4934
.4951
.4857
.4890
.4916
.4936
.4952
2.6
2.7
2.8
2.9
3.0
.4953
.4965
.4974
.4981
.4987
.4955
.4966
.4975
.4982
.4987
.4956
.4967
.4976
.4982
.4987
.4957
.4968
.4977
.4983
.4988
.4959
.4969
.4977
.4984
.4988
.4960
.4970
.4978
.4984
.4989
.4961
.4971
.4979
.4985
.4989
.4962
.4972
.4979
.4985
.4989
.4963
.4973
.4980
.4986
.4990
.4964
.4974
.4981
.4986
.4990
Jhon E. Freund y Gary A. Simon. Estadstica elemental. 8. Edicin. Edit. Prentice may 1992.
Tambin para z= 4.0, 5.0 y 6.0 las reas son 0.49997, 0.4999997 y 0.499999999.
23
Matemticas aplicadas
Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE
Te recomendamos que utilices una curva normal por cada ejercicio, y apoyndote en la tabla de
la pgina 21, encuentres las respuestas correctas. Sigue los ejemplos de las pginas 18 y 19.
a) ENTRE 0 Y 1.68
P(0 Z < 1.68)
b) A LA DERECHA DE 0.69
P(Z 0.69)
d) ENTRE -2.36 y 0
P(-2.36 Z < 0)
g) A LA IZQUIERDA DE 0.35
P(Z < -0.35)
24
Matemticas aplicadas
Estadstica Inferencial
muestreo se denomina teorema del lmite central, que es tal vez, el teorema ms
importante de toda la inferencia estadstica; su importancia radica en que nos permite usar
los estadsticos de la muestra, para hacer inferencias con respecto a los parmetros de
poblacin, sin saber nada sobre la forma de la distribucin de frecuencias de esa poblacin,
ms que lo que podamos obtener de la muestra.
El teorema del lmite central, nos permite el empleo de la distribucin normal en una amplia
variedad de problemas; an, cuando la variable en estudio no tenga distribucin normal, o su
distribucin sea desconocida. Si el nmero de elementos de la muestra es suficientemente
grande, por aplicacin del Teorema del Lmite Central, la media aritmtica igualmente va a tener
aproximadamente distribucin normal.
sale?
x1 x
s
Siguiendo el mismo ejercicio de la pgina 16, de los 3000 estudiantes universitarios que se
distribuyen normalmente con una media 68.0 pulg y desviacin estndar 3.0 pulg y
donde calculamos un error estndar de la media x 0.6 pulg. Ahora las preguntas sern
En cuntas muestras de las 80 del anterior problema, esperaramos encontrar la media
a) entre 66.8 y 68.3 pulg y tambin
b) menor que 66.4 pulg.?
25
Matemticas aplicadas
La media
Estadstica Inferencial
x
0.6
a) Cuntas muestras hay entre 66.8 y 68.3 pulgadas? o P (66.8 Z < 68.3)
66.8 en unidades estndar =
66.8 68.0
2.0
0.6
68.3 68.0
0.5
0.6
z = -2.67
= 68.0
z=0
2.67
26
Matemticas aplicadas
Estadstica Inferencial
Con base en el teorema del lmite central. Cul es la probabilidad de que el error de una
variable aleatoria sea menor que 5, cuando se usa la media de una muestra aleatoria de
tamao n = 64 para estimar la media de una poblacin infinita con = 20?
Aunque el valor de es desconocida, sabemos que la distribucin muestral de las medias es
normal con la media poblacional . Por lo tanto, la probabilidad se obtiene por medio del rea
de la zona bajo la curva de normal estndar, entre
z
z
5
2
20 / 64
xu
x
z
5
2
20 / 64
0.4772
-5
z = -2.0
0.4772
z=0
+ 5
z = 2.0
SAETA
27
Matemticas aplicadas
Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE:
Con el propsito que reafirmes lo aprendido, contesta
utilizando tus palabras y criterio las siguientes preguntas
1. Explica brevemente qu entiendes por distribucin muestral?
Respuesta: __________________________________________________________________
____________________________________________________________________________
2. Qu estudiamos cuando analizamos una distribucin muestral de medias?
Respuesta: __________________________________________________________________
____________________________________________________________________________
3. Cul es el nmero de muestras de tamao 5, que podran obtenerse de un grupo de 200
estudiantes, con reemplazo y sin reemplazo? Realiza tus clculos aqu. Por favor.
Con reemplazo: _________
28
Matemticas aplicadas
Estadstica Inferencial
8. Una poblacin consiste de cinco nmeros 2, 3, 6, 8 y 11. Considere todas las muestras de
tamao igual a 2 que pueden obtenerse, con reemplazamiento y sin reemplazamiento, a partir
de estas poblaciones. Calcule a) la media de la poblacin, b) la desviacin estndar de la
poblacin, c) la media de la distribucin muestral de medias, y d) la desviacin estndar
de la distribucin de medias, es decir, el error estndar de medias.
10. Una regin agrcola consta de 200 000 hectreas donde se siembra trigo. Para estimar la
produccin media por hectrea, se realiza una muestra de 900 hectreas que tuvieron en
promedio una productividad de = 3.4 toneladas. La SAGARPA estima que la que la desviacin
estndar de la productividad del trigo en la regin es de = 0.8 Toneladas. Cul es la
probabilidad de que nuestra estimacin de la produccin media en la regin, tenga un
error de a lo ms 0.05 toneladas?
11. La media de una muestra aleatoria de tamao n = 300 es usada para estimar la media del
ingreso familiar de una poblacin de 20,000 familias de una regin. Si el INEGI estima que la
desviacin estndar del ingreso familiar en la regin es = $ 1500. Determina la probabilidad
de que el error de estimar la media sea a) menor que $200 y b) menor que 250
12. La media de una muestra aleatoria de tamao n = 50 barricas, es empleada para estimar el
contenido de alcohol de la produccin tequilera en una bodega de 20000 barricas. Si la
desviacin estndar del contenido alcohlico del tequila es de = 0.5%. Determina la
probabilidad de que el error de estimar la media sea a) menor al 0.01% y b) menor al
0.02%
29
Matemticas aplicadas
Estadstica Inferencial
Observaciones
Es conveniente un
tiempo
aceptable
para desarrollar esta
importante
introduccin.
El director de un CBTA no sabe que hacer; segn el, es urgente incrementar las
inscripciones porque la infraestructura de la escuela est en psimas condiciones, pero
tambin sabe que los alumnos son de escasos recursos econmicos y no quiere daar su
buena imagen ante ellos, por lo que decide obtener una muestra aleatoria de 200 alumnos Integrarse
del CBTA, de los cuales, 144 se oponen a un incremento de la inscripcin y 56 estn a equipos
de
favor de dicho incremento.
estudiantes.
a) Construye un intervalo de confianza del 95%, para la proporcin de la poblacin de
estudiantes que se oponen al incremento de la inscripcin. Interpreta su resultado
b) Construye un intervalo de confianza del 95%, para la proporcin de la poblacin
que est a favor del incremento de la inscripcin. Interpreta su resultado
BLOQUE: ACTIVIDADES DE DESARROLLO
1.- Consultar la presente gua didctica, en los temas correspondientes a:
Estimacin de parmetros; Estimacin sin sesgo; Estimacin puntual y estimacin por
intervalos; Estimacin por intervalos de confianza de los parmetros poblacionales: para
medias y de proporciones. Error probable o error mximo y Tamao de la muestra.
2. Investigar de manera personal, otras fuentes de informacin a tu alcance para
enriquecer tus conocimientos de los temas antes mencionados.
3.- Integrado en equipos de tres compaeros, comenten las estrategias para la solucin
de las preguntas antes sealadas.
3. Realicen esquemas, lminas, o presentaciones para su exposicin grupal en el aula.
Consultar
presente
didctica
argumentar
solucin y
bibliografas.
en
3
la
gua
para
su
otras
El cierre se har en
dos fases
1ra.
Sobre
las
relaciones humanas
2da.
Sobre
el
problema
estadstico
30
Matemticas aplicadas
Estadstica Inferencial
31
Matemticas aplicadas
Estadstica Inferencial
- 3 - 2 -
+ 2 + 3
Escala x
68.26%
P( X ) 68.26%
en probabilidad ser P( 2 X 2 ) 95.44%
95.44%
99.74%
P( 3 X 3 ) 99.74%
zc
99.73%
99%
2.575
98%
96%
95.45%
95%
1.96
90%
1.645
80%
68.27%
50%
= 0.10
1- = 0.90
/2 = 0.05
32
Matemticas aplicadas
Estadstica Inferencial
DE CONFIANZA
PARA MEDIAS
( x x)
n 1
24.87
29
2
n x2 x
n(n 1)
N n
X Zc
X Zc
n N 1
n
si el muestreo se realiz sin reemplazamiento de una poblacin finita.
Donde el rea de la curva normal estndar entre 0 y Zc es / 2, esto es, con un grado de
confianza el error al estimar la media ( ) por
es menor a Z c .
33
Matemticas aplicadas
Estadstica Inferencial
N 1
Los grados de confianza que ms emplearemos son 0.95 y 0.99 y sus correspondientes
coeficientes de confianza o valores crticos Zc que son 1.96 y 2.575, respectivamente. A estos
intervalos, tambin se les conoce, como los intervalos de confianza del 95% y 99%.
Para encontrar los intervalos de confianza al 95 % de confianza, en el caso del nivel de
contaminacin de ozono tenemos:
24.87
X Zc
213.5 1.96.
30
213.5 1.96. (4.54) = 213.5 8.90 = 204.60 y 213.5 + 1.96. (4.54) = 213.5 + 8.90 = 222.40
por lo que el intervalo de confianza del 95% es 204.60 < < 222.40 por lo tanto
Con una probabilidad de 0.95 la media poblacional se encuentra entre 204.60 y 222.4 o
bien, que con un grado de confianza del 95% el error al estimar la media como 213.5 es
menor a 8.9.
Analicemos ms detenidamente esto ltimo
x
a expresin
Zc .
poblacional ( ) con grado de confianza , y puede ser usada para determinar el tamao
de la muestra, cuando se desea cierto grado de precisin; esto lo analizaremos un poco ms
adelante.
Por lo tanto, el Error mximo del nivel de contaminacin de ozono al 95% de confianza es:
24.87
Zc .
1.96.
1.96(4.54) 8.90
n
30
Si se aumenta el grado de confianza, aumentar el error mximo al estimar la media.
X Zc
213.5 2.575.
24.87
30
34
Matemticas aplicadas
Estadstica Inferencial
3.4 Z c
frmula
X Zc
900
n
Para obtener el intervalo de confianza del 90%, debemos encontrar el valor de Zc (de la tabla
reas bajo la curva normal estndar de la pgina 22), que corresponde a 90/2 (dos colas)= 0.45 que es
Zc = 1.645 debido a que 0.4495 = 1.64 y 0.4505 = 1.65 la parte media ser 0.45 =1.645. Por lo
tanto, los intervalos al 90 % de confianza sern
3.4 1.645.(0.0267) = 3.4 0.0439 = 3.36 y 3.4 + 1.645. (0.0267) = 3.4 + 0.0439 = 3.44
El intervalo de confianza al 90% es 3.36 < < 3.44 y su error mximo de 0.0439
Como ya sabemos el valor de Zc = 1.96 para el nivel de confianza de 95 %, por lo tanto, sus
intervalos de confianza sern
0.8
3.4 1.96
900
3.4 1.96.(0.0267) = 3.4 0.0523 = 3.35 y 3.4 + 1.96. (0.0267) = 3.4 + 0.0523 = 3.45
El intervalo de confianza al 95% es 3.36 < < 3.44 y su error mximo de 0.0523
Finalmente y como ya sabemos, el valor de Zc = 2.575 para el nivel de confianza de 99 %, por
0.8
lo tanto, sus intervalos de confianza sern
3.4 2.575
900
3.4 2.575.(0.0267) = 3.4 0.0688 = 3.33 y 3.4 + 2.575. (0.0267) = 3.4 + 0.0688 = 3.47
El intervalo de confianza al 99% es 3.33 < < 3.47 y su error probable de 0.0688
Ahora si, vamos a
obtener el tamao
de la muestra
Animo!
TAMAO DE LA MUESTRA
Zc .
media poblacional (), por x con un grado de confianza y puede ser usada, para
determinar el tamao de la muestra, cuando se desea cierto grado de precisin.
Para comprender mejor, resolvamos un problema de un fabricante de llantas.
Un Fabricante de llantas, desea determinar la vida promedio de cierto tipo de llantas, con un
grado de certeza del 99% y con un error menor a 1000 Km. Por estudios previos, el fabricante
sabe, que la desviacin estndar para este tipo de llantas es de 3000 Km. Qu tan grande
debe ser la muestra?
Si E, es el error mximo o error probable, entonces E Z c . 2.575. 3000 y como deseamos
n
n
que E sea menor de 1000, obtenemos la ecuacin 1000 2.575. 3000 , que al resolver da
n
35
Matemticas aplicadas
Estadstica Inferencial
1000
2.575
n
cuadrado para llegar a n = 59.67, y como este nmero, no es entero debemos redondear hacia
arriba para tener n = 60 llantas.
Con un 99% de certeza, el fabricante de llantas, debe obtener una muestra de 60 llantas para
tener un error menor de 1000 Km.
Tambin se puede utilizar la siguiente frmula para calcular el tamao de la muestra, para
estimar a como sigue
2
2
2
2
Z ( )
2.575(3000)
7725
n
7.725 59.67
n /2
1000
1000
E
ltimo ejemplo para reflexionar;
Un investigador a cuyo cargo est un departamento de educacin fsica, desea hacer una
estimacin del consumo de oxgeno (en litros por minuto), de los estudiantes normales que
estn entre los 17 y los 21 aos de edad, despus de haber hecho un tipo especial de ejercicio.
El investigador, desea que su estimacin se encuentre por lo menos a 0.10 litros de la media
verdadera, con una confianza del 95%. Los estudios que se han hecho, indican que la varianza
del consumo de oxgeno de este tipo de sujetos, bajo las condiciones especificadas, es
aproximadamente igual a 0.09 litros por minuto cuadrado.
Qu tamao debe tener la muestra que necesita este investigador?
=0.30.
Z ( )
n /2
(1.96)(0.3)
n
34.57 Como el tamao de la muestra tiene que ser un entero, el
0.10
investigador necesitar tomar una muestra de tamao 35, para lograr la confianza y la amplitud
de intervalo deseadas.
Es importante sealar lo siguiente en este tema:
Si hay que sacar la muestra de una poblacin finita, puede resultar conveniente incorporar el
factor de correccin poblacional finita (cpf), a la frmula para n, en este caso la frmula se
transforma en
Nz 2 2
z 2 2 E 2 ( N 1)
Aceboman, yo
tambin le echar
muchas ganas
he
36
Matemticas aplicadas
Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE.
A un lado de sta hoja, resuelve adecuadamente los siguientes problemas.
1) Un centro de verificacin vehicular, efecta una muestra aleatoria de 50 vehculos para
estimar el tiempo promedio, que se requiere para efectuar la prueba obteniendo una media x
de 7.2 minutos y una desviacin estndar s = 0.8 minutos. Determina los intervalos de
confianza de la media del 95% y del 99%, as como los errores mximos de estos grados
de confianza.
Al 95%:
Al 99%:
2) Se desea estimar las horas que un amplificador de msica puede ser usado antes de
necesitar alguna reparacin. Si por estudios previos se sabe que = 500 horas, Qu tan
grande debe ser el tamao de la muestra, si necesitamos tener un grado de confianza del
95% y un error de 100 horas?
RESPUESTAS CORRECTA: ______________
3) Una compaa de reparto de paquetera, efecta una muestra tamao n = 60 del nmero de
paquetes que entrega por da una camioneta. Si se obtuvo una media de x = 26.8 paquetes y
una desviacin estndar de s = 1.4 paquetes, construye los intervalos de confianza del 90%
y del 95%, para el promedio de paquetes que entrega una camioneta.
Al 95%:
Al 90%:
37
Matemticas aplicadas
Estadstica Inferencial
6) Una empresa publicitaria, desea investigar el tiempo promedio semanal que las amas de
casa, de cierta regin dedican a ver telenovelas. Si saben que es razonable tomar =2.8 horas
para estos estudios. Qu tan grande debe ser la muestra, si desean tener un grado de
confianza del 99% y un error mximo de media hora?
RESPUESTAS CORRECTA: ____________________
8) Unos diseadores industriales, desean determinar el tiempo promedio que un adulto requiere
para ensamblar un juguete fcil de ensamblar, para lo cual obtuvieron una muestra de n = 36
x = 19.9 y s = 5.73 Encuentre un intervalo de confianza del 95% para el tiempo
promedio que un adulto, requiere ensamblar dicho juguete?.
RESPUESTAS CORRECTA: _____________________
9) Un profesor, quiere calcular el tamao de la muestra del tiempo promedio que los estudiantes
necesitan para pasar de una clase a otra, y quiere afirmar con una probabilidad de 0.95, que su
error ser a lo sumo de 0.25 minutos.Cul es el tamao de la muestra que necesita, si sabe
que en estudios similares = 1.50 minutos?
RESPUESTAS CORRECTA: _____________________
38
Matemticas aplicadas
Estadstica Inferencial
p
INTERVALOS DE CONFIANZA
PARA PROPORCIONES
asta aqu hemos analizado, que a partir de la informacin contenida en una muestra
aleatoria y con una confiabilidad preestablecida (1 ), podemos determinar los
extremos de un intervalo de confianza para parmetros de inters, como la media
poblacional ( ) . Ya se ha comentado que el valor de los parmetros poblacionales en general
se desconocen, por lo que, podemos hacer una estimacin puntual de P, por medio de la
proporcin p con la que ocurre la categora bajo estudio, en una muestra aleatoria de la
poblacin. Cabe sealar, que la probabilidad de ocurrencia (llamado xito) de un evento es p,
mientras que la probabilidad de la NO ocurrencia (llamado fracaso) del evento es q = 1 p
El teorema central del lmite para variables categricas, nos dice que una variable categrica,
cuyas categoras ocurren con una proporcin P en la poblacin correspondiente. Si se extraen
de la poblacin muestras aleatorias de tamao n, entonces:
1) Los valores p calculados en cada una de las muestras, se distribuyen en forma
normal si el valor de n es grande.
2) El promedio poblacional de los valores p, al que llamaremos p, es igual a la
proporcin poblacional P: p = p
3) La desviacin estndar poblacional de los valores p , a la que llamaremos p, es tal
que: p
P 1 p
n
P 1 p
. Este valor recibe el nombre de error estndar de la proporcin estimada p.
n
Si P, es la proporcin en la que ocurre una categora de una variable categrica en una poblacin, y si
se extrae de sta una muestra de tamao n en la que la categora ocurre con proporcin p, entonces
un intervalo de (1 ) 100% de confianza para P, si np > 5 y n(1- p) es > 5 y si el muestreo se efectu
de una poblacin infinita o una finita con reemplazamiento es:
p ' Z c
p '(1 p ')
n
p ' Z c
p '(1 p ')
n
Np n
Np 1
39
Matemticas aplicadas
Estadstica Inferencial
En una agrupacin de profesionista con 10 000 miembros, se ha tomado una muestra aleatoria
de 392 miembros. A la pregunta Los problemas gremiales que no le conciernen
directamente, son de inters para usted?, 97 miembros dieron respuestas: no, para nada o
bien no se. Estimar con 95% de confianza, la proporcin de los miembros que hubiesen dado
respuestas semejantes, si se hubiera tomado un censo completo, preguntando a todos los
miembros de la agrupacin.
Primer paso: se procede a realizar la prueba np > 5 y n (1- p ) > 5
n = 392
p = 97/ 392 = 0.2474
np = (392) (0.2474) = 96.8 y n ( 1 - p ) = (392) (0.7526) = 295.2 Por lo tanto
Como ambos np y n ( 1 - p ) son mayores que 5, podemos continuar con la prueba.
Segunda prueba: la relacin n/N, para saber si se utiliza el coeficiente de poblacin finita (cpf)
392 / 10,000 = 0.0392 < 0,05 por lo tanto no se usa el cpf
p '(1 p ')
p ' Z c
n
Como se requiere una confiabilidad de 95% Zc = 1.96, y por lo tanto tenemos:
0.2474 1.96
(0.2474)(0.7526)
0.2474 0.0427 0.2047
392
(0.2474)(0.7526)
0.2476 0.0427 0.2903
392
El intervalo de confianza al 95% es 0.2047 p 0.2903 o tambin < 0.2047, 0.2903 >
Entonces podemos afirmar con 95% de confianza, que la proporcin de miembros de la
agrupacin gremial que contestarn no, para nada o no se a la pregunta planteada, est
entre 0.2047 y 0.2903. En otros trminos, podemos decir, con una confianza de 95%, que el
porcentaje de miembros del gremio a quienes no les interesan los problemas, que no les
conciernen directamente est entre 20.47% y 29.03 %.
p
0.2476 1.96
En un estudio sobre las razones que dan los alumnos suspendidos en el CBTA; un profesor
tom una muestra de 200 estudiantes en una poblacin de 1500 que haban sido suspendidos.
De los 200 estudiantes suspendidos que fueron entrevistados, 140 dijeron que haban fallado
debido a dificultades econmicas en su familia. El profesor quera construir una estimacin del
intervalo de confianza del 95%, para la verdadera proporcin de jvenes que haban fallado por
esta razn.
Primer paso: se procede a realizar la prueba np > 5 y n (1- p ) > 5
n = 200
p = 140/ 200 = 0.70
Por lo tanto
np = (200) (0.70) = 140 y n ( 1 - p ) = (200) (0.30) = 60
Como ambos np y n ( 1 - p ) son mayores que 5, podemos continuar con la prueba.
Segunda prueba: la relacin n/N, para saber si se utiliza el coeficiente de poblacin finita (cpf)
200/ 1,500 = 0.1333 > 0,05 por lo tanto si se usa el cpf
p ' Z c
p '(1 p ')
n
Np n
Np 1
40
Matemticas aplicadas
0.70 1.96
Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE.
En tu cuaderno de estadstica, resuelve adecuadamente los siguientes problemas.
Recuerda, antes de calcular el intervalo, debes verificar que el tamao de la
muestra sea lo suficientemente grande, es decir, que np>5 y n(1-P) >5
y n/N, para saber si se va utilizar el factor (cpf).
1. Un profesor se interesa por saber qu proporcin P de alumnos de la escuela donde trabaja,
participan en actividades culturales. Para ello, elige aleatoriamente a 50 estudiantes y
encuentra que 37 de ellos participan en actividades culturales. Calcule un intervalo de 95% de
confianza para P. Interpreta el resultado.
p
2. En una muestra aleatoria, 136 de 400 personas a quienes se les administr una vacuna
contra la gripe, experimentaron alguna molestia. La poblacin total de pacientes es de 5500.
Elabore un intervalo de confianza del 95% para la proporcin real de personas, que
experimentarn esta molestia como resultado de la vacuna.
Interpreta el resultado.
3. Una muestra aleatoria de 200 delincuentes juveniles, sacada de 3000 internos de una
escuela correccional, revel que para 40 de ellos, el delito por el cual haban sido detenidos era
el de robo de automviles. Construir un intervalo de confianza de 90 %, para la proporcin
poblacional de los que haban sido detenidos por robos de automviles. Interpreta el resultado
4. De una poblacin de 1540 personas, se obtuvo una muestra aleatoria de 140 supuestos
contactos con OVNIS, 119 se podran explicar fcilmente en trminos de fenmenos naturales.
Elabore un intervalo de confianza del 99% para la probabilidad de que un supuesto contacto
con un OVNI, se puede explicar fcilmente en trminos de fenmenos naturales. Interpreta el
resultado
41
Matemticas aplicadas
Estadstica Inferencial
42
Matemticas aplicadas
Estadstica Inferencial
Observaciones
Proyectar videos,
audio, o
presentaciones
estadsticas
Consultar la
presente gua
didctica y otras
bibliografas, para
argumentar la
solucin.
43
Matemticas aplicadas
TEMA ----------------TEORIA
Estadstica Inferencial
DE DECISIN ESTADSTICA
DECISIONES ESTADSTICAS
n la prctica, con frecuencia se est obligado a tomar decisiones sobre poblaciones con
base en la informacin de muestras. stas se denominan decisiones estadsticas. Por
ejemplo, quizs se quiera decidir, apoyado en datos muestrales, si un procedimiento
educativo es mejor que otro; si un nuevo suero es realmente efectivo para curar una
enfermedad; si un material didctico (libro o apuntes) es mejor que otro; si un fertilizante es
mejor que la materia orgnica, para el desarrollo de algunas plantas, etctera.
En el tema anterior, estudiamos los conceptos y las tcnicas de la estimacin por intervalos de
una media y de una proporcin poblacional; esto ha servido para empezar a familiarizarse con
la inferencia estadstica, que consiste en ver si se puede considerar, a travs de la informacin
contenida en una muestra representativa de la poblacin bajo estudio, como verdadera una
conjetura planteada acerca de la poblacin. En el presente tema, vamos a analizar otro
problema tpico de la inferencia estadstica: LA PRUEBA DE HIPOTESIS.
Los mtodos estadsticos que permiten poner a prueba una hiptesis; conforman una
importante rama de la estadstica; dichos mtodos siguen una estrategia general; nosotros
abordaremos el camino que sigue del planteamiento de una hiptesis de investigacin hasta su
manejo estadstico, comentaremos los tipos de errores que se pueden cometer, as como los
conceptos y la estrategia bsica para la prueba de hiptesis.
Con el propsito de abordar de manera diferente ste tema, y esperando que sea ameno y
sobre todo, ms lgica su comprensin, abordaremos con un ejemplo sencillo, los distintos
subtemas en donde iremos realizando actividades de aprendizaje y cuando sea
conveniente, generalizaremos el concepto que estemos analizando (hiptesis estadsticas,
estrategia de prueba, dos tipos de errores, regla de decisin, esquema general de la prueba de hiptesis ),
para despus, regresar nuevamente a nuestro ejemplo.
44
Matemticas aplicadas
Estadstica Inferencial
Los profesores sospechan que los jvenes de las zonas rurales tienen un nivel
de conocimientos en matemticas diferentes del de los de zonas urbanas, por
lo que plantean que, de aplicarse el examen en zonas rurales, se obtendra un
promedio de calificaciones, distinto de 7.5. Sin embargo, las zonas rurales del
estado de Nayarit, son de difcil acceso, por lo que resulta imprctico aplicar el
examen en todas las escuelas de dichas zonas. Por ello, los profesores deciden trabajar con
una muestra representativa de 30 jvenes de las zonas rurales, dicha muestra es elegida con
base en tcnicas de muestreo que ya analizamos en el primer tema, por lo que el promedio de
las calificaciones obtenidas por los 30 jvenes, ser un estimador del promedio de las
calificaciones de todos los jvenes de las zonas rurales, del estado de Nayarit.
Hagamos un breve anlisis de algunos elementos de este problema. La variable con la que
trabajaremos es la calificacin, obtenida en el examen de matemticas y la denotamos con x.
La poblacin que nos interesa es la coleccin de las calificaciones que obtendran en los
exmenes, todos los jvenes de las zonas rurales del estado y la caracterstica que nos
interesa es el promedio de estas calificaciones; es decir, el valor del parmetro . El valor de
es desconocido, pero podemos estimarlo puntualmente, mediante la media de las calificaciones
obtenidas por los 30 jvenes.
SUPONGAMOS que esta media muestral es de 7.86, es decir x = 7.86
Se podra afirmar que, como x 7.5, el promedio de calificaciones en zonas rurales difiere del
de zonas urbanas? SI_________ o NO __________
Claro que no! Recuerde que la media ( x ), vara de muestra a muestra, por ello, no es
evidente que a partir del valor de x obtenido en una muestra, podamos inferir que el promedio
poblacional, , difiere del promedio de calificaciones en zonas rurales.
Pero con calma primero analicemos
los diferentes tipos de hiptesis, Sale?
HIPTESIS ESTADSTICAS
a palabra hiptesis se define como: (1) Una afirmacin que est sujeta a verificacin o
comprobacin. (2) Una suposicin que se utiliza como base para una accin. (3) Una
conjetura que se hace sobre algo, para sacar una conclusin. El punto clave de estas
definiciones est, en que una hiptesis es una afirmacin o suposicin y no un hecho
establecido.
Al intentar tomar una decisin, es til hacer suposiciones o conjeturas acerca de las
poblaciones implicadas. Dichas suposiciones, que pueden o no ser verdaderas, se
denominan hiptesis estadsticas. En general las hiptesis, son afirmaciones acerca de las
distribuciones de probabilidad de las poblaciones.
Podemos expresar, en trminos estadsticos la conjetura del grupo de profesores de nuestro
ejemplo como sigue: El promedio poblacional , de las calificaciones que obtendran en el
examen de matemticas los jvenes de las zonas rurales del estado de Nayarit, difieren del
promedio poblacional de las calificaciones, obtenidas por los jvenes de las zonas urbanas
Denotemos con u (mu u de urbana) al promedio de las zonas urbanas, entonces sabemos, u =
7.5 y la conjetura de los profesores se puede expresar:
7.5
o bien
u
En adelante nos referimos a la conjetura de los profesores como hiptesis de investigacin y la
expresamos como sigue:
45
Matemticas aplicadas
Estadstica Inferencial
Hinv : 7.5
o bien
Hinv : u
(Prueba Bilateral por corresponder a ambos lados de la media o en ambas colas de la distribucin, 2
colas)
Es importante sealar que los profesores de nuestro ejemplo, podran haberse planteado
alguna de las siguientes hiptesis:
El nivel promedio de conocimientos en matemticas, de los jvenes de las zonas
rurales es mayor que el de los jvenes de las zonas urbanas. En este caso se
conjetura que > u y la hiptesis de investigacin es Hinv : > u.
(Prueba Unilateral, una cola de la distribucin)
Nosotros nos limitaremos a estudiar los casos en los que las hiptesis de investigacin plantea
la existencia de alguna diferencia, como en las tres posibilidades sealadas en nuestro ejemplo:
Ahondaremos ms en este aspecto, para ver cmo se generan las hiptesis estadsticas. Para
ello, consideremos las distintas modalidades que, segn se mencion anteriormente, puede
adoptar la hiptesis de investigacin.
CASO 1. En nuestro ejemplo se postul:
Hinv : 7.5
o bien
(Hinv : u ).
o bien
(H0: = u)
o bien
(H1: u).
o bien
(Hinv : > u ).
46
Matemticas aplicadas
Estadstica Inferencial
H0: 7.5
o bien
(H0: u ).
o bien
(H1: > u ).
o bien
o bien
(H0: u).
o bien
Caso 1
Caso 2
Caso 3
En la hiptesis de
investigacin
(Hinv) aparece el smbolo
En la hiptesis Nula
(H0) aparece el
smbolo
En al hiptesis
alternativa (H1)
aparece el smbolo
La prueba se
llama
>
>
<
<
Bilateral o de
dos colas
Unilateral o de
una cola
Unilateral o de
una cola
SAETA
47
Matemticas aplicadas
Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE:
1. Establezca las hiptesis nula (H0) y las hiptesis alternativa
siguientes casos:
(H1)
a) Hinv: > 0
H0 : _______________
H1 :______________
b) Hinv: 9.43
H0 : _______________
H1 :______________
H0 : _______________
H1 :______________
d) Hinv: -10.11< 0
H0 : _______________
H1 :______________
H0 : _______________
H1 :______________
Si se est trabajando con una variable categrica y el parmetro de la poblacin, que nos
interesa, es la proporcin poblacional P, con la que ocurre cierta categora, se puede hacer una
hiptesis de investigacin sobre P. En seguida te damos una lista de hiptesis de investigacin
Hinv. Establezca la hiptesis nula H0 y la hiptesis alternativa H1 en cada uno de los casos:
a) Hinv: p .37
H0 : _______________
H1 :______________
b) Hinv: p < .5
H0 : _______________
H1 :______________
c) Hinv: p - .48 0
H0 : _______________
H1 :______________
H0 : _______________
H1 :______________
48
Matemticas aplicadas
Estadstica Inferencial
ESTRATEGIA DE PRUEBA
49
Matemticas aplicadas
Estadstica Inferencial
SITUACIN
ESTADSTICA
Se rechaza
H0
NO se rechaza
H0
H0 es verdadera
H0 es falsa
Se comete el
error tipo I con una
No se comete
Error La probabilidad de
probabilidad
No se comete
Error. La probabilidad de
Se comete el
error tipo II con una
probabilidad
Antes de seguir adelante, veamos en qu consiste cada uno de estos dos errores, en los
trminos de nuestro ejemplo inicial. Hinv: 7.5 H0: = 7.5
H1: 7.5
Como vimos anteriormente, la estrategia de prueba ser considerar como verdadera, la
hiptesis de investigacin Hinv,, slo si podemos rechazar la hiptesis nula H0. Entonces:
1) El error tipo I consiste en rechazar la hiptesis H0: =7.5 cuando en realidad es
verdadera. Dicho en otras palabras, si en nuestro problema se cometiera el error de tipo I, esto
equivaldra a considerar que el nivel en matemticas, que tienen los jvenes de las zonas
rurales del estado de Nayarit, difiere del que tienen los de las zonas urbanas del estado, cuando
en realidad, no difieren.
2) El error tipo II consiste en no rechazar la hiptesis H0: =7.5 cuando en realidad es
falsa. O sea, si en nuestro problema se cometiera el error tipo II, esto equivaldra a no
considerar que el nivel en matemticas, que tienen los jvenes de las zonas rurales, del estado
de Nayarit, difiera del que tienen los de las zonas urbanas, cuando en realidad, si difieren.
La probabilidad de cometer el error de tipo I, lo llamaremos P(EI) y la probabilidad de cometer el
error tipo II, lo llamaremos, P(EII). Ahora, si deseamos tener el mnimo riesgo posible de
cometer error, en caso de que consideremos la hiptesis de investigacin como verdadera,
50
Matemticas aplicadas
Estadstica Inferencial
entonces, lo que queremos es tener el mnimo riesgo posible de cometer el error tipo I, por lo
tanto, deseamos que P(EI) sea un nmero pequeo.
Los valores de P(EI) que se usan ms comnmente son: 0.10, 0.05, 0.01. Al decidir qu
probabilidad de cometer el error tipo I permitimos; estamos diciendo qu confianza queremos
tener, en caso de considerar la hiptesis de investigacin verdadera. Los valores de P(EI) que
acabamos de dar ,corresponden a confiabilidades de 90%, 95% y 99% respectivamente.
ACTIVIDAD DE APRENDIZAJE
La siguiente tabla es similar a la de la pgina 46, en donde est expresada en trminos de H0.
Ahora t exprsala en trminos de la hiptesis alternativa, H1.
SITUACIN
ESTADSTICA
SITUACIN REAL
( desconocida)
Regresemos a nuestro ejemplo, para esto, los profesores cuentan con una muestra de 30
calificaciones, en la que se obtuvo un promedio muestral de 7.86, es decir: n = 30 y x = 7.86.
La regla de decisin que queremos, nos debe indicar si la diferencia x u = 7.86 7.5 = 0.36
puede ser considerada lo suficientemente GRANDE, como para rechazar la hiptesis nula, o
si, por el contrario, debe ser considerada los suficientemente PEQUEA, como para no
rechazar H0. Tambin, que los valores de la media de distintas muestras tienen una distribucin
muestral, cuya dispersin estimamos mediante el error estndar muestral, x
s
, si esta
n
dispersin es grande, el promedio de cada muestra, puede alejarse bastante del promedio
poblacional , y si es pequea se espera que cada promedio est cercano a . Esto hace que
s
; diremos que
n
s
el promedio muestral x difiere mucho o poco de u con respecto al error muestral
.Para
n
evaluemos la diferencia x u , con respecto al error estndar muestral x
ver cmo es la regla de decisin que nos permitir decir una cosa u otra, nuestro punto de
partida ser, el intervalo de confianza para que ya estudiamos en el tema anterior. Como
51
Matemticas aplicadas
Estadstica Inferencial
sabemos, para hacer una estimacin por intervalo de , decidiremos con qu probabilidad
estamos dispuestos a cometer el error en la estimacin.
Por ejemplo si decidimos que = 0.05, sabemos que podemos encontrar un intervalo de (1- )
100% = 95% confianza para . Debido a que no conocemos el valor de (desviacin estndar
poblacional), tendremos que calcular de la muestra, el valor de s (desviacin estndar muestral) y
hacer uso de la distribucin t de Student para construir el intervalo de confianza;
x t( n 1)
s
n
donde t
(n -1)
x 2.045
s
s
de donde se deduce que, con una probabilidad de 0.95:
x 2.045
n
n
x
2.045
2.045
s/ n
Observemos que esta regla de decisin es precisamente la que desebamos obtener, ya que:
1) Si el valor de
x u
s/ n
x 7.5
s/ n
difiere mucho de cero y que es porque la diferencia x - 7.5 (que puede ser negativa o
positiva) difiere mucho de cero con respecto al error estndar muestral
s / n . Este es
el caso en el que x difiere mucho de 7.5 y que nos dice cundo podemos rechazar la
hiptesis nula.
2) Si el valor de
x u
s/ n
x 7.5
s/ n
difiere poco de cero y que es porque la diferencia x - 7.5 difiere poco de cero con
respecto al error estndar muestral s / n . Este es el caso en el que x difiere poco de
7.5 y que nos dice cundo no podemos rechazar la hiptesis nula.
52
Matemticas aplicadas
Estadstica Inferencial
** Grados de libertad: Es un parmetro de la distribucin t. para determinar un estimado de intervalo de una media
de poblacin, tiene n 1 grados de libertad, siendo n el tamao de la muestra aleatoria. (ver glosario de conceptos al
final de la gua didctica.
.10
.90
.45
.30
.70
.35
.50
.50
.25
.60
.40
.20
.70
.30
.15
.80
.20
.10
.90
.10
.05
1.376
1.963
3.078
6.314
1.386
1.886
2.920
.98
.02
.01
.99
.01
.005
12.706
31.821
63.657
4.303
6.965
9.925
.95
.05
.025
.995
.005
.0025
.998
.002
.001
.999
.001
.0005
127.32
318.31
636.62
14.089
22.327
31.598
12.924
Valores de t
1
2
3
4
.158
.142
.137
.134
.510
.445
.424
.414
1.000
.816
.765
.741
1.061
.978
.941
1.250
1.638
2.353
3.182
4.541
5.841
7.453
10.214
1.190
1.533
2.132
2.776
3.747
4.604
5.598
7.173
8.610
5
6
7
8
9
.132
.131
.130
.130
.129
.408
.404
.402
.399
.398
.727
.718
.711
.706
.703
.920
.906
.896
.889
.883
1.156
1.476
2.015
2.571
3.365
4.032
4.773
5.893
6.869
1.134
1.440
1.943
2.447
3.143
3.707
4.317
5.208
5.959
1.119
1.415
1.895
2.365
2.998
4.490
4.029
4.785
5.408
1.108
1.397
1.860
2.306
2.896
3.355
3.833
4.501
5.041
1.100
1.383
1.833
2.262
2.821
3.250
3.690
4.297
4.781
10
11
12
13
14
.129
.129
.128
.128
.128
.397
.396
.395
.394
.393
.700
.697
.695
.694
.692
.879
.876
.873
.870
.868
1.093
1.372
1.812
2.228
2.764
3.169
3.581
4.144
4.587
1.088
1.363
1.796
2.201
2.718
3.106
3.497
4.025
4.437
1.083
1.356
1.782
2.179
2.681
3.055
3.428
3.930
4.318
1.079
1.350
1.771
2.160
2.650
3.012
3.372
3.852
4.221
1.076
1.345
1.761
2.145
2.624
2.977
3.326
3.787
4.140
15
16
17
18
19
.128
.128
.128
.127
.127
.393
.392
.392
.392
.391
.691
.690
.689
.688
.688
.866
.865
.863
.862
.861
1.074
1.341
1.753
2.131
2.602
2.947
3.286
3.733
4.073
1.071
1.337
1.746
2.120
2.583
2.921
3.252
3.686
4.015
1.069
1.333
1.740
2.110
2.567
2.898
3.222
3.646
3.965
1.067
1.330
1.734
2.101
2.552
2.878
3.197
3.610
3.922
1.066
1.328
1.729
2.093
2.539
2.861
3.174
3.579
3.883
20
21
22
23
24
.127
.127
.127
.127
.127
.391
.391
.390
.390
.390
.687
.686
.686
.685
.685
.860
.859
.858
.858
.857
1.064
1.325
1.725
2.086
2.528
2.845
3.153
3.552
3.850
1.063
1.323
1.721
2.080
2.518
2.831
3.135
3.527
3.819
1.061
1.321
1.717
2.074
2.508
2.819
3.119
3.505
3.792
1.060
1.319
1.714
2.069
2.500
2.807
3.104
3.485
3.767
1.059
1.318
1.711
2.064
2.492
2.797
3.091
3.467
3.745
25
26
27
28
29
.127
.127
.127
.127
.127
.390
.390
.389
.389
.389
.684
.684
.684
.683
.683
.856
.856
.855
.855
.854
1.058
1.316
1.708
2.060
2.485
2.787
3.078
3.450
3.725
1.058
1.315
1.706
2.056
2.479
2.779
3.067
3.435
3.707
1.057
1.314
1.703
2.052
2.473
2.771
3.057
3.421
3.690
1.056
1.313
1.701
2.048
2.467
2.763
3.047
3.408
3.674
1.055
1.311
1.699
2.045
2.462
2.756
3.038
3.396
3.659
1.055
1.310
1.697
2.042
2.457
2.750
3.030
3.385
3.646
1.050
1.303
1.684
2.021
2.423
2.704
2.971
3.307
3.551
1.046
1.296
1.671
2.000
2.390
2.660
2.915
3.232
3.460
1.041
1.289
1.658
1.980
2.358
2.617
2.860
3.160
3.373
1.036
1.282
1.645
1.960
2.326
2.576
2.807
3.090
3.291
.127
.389
.126
.388
.126
.387
.126
.386
.126
.385
UPN-SEP. Introduccin
30
40
60
120
.683 .854
.681 .851
.679 .848
.677 .845
.674 .842
a los mtodos
Grados de libertad: Nmero de valores de una muestra que podemos especificar libremente, una vez que separamos algo de ella.
53
Matemticas aplicadas
A la expresin
x u
s/ n
Estadstica Inferencial
valor de tc es tal que tc si est en el intervalo <-2.045, 2.045>, no se rechaza H0, por lo que al
intervalo <-2.045,2.045> se le denomina la regin de no rechazo de H0. Si el valor de tc es tal
que tc no est en el intervalo <-2.045, 2.045>,se rechaza H0
= .05
Grficamente, se tiene:
t (29)
-2.045
Regin de
rechazo de H0
2.045
Regin de NO rechazo de H0
Regin de
rechazo de H0
Sabemos que si rechazamos H0 , podemos estar cometiendo el error tipo I. Por lo tanto, se
tiene que es la probabilidad de que siendo H0 verdadera, tc no est en el intervalo y
rechacemos H0.
Los pasos que consideraremos al probar una hiptesis son los siguientes:
1. Planteamiento de las hiptesis
2. Estadstico de prueba y condiciones para su uso.
3. Regla de decisin
4. Clculos
5. Decisin estadstica
6. Interpretacin de los resultados.
A continuacin se detallan cada uno de ellos de manera somera.
1) Planteamiento de las hiptesis.
Se plantear en trminos del problema a tratar la hiptesis de investigacin, la que se traducir
a trminos estadsticos. Se plantearn tambin las hiptesis nula y alternativa.
2) Estadstico de prueba y condiciones para su uso.
54
Matemticas aplicadas
Estadstica Inferencial
tc
x 7.5
s/ n
55
Matemticas aplicadas
Estadstica Inferencial
3) Regla de decisin
Como se desea probar H1: 7.5 ( u) con un nivel de significancia de 5%, se tienen que
=0.05 en dos colas. El valor en la tabla de la distribucin t de Student con 30 1= 29 grados
de libertad es t (29) = 2.045. A partir de este valor se definen las regiones de rechazo y no
rechazo de H0 , como sigue
No se rechaza H0
si tc est en el intervalo <-2.045, 2.045>
= .05
Se rechaza H0 si
tc est < ,2.045]
Se rechaza H0 si
tc est [2.045,>
t (29)
2.045
4) Clculos
Regin de
rechazo de H0
2.045
0
Regin de NO rechazo de H0
tc
x u
s/ n
Regin de
rechazo de H0
7.86 7.5
0.36
2.778
0.71/ 30 0.1296
5) Decisin estadstica
Como tc = 2.778 no est en el intervalo < -2.045,2.045>, se decide rechazar H0.
6) Interpretacin de los resultados
Como se rechaz la hiptesis nula, H0 : = 7.5 con = 0.05 se puede sealar:
La muestra proporciona evidencia suficiente para considerar, con 95% de confianza, que la
hiptesis de investigacin es verdadera, o sea que los jvenes de las escuelas secundarias
ubicadas en las zonas rurales del estado de Nayarit, tienen un nivel de conocimientos en
matemticas que es distinto del que tienen los jvenes de las secundarias urbanas del mismo
estado. Dicho de otra forma, podemos decir que hay diferencias significativas del nivel de
conocimientos en matemticas entre los jvenes de las escuelas secundarias de las zonas
rurales y los de las zonas urbanas del estado de Nayarit.
Si reflexionas y analizas detenidamente lo anterior, observaras que para llegar a stas conclusiones
estadsticas, intervinieron adems del valor de u (postulado por la hiptesis nula H0 : = u ), los
siguientes nmeros;
El promedio muestral ( x );
La desviacin estndar muestral(s);
El tamao de la muestra (n ); y
La probabilidad con la que se est dispuesto a cometer el error tipo I ().
En las siguientes actividades de aprendizaje te permitir reflexionar cmo influye cada uno de estos
nmeros en la conclusin estadstica de rechazar o no rechazar la hiptesis nula.
56
Matemticas aplicadas
Estadstica Inferencial
ANIMO, CORRE HACIA TU
AUTOAPRENDIZAJE
tc
Regin de NO rechazo de H0
< -tc (n-1) , tc (n-1)>
Conclusin estadstica:
Se rechaza H0 y se
acepta H1?
2.778
SI
7.00
17.14
7.35
7.50
7.65
7.86
8.00
Qu relacin guarda la distancia entre
la distancia entre
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
2) En el ejercicio se trabaj con x = 7.86, n = 30 y = 0.05. Obtenga la conclusin estadstica si
s hubiera sido cada uno de los indicados en la columna de la izquierda en la siguiente tabla:
tc
Regin de NO rechazo de H0
< -tc (n-1) , tc (n-1)>
Conclusin estadstica:
Se rechaza H0 y se
acepta H1?
2.778
SI
0.30
0.50
0.71
0.90
1.10
1.30
1.50
Qu relacin hay entre la dispersin de los datos de la muestra (s) y el valor t c del estadstico de
prueba? Qu relacin hay entre la dispersin de los datos de la muestra y la conclusin estadstica?
____________________________________________________________________________
____________________________________________________________________________
57
Matemticas aplicadas
Estadstica Inferencial
____________________________________________________________________________
3) En el ejercicio se trabaj con x = 7.86, s = 0.71 y = 0.05. Obtenga la conclusin estadstica
si n hubiera sido cada uno de los indicados en la columna de la izquierda en la siguiente tabla:
tc
Regin de NO rechazo de H0
< -tc (n-1) , tc (n-1)>
Conclusin estadstica:
Se rechaza H0 y se
acepta H1?
2.778
SI
5
10
15
20
25
30
40
Qu relacin hay entre n y el intervalo; n con tc ; n y la conclusin estadstica?, analiza tus conclusiones
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
3) En el ejercicio se trabaj con x = 7.86, s = 0.71 y n = 30. Obtenga la conclusin
estadstica si n hubiera sido cada uno de los indicados en la columna de la izquierda en
la siguiente tabla:
tc
Regin de NO rechazo de H0
< -tc (n-1) , tc (n-1)>
Conclusin estadstica:
Se rechaza H0 y se
acepta H1?
2.778
SI
0.10
0.05
0.02
0.01
0.005
0.002
0.001
Qu relacin hay entre y la amplitud de la regin de no rechazo de H0? Con cuanta confianza
podemos aceptar H1?, analiza tus conclusiones
____________________________________________________________________________
____________________________________________________________________________
58
Matemticas aplicadas
Estadstica Inferencial
____________________________________________________________________________
edicaremos este espacio para plantear en forma general, el mtodo que sirve para probar
hiptesis del tipo que ya sealamos en el tema de decisin estadstica , esto es, la
prueba para hiptesis estadsticas de la forma:
H0: = 0
H0: 0
H0: 0
o bien
o bien
H1 : 0
H1: > 0
H1: < 0
x 0
s/ n
es la t de Student con n-1 grados de libertad; adems que los resultados que se obtienen son
vlidos tanto para muestras grandes como para muestras pequeas. Para realizar dicha
prueba de hiptesis seguirn siendo vlidos los seis pasos del esquema general para la prueba
de hiptesis propuesto en el tema anterior.
El siguiente cuadro resume este mtodo:
Si X es una variable que se distribuye normalmente como media , y si se tiene una de
las siguientes hiptesis nulas:
H0: = 0
H0: 0
H0: 0
Donde 0 es un valor conocido, entonces un estadstico de prueba es
tc
x 0
s/
Regin de rechazo de H0
t(n1) es el valor
de t con en,
H1 : 0
Dos colas
H1: > 0
H1: < 0
[ t(n1), >
< , t(n1) ]
Una cola
Una cola
59
Matemticas aplicadas
Estadstica Inferencial
x 0
s/ n
Se rechaza H0 si
tc est < ,2.093]
Se rechaza H0 si
tc est [2.093,>
t (19)
2.093
Regin de
Rechazo de H0
0
Regin de NO rechazo de H0
2.093
Regin de
Rechazo de H0
4) Clculos:
Como n = 20, la media muestral es x = 11.9, la desviacin estndar muestral es s = 0.9
tenemos tc
x 0
s/ n
11.9 12.5
2.98
0.9 / 20
5) Decisin estadstica:
60
Matemticas aplicadas
Estadstica Inferencial
x 0
s/ n
61
Matemticas aplicadas
Estadstica Inferencial
t (120) = 1.658 (en un caso as se puede usar el valor ms prximo, que este caso es de t (120)) A partir de este
valor se definen las regiones de rechazo y no rechazo de H0, como sigue:
No se rechaza H0
si tc est en el intervalo <-, 1.658>
Se rechaza H0 si
tc est [1.658,>
= .05
1.658
0
Regin de NO
rechazo de
t (124)
H0
Regin de
Rechazo de H0
4) Clculos:
Como n = 125, x = 5.30, s = 1.8 y 0 = 4.25, tenemos:
tc
x 0
s/ n
5.30 4.25
6.522
1.8 / 125
5) Decisin estadstica:
Como tc = 6.522 y est en [1.658,> , se rechaza H0 .
6) Interpretacin de los resultados
:
Como se rechaz H0 : 4.25 con = 0.05, hay suficiente evidencia para considerar que el
puntaje promedio en la prueba de comprensin de lectura es ms alto para los estudiantes que
no usaron textos programados que para los estudiantes que usaron textos programados en sus
estudios preuniversitarios con una confiabilidad de 95%.
SAETA
62
Matemticas aplicadas
Estadstica Inferencial
El esquema de seis pasos para la prueba de hiptesis, que planteamos anteriormente, y que
utilizamos en la prueba de hiptesis sobre la media poblacional, nos servir aqu tambin.
Supongamos que estamos estudiando un fenmeno que tiene asociada una variable
categrica, y que estamos interesados en comparar la proporcin poblacional p con la que
ocurre cierta categora de la variable, con un determinado valor p0 que es conocido o que se
supone como dado. Entonces, las hiptesis estadsticas sern de la forma:
H0: p p0
H0: p = p0
o bien
H1: p p0
H0: p p0
o bien
H1: p > p0
H1: p < p0
El mtodo general para probar hiptesis sobre una proporcin poblacional es el siguiente:
zc
p p0
p0 1 p0
n
Regin de rechazo de H0
z es el valor de Z
con en,
< , z ] U [ z, >
Dos colas
[ z, >
H1: p > p0
H1: p < p0
< ,z ]
Una cola
Una cola
63
Matemticas aplicadas
Estadstica Inferencial
Procedamos a realizar dos problemas para estar listos para las actividades de autoaprendizaje
Problema para reflexionar
Se sospecha que menos del 60% de los profesores ayudan a los nios dislxicos (dificultad de la
lectura) a mejorar sus habilidades. Se realiz una investigacin para saber si esto es verdad en
cierta zona escolar. Para ello, se eligieron aleatoriamente a 230 maestros y se realiz una
entrevista con ellos para detectar si, al desarrollar su labor docente, ayudan a los nios
dislxicos a mejorar sus habilidades; se encontr que 134 de ellos s ayudan a los nios
dislxicos. Supongamos que se desea someter a prueba la hiptesis con = 0.05
1) Planteamiento de la hiptesis:
La hiptesis de investigacin es: Menos de 60% de los profesores ayudan a los nios dislxicos
a mejorar sus habilidades. O sea,
Hinv: p < 0.60
H0: p 0.60
H1: p < 0.60
2) Estadstico de prueba y condiciones para su uso:
p p0
El estadstico de prueba que usaremos es:
Las hiptesis estadsticas son:
zc
p0 1 p0
n
1.645
Regin de rechazo
de H0
Regin de NO rechazo de H0
4) Clculos:
Como n = 230, p = 134 / 230 = 0.5826 (proporcin de los que si ayudan a los nios) y p0 = 0.60,
tenemos:
p p0
0.5826 0.60 0.0174
zc
p0 1 p0
n
(0.60)(0.40)
230
0.0323
0.5387
64
Matemticas aplicadas
Estadstica Inferencial
5) Decisin estadstica:
Como zc = -0.5387, se encuentra en la regin de no rechazo, en el intervalo < -1.645, >, por lo
tanto, la H0 no se rechaza.
6) Interpretacin de los resultados
Como no se rechaz H0: p 0.60, no hay evidencia suficiente para considerar, con una
confianza de 95%, que el porcentaje de los maestros que ayudan a los nios dislxicos a
mejorar sus habilidades sea menor de 60%.
Otro ltimo problema para confirmar aprendizajes
Un Psiclogo opina que ms de 30% de los jvenes cuyas edades fluctan entre 16 y 19 aos
tienen inters en conocer aspectos de educacin sexual. Para someter a prueba su hiptesis,
elige aleatoriamente 150 jvenes y por medio de una entrevista y una prueba detecta que 63 de
ellos estn interesados en temas de educacin sexual. Supongamos que el psiclogo desea
una confiabilidad en su prueba de 99% ( por lo que = 0.01).
1) Planteamiento de la hiptesis:
La hiptesis de investigacin es: Ms de 30% de los jvenes cuyas edades fluctan entre 16 y
19 aos tienen inters en conocer aspectos de ecuacin sexual, O sea, Hinv: p > 0.30
H0 : p 0.30
H1 : p > 0.30
zc
p0 1 p0
n
Se rechaza H0 si
zc est [2.326,>
= .01
2.326
0
Regin de NO
rechazo de
H0
Regin de
Rechazo de H0
65
Matemticas aplicadas
Estadstica Inferencial
4) Clculos:
Como n = 150, p = 63 / 150 = 0.42 (proporcin interesada en temas de educacin sexual) y p0 : 0.30,
tenemos:
zc
p p0
p0 1 p0
n
0.42 0.30
0.12
3.21
(0.30)(0.70) 0.0374
150
5) Decisin estadstica:
Como 3.21 est [2.326,> , se rechaza H0
6) Interpretacin de los resultados:
Como se rechaz H0: p 0.30 con = 0.01, hay suficiente evidencia para considerar, con 99%
de confianza, que ms de 30% de los jvenes cuyas edades fluctan entre 16 y 19 aos, tienen
inters en conocer aspectos de educacin sexual.
Gracias
aceboman
quiero y
merezco mi 10
MUCHAS FELICIDADES!!
SAETA
66
Matemticas aplicadas
Estadstica Inferencial
ACTIVIDADES DE APRENDIZAJE
Resuelve las siguientes pruebas de hiptesis para una media y proporcin poblacional y
Realiza tus operaciones en tu cuaderno y aqu escribe tus respuestas correctas
1) La productividad de Maz de 5 hectreas elegidas aleatoriamente en la regin sur del Estado
de Nayarit fue de 4.1, 3.7, 3.2, 3.3, y 3.5 toneladas.
a) Determina la productividad media y la desviacin estndar de esta muestra.
b) De acuerdo con el INEGI, la productividad media de la regin es de 3.5 toneladas por
hectrea. Debemos rechazar la hiptesis nula H0: = 3.5 y aceptar la hiptesis
alternativa 3.5 a un nivel de significancia de 0.05? realiza los 6 pasos para comprobar
dicha hiptesis.
2) Un inspector de Hacienda sospecha que las ventas semanales promedio de una empresa
superan los $ 36 750.00 que indic la empresa en su declaracin anual. El inspector selecciona
aleatoriamente 9 semanas y al estudiarlas detalladamente obtiene que durante estas 9
semanas las ventas semanales tuvieron una media de x = $ 40 500.00 y una desviacin
estndar de s = $ 2 850.00. El inspector decide continuar con la auditoria en caso de que deba
rechazar la hiptesis nula = 36 750.00 y aceptar la hiptesis alternativa > 36 750.00 a un
nivel de significancia de 0.05. Continuar la auditoria el inspector? Realiza los 6 pasos
3) Una empresa entrevista a una muestra de 18 secretarias provenientes de una escuela que
afirma que sus egresadas escriben en la computadora 70 palabras por minuto. La media de
esta muestra fue x = 67.3 palabras por minuto y la desviacin estndar fue de s = 4.4 palabras
por minuto. Usa el nivel de significancia de 0.05 para decidir si la empresa debe rechazar la
hiptesis nula H0 : = 70 y aceptar la hiptesis alternativa < 70. Realiza los 6 pasos
4) En un informe acerca de la desercin, se menciona que en los CBTAs del estado de Nayarit,
el 40% de los alumnos abandonan sus estudios porque carecen de recursos econmicos. Un
profesor piensa que en su CBTa esto no coincide con la realidad; para someter a prueba su
hiptesis, obtiene una muestra aleatoria de 70 estudiantes desertores, y encuentra que 30 de
ellos carecen de recursos econmicos. Puede el profesor, con un nivel de significancia =
0.05, considerar que, entre los alumnos desertores, los que carecen de recursos econmicos
son un porcentaje distinto de 40%?. Realiza los 6 pasos
5) Un trabajador social cree que menos del 25% de las parejas de cierta regin, han utilizado
por lo menos una vez, alguna forma de control natal. Con el fin de ver si esta suposicin es
razonable, el trabajador social selecciona una muestra aleatoria de 120 parejas de la regin, de
las cuales 20 dijeron que haban empleado algn mtodo de control natal. Realiza los 6 pasos para
verificar la hiptesis planteada.
67
Matemticas aplicadas
Estadstica Inferencial
68