Sie sind auf Seite 1von 74

TAMAO DE LA MUESTRA

DEFINICIONES BSICAS
Poblacin.- Llamado tambin universo o colectivo, es el conjunto de todos los elementos que tienen una
caracterstica comn.
Una poblacin puede ser finita o infinita. Es poblacin finita cuando est delimitada y conocemos el nmero que la
integran, as por ejemplo: Estudiantes de la Universidad UTN.
Es poblacin infinita cuando a pesar de estar delimitada en el espacio, no se conoce el nmero de elementos que la
integran, as por ejemplo: Todos los profesionales universitarios que estn ejerciendo su carrera.

Muestra.- La muestra es un subconjunto de la poblacin. Ejemplo: Estudiantes de 2do Semestre de la Universidad


UTN.

Elemento o individuo.- Unidad mnima que compone una poblacin. El elemento puede ser una entidad simple
(una persona) o una entidad compleja (una familia), y se denomina unidad investigativa.

DEDUCIN DE LA FRMULA PARA CALCULAR EL TAMAO DE LA MUESTRA


De la frmula de la estimacin del intervalo de confianza para la media

De donde el error es:

TAREA: Despejar n


Donde:
Desviacin estndar de la poblacin que rara vez conoce su valor. Generalmente cuando no se tiene su valor, suele
utilizarse un valor constante de 0,5.
= Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se tiene su valor, se lo toma en relacin
al 95% de confianza equivale a 1,96 (como ms usual) o en relacin al 99% de confianza equivale 2,58, valor que queda a
criterio del investigador de acuerdo al nivel de profundidad de la investigacin.
= Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor, suele utilizarse un valor que vara
entre el 1% (0,01) y 9% (0,09), valor que queda a criterio del encuestador de acuerdo al nivel de profundidad de la
investigacin, sin embargo, se aconseja emplear el 5% o el 1%, por ser valores que guardan relacin con el 95% y 99% de
confianza, respectivamente.

TAREA:
1) Calcular el tamao de la muestra de una poblacin de 1000 elementos en forma manual y
empleando Excel
2) Una Parroquia de una determinada ciudad est compuesta de 3 barrios, el barrio A de 1500
habitantes, el barrio B de 2500 habitantes y el barrio C de 1000 habitantes. Se va a realizar un
estudio de mercado.
2.1) Cuntas encuestas se debe aplicar si se emplea el clculo de la tamao de la muestra al 95%
de confianza con un error de muestreo del 5% ?
2.2) Cuntas encuentras se deben aplicar en cada barrio?
3) Proponga y resuelva un ejemplo del clculo de tamao de la muestra empleando Excel

DISTRIBUCIN DE FRECUENCIAS
- Frecuencia Absoluta ().- Es el nmero de veces que se repite el valor de cada variable. La suma de frecuencias
absolutas es siempre al total de datos observados.
- Frecuencia Relativa ().- Indica la proporcin con que se repite un valor. Es el cociente entre la frecuencia absoluta
y el nmero total de datos. La suma de las frecuencias relativas es siempre 1
- Frecuencia Acumulada ().- Indica el nmero de valores que son menores o iguales que el valor dado. Al sumar las
frecuencias absolutas desde el menor puntaje hacia arriba tenemos la frecuencia acumulada, es decir, es la suma de la
frecuencia absoluta primera con la segunda, este valor con la tercera, y as sucesivamente.
- Frecuencia Porcentual ().- Llamada tambin frecuencia relativa porcentual. Se obtiene multiplicando la frecuencia
relativa por 100. La suma de las frecuencias porcentuales es siempre 100%.
- Frecuencia Relativa Acumulada ().- Es la suma de la frecuencia relativa primera con la segunda, este valor con la
tercera, y as sucesivamente.
- Frecuencia Relativa Acumulada Porcentual ().- Indica el nmero de valores que son menores o iguales que el
valor dado. Se obtiene multiplicando la frecuencia relativa acumulada por 100.

TAREA:
1) Calcular las diferentes frecuencias empleando Excel de las siguientes calificaciones evaluadas sobre 10 obtenidas
de 40 estudiantes en la asignatura de Estadstica sin agrupar en clases:

10 8 9
6 7 10
6 5 6
8 10 9
8 10 7

8
9
8
7
8

7
8
10
6
5

8
8
5
7
9

9 10
10 8
9 9
7 6
8 5

Realice la interpretacin de un valor cualquiera de , , , , y

2) Calcule las frecuencias empleando Excel de siguientes calificaciones evaluadas sobre 10 obtenidas de 40
estudiantes en la asignatura de Estadstica

10

10

10

Realice la interpretacin de un valor cualquiera de , , , , y

INTERVALOS O CLASES
- Rango (R).- Tambin se llama recorrido o amplitud total. Es la diferencia entre el valor mayor y el menor de
los datos.
- Nmero de Intervalos de Clase ().- No debe ser menor de 5 y mayor de 12, ya que un nmero mayor o menor de
clases podra oscurecer el comportamiento de los datos. Para calcular el nmero de intervalos se aplica la regla de
Sturges, propuesta por Herberth Sturges en 1926:

- Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el nmero de intervalos

Cuando
el valor de no es exacto, se debe redondear al valor superior ms cercano. Esto altera el valor de
rango por lo que es necesario efectuar un ajuste as:

- Intervalos de Clase agregando al lmite inferior de cada clase, comenzando por el del rango.

TAREA
A 40 estudiantes se les pidi que estimen el nmero de horas que habran dedicado a estudiar la semana pasada
(tanto en clase como fuera de ella), obtenindose los siguientes resultados:

36
54
32
58
58

30
35
35
50
50

47
45
56
65
47

60
52
48
35
58

32
48
30
56
55

35
58
55
47
39

40
60
49
37
58

50
38
39
56
45

a) Calcular n, el rango, el nmero de intervalos y el ancho del intervalo

b) Arme los intervalos y calcule las frecuencias

A 40 docentes que laboran en la Universidad UTN se les pregunt su edad, obtenindose los siguientes
resultados:

32
54
42
48
48

50
44
55
40
54

52
48
46
57
57

40
38
38
55
48

45
49
54
46
51

38
55
44
57
59

58
58
47
47
54

58
48
43
46
55

Arme los intervalos y calcule las frecuencias


Realice la interpretacin de un valor cualquiera de

GRFICOS ESTADSTICOS
TAREA:
Las calificaciones obtenidas por 40 estudiantes en una evaluacin de Matemtica son:

4
8
4
10
10

6
8
7
5
4

6
7
9
10
3

8
7
7
6
3

10
9
9
8
3

10
8
10
4
8

1) Elaborar un diagrama de barras verticales en 2D

6
4
8
5
7

8
8
9
7
8

2) Elaborar un diagrama de barras verticales en 3D

3) Elaborar un diagrama de barras horizontales en 3D

4) Elaborar una ojiva en 2D

5) Elaborar una ojiva de porcentajes en 3D

6) Elaborar un diagrama de sectores en 3D con los siguientes datos corresponde a las edades en aos de un
grupo de personas:
Nombr
e
Edad

Mario

Dyana

35

36

Matha Segund
s
o
5
63

Bertha
65

Alberto Victoria
64

7) Elaborar un diagrama de sectores en 3D con las edades de 10 familiares suyos

63

Emily

Fausto

0,5

58

En una encuesta efectuada a los estudiantes de Segundo Semestre de la Universidad UTN sobre la edad de sus
padres, se obtuvieron los siguientes resultados:

40
54
40
48
58

45
44
45
50
44

56
43
56
47
47

60
58
48
45
58

62
49
44
56
41

48
54
48
47
59

56
46
57
47
55

1) Terminar de llenar la siguiente tabla


Clases
39-42

43-46
47-50

0,075
44,5

59-62

0,275

10

21

51-54
55-58

7,5

25

0,1
11

0,625

62,5

100

56,5
0,1

40

10

52
57
53
56
60

2) Elaborar un histograma

3) Elaborar un histograma para la fra%

4) Elaborar un diagrama de sectores en 2D

A 40 estudiantes se les pidi que estimen el nmero de horas que habran dedicado a estudiar la semana
pasada (tanto en clase como fuera de ella), obtenindose los siguientes resultados:
30
36
47
50
58

30
37
47
52
58

32
38
47
54
58

32
39
48
55
58

35
39
48
55
58

35
40
49
56
60

35
45
50
56
60

35
45
50
56
65

Elaborar un diagrama de tallo y hojas


5) Investigue sobre un tema de su preferencia y elabore un diagrama de tallos y hojas empleando GeoGebra

http://
es.scribd.com/doc/284377000/Taller-sobre-tamano-de-la-muestra-frecuencias-y-graf
cos-estadisticos#logout

MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central son medidas representativas que tienden a ubicarse hacia el centro del conjunto de datos,
es decir, una medida de tendencia central identifica el valor del dato central alrededor de cual se centran los dems datos
MEDIA ARITMTICA
La medida aritmtica, al igual que cualquier otra medida de datos estadsticos, cuando se calcula a nivel de toda la
poblacin, se denominan parmetro, como por ejemplo, la calificacin promedio en el examen de admisin de todos los
estudiantes que ingresan a la Universidad UTN al primer semestre del presente ao lectivo. Pero si se calcula basada en
muestras, se denomina estadgrafo o estadstico, como por ejemplo, la calificacin promedio en el examen de admisin de
estudiantes de colegios fiscales que ingresan a la Universidad UTN al primer semestre del presente ao lectivo.
MEDIA ARITMTICA SIMPLE
a) Para Datos sin Agrupar
media de una poblacin es el parmetro (que se lee miu). Si hay N observaciones en el conjunto de
La
datos de la poblacin, la media se calcula as:

MEDIA ARITMTICA SIMPLE


media de una muestra es un estadstico (que se lee x barra). Con n observaciones en el conjunto de datos de la
La
muestra , la media se determina as:

b) Para Datos Agrupados en Tablas de Frecuencias.- Cuando una serie se la agrupa en serie simple con frecuencias
para obtener la media aritmtica, se multiplica la variable por la frecuencia respectiva (f), luego se obtiene la suma de
todos estos productos y luego a este valor se lo divide para el nmero de elementos (n). Todo esto puede representarse
mediante una frmula matemtica, as:

Para Datos Agrupados en Intervalos.- Cuando una serie se la agrupa en intervalos para obtener la media aritmtica,
c)
se multiplica la marca de clase de intervalo () por la frecuencia respectiva (), luego se obtiene la suma de todos estos
productos y luego a este valor se lo divide para el nmero de elementos. Todo esto se representa mediante la siguiente
frmula matemtica:

TAREA:
Calcule la media aritmtica de las siguientes calificaciones de Matemtica tomadas de una muestra

10 8 9
5 4 8
8 3 8
8 10 10

7 6
8 3
9 10
9 8

3 7 10
4 8 9
5 9 8
6 10 7

a) Sin agrupar
7,0833
b) Agrupando en frecuencias
7,0833
c) Agrupando en intervalos de ancho 2
7

6
5
4
3

MEDIA ARITMTICA PONDERADA

Cuando
los nmeros se les asocian ciertos factores peso (o pesos) , dependientes de la relevancia asignada a cada
nmero, en tal caso se requiere calcular la media aritmtica ponderada, la cual se calcula as:

TAREA:
1) Si el examen final de Estadstica cuenta tres veces ms que una evaluacin parcial, y un estudiante tiene 8 en el
examen final, 7 y 9 en las dos parciales. Calcule la calificacin media
2) En una encuesta sobre la aceptacin de un producto, 80 de los encuestados manifestaron que el producto es
Excelente, 120 indicaron que es Muy Bueno, 60 que es Bueno, 20 que es Regular. Para aplicar las encuestas se
emple el tamao de la muestra con un nivel de confianza del 95% y un error de muestreo del 5%.
a) Cul es la tamao de la poblacin?
1030
b) Cul es la aceptacin promedio del producto considerando Excelente = 4, Muy Bueno = 3, Bueno =2 y
Regular =1?
2,9 = Muy Bueno
c) Presente los resultados de la encuesta mediante un diagrama de pastel

LA MEDIANA
La mediana, llamada algunas veces media posicional, es el valor del trmino medio que divide una distribucin de
datos ordenados en dos partes iguales, es decir, el 50% de los datos se ubican sobre la mediana o hacia los puntajes
altos y el 50% restante hacia los puntajes bajos.
a) Para Datos sin Agrupar
Calcular la mediana de las siguientes calificaciones del curso de Estadstica evaluadas sobre diez: 10, 8, 6, 4, 9, 7,
10, 9 y 6
Se ordena los datos de menor a mayor:
4

10

10

La mediana es el valor de x5 (quinto dato), es decir, Md=8


Calcular la mediana de las siguientes calificaciones del curso de Matemtica evaluadas sobre diez: 10, 8, 9, 6, 4, 8,
9, 7, 10 y 9
Se ordena los datos de menor a mayor:
4

10

10

TAREA: Calcular con Excel los dos ejercicios

Para Datos Agrupados en Tablas de Frecuencia


Para calcular la posicin de la mediana se aplica la siguiente ecuacin:
TAREA
Calcular la mediana agrupando en tablas de frecuencia dados los siguientes 20 nmeros: 1, 3, 3, 5, 5, 5, 5, 2, 2, 2, 6, 6,
4, 4, 4 ,4, 5, 5, 5, 5
Md=4,5

Para Datos Agrupados en Intervalos

En donde:
Lmite inferior del intervalo de clase de la mediana
Nmero total de datos
Frecuencia acumulada del intervalo de clase que antecede al intervalo de clase de la mediana.
Frecuencia absoluta del intervalo de clase de la mediana
Ancho del intervalo

TAREA:
Calcular la mediana con los siguientes datos

Intervalo
s
[45,55)
[55,65)
[65,75)
[75,85)
[85,95)

6
10
19
11
4

Calcular la mediana empleando un histograma para fa

=69,737

MEDIDAS DE POSICIN
CUARTILES.- Son cada uno de los 3 valores que dividen a la distribucin de los datos en 4 partes iguales.

Para Datos No Agrupados

TAREA: Calcule los cuartiles y elaborar un diagrama de caja y bigotes dada la siguiente distribucin: 6, 9, 9,
12, 12, 12, 15 y 17
9; 12; 13,5

TAREA: Calcular el cuartil 2

6
9
12
15
17

1
2
3
1
1

Para Datos Agrupados en Intervalos

Calcular los cuartiles y con un histograma para fra% con los siguientes datos
Intervalo
s
45- 55
55- 65
65- 75
75- 85
85- 95

6
10
19
11
4

MEDIDAS DE TENDENCIA CENTRAL

MODA
La moda de un conjunto de datos es el valor que aparece con mayor frecuencia
Para Datos No Agrupados
Se observa el dato que tiene mayor frecuencia
Ejemplo:
1) Determinar la moda del conjunto de datos 2, 4, 6, 8, 8 y 10
Solucin:
Mo = 8, porque es el dato que ocurre con mayor frecuencia. A este conjunto de datos se le llama unimodal

2) Determinar la moda del conjunto de datos: 8, 4, 6, 6, 8, 2 y 10


Este conjunto de datos tiene dos modas, 8 y 6, y se llama
bimodal

3) Determinar la moda del conjunto de datos: 2, 4, 6, 8 y 10


Este conjunto de datos no tiene moda, porque ningn nmero tiene mayor frecuencia

Para datos ordenados en tabla de frecuencias


Calcule la moda o modas (si las hay) de los siguientes datos:
f
2
4
6
8
10

1
2
3
1
1

Se observa que el dato con mayor frecuencia es 6, por lo tanto Mo = 6

Para Datos Agrupados en Intervalos


Se halla en el intervalo o clase que tenga la frecuencia ms alta, llamada intervalo o clase modal. Se emplea la
siguiente ecuacin:

Lmite
inferior de la clase modal.
Diferencia entre la frecuencia absoluta de la clase modal y la clase que la antecede.
Diferencia entre la frecuencia absoluta de la clase modal y la clase que le sigue.
ancho de la clase modal.
TAREA: Con los siguientes datos calcular:

Intervalo o
Clase
10-19
20-29
30-39
40-49
50-59

3
7
15
12
8

1) La moda mediante la ecuacin y con un histograma


2) El Cuartil 3 mediante la ecuacin y con un
histograma
fra%
2) El Quintil para
1
3) La media aritmtica

MEDIDAS DE DISPERSIN

Las medias de tendencia central o posicin nos indican donde se sita un dato dentro de una distribucin de datos, se
ubican generalmente hacia el centro de una distribucin estadstica. Las medidas de dispersin, variabilidad o variacin
nos indican si esos datos estn prximos entre s o s estn dispersos, es decir, nos indican cun esparcidos se
encuentran los datos con relacin a un valor central, siendo la media aritmtica le valor central ms empleado.
DESVIACIN MEDIA O DESVIACIN PROMEDIO
La desviacin media o desviacin promedio es la media aritmtica de los valores absolutos de las desviaciones
respecto a la media aritmtica.

Para
Datos No Agrupados
Se emplea la frmula:

TAREA: Calcular la desviacin media de la distribucin: 3, 8, 8, 8, 9, 9, 9, 18

Para datos ordenados en tabla de frecuencias

TAREA: Calcular la desviacin media en base a la siguiente tabla sobre las calificaciones de un estudiante en 12
asignaturas evaluadas sobre 10
Calificacin Cantidad
de
asignaturas
6
4
7
2
8
3
9
2
10
1
Total
12
Para Datos Agrupados en Intervalos

TAREA: Calcular la desviacin media en base a la siguiente tabla

Intervalo o
Clase
10-19
20-29
30-39
40-49
50-59

3
7
15
12
8

VARIANZA Y DESVIACIN ESTNDAR


La varianza es la media aritmtica de los cuadrados de las desviaciones respecto a la media aritmtica, es decir, es el
promedio de las desviaciones de la media elevadas al cuadrado. La desviacin estndar o desviacin tpica es la raz
de la varianza.
Indican el grado en que estn dispersos los datos en una distribucin. A mayor medida, mayor dispersin
Teorema de Chebyshev
una aplicacin de la desviacin estndar del matemtico ruso Pafnuty Lvovich Chebyshev, y se aplica a todos los
Es
conjuntos de datos. Establece que para todo conjunto de datos, por lo menos de las observaciones estn dentro de k
desviaciones
estndar de la media, en donde k es cualquier nmero mayor que 1. Este teorema se expresa de la
:
siguiente manera:

As por ejemplo, si se forma una distribucin de datos con k =3 desviaciones estndar por debajo de la media hasta
3 desviaciones estndar por encima de la media, entonces por lo menos

Interpretacin: El 88,89% de todas las observaciones estarn dentro 3 desviaciones de la media.

Para Datos No Agrupados


La varianza para una poblacin se calcula con:

La desviacin estndar poblacional se calcula con:

Donde:

La varianza de la muestra se calcula con:

Donde:

La desviacin estndar de una muestra se calcul con:

TAREA:
1) Considere que los siguientes datos corresponden al sueldo de una poblacin: $350, $400, $500, $700 y $1000
a) Calcular la desviacin estndar.
b) Cul es el intervalo que est dentro de k = 2 desviaciones estndar de la media?. Qu porcentaje de las
observaciones se encuentran dentro de ese intervalo?
Solucin:

2) Dos empresas, A y B, venden sobres de caf instantneo de 350 gramos. Se seleccionaron al azar en los mercados cinco
sobres de cada una de las compaas y se pesaron cuidadosamente sus contenidos. Los resultados fueron los siguientes

A
350,14
350,18
349,98
349,99
350,12

B
350,09
350,12
350,20
349,88
349,95

a) Qu empresa proporciona ms caf en sus sobres?


b) Qu empresa llena sus sobres de manera ms consistente?

Para datos ordenados en tabla de frecuencias


La varianza para una poblacin se calcula con:

La varianza de la muestra se calcula con:

La desviacin estndar poblacional se calcula con:

La desviacin estndar de una muestra se calcula con:

TAREA: Calcular la desviacin estndar de los siguientes datos correspondientes a una muestra

Calificacione
s
4
5
6
7
8
10
Total

3
6
4
13
7
6
39

Para Datos Agrupados en Intervalos


La varianza para una poblacin se calcula con:

La desviacin estndar poblacional se calcula con:

La varianza de la muestra se calcula con:

La desviacin estndar de una muestra se calcula con:

Calcular la desviacin estndar de los siguientes datos correspondientes a una muestra.

Intervalo o
Clase
10-19
20-29
30-39
40-49
50-59

3
7
15
12
8

DISPERSIN RELATIVA O COEFICIENTE DE VARIACIN


Las medidas de dispersin son medidas de variacin absolutas. Una medida de dispersin relativa de los datos, que
toma en cuenta su magnitud, est dada por el coeficiente de variacin.
El Coeficiente de variacin (CV) es una medida de la dispersin relativa de un conjunto de datos, que se obtiene
dividiendo la desviacin estndar del conjunto entre su media aritmtica y se expresa generalmente en trminos
porcentuales.
Puesto que tanto la desviacin estndar como la media se miden en las unidades originales, el CV es una medida
independiente de las unidades de medicin. Debido a la propiedad anterior el CV es la cantidad ms adecuada para
comparar la variabilidad de dos conjuntos de datos.
Para una poblacin se emplea la siguiente frmula:

Para una muestra se emplea la siguiente frmula:

TAREA:
Se calcula una muestra sobre las calificaciones en las asignaturas de Matemtica y Estadstica en una determinada
carrera, resultados que se presentan en las siguientes tablas. En qu asignatura existe mayor variabilidad?.

Matemtica
Intervalos
f
2-4
8
5-7
12
8 - 10
20
Total
40

Estadstica
f
Intervalos
8
24
14
57
18
8 - 10
40
Total

DISTRIBUCIN NORMAL
Resea histrica
Abrahan De Moivre (1733) fue el primero en obtener la ecuacin matemtica de la curva normal. Kart Friedrich Gauss y
Mrquez De Laplece (principios del siglo diecinueve) desarrollaron ms ampliamente los conceptos de la curva. La curva
normal tambin es llamada curva de error, curva de campana, curva de Gauss, distribucin gaussiana o curva de
De Moivre.
Su ecuacin matemtica de la funcin de densidad es:
Donde:
Y = altura de la curva para cualquier valor de x

X = valor en el eje horizontal

En Excel

Cuando se expresa la variable x en unidades estndar (frmula de estandarizacin)

Nota: No existe una nica distribucin normal, sino una familia de distribuciones con una
forma comn, diferenciadas por los valores de su media y su varianza. De entre todas ellas, la
ms utilizada es la distribucin normal estndar, que corresponde a una distribucin con
una media aritmtica de 0 y una desviacin tpica de 1
rea bajo la curva
rea total limitada por la curva y el eje X es 1, por lo tanto, el rea bajo la curva entre X = a y X = b,
El
con a < b, representa la probabilidad de que X est entre a y b. Esta probabilidad se denota por:
Esta probabilidad se ilustra en el siguiente grfico elaborado con el programa Winstats.

TAREA
1) Calcular el rea entre una, dos y tres desviaciones estndar
0,6827 =
68,27%

0,9545 =
95,45%

0,9973 =
99,73%

0,6827 =
68,27%

0,9545 =
95,45%

0,9973 =
99,73%

2) Calcule Z si el rea entre -1,5 y Z es 0,0217

3) En cierta rea, un conductor promedio recorre una distancia de 1200 millas al mes (1,609 Km al mes), con una
desviacin estndar de 150 millas. Suponga que el nmero de millas se aproxima mediante una curva normal, encuentre
la probabilidad de todos los automovilistas que recorren entre 1200 y 1600 millas por mes. Resuelva empleando la tabla
de la distribucin normal, Excel y Winstats
49,6%
4) Las calificaciones que obtienen alumnos universitarios en un examen siguen una distribucin normal, siendo la
media igual a 7. El 80% de los alumnos obtienen una calificacin inferior a 8. Resuelva empleando la tabla de la
distribucin normal, Excel y Winstats
4.1) Calcule la desviacin tpica de las calificaciones
1,2
4.2) Se escoge un alumno al azar, calcule el porcentaje de obtener una calificacin superior a 9
4,6%
5) La altura de los rboles de un bosque sigue una distribucin normal con una altura media de 17 m. Se selecciona un
rbol al azar. La probabilidad de que la altura del rbol seleccionado sea mayor que 24 metros es 6%. Si se selecciona al
azar 100 rboles. Utilice Excel y GeoGebra.
5.1) Calcule la desviacin tpica de las alturas de los rboles
4,5
5.2) Calcular el nmero esperado de rboles cuyas alturas varan entre 17m y 24m.
44

ESTIMACIN DEL INTERVALO DE CONFIANZA PARA LA MEDIA ( CONOCIDA)

TAREA
1) Un fabricante de papel para computadora tiene un proceso de produccin que opera continuamente a lo largo
del turno. Se espera que el papel tenga una media de longitud de 11 pulgadas y una desviacin estndar de 0,02
pulgadas. Se selecciona una muestra de 100 hojas con una media de longitud del papel de 10,998 pulgadas.
Calcule la estimacin del intervalo de confianza del 95%
10,99408 11,00192
2) El gerente de control de calidad de una fbrica de focos necesita estimar la media de vida de un gran embarque de
focos. La desviacin estndar es de 100 horas. Una muestra aleatoria de 64 focos indic que la vida media de la
muestra es de 350 horas. Calcule la estimacin del intervalo de confianza para la media poblacional de vida de los
focos de este embarque del 98%
320,875 379,125

ESTIMACIN DE INTERVALO DE CONFIANZA PARA LA MEDIA ( DESCONOCIDA)

Si

TAREA
1) Sea X = hallar el valor de P(X -1,3722) + P(X 2,7638)

2) Un fabricante de papel para computadora tiene un proceso de produccin que opera continuamente a lo largo del
turno. De 500 hojas se selecciona una muestra de 29 hojas con una media de longitud del papel de 10,998 pulgadas y
una desviacin estndar de 0,02 pulgadas. Calcular la estimacin del intervalo de confianza del 99%

3) Una empresa manufacturera produce aislantes elctricos. Si los aislantes se rompen al usarse, muy posiblemente
tendremos un corto circuito. Para probar la fuerza de los aislantes, se lleva a cabo una prueba destructiva para determinar
cunta fuerza se requiere para romperlos. Se mide la fuerza observando cuntas libras se aplican al aislante antes de que se
rompa. La siguiente tabla lista 30 valores de este experimento de la fuerza en libras requerida para romper el aislante.
Construya una estimacin del intervalo de confianza del 95% para la poblacin media de fuerza requerida para romper al
aislante empleando Excel y Winstats.

1870
1866
1820

1728
1764
1744

1656
1734
1788

1610
1662
1688

1634
1734
1810

1784
1774
1752

1522
1550
1680

1696
1756
1810

1592
1762
1652

1662
1866
1736
1689,96 1756,84

ESTIMACIN DEL INTERVALO DE CONFIANZA PARA UNA PROPORCIN

TAREA:
1) En un almacn se est haciendo una auditoria para las facturas defectuosas. De 500 facturas de venta se escoge una
muestra de 30, de las cuales 5 contienen errores. Construir una estimacin del intervalo de confianza del 95%.

2) Una empresa telefnica desea estimar la proporcin de hogares en los que se contratara una lnea telefnica adicional.
Se seleccion una muestra aleatoria de 500 hogares. Los resultados indican que a un costo reducido, 135 de los hogares
contrataran una lnea telefnica adicional. Construya e interprete una estimacin del intervalo de confianza del 99% de la
proporcin poblacional de hogares que contrataran una lnea telefnica adicional.
21,9% 32,1%

PRUEBA DE HIPTESIS PARA MEDIAS


Una hiptesis es un enunciado acerca del valor de un parmetro (media, proporcin, etc.).
Prueba de Hiptesis es un procedimiento basado en evidencia muestral (estadstico) y en la teora de probabilidad
(distribucin muestral del estadstico) para determinar si una hiptesis es razonable y no debe rechazarse, o si es
irrazonable y debe ser rechazada.
hiptesis de que el parmetro de la poblacin es igual a un valor determinado se conoce como hiptesis nula. Una
La
hiptesis nula es siempre una de status quo o de no diferencia. Se simboliza con el smbolo

Siempre
que se especifica una hiptesis nula, tambin se debe especificar una hiptesis alternativa, o una que debe ser
verdadera si se encuentra que la hiptesis nula es falsa. La hiptesis alternativa se simboliza . La hiptesis alternativa
representa la conclusin a la que se llegara si hubiera suficiente evidencia de la informacin de la muestra para decidir
que es improbable que la hiptesis nula sea verdadera, y por tanto rechazarla. Es siempre opuesta a la Hiptesis Nula.

En toda prueba de hiptesis se presentan 3 casos de zonas crticas o llamadas tambin zonas de rechazo de la hiptesis
nula, estos casos son los siguientes:

1) Prueba Bilaterial o a dos colas:

2) Prueba Unilateral con cola hacia la derecha:

3) Prueba Unilateral con cola hacia la izquierda:

PRUEBA DE HIPTESIS PARA MEDIAS DE UNA MUESTRA


Se utiliza una prueba de una muestra para probar una afirmacin con respecto a una media de una poblacin nica.

Si se conoce la desviacin estndar de la poblacin

Si se conoce la desviacin estndar de la muestra


TAREA:
1) La duracin media de una muestra de 200 tubos fluorescentes producidos por una compaa resulta ser de
1620 horas. Se sabe que la desviacin tpica de la poblacin es de 100 horas. Comprobar la hiptesis contra la
hiptesis alternativa horas con un nivel de significacin de 0,05

Decisin: Dado que se rechaza la

ES representa el error debido a la estimacin de la media poblacional a partir de las medias


muestrales, es decir, es la desviacin estndar de todas las posibles muestras escogidas de esa
poblacin

2) La duracin media de lmparas producidas por una compaa han sido en el pasado de 1120 horas. Una muestra de 8
lmparas de la produccin actual dio una duracin media de 1070 horas con una desviacin tpica de 125 horas.
Comprobar la hiptesis horas contra la hiptesis alternativa horas mediante un

Decisin: Dado que se Acepta la

PRUEBA MEDIAS DE DOS MUESTRAS


Las pruebas de dos muestras se utilizan para decidir si las medias de dos poblaciones son iguales. Se requieren
dos muestras independientes, una de cada una de las dos poblaciones
La hiptesis nula puede establecer que las dos poblaciones tienen medias iguales:
: 1 = 2
alternativas pueden ser alguna de las siguientes:
Las
: 1 2 : 1 > 2 : 1 < 2

Cuando
se conocen las desviaciones estndar de la poblacin y , el valor estadstico de prueba es el siguiente:

Cuando no se conocen las desviaciones estndar de la poblacin, y n 1 + n2 es menor a 30, el valor estadstico de
prueba es como el que se presenta a continuacin.


Cuando
los tamaos de las dos muestras no son iguales, y su suma es menor de 30, la frmula para el valor
estadstico de prueba se convierte en:

El valor de t cuando es verdadera, tiene una distribucin t con grados de libertad, s se puede suponer que ambas
poblaciones son aproximadamente normales.

TAREA:
1) La media de las calificaciones de dos muestras de 15 estudiantes de primer semestre en la asignatura de Estadstica
de la universidad UTN resulta ser de 7 y 8,5. Se sabe que la desviacin tpica de las calificaciones en esta asignatura
fue en el pasado de 1,5. Comprobar la hiptesis 1 = 2 contra la hiptesis alternativa 1 < 2 con un nivel de
significacin de 0,025.

Decisin: Se rechaza H0, ya que

ANLISIS DE VARIANZA
El anlisis de varianza es una tcnica que se puede utilizar para decidir si las medias de dos o ms poblaciones son
iguales. La prueba se basa en una muestra nica, obtenida a partir de cada poblacin. El anlisis de varianza puede
servir para determinar si las diferencias entre las medias muestrales revelan las verdaderas diferencias entre los
valores medios de cada una de las poblaciones, o si las diferencias entre los valores medios de la muestra son ms
indicativas de una variabilidad de muestreo.

ESTIMACIN INTERNA DE VARIANZA (WITHIN ESTMATE)

ESTIMACIN INTERMEDIANTE DE VARIANZA (BETWEEN ESTMATE)

Donde

2) La duracin media de dos muestras de 10 y 14 pantalones producidos por dos empresas


resulta ser de 5,4 aos y 5 aos, con una desviacin tpica de 1,1 aos y 1,2 aos,
respectivamente. Comprobar la hiptesis 1 = 2 contra la hiptesis alternativa 1 2 con un
nivel de signifcacin Se
deaprueba
0,05 H0, ya que tprueba=0,83 se encuentra dentro del intervalo de aceptacin t tabla=2,0739

TAREA:
Dado la siguiente tabla con datos acerca de los pesos en kg por 1,7 m de estatura
Observaci
n

Muestra
2
3

1
2
3
4
5
6

70
75
74
72
68
59

74
77
70
80
72
76

68
70
65
60
72
73

75
70
73
72
71
72

Realizar una estimacin interna de varianza

Calcular la estimacin intermediante de varianza

LA RAZN F
A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos valores, el anlisis de
varianza emplea la razn de las estimaciones, dividiendo la estimacin intermediante entre la estimacin interna

Determinacin de los grados de libertad


k - 1 es el nmero de grados de libertad para el numerador.
Los grados de libertad para el denominador son entonces, k(n -l).
Hiptesis Nula y Alternativa
H0: Todas las proporciones de la poblacin son iguales.
H1: No todas las proporciones de la poblacin son iguales.

TAREA:

Los pesos en kg por 1,7 m de estatura se ilustran en la siguiente tabla. La finalidad es determinar si existen
diferencias reales entre las cuatro muestras. Emplear un nivel de significacin de 0,05
Observaci
n

Muestra
3

1
2
3
4
5
6

70
75
74
72
68
59

74
77
70
80
72
76

68
70
65
60
72
73

75
70
73
72
71
72

Decisin: Como es menor que , se aprueba, por lo tanto no existen diferencias reales en los pesos de las 4 muestras

PRUEBA DE PROPORCIONES DE k MUESTRAS


Prueba Chi Cuadrado
finalidad de una prueba de k muestras es evaluar la aseveracin que establece que todas las k muestras
La
independientes provienen de poblaciones que presentan la misma proporcin de algn elemento. De acuerdo con
esto, las hiptesis nula y alternativa son:
Todas las proporciones de la poblacin son iguales.
No todas las proporciones de la poblacin son iguales.
La estimacin combinada de la proporcin muestral p se calcula de la siguiente manera:

una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias observadas o (las que
En
se observa directamente) y frecuencias esperadas o tericas e (las que se calculan de acuerdo a las leyes de
probabilidad).
La frecuencia esperada e se calcula as:
Donde:
= proporcin muestral
= frecuencia total observada

El estadstico de prueba es

Donde:
es la letra griega ji ; se lee ji cuadrado

Grados de libertad:
r = fila ; k = columna

Decisin de aceptar o rechazar Ho

TAREA:
En un estudio para determinar la preferencia por determinados sabores de helados en diferentes regiones del
pas, se recopilaron los siguientes datos:
Sabor del
helado

Frecuencias observadas por regin


Costa
Sierra
Oriente

Vainilla
Chocolate
Fresa
Otros
Total

86
45
34
85
250

44
30
6
20
100

70
50
10
20
150

Calcule la proporcin muestral p de cada sabor del helado


pv = 0,4 ; pch = 0,25 ; pf = 0,10 ; po = 0,25
Calcule las frecuencias esperadas de cada sabor del helado en cada regin
Sabor del helado

Frecuencias esperadas por regin

Vainilla
Chocolate
Fresa
Otros

Costa
100
62,5
25
62,5

Sierra
40
25
10
25

Oriente
60
37,5
15
37,5

Determine si la preferencia por cierto sabor es independiente de la regin (es la misma en cada regin), utilizando
el nivel de significacin 0,05
0 se rechaza, ya que (37,87) es mayor que (12,592), por lo tanto, se concluye que la preferencia por cierto sabor
H
depende de la regin.
En Excel

GRFICAS DE CONTROL
Las grficas de control permiten monitorear la variacin en una caracterstica del producto o servicio a lo largo del tiempo.
Las grficas de control se utilizan para estudiar el desempeo pasado, para evaluar las condiciones presentes, o para predecir
los resultados futuros
La informacin obtenida al analizar una grfica de control constituye la base para el proceso de mejoramiento
GRFICAS DE CONTROL PARA VARIABLES
La Grfica R

La Grfica

Lmite superior de control para el rango

Lmite superior de control para las medias

Lmite inferior de control para el rango

Lmite inferior de control para las medias

TABLA
Factores crticos de las grficas o cartas de control
Grfica
Grfica para
para
medias
medias

n
n
2
32
34
45
56
67
78
89
9
10
10
11
11
12
12
13
13
14
14
15
15
16
16
17
17
18
18
19
19
20
21
22
23
24
25

Grfica
Grfica para
para
rangos
rangos

Factor para el Factor para la


lmite de
Factor
para la
recta central
Factores de los lmites de control
control
recta dcentral
Factores
de
lmites
de controld3
D3 = 1-3(d
D4los
= 1+3(d
2
3/ d2)
3/ d2)
A2 1,881
= 3/( d2)
d
D
=
1-3(d
/
d
)
D
=
1+3(d
/
d30,8525
1,128
2
3-1,267=0
3
2
3,267
4
3 d2)
1,881
1,128
-1,267=0
3,267
0,8525
1,023
1,693
-0,574=0
2,574
0,8884
1,023
1,693
-0,574=0
2,574
0,8884
0,729
2,059
-0,282=0
2,282
0,8798
0,729
2,059
-0,282=0
2,282
0,8798
0,577
2,326
-0,114=0
2,114
0,8641
0,577
2,326
-0,114=0
2,114
0,8641
0,483
2,534
-0,004=0
2,004
0,8480
0,483
2,534
-0,004=0
2,004
0,8480
0,419
2,704
0,076
1,924
0,8330
0,419
2,704
0,076
1,924
0,8330
0,373
2,847
0,136
1,864
0,8200
0,373
2,847
0,136
1,864
0,8200
0,337
2,970
0,184
1,816
0,8080
0,337
2,970
0,184
1,816
0,8080
0,308
3,078
0,223
1,777
0,7970
0,308
3,078
0,223
1,777
0,7970
0,285
3,173
0,256
1,744
0,7870
0,285
3,173
0,256
1,744
0,7870
0,266
3,258
0,284
1,716
0,7780
0,266
3,258
0,284
1,716
0,7780
0,249
3,336
0,308
1,692
0,7700
0,249
3,336
0,308
1,692
0,7700
0,235
3,407
0,329
1,671
0,7620
0,235
3,407
0,329
1,671
0,7620
0,223
3,472
0,348
1,652
0,7550
0,223
3,472
0,348
1,652
0,7550
0,212
3,532
0,364
1,636
0,7490
0,212
3,532
0,364
1,636
0,7490
0,203
3,588
0,379
1,621
0,7430
0,203
3,588
0,379
1,621
0,7430
0,194
3,640
0,392
1,608
0,7380
0,194
3,640
0,392
1,608
0,7380
0,187
3,689
0,404
1,596
0,7330
0,187
3,689
0,404
1,596
0,7330
0,180
3,735
0,414
1,586
0,7290
0,173
3,778
0,425
1,575
0,7240
0,167
3,819
0,434
1,566
0,7200
0,162
3,858
0,443
1,557
0,7160
0,157
3,895
0,452
1,548
0,7120
0,153
3,931
0,459
1,541
0,7090

Fuente: WEBSTER, Allen, (2000), Estadstica Aplicada a los Negocios y a la Economa, Ed. McGraw Hill.

Una fbrica elabora planchas de madera para tapas de mesas, las cuales deben cumplir ciertas especificaciones de tamao.
Para garantizar que se cumplan estos estndares de calidad, se recolecta K= 24 muestras (subgrupos) de tamao n = 6, y
mide su largo. Los resultados aparecen en la siguiente tabla:
N de muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

14,5
15,4
16,5
14,8
15,7
15,9
15,2
14,5
15,6
16,5
14,5
17,1
18,5
17,2
19,2
18,4
14,2
16,2
17,2
16,8
15,9
15,0
16,8
18,9

Medias muestrales
15,9 15,7 16,3 14,5
15,2 15,9 15,2 14,5
15,9 14,8 16,2 16,5
16,8 15,5 15,2 15,2
14,5 16,9 14,2 14,5
15,4 17,1 14,8 16,8
14,2 18,5 15,8 15,9
14,8 17,2 16,2 15,0
15,7 19,2 16,1 16,8
16,8 18,4 14,8 18,9
15,8 14,2 14,5 18,7
15,8 16,2 15,4 15,7
15,9 17,2 14,2 15,9
15,7 16,8 14,8 14,8
15,7 15,9 15,7 15,5
16,8 15,0 16,8 16,9
16,9 16,8 15,8 17,1
17,2 18,9 15,8 18,5
17,6 18,7 15,9 17,2
14,5 19,8 15,7 18,2
17,9 18,7 15,7 18,4
18,0 18,2 16,8 14,2
18,9 20,0 16,9 16,2
17,9 17,4 17,5 17,2

16,2
14,5
16,2
14,2
15,2
14,8
15,7
16,8
15,9
16,1
16,3
16,2
14,7
14,9
14,8
14,7
15,4
18,9
16,0
18,7
17,5
17,8
18,5
16,5

Calcular el rango promedio


a)
b) Calcular el lmite superior de control para el rango
c) Calcular el lmite inferior de control para el rango
d) Elaborar la grfica R.
e) Calcular
f) Calcular el lmite superior de control para las medias
g) Calcular el lmite inferior de control para las medias
h) Elaborar la grfica .
Interpretacin: Observando la grfica R se concluye que la misma est bajo control, ya que no
existen variaciones de causa asignable, es decir, no existe ningn punto que se salga de los
lmites de control.

Interpretacin: Observando la grfica se concluye que la misma est fuera de control, ya


que, la muestra 23 representa una variacin de causa asignable, es decir, la muestra 23 se
sale del lmite superior de control.

GRFICAS DE CONTROL PARA ATRIBUTOS


Grfica de control para la proporcin de artculos disconformes: la grfica p
Los lmites de control para la grfica p son:

k = nmero de subgrupos seleccionados


= tamao promedio del subgrupo
= proporcin estimada de elementos disconformes

Se recolectaron los datos de las disconformidades diariamente de una muestra de 200 habitantes de un hotel. La siguiente
tabla lista el nmero y proporcin de habitaciones disconformes para cada da durante un periodo de 4 semanas
Da (k)

Habitaciones Habitaciones
estudiadas (n) no preparadas
(X)

Proporci
n
(X/n)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200
200

16
7
21
17
25
19
16
15
11
12
22
20
17
26
18
13
15
10
14
25
19
12
6
12
18
15
20
22

0,08
0,035
0,105
0,085
0,125
0,095
0,08
0,075
0,055
0,06
0,11
0,1
0,085
0,13
0,09
0,065
0,075
0,05
0,07
0,125
0,095
0,06
0,03
0,06
0,09
0,075
0,1
0,11

Total

5600

463

2,315

Elaborar la
grfca p

Para estos datos,

La Grfica c
Estas grficas estn diseadas para detectar el nmero de defectos en una sola unidad. Al desarrollar la grficas p
una unidad completa se consideraba defectuosa o no defectuosa
Desviacin estndar para el nmero de defectos
Los lmites de control estn a tres desviaciones estndar por encima y por debajo de
Lmite superior de control para el nmero de defectos
Lmite inferior de control para el nmero de defectos
Nota: Si , se considera que

Una empresa dedicada a la elaboracin de papel para computador inspeccion 20 hojas de un nuevo tipo de
papel para buscar defectos. Los resultados se observan en la siguiente tabla
Hoja

Nmero de defectos

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

5
4
3
5
16
1
8
9
9
4
3
15
10
8
4
2
10
12
7
17

Elaborar la
grfca c

Das könnte Ihnen auch gefallen