Sie sind auf Seite 1von 91

Gastronoma

Colaboradores:
Mtra. Claudia Gonzlez Olgun
Mtro. Romualdo Aguilar Cortes
QFB. Zulima E. De Dios Feria

Enero Abril 2013

Pgina | 1

Gastronoma
NDICE
Pgina
1.1 Introduccin

1.2 ESTADSTICA DESCRIPTIVA

1.2.1 Conceptos Bsicos

1.3 Distribuciones de frecuencia con datos no agrupados

1.3.1 Frecuencia absoluta (

1.3.2 Frecuencia relativa (

1.3.3.

Frecuencia absoluta acumulada (Fi) hasta la clase i.

1.3.4

Frecuencia Relativa Acumulada (Fr)

1.4

Distribuciones de frecuencia con datos agrupados

1.5

Marca de clase o punto medio

11

1.6

Representaciones grficas

12

1.6.1 Histograma

12

1.6.2 Polgono de frecuencias

13

1.6.3.

Distribuciones de frecuencia acumulada y acumulada relativa

15

1.6.4

Ojiva

17

1.7 Grficos de tallo y hoja

19

1.8 Medidas de tendencia central

23

1.8.1. Media aritmtica o media ().

23

1.8.1.1.

24

Clculo de media para datos simples con frecuencia asociada

1.8.1.2 Clculo de media aritmtica para datos agrupados con frecuencia asociada.

25

1.8.2. Mediana.

26

1.8.2.1. Calculo de mediana para datos simples con frecuencia asociada.

27

1.8.2.2. Calculo de mediana para datos agrupados con frecuencia asociada

29

1.8.3. Moda

30

1.8.3.1. Calculo de moda para datos simples con frecuencia asociada.

31

1.8.3.2. Calculo de moda para datos agrupados con frecuencia asociada.

31

1.8.4. Centro de amplitud

32

Gastronoma
1.9. Medidas de dispersin.

34

1.9.1. Amplitud o rango.

34

1.9.2. Desviacin media (o desviacin con respecto a la media).

35

1.9.3. Varianza

36

1.9.3.1. Calculo de varianza para datos con frecuencia asociada

37

1.9.3.2 Calculo simplificado de la varianza.

38

1.9.4. Desviacin estndar (de un conjunto de valores mustrales).

39

1.10. Sesgo.

40
44

2. ESTADSTICA INFERENCIAL
2.1 Teora del Muestreo

44

2.1.1 Muestras Aleatorias

44

2.1.1.1 Errores en el Muestreo

45

2.1.2 Muestreo Estratificado

46

2.1.3 Muestreo por Conglomerados

46

2.1.4 Muestreo Sistemtico

47

2.2 Distribuciones Muestrales

47

2.3 Distribucin Normal

54

2.4 Teora de Pequeas Muestras

57

2.4.1 Distribucin "T de Student"

58

2.4.2 Intervalo de Confianza para


2.5

; Con

Anlisis de tendencias

Desconocida

62

65

2.5.1 Anlisis de Regresin y Correlacin

65

2.5.2 Ajuste de Curvas

65

2.5.3 Ajuste de Curvas a Mano

66

2.5.4 Coeficiente de Correlacin

66

2.5.5 Regresin Lineal

69

ANEXOS
PROBLEMAS COMPLEMENTARIOS

73

BIBLIOGRAFA

93

Gastronoma
I

Estadstica Descriptiva

1.1 Introduccin
La Estadstica la podemos definir como la ciencia que se ocupa de la recopilacin, clasificacin,
presentacin e interpretacin de datos y que tiene por objeto agrupar metdicamente a grandes
conjuntos numricos. desempea un papel importante en casi todas la facetas del progreso
humano; su nombre procede de que anteriormente solo se aplicaba a los asuntos de Estado, pero
en la actualidad se ha convertido en un mtodo cientfico de anlisis, aplicado a todas las ciencias
sociales y naturales; su uso incluye el clculo del promedio de calificaciones, en la medicin de
distribucin de las radiaciones nucleares de los cuerpos, en la medicina para probar la eficiencia de
un medicamento, en las elecciones de cualquier tipo en la administracin para analizar las
tendencias comerciales.
La estadstica contempla tres fases:
1. La recoleccin de datos
2. La ordenacin de los mismos
3. Las conclusiones del anlisis
Para desarrollar lo anterior la Estadstica se divide en dos grandes reas:
1. La Estadstica descriptiva y
2. La Estadstica inferencial
La primera contempla la recopilacin, presentacin y descripcin de los datos; la segunda se
refiere a las tcnicas de interpretacin de los valores resultantes y a su utilizacin posterior para la
toma de decisiones.

1.2 ESTADSTICA DESCRIPTIVA


1.2.1 CONCEPTOS BSICOS

POBLACIN: Es la mayor coleccin de elementos de inters en un momento particular.


Ejemplo: El conjunto de todos los estudiantes que asisten a determinada escuela
MUESTRA: Es una parte de una poblacin. Ejemplo: Los alumnos del grupo vespertino
1D de Tecnologa Ambiental
TAMAO DE LA MUESTRA: es el nmero de elementos que tiene una muestra. Ejemplo:
El nmero de alumnos del grupo 1 D es 25.
MUESTREO ALEATORIO: Proceso mediante el cual se extrae una muestra representativa
de la poblacin
VARIABLE ESTADSTICA: Es la caracterstica de inters a investigar de cada elemento
de una poblacin o muestra. Ejemplo: La edad de los estudiantes, su peso, su estatura,
etc.
4

Gastronoma

DATO: Es el valor que toma la variable asociado a un elemento de una poblacin o una
muestra. Ejemplo: Pedro tiene 18 aos, su cabello es castao, mide 1.72 m y pesa 78 kg.
Cada medicin es un valor o un dato de cada una de las cuatro variables de respuesta
medidas para Pedro.
DATO CUALITATIVO O ATRIBUTO: Es el resultado de un proceso que categoriza o
describe un elemento de una poblacin. Ejemplo el tipo de cabello (lacio, rizado,
ondulado), el color de un automvil, el funcionamiento del vehculo (bueno, regular, malo),
etc.
DATO CUANTITATIVO O NUMRICO: Es el resultado de un proceso que cuantifica, es
decir, que cuenta o mide; los datos se subdividen en:
a) Datos cuantitativos discretos. Son los que se producen siempre por conteo, son
nmeros enteros. Ejemplo: El nmero de autos, el nmero de insectos, etc.
b) Datos cuantitativos continuos. Son los que resultan de medir. Ejemplo: El peso, la
estatura, etc.
EXPERIMENTO: es una accin perfectamente planificada basada en la teora del
muestreo con el fin de obtener un conjunto de datos
PARMETRO: Caracterstica numrica de una poblacin. Ejemplo: El promedio de edad al
momento de la admisin de los estudiantes que hayan asistido a secundaria. Un parmetro
es un valor que describe a toda una poblacin
ESTADSTICA: Caracterstica numrica de una muestra.

EJERCICIOS
1. Un fabricante de medicamentos desea conocer la proporcin de personas cuya
hipertensin (alta presin sangunea) puede ser controlada con un nuevo producto. Al
realizar un estudio en 5000 individuos hipertensos se encontr que 80 % de ellos pudo
controlar su hipertensin utilizando el nuevo medicamento. Suponiendo que esas 5000
personas son representativas del grupos de pacientes con hipertensin, conteste las
siguientes preguntas:
a) Cul es la poblacin?
b) Cul es la muestra?
c) Identifique el parmetro de inters
d) Identifique la estadstica e indique cul es su valor
e) Se conoce el valor del parmetro?
2. Un tcnico de control de calidad selecciona partes de una lnea de ensamble de aparatos
elctricos y anota para cada una de ellas la siguiente informacin
a) Si est o no defectuosa
b) El nmero de identificacin de la persona que arm la pieza
c) El peso de la pieza
Clasifique las respuestas para cada parte como dato cualitativo o atributo, dato de variable
discreta o dato de variable continua
3. Relacione las dos columnas, colocando en el parntesis de la columna de la derecha, la
letra que corresponde.
5

Gastronoma
a) Dato discreto

Total de elementos en estudio que presentan


caractersticas comunes

b) Muestra

Caractersticas de cada elemento de una


muestra o poblacin

c) Parmetro

Medida descriptiva de una muestra

d) Poblacin

Valor numrico de una variable

e) Datos

Subconjunto representativo de una poblacin

f)

Es el valor que se obtiene como resultado de un


conteo

Variable

g) Estadstica
h) Dato continuo

4. Identifique cada uno de los siguientes casos como ejemplos de variables y escriba el
nmero correspondiente en el parntesis de la derecha
i. Atributo
ii. Discreta
iii. Continua
a) El resultado de la encuesta hecha a un grupo de votantes posibles (
)
acerca del candidato de su preferencia
b) El tiempo necesario para que una herida cicatrice cuando se utiliza un (
)
nuevo medicamento
c) El nmero de llamadas telefnicas recibidas en un conmutador cada 10 (
)
minutos
d) La distancia a la que puede llegar un baln de ftbol al ser pateado
(
)
e) El nmero de pginas escritas por cada trabajo

f)

La clase de rbol utilizado como smbolo navideo

1.3 Distribuciones de frecuencia con datos no agrupados


Una distribucin de frecuencia representa un conjunto de datos denotado por x y su frecuencia
es el nmero de veces que ocurre el valor de x en una muestra.
Ejemplo: Al arrojar 15 veces un dado se tienen los siguientes datos:
6

Gastronoma
1.3.1 Frecuencia absoluta (
Una distribucin de frecuencia no agrupada (no agrupada significa que los valores de x no se
combinan para formar grupos, sino que cada x es un grupo en s). En la siguiente tabla se
muestra una distribucin de frecuencia, donde es la frecuencia absoluta, frecuencia o el nmero
de veces que ocurre el valor de x en la muestra y la suma de las frecuencias debe ser igual al
nmero de datos.
x

1.3.2 Frecuencia relativa (

Total

15

Es el cociente de la frecuencia de cada clase entre el tamao de la muestra y se utiliza para


expresar en porcentaje la frecuencia de clase, la denotaremos como

O en porcentaje

Donde:
Frecuencia absoluta o frecuencia
n= nmero total de observaciones
As la frecuencia relativa del primer intervalo es:

1.3.4.

Frecuencia absoluta acumulada (Fi)hasta la clase i.

Gastronoma
Es una muestra ordenada de menor a mayor y representa la suma de todas las frecuencias
correspondientes a los datos o valores de la muestra que son menores o iguales que x.
Cuando i = 1; F1 = f1
Cuando i = 2; F1 = f1 + f2
Cuando i = 3; F1 = f1 + f2 + f3
Cuando i = n; Fn = f1 + f2 + f3+ + fn

1.6.5

Frecuencia Relativa Acumulada (Fr)

Es la divisin de la frecuencia acumulada entre el tamao n de la muestra.

La cual tambin puede expresarse en porcentaje:

En el ejemplo de arrojar un dado 15 veces, calcule: la frecuencia relativa (f r), la frecuencia relativa
en porcentaje (fr(%)), la frecuencia acumulada (Fi), la frecuencia relativa acumulada (F r) y la
frecuencia relativa acumulada en porcentaje Fr (%).
Solucin:
X

fi

fr

fr (%)

Fi

Fr

Fr (%)

0.1333

13.33

0.133

13.33

0.2000

20.00

0.333

33.33

0.2000

20.00

0.533

53.33

0.2000

20.00

11

0.733

73.33

0.0667

6.67

12

0.800

80.00

0.2000

20.00

15

1.000

100.00

1.0000

100.00

n = 15

EJERCICIOS

Gastronoma
En cada uno de los casos siguientes, elabore una distribucin de frecuencias de la muestra dada,
que incluya la frecuencia absoluta (f i), el porcentaje de frecuencia relativa (f r(%)), la frecuencia
acumulada (Fi), la frecuencia relativa acumulada (Fr) y la frecuencia relativa acumulada en
porcentaje Fr (%).
a) Calificaciones de 20 estudiantes de Qumica.
87

86

85

87

86

87

86

81

77

85

86

84

83

82

84

83

79

82

79

83

b) Nmero de inquilinos por apartamento en un edificio de 48 cuartos


2

c) Horas trabajadas por personal en un restaurante de comida rpida


Horas

10

Empleado

10

1.7 Distribuciones de frecuencia con datos agrupados


Cuando los datos estadsticos son numerosos y la variable toma un nmero grande de valores
distintos, se recomienda reducirlos mediante la formacin de grupos, clases o intervalos, los cuales
deben mostrar las frecuencias.
Procedimiento para formar tablas de distribucin de frecuencias:
1. Se buscan los datos menor y mayor
2. Se calcula el rango de las mediciones restando al dato mayor el dato menor:
R = Xmx - Xmn
3. Se calcula el nmero de clases el cual depende de la naturaleza de los datos, pero una
gua es la aplicacin de la Regla de Sturges, con la recomendacin de que dicho nmero
sea mayor o igual a 5, pero menor o igual a 20.
Regla de Sturges

NC = 1 +3.3 logn

Gastronoma
Donde:

NC = Nmero de clases o nmero de intervalos.


n = Nmero total de observaciones

4. Se calcula el ancho de los intervalos de clase, que es la diferencia entre un lmite inferior
de clase y el lmite inferior de clase y el lmite inferior de la siguiente clase, con la
expresin:

5. Se calcula el nuevo rango: NR = NC * I


Ejemplo:
Las puntuaciones siguientes se obtuvieron en una prueba de 53 preguntas. Elabore una
distribucin de frecuencias con datos agrupados.

49

37

31

26

19

46

37

31

26

18

46

37

30

25

16

15

44

35

30

24

32

21

39

31

27

20

33

27

21

39

38

31

27

48

27

43

35

29

23

43

34

29

23

41

20

45

36

30

24

33

28

22

41

Solucin:
1. Se buscan los datos menor y mayor:
2. El rango:
3. El nmero de clases:

Xmx = 49
Xmn = 15
R = 49 15 = 34
NC = 1+ 3.3 log(53) = 6.7

4. La anchura del intervalo:


5. El nuevo rango:

NR = 5(7) = 35

NMERO DE
RESPUESTAS

fi

10

Gastronoma
9
10
11
9
5
5
Total

53

1.8 Marca de clase o punto medio


Es la media aritmtica de cada intervalo de clase, que en este caso es el nmero de respuesta
promedio de cada clase. Las denotaremos con xi.
De la distribucin de frecuencias anterior, calcule la marca de clase de cada intervalo.
NMERO
RESPUESTAS

Total

DE

fi

MARCA DE
CLASE

17

22

10

27

11

32

37

42

47

53

EJERCICIOS
1. Enseguida aparecen los pesos en libras de 40 estudiantes. Elabore una distribucin de
frecuencias con datos agrupados y encuentre las marcas de clase.

11

Gastronoma
138

164

150

144

132

157

149

125

140

158

146

147

144

152

148

136

161

158

145

142

150

128

145

158

146

173

147

142

153

135

135

140

168

126

175

138

163

119

154

165

2. Enseguida aparecen los pesos en libras de 40 estudiantes. Elabore una distribucin de


frecuencias con datos agrupados y encuentre las marcas de clase
138

164

150

144

132

157

149

125

140

158

146

147

144

152

148

136

161

158

145

142

150

128

145

158

146

173

147

142

153

135

135

140

168

126

175

138

163

119

154

165

1.9 Representaciones grficas


1.6.1 Histograma
Es una grfica que consiste en una serie de barras rectangulares que tiene sus bases sobre el eje
x, con centros en las cas de clase y una altura igual a la frecuencia respectiva. Los histogramas
nos proporcionan una versin ms clara de la distribucin de las frecuencias.
Ejemplo:
Realizar el Histograma de Frecuencia a partir de los siguientes datos:
NMERO
RESPUESTAS

DE

fi

4
9
10
11
9
5

12

Gastronoma
5
Total

53

1.6.2 Polgono de frecuencias


Es una grfica de lnea continua y se traza uniendo las marcas de clase y su frecuencia; se inicia y
termina en un punto hipottico antes y despus de los intervalos. Se observa que al construir el
polgono de frecuencias, la distribucin puede ser simtrica o asimtrica, segn se ajuste la curva.
La grfica del polgono de frecuencia del ejemplo anterior es:
NMERO
RESPUESTAS

DE

fi

MARCA DE
CLASE

17

22

10

27

11

32

13

Gastronoma
Total

37

42

47

53

El polgono y el Histograma de Frecuencia se puede presentar en el mismo grfico:

14

Gastronoma

1.6.4.

Distribuciones de frecuencia acumulada y acumulada relativa

En estas grficas, la altura de cada barra representa el nmero total de observaciones que son
menores o iguales al lmite superior de la clase respectiva. Las distribuciones acumuladas tambin
son tiles en la interpretacin de datos.
Ejemplo:
Realizar la grfica de distribucin de frecuencia de los datos presentados:
Nmero de
respuestas

fi

Fi

15-19

20-24

13

25-29

10

23

30-34

11

34

35-39

43

40-44

48

45-49

53

Total

53

15

Gastronoma

Las distribuciones acumuladas tambin son tiles en la interpretacin de datos; en la figura anterior
puede leerse de inmediato que existen aproximadamente 43 puntuaciones menores o iguales a 39
respuestas.
Con respecto a la distribucin acumulada de frecuencia relativa, quedara de la siguiente manera:
Nmero de
respuestas

fi

Fi

Fr (%)

15-19

7.5

20-24

13

24.5

25-29

10

23

43.4

30-34

11

34

64.2

35-39

43

81.1

40-44

48

90.6

45-49

53

100

Total

53

Siendo la distribucin de frecuencia relativa de la siguiente manera:

16

Gastronoma

En la figura anterior puede leerse de inmediato que existen aproximadamente el 81.1%


puntuaciones menores o iguales a 39 respuestas.

1.9.4

Ojiva

Una ojiva es una grfica de una distribucin de frecuencias acumuladas (o de frecuencias relativas
acumuladas).
Es una grfica de lnea continua y se traza uniendo las marcas de clase y su frecuencia acumulada
o acumulada relativa, segn sea el caso. Esta se inicia y termina en un punto hipottico antes de
los intervalos.
Ejemplo:
Realizar la ojiva de la distribucin de frecuencia acumulada y acumulada relativa.
Nmero de
respuestas

fi

Fi

Fr (%)

MARCA
DE CLASE

15-19

7.5

17

20-24

13

24.5

22

25-29

10

23

43.4

27

30-34

11

34

64.2

32

35-39

43

81.1

37

40-44

48

90.6

42

45-49

53

100

47
17

Gastronoma
Total

53

18

Gastronoma

1.7 Grficos de tallo y hoja


Es una forma rpida de obtener una representacin visual ilustrativa del conjunto de datos, para
construir un diagrama de tallo y hoja primero se debe seleccionar uno o ms dgitos iniciales para
los valores de tallo, el dgito o dgitos finales se convierten en hojas, luego se hace una lista de
valores de tallo en una columna vertical. Despus se registra la hoja por cada observacin junto al
valor correspondiente de tallo; finalmente se indica las unidades de tallos y hojas en algn lugar del
diagrama. Esta grfica se usa para listas grandes y es un mtodo ms que los datos y no aparece
por ningn lado informacin sobre frecuencias y dems datos importantes.
Supongamos la siguiente distribucin de frecuencias que representan la edad de un colectivo de n
= 20 personas y que vamos a representar mediante un diagrama de tallos y hojas.
36

25

37

24

39

20

36

45

31

31

39

24

29

23

41

40

33

24

34

40

Se seleccionan primero los tallos, que en nuestro caso son las cifras de decenas, es decir, 2, 3 y 4.
A continuacin efectuamos un recuento y vamos aadiendo cada hoja a su tallo:
Tallo Hoja
2

4
19

Gastronoma
3

Por ltimo reordenamos las hojas y hemos terminado el diagrama:


Tallo Hoja
2

4
0
0
1
5
Los expertos dirn que dicha representacin es un histograma y, en efecto, as es. Sin embargo,
los diagramas de tallos y hojas, adems de ser fciles de elaborar, presentan ms informacin que
los histogramas. Esta tcnica funciona bien para los conjuntos de datos que no tienen una
dispersin muy grande.
EJERCICIOS
1. Las edades de 50 bailarinas que se presentaron a un concurso de seleccin para una
comedia musical fueron
21

19

22

19

18

20

23

19

19

20

19

20

21

22

21

20

22

20

21

20

21

19

21

21

19

19

20

19

19

19

20

20

19

21

21

22

19

19

21

19

18

21

19

18

22

21

24

20

24

17

a) Construya una distribucin de frecuencias, frecuencias relativas, frecuencia relativa


acumulada de estas edades
b) Trace un histograma de frecuencia
c) Trace un histograma de frecuencia relativa
d) Trace una ojiva para los datos
2. Dadas las siguientes 50 calificaciones de exmenes, realice los siguientes ejercicios:

42

60

79

58

48

68

33

54

66

58

35

78

63

26

64

35

79

33

54

58

41

48

81

24

47

58

51

57

45

55

27

32

72

45

18

22

36

30

55

47

13

45

57

82

35

53

45

66

37

44

a) Construya la distribucin de frecuencia, utilizando intervalos de 10 puntos;


comincela con 10 puntos.
b) Dibuje un histograma de frecuencia y frecuencia relativa
c) Utilizando la curva acumulada de frecuencia, encuentre la calificacin sobre la cual
est el 25% de los estudiantes.
20

Gastronoma
3. Del ejercicio 2 realizar el diagrama de tallo y hoja
4. La siguiente es la distribucin de los pesos de 125 muestras de minerales recolectadas en
una investigacin de campo:

Peso en gramos

Nmero de especmenes

0.0-19.9

16

20.0-39.9

38

40.0-59.9

35

60.0-79.9

20

80.0-99.9

11

100.0-119.9

120.0-139.9

Total

125

Si es posible, encuentre cuntas de las muestras pesan mximo:


a) 59.9 g
b) Ms de 59.9 g
c) Ms de 80.0 g
d) 80.0 g o menos
e) Exactamente 70.0 g
f) Cualquier valor de 60.0 a 100.0 g.
5. Las siguientes son temperaturas en C de un horno utilizado por alumnos de gastronoma
durante una prctica:
65

63

81

60

77

73

74

72

70

76

72

94

83

65

85

63

68

49

37

58

76

74

97

90

52

65

88

87

91

31

87

66

89

47

77

72

69

63

38

75

a) Realice una distribucin de frecuencias


b) Dibuje un histograma de frecuencia y frecuencia relativa
c) Trace una ojiva para los datos
d) A partir de qu temperatura se encuentra por debajo del 80%?
6. Se realiza un estudio para ayudar a comprender el efecto de fumar en los patrones del
sueo. La variable aleatoria considerada es x, es decir, el tiempo en minutos que tarda en

21

Gastronoma
quedarse dormida una persona. Las muestras de fumadores y no fumadores producen
estas observaciones sobre x:

NO FUMADORES

FUMADORES

17.2 19.7 18.1 15.1 18.3 17.6

15.1 20.5 17.7 21.3 16.0 24.8

16.2 19.9 19.8 23.6 24.9 20.1

16.8 21.2 18.1 22.1 15.9 25.2

19.8 22.6 20.0 24.1 25.0 21.4

22.8 22.4 19.4 25.2 18.3 25.0

21.2 18.9 22.1 20.6 23.3 20.2

25.8 24.1 15.0 24.1 21.6 16.3

21.8 22.1 21.1 20.5 20.4 20.7

24.3 25.7 15.2 18.0 23.8 17.9

19.5 18.8 19.2 22.4 19.3 17.4

15.7 15.3 19.9 23.1 23.0 25.1

a) Construya un diagrama de tallo y hoja para los datos de los no fumadores.


b) Construya un diagrama de tallo y hoja para los datos de los fumadores
c) Se sorprendera si alguien le dijera que no existe diferencia en la distribucin de x en
los dos grupos? Explique
Utiliza Excel para elaborar un histograma y un polgono de frecuencias con las clases 40-44,4549,50-54, 55-59, 60-64, 65-69, 70 -74 y 75-79, para el nmero de clientes en un restaurante a
quienes se les sirvi la cena durante 120 das laborales.
50

46

55

64

59

60

48

54

62

59

57

61

64

59

61

46

62

59

62

52

56

43

61

59

74

76

67

62

56

56

67

56

59

50

66

55

51

45

55

49

63

52

63

59

57

52

78

62

49

60

58

57

65

55

52

61

64

53

61

60

41

57

57

60

68

58

73

60

52

47

66

63

65

63

61

63

60

63

64

57

58

65

58

71

53

62

66

64

51

43

69

59

48

53

58

55

63

58

53

42

61

60

53

63

58

54

60

61

64

65

56

47

51

62

66

56

64

67

55

54

22

Gastronoma
1.8 Medidas de tendencia central
Despus de considerar los datos de una poblacin o de una muestra y hecha la distribucin de
frecuencias de donde obtenemos informacin preliminar de inters, debemos reducir los valores
hasta obtener uno solo que represente al conjunto de datos de manera descriptiva; a ese valor se
le llama VALOR MEDIO.
El valor medio debe cumplir la condicin de ser representativo de conjunto, es por eso, que alos
datos se les llama medidas de TENDENCIA CENTRAL, en donde se incluye:

El promedio

La media aritmtica

La mediana

La moda

La media geomtrica, etc.

Medida de tendencia central: Valor que se encuentra en el centro o la mitad de un conjunto de


datos.
1.8.1. Media aritmtica o media ().
La media aritmtica generalmente es la ms importante, de todas las medidas numricas utilizadas
para describir datos; constituye lo que la mayora de gente denomina promedio.
La media aritmtica de un conjunto de n nmeros (x1, x2, x3 .., xn) denotada (x barra) es
el promedio que se obtiene sumando todos los valores de la variable x (simbolizado por
) y se dividen entre el nmero total de puntajes (n).

Donde:
xi = xn = Es la variable que suele utilizarse para representar los valores de los datos individuales.
= sumatoria de un conjunto de valores.
n = Representa el nmero de valores de una muestra.
N = Representa el nmero de valores de una poblacin.
= Media de un conjunto de datos de una muestra.

23

Gastronoma
= Media de un conjunto de datos de una poblacin.

Ejemplo:
Halle la media entre los nmeros 3, 3, 4, 5, 7, 8,9
=

= 5.57

2.8.1.1. Clculo de media para datos simples con frecuencia asociada


Para obtener la media de los datos de una muestra que estn representados en una tabla de
frecuencias, sin datos agrupados, se realizar lo siguiente:
Ejercicio:
Un estudio sobre ausentismo de trabajadores durante cierto mes del
condujo a la tabla siguiente:
Nmero de
das

Total de
trabajadores

17

25

15

ao en un restaurante,

Calcular el valor de la media aritmtica en interpretar el resultado.


El clculo de la media aritmtica, se realiza mediante la siguiente frmula:
=

Por lo que a la tabla anterior, hay que agregar la siguiente columna:

24

Gastronoma
Nmero de das

Total de trabajadores

x1

f1

17

(0)(17) =0

25

(1)(25)= 25

15

(2)(15) = 30

(3)(7) = 21

(4)(4) = 16

(5)(2) = 10

(6)(2) = 12

f1= 72

x1 f1

x1 f1= 114

= 1.6

Interpretacin: cada uno de los 72 trabajadores del restaurante, faltaron a su trabajo 1.6 das en el
mes; por lo tanto, durante el mes considerado, los trabajadores faltaron1.6 das en promedio.

1.8.1.2 Clculo de media aritmtica para datos agrupados con frecuencia asociada.
Cuando se tiene una distribucin de frecuencias con datos agrupados, el valor de x ser la marca
de clase y se sigue la frmula anterior modificando x por m.

Ejemplo:
Nmero de clase

Lmites de clase

Marcas de clase

22-32

27

27

33-43

38

76

25

Gastronoma
3

44-54

49

245

55-65

60

120

66-76

71

639

77-87

82

738

88-98

10

93

930

99-109

104

520

110-120

115

345

10

121-131

126

504

Suma

50

4144

= 82.88 = 82.9

Una desventaja de la media es su sensibilidad a cada valor, de modo que un puntaje excepcional
puede afectarla de manera drstica. La mediana resuelve, en gran parte, esa desventaja.

1.8.2. Mediana.
Mediana: medida de tendencia central que implica el valor que est en medio, cuando los
valores originales de los datos se presentan en orden de magnitud creciente (o decreciente).
Para calcular la mediana, primero clasifique los valores (acomodndolos en orden) luego siga uno
de estos dos procedimientos:
1. Si el nmero de valores es impar, la mediana es el nmero que se localiza exactamente a
la mitad de la lista.
Ejemplo: Los datos 6, 3, 8, 5, 3 son ordenados de menor a mayor, o sea, 3, 3, 5, 6, 8. El 5 est en
la tercera posicin, que es la central de los cinco nmeros. Por lo tanto, la mediana es igual a 5.
2. Si el nmero de valores es par, la mediana se obtiene calculando la media de los dos
nmeros que estn a la mitad.

26

Gastronoma
Ejemplo: Sean los nmeros 6, 7, 8, 9, 9, 10 aqu n = 6, entonces el valor de la mediana, se
calcular sumando los dos valores centrales, dividindolos entre 2 (media).
Me = 8 + 9/2 = 8.5

La mediana esencialmente divide los datos ordenados en dos subconjuntos. La posicin (o


profundidad) de la mediana se calcula con la frmula:
No. de orden =

, cuando el nmero de datos es impar, donde 1 es la posicin del dato con el

valor ms pequeo y n es la posicin del dato con el valor ms grande.

Si el nmero n es impar, la mediana ser exactamente el valor central.


3, 3, 5, 6, 8
No. Orden = (5 + 1)/ 2 = 3

valor posicional.

Es decir, el valor de la mediana, es el que ocupa la posicin nmero 3, en este caso es 5.


Si el nmero n es par, la mediana estar ubicada entre 2 valores centrales. Ejemplo: Sean los
nmeros 6, 7, 8, 9, 9, 10 aqu n = 6
No. Orden = (6 + 1)/ 2 = 7/2 = 3.5
El valor de la mediana estar ubicada entre los nmeros que ocupan la posicin 3 y 4, que en este
caso son 8 y 9.
Me = (8 +9)/2 = 17/2= 8.5

1.8.2.1. Calculo de mediana para datos simples con frecuencia asociada.


Para obtener la mediana en este tipo de series, primero se encuentran las frecuencias acumuladas
(Fi), el valor de la variable que comprende a la frecuencia acumulada que contiene a n/2, o sea el
50% de los casos, que constituye la mediana.
Ejemplo:
Un estudio sobre ausentismo de trabajadores durante cierto mes del
condujo a la tabla siguiente:

ao en un restaurante,

27

Gastronoma

Nmero de
das

Total de
trabajadores

17

25

15

Halle el valor de la mediana e interprete el resultado.


Solucin:
Primero debemos calcular la frecuencia acumulada:
Nmero de
das

Total de
trabajadores

F1

17

17

25

42

15

57

64

68

70

72

28

Gastronoma
Como el valor de la mediana corresponde al valor central de los datos, localizamos en que clase se
encuentra el valor de sta, utilizando la siguiente frmula: n/2.
n/2 = 72/2= 36
Este dato se halla en el 42, que acumula hasta la categora 2. Por lo tanto el valor de la mediana
se encuentra en esta categora.
Me = 1 da
Interpretacin. Por lo menos, la mitad de los trabajadores en el restaurante se ausentaron 1 da a
sus labores durante el mes.

1.8.2.2. Calculo de mediana para datos agrupados con frecuencia asociada


Las distribuciones de frecuencia agrupadas, se pueden obtener por dos mtodos:
1. Por interpolacin
2. Por medio de una grfica, llamada ojiva.
Por interpolacin se aplica la siguiente frmula:
Me =

).I

Donde:
Li = lmite inferior de la clase mediana
n = nmero de valores observados
Fa = frecuencia acumulada anterior a la clase donde se encuentra la mediana.
I = valor del intervalo.
fm = frecuencia de la clase donde se encuentra la mediana.

Ejemplo:
Obtenga la mediana para los datos de la siguiente tabla.

29

Gastronoma
Pesos (libra)

Datos: n= 40

(f i)

Frecuencia
acumulada
(Fi)

118-126

127-135

136-144

17

145-153

12

29

154-162

34

163-171

38

172-180

40

Li = 144.5

frecuencia

Fa= 17

fm = 12

I = 154-145

n/2 =20

Solucin:
Me = 144.5 + (

) . 9 = 146.75

1.8.3. Moda
La moda es el valor de que ocurre con mayor frecuencia o el que ms se repite.
Cuando dos valores ocurren con la misma frecuencia y sta es la ms alta, ambos valores
son modas, por lo que el conjunto de datos es bimodal.
Cuando ms de dos valores ocurren con la misma frecuencia y sta es la ms alta, todos
los valores son modas, por lo que el conjunto de datos es multimodal.

Cuando ningn valor se repite, se dice que no hay moda.


Ejemplo: calcule las modas de los siguientes conjuntos de datos.
a. 5.40
b. 27
c. 1

1.10
27
2

0.42
27
3

0.73
55
6

0.48
55
7

1.10
55
8

88
9

88
10

99

Solucin.
a. El nmero 1.10 es la moda, ya que es el valor que ocurre con mayor frecuencia.

30

Gastronoma
b. Los nmeros 27 y 55 son modas, ya que ambos ocurren con la frecuencia ms alta. Este
conjunto de datos es bimodal, porque tiene dos modas.
c. No hay moda, ya que ningn valor se repite.
1.8.3.1. Calculo de moda para datos simples con frecuencia asociada.
Volvamos al ejemplo de los trabajadores que se ausentaron en cierto mes del ao a trabajar a un
restaurante.
Nmero de
das

Total de
trabajadores

17

25

15

La mxima frecuencia es 25, por lo tanto la moda es 1.


Interpretacin: El caso ms notorio, es el de los trabajadores que dejaron de trabajar 1 da durante
el mes.
1.8.3.2. Calculo de moda para datos agrupados con frecuencia asociada.
Para el caso de datos agrupados donde se construye una distribucin de frecuencias y/o
histograma, la moda se puede obtener utilizando la siguiente frmula:
Moda =

Dnde:
Li = lmite inferior de la clase modal (clase que tiene la mxima frecuencia).
1 = Diferencia entre la mayor frecuencia y la frecuencia anterior.
2 = Diferencia entre la mayor frecuencia que le sigue.
I = Intervalo de clase.
Ejemplo. Halle la moda para la siguiente distribucin de frecuencias.
31

Gastronoma
X

fi

50-60

60-70

10

70-80

16

80-90

14

90-100

10
5

100-110
110-120

La moda es:
Moda: 69.5 + [

]10 = 77

1.8.4. Centro de amplitud


Un conjunto de datos siempre tiene un extremo inferior (L) y otro superior (H). el punto medio o
centro de amplitud, es un nmero situado entre ellos, exactamente en la parte central. Ejemplo.
Sea 6, 7, 8, 9, 9, 10.
El centro de amplitud es = (

)= 8.

EJERCICIOS.
1) Realice una tabla, que contenga las medidas de tendencia central y las frmulas que empleara
cuando se tengan datos simples, datos simples con frecuencia asociada y datos agrupados con
frecuencia asociada.
2) La siguiente tabla muestra un conjunto de datos agrupados en una distribucin de frecuencia,
que representa la estancia de 72 turistas en hoteles de categora una a cinco estrellas en Cancn,
Quintana Roo. Con base en los datos:
a) Calcular la media aritmtica e interpretar el resultado.
b) Calcular el valor de la mediana mediante la aplicacin de la frmula y por la ojiva.
Interpretar el resultado.
32

Gastronoma
c) Calcular el valor de la moda. Interpretar el resultado.
d) Obtener el histograma de frecuencia.

Clase

fi

(estancia)

(nmero de turistas)

14

58

6 12

13 16

17 20

14

21 24

18

22 -28

12

29 32

33 36

37 40

3) Obtenga la media la media de la muestra que se compone de los siguientes nmeros:


7, 11, 11, 8, 12, 7, 6, 6
4) Enseguida se presentan los ingresos anuales de diez familias. Encuentra la media, la mediana,
la moda y el centro de amplitud.
$ 45000

$ 39000

$ 37500

$ 36750

$ 35250

$ 31500

$ 31500

$ 31500

$ 31500

$ 22500

5) Los precios de una libra de caf en siete tiendas son:


$ 5.58, $5.18, $5.84, $5.75, $5.67, $5.95, $5.62.

Hallar:
a) La media de los precios
b) La mediana de los precios
33

Gastronoma
6) Alumnado segn tiempo dedicado al estudio fuera de clase.
Horas
semanales

Alumnos
Total= 188

1-3
4-6
7-9
10-12
13-15
16-18
19-21
22-28

50
38
26
36
19
7
7
5

a. Trazar un histograma, un polgono de frecuencias y una ojiva normal y ojiva porcentual.


b. Calcular la media e interpretar el resultado.
c. Determine el valor de la mediana, a partir de la frmula para datos agrupados y a partir de
la ojiva porcentual. Interprete el resultado.
d. Determine la moda e interprete el resultado.
1.9. Medidas de dispersin.
Es importante medir la variabilidad de las distribuciones y no solo su media, ya que existen curvas
con la misma media y con formas radicalmente distintas. La dispersin puede medirse en trminos
de la diferencia entre dos valores seleccionados del conjunto de datos.
Las medidas de dispersin es la manera en que los valores individuales de una muestra o
poblacin se desvan del valor promedio y abarcan la amplitud (o rango), la desviacin media, la
varianza y la desviacin estndar. Estos valores numricos describen el grado de dispersin o
variabilidad de los datos. Los valores de esta medida de dispersin sern mayores cuando los
datos estn muy disgregados y sern menores cuando los datos estn ms cercanamente
agrupados.
Las medidas de dispersin son:

Amplitud o rango
Desviacin media
Desviacin estndar
Varianza

1.9.1. Amplitud o rango.


Es la diferencia entre el dato mayor (H) y el dato menor (L).
AMPLITUD = H L

34

Gastronoma
Ejemplo:
Sea 3, 3, 5, 6, 8, entonces la amplitud es 8 3 = 5.
El rango es fcil de calcular, pero slo nos proporciona una medida, relativamente inexacta, de la
dispersin, pues el rango mide en realidad la dispersin slo de los datos extremos y no la de los
intermedios.
Las otras medidas de dispersin, desviacin media, desviacin estndar y varianza en realidad
son medidas de separacin con respecto a la media.

1.9.2. Desviacin media (o desviacin con respecto a la media).


Es la media aritmtica del valor absoluto de todas las desviaciones respecto a la media, es
decir, es la diferencia entre cada uno de los valores de la variable y la media (X - ).
D.M. =

Ejemplo:
Sea la serie 2, 10, 12, 16 se DM ser:
|

DM = =

10

12

16

= 40

= 16

= 10
=

=4

Ejercicios:
1. Halle la desviacin media del conjunto 2, 3, 6, 8, 11.
2. Halle el rango y la DM y diga cul tiene mayor dispersin.
a. 12, 6, 7, 3, 15, 10, 18, 5
b. 9, 3, 8, 8, 9, 8, 9, 18.
35

Gastronoma
1.9.3. Varianza
Usamos el trmino variacin, como una descripcin general de la cantidad que varan los valores
entre s. El trmino varianza, se refiere a una definicin especfica:
Varianza (de un conjunto de valores): es la suma de los cuadrados de las desviaciones entre el
nmero total de datos, y est dada y representada por la frmula:
s

2=

s = varianza de la muestra
n = tamao de la muestra.
Procedimiento para calcular la varianza:
1. Calcule la media.
2. Reste la media de cada valor individual para tener una lista de desviaciones de la forma
(x -).
2
3. Eleve al cuadrado cada una de las diferencias obtenidas en el paso 2. (x - ) .
4. Sume todos los cuadrados obtenidos en el paso 3.
5. Divida el total del paso 4 entre n.
Ejemplos:
Calcule la varianza de la serie 6, 3, 8, 5, 3.
1. Calcular la media

=5

X
6

65=1

3 5 = -2

85=3

55=0

35=-2

x = 25

=0

= 18

36

Gastronoma
s

2=

= 3.6

2. Obtenga la varianza para los siguientes datos.


Datos n = 6, =

=4
2

clase
i

(x- )

(x - )

3 4 = -1

64=2

1 4 = -3

2 4 = -2

5
6

7
5

74=3
54=1

9
1
= 28

2=

= 4.66

1.9.3.1. Calculo de varianza para datos con frecuencia asociada


Si x1, x2, x3, xn se presentan con frecuencias f1, f2, f3, fn, respectivamente la varianza se puede
obtener con la siguiente frmula:
s

2=

Ejemplos: Obtenga la varianza para los siguientes datos con las frecuencias dadas:
Primero: calcule la media:
=

=5.33
x

fi

xfi

(x - )

12

35.33 = -2.33

5.4889

4(5.4889)=21.7156

20

4- 5.33 =-1.33

1.7689

5(1.7689)=8.8445

fi

37

Gastronoma
5

30

5-5.33= -0.33

0.1089

6(0.1089)=0.6534

42

6-5.33 = 0.67

0.4489

7(0.4489)=3.1423

56

7- 5.33 = 1.67

2.7889

8(2.7889)=22.3112

Totales

30

=160

La varianza es =

= 56.667

= 1.8889

1.9.3.2 Calculo simplificado de la varianza.


El clculo de la varianza se puede hacer utilizando el mtodo abreviado que no hace uso de las
desviaciones medias. La frmula es:
2

S =[

]-

S =[

] para datos simples sin frecuencia.

]-

] para datos con frecuencia asociada.

Ejemplos:
1. Halle la varianza de los siguientes datos: 2, 10, 12, 16.
2

S =[
=[

]-

]
]-[

] =

-( ) = 26

2. Halle la varianza por el mtodo abreviado a la tabla del peso en kg de 20 personas.


Peso

fi

45 -55
55 65
65 -75
75 85
85 95
Total

3
4
6
5
2
20

Marca de clase
xi
50
60
70
80
90

xifi
3(50)=150
4(60)=240
6(70)=210
5(80)=400
2(90)=180
1390

fi
2

(50) (3)= 7500


2
(60) (4)= 14400
2
(70) (6)= 29400
2
(80) (5)= 32000
2
(90) (2)= 16200
99500

1. Calcule la marca de clase, x


2. Calcule xi fiy obtenga el total.
3. Calcule

y obtenga el total.

38

Gastronoma
2

S =[
2

S =[

]]-[

]
] = 144

1.9.4. Desviacin estndar (de un conjunto de valores mustrales).


La varianza es una medida importante de la variacin de los datos, pero debido a la elevacin al
cuadrado de las desviaciones, la varianza no est en las mismas unidades de medida que los
2
datos mismos; si los datos estn en kilogramos, la varianza se dar en kg . Para compensar esta
anomala, se toma sencillamente la raz cuadrada de la varianza y se tiene entonces la desviacin
estndar (s).
s=

s es la desviacin estndar de la muestra


Y para datos con frecuencia asociada:

Interpretacin y aplicacin de la desviacin estndar.


Hay que comprender con claridad que la desviacin estndar mide la variacin entre los valores.
Los valores cercanos producirn una desviacin estndar pequea, mientras que los valores muy
dispersos producirn una desviacin estndar ms grande.
A continuacin se dar una interpretacin de la desviacin estndar (regla emprica): cuando n es
grande y cuando la distribucin de las n observaciones es aproximadamente en forma de campana
(normal) puede usarse la siguiente regla, la cual dice que los intervalos:
a) s incluir aproximadamente 68.27 % de las mediciones.
b) 2s incluir aproximadamente 98.45% de las mediciones.
c) 3s incluir aproximadamente 99.73 % de las mediciones

Ejercicios:
1. Halle la media muestral, la mediana, la varianza
siguientes resultados.
80
65
85
95
72
76
75

60

74

75

63

78

y la desviacin estndar para los


72

93

84

87

90

70

2. Halle la media muestral, la mediana, la varianza y la desviacin estndar para los datos:
a. 4, 6, 6, 7, 9, 10.
39

Gastronoma
b. 8, 7, 12, 5, 6, 7, 4.
1.10. Sesgo.
Una comparacin de la media, mediana y la moda puede revelar informacin acerca de las
caractersticas de sesgo, que se define a continuacin.
Una distribucin de datos es sesgada si no es simtrica y se extiende ms hacia un lado que
hacia otro. (Una distribucin de datos es simtrica si la mitad izquierda de su histograma es
aproximadamente una imagen en espejo de su mitad derecha).

Los datos sesgados a la izquierda (que tambin se denomina sesgo negativo) poseen una cola
izquierda ms larga, en tanto que la media y la mediana se encuentran a la izquierda de la moda.
Aunque no siempre es posible predecirlo, los datos sesgados a la izquierda suelen tener una
media menor a la mediana.

Media

Moda
Mediana

Los datos sesgados a la derecha (lo que tambin se denomina sesgo positivo) poseen una cola
derecha ms larga, mientras que la media y la mediana se encuentran a la derecha de la moda,
aunque no siempre es posible predecirlo.

Moda

Media
Mediana

Cuando la distribucin de datos es simtrica (sesgo cero), la media, la mediana y la moda son
iguales.

40

Gastronoma
Media Mediana Moda

Para medir el sesgo o asimetra, se utiliza el coeficiente de asimetra de Pearson y se obtiene


mediante la ecuacin:
Coeficiente de asimetra: =

Este coeficiente toma generalmente valores entre -3 y +3; cuando la distribucin es simtrica su
valor es cero.

Ejemplo:
En la siguiente distribucin de calificaciones de un examen, calcule el coeficiente de asimetra.
Calificacin
Li
Ls

3
4

3.9
4.9

fi

Marca
de
clase
xi

fi Xi

Fi

xi x

(xi x)

4
4

3.5
4.5

14
18

4
8

-3.5
-2.5

12.25
6.25

fi (xi x)

49
25
41

Gastronoma
5
6
7
8
9

5.9
6.9
7.9
8.9
9.9

5
8
13
11
5
50

5.5
6.5
7.5
8.5
9.5

27
52
97
93
47
348

13
21
34
45
50

-1.5
-0.5
0.5
1.5
2.5

2.25
0.25
0.25
2.25
6.25

11.25
2
3.25
24.75
31.25
146.5

= 6.96

S=
=

=7+(

) 1.0 = 7.3

= 1.71
=

= -0.596

EJERCICIOS:
1. De acuerdo a la tabla siguiente, elabore en Excel:
a) El histograma de frecuencias relativas en porcentaje, as como el polgono
correspondiente.
b) La ojiva porcentual.
c) El dimetro promedio (media) e interpretacin de resultados.
d) La mediana de los dimetros e interpretacin.
e) El dimetro que tienen la mayora de los cuchillos chef (moda) e interpretacin del
resultado.
f) La variabilidad (varianza y desviacin estndar).
g) Las medidas de variacin parecen indicar que la variacin tiene un nivel aceptable, si la
medida estndar del cuchillo chef es de 8 pulgadas. Es la variacin un indicador para
rechazar o aceptar las medidas del cuchillo?
Dimetro en pulgadas de cuchillos chef
Nmero de cuchillos chef
7.80 7.85

7.86 7.91

7.92 7-97

16

7.98 8.03

28

8.04 8.09

13

8.10 8.15

42

Gastronoma
8.16 8.21

2. El gerente local de una tienda de autoservicio est interesada en el nmero de veces que
un cliente compra en su almacn durante un perodo de dos semanas. Las respuestas de
51 clientes fueron:
5
6
3
11
9

3
3
1
4
4
5
6
4
2
6
6
7
1
1
14
1
2
4
4
4
5
6
5
3
4
5
6
8
4
7
6
5
9
3
12
4
7
6
5
15
1
1
10
8
2
12
a. Comenzando con el 0 como el lmite inferior de la primera clase y utilizando un
intervalo de clase 3, organice los datos en una distribucin de frecuencias.
b. Describa la distribucin dnde tiende a agruparse los datos?
c. Convierta la distribucin en una distribucin de frecuencias relativas.
d. Calcule la media, mediana y moda e interprete cada una de ellas.

3. Los siguientes datos presentan las cantidades semanales gastadas (en pesos) en
comestibles de un grupo de alumnos de gastronoma.
371
463
259
176
327
437
395
412
350
379
305 379

a.
b.
c.
d.
e.

366

299

277

262

332

403

292

281

421

409

346

378

150

141

435

216

200

251

340

574

397

270

288

420

529

394

670

442

379

335

534

223

425

Calcula el nmero de clases con la regla de Sturges.


Calcula el ancho de los intervalos de clase.
Organice los datos en una distribucin de frecuencias.
Calcule la media, mediana y moda. Interprete los resultados.
Calcule la variabilidad (varianza y desviacin estndar)

43

Gastronoma
II Estadstica Inferencial
2.1 Teora del Muestreo
Uno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales
desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El punto de
inters es la muestra, la cual debe ser representativa de la poblacin objeto de estudio.
Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras reflejen
observaciones a la poblacin de la que proceden, ya que solo se pueden hacer observaciones
probabilsticas sobre una poblacin cuando se usan muestras representativas de la misma.
Una poblacin est formada por la totalidad de las observaciones en las cuales se tiene cierto
observa.
Una muestra es un subconjunto de observaciones seleccionadas de una poblacin.
2.1.1 Muestras Aleatorias
Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras por
muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser
econmicamente imposible, o no se cuenta con el tiempo suficiente.
A continuacin se ver algunos usos del muestreo en diversos campos:
1. Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos
midan la opinin pblica y el apoyo en las elecciones.
2. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan
para determinar la eficiencia de una tcnica o programa de enseanza.
3. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la
calidad.
4. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la
eficacia de una tcnica o de un frmaco nuevo.
5. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin
los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios
del pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional.

44

Gastronoma
2.1.1.1 Errores en el Muestreo
Cuando se utilizan valores muestrales, o estadsticos para estimar valores poblacionales,
o parmetros, pueden ocurrir dos tipos generales de errores: el error muestral y el error no
muestral.
El error muestral se refiere a la variacin natural existente entre muestras tomadas de la misma
poblacin.
Cuando una muestra no es una copia exacta de la poblacin; an si se ha tenido gran cuidado
para asegurar que dos muestras del mismo tamao sean representativas de una cierta poblacin,
no esperaramos que las dos sean idnticas en todos sus detalles. El error muestral es un
concepto importante que ayudar a entender mejor la naturaleza de la estadstica inferencial.
Los errores que surgen al tomar las muestras no pueden clasificarse como errores muestrales y se
denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere a una
tendencia sistemtica inherente a un mtodo de muestreo que da estimaciones de un parmetro
que son, en promedio, menores (sesgo negativo), o mayores (sesgo positivo) que el parmetro
real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorizacin.
La aleatorizacin se refiere a cualquier proceso de seleccin de una muestra de la poblacin en el
que la seleccin es imparcial o no est sesgada; una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria.
Los tipos ms comunes de tcnicas de muestreo aleatorios son el muestreo aleatorio simple, el
muestreo estratificado, el muestreo por conglomerados y el muestreo sistemtico.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin tengan la
misma probabilidad de ser seleccionados, la llamamos muestra aleatoria simple.
Ejemplo
Supongamos que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadstica de 20 alumnos. 20C5 da el nmero total de formas de elegir una muestra no ordenada y
este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos las 15,504 en trozos
separados de papel, una tarea tremenda, luego los colocamos en un recipiente y despus los
revolvemos, entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo de
papel con cinco nombres. Un procedimiento ms simple para elegir una muestra aleatoria sera
escribir cada uno de los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y despus extraer cinco papeles al mismo tiempo.

45

Gastronoma
Otro mtodo para obtener una muestra aleatoria de 5 estudiantes en un grupo de 20 utiliza una
tabla de nmeros aleatorios. Se puede construir la tabla usando una calculadora o una
computadora. Tambin se puede prescindir de estas y hacer la tabla escribiendo diez dgitos del 0
al 9 en tiras de papel, las colocamos en un recipiente y los revolvemos, de ah, la primera tira
seleccionada determina el primer nmero de la tabla, se regresa al recipiente y despus de
revolver otra vez se selecciona la seguida tira que determina el segundo nmero de la tabla; el
proceso contina hasta obtener una tabla de dgitos aleatorios con tantos nmeros como se desee.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico, imposible o
no deseado; aunque sera deseable usar muestras aleatorias simples para las encuestas
nacionales de opinin sobre productos o sobre elecciones presidenciales, sera muy costoso o
tardado.
2.1.2 Muestreo Estratificado
El muestreo estratificado requiere de separar a la poblacin segn grupos que no se traslapen
llamados estratos, y de elegir despus una muestra aleatoria simple en cada estrato. La
informacin de las muestras aleatorias simples de cada estrato constituira entonces una muestra
global.
Ejemplo
Supongamos que nos interesa obtener una muestra de las opiniones de los profesores de una gran
universidad. Puede ser difcil obtener una muestra con todos los profesores, as que supongamos
que elegimos una muestra aleatoria de cada colegio, o departamento acadmico; los estratos
vendran a ser los colegios, o departamentos acadmicos.
2.1.3 Muestreo por Conglomerados
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de unidades
heterogneas entre s de la poblacin llamadas conglomerados. Cada elemento de la poblacin
pertenece exactamente a un conglomerado, y los elementos dentro de cada conglomerado son
usualmente heterogneos o dismiles.
Ejemplo
Supongamos que una compaa de servicio de televisin por cable est pensando en abrir una
sucursal en una ciudad grande; la compaa planea realizar un estudio para determinar el
porcentaje de familias que utilizaran sus servicios, como no es prctico preguntar en cada casa, la
empresa decide seleccionar una parte de la ciudad al azar, la cual forma un conglomerado.
En el muestreo por conglomerados, stos se forman para representar, tan fielmente como sea
posible, a toda la poblacin; entonces se usa una muestra aleatoria simple de conglomerados para
estudiarla. Los estudios de instituciones sociales como iglesias, hospitales, escuelas y prisiones se
realizan, generalmente, con base en el muestreo por conglomerados.

46

Gastronoma
2.1.4 Muestreo Sistemtico
El muestreo sistemtico es una tcnica de muestreo que requiere de una seleccin aleatoria inicial
de observaciones seguida de otra seleccin de observaciones obtenida usando algn sistema o
regla.
Ejemplo
Para obtener una muestra de suscriptores telefnicos en una ciudad grande, puede obtenerse
primero una muestra aleatoria de los nmeros de las pginas del directorio telefnico; al elegir el
vigsimo nombre de cada pgina obtendramos un muestreo sistemtico, tambin podemos
escoger un nombre de la primera pgina del directorio y despus seleccionar cada nombre del
lugar nmero cien a partir del ya seleccionado. Por ejemplo, podramos seleccionar un nmero al
azar entre los primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los
nombres del directorio que corresponden a los nmeros 40, 140, 240, 340 y as sucesivamente.
EJERCICIOS
1. Defina los siguientes trminos de la manera ms precisa posible:
a) Muestreo aleatorio simple
b) Muestreo estratificado
c) Muestreo sistemtico
d) Muestreo por conglomerados
2. Realizar un cuadro comparativo de los siguientes trminos:
a) Fiabilidad del muestreo y efectividad del muestreo
b) Muestreo uniforme y muestreo proporcional
3. Determine la poblacin y proponga el diseo de muestreo ms adecuado para estudiar las
siguientes situaciones:
a) En una industria que produce embutidos, existen 500 mquinas que elaboran los
embutidos. De estas 500 mquinas, 250 son operadas manualmente; 150 son
semiautomticas y 100 son totalmente automticas.
b) Un restaurant est considerando la revisin del sistema vacacional de sus
empleados y desea determinar la proporcin de empleados que apoyan la nueva
propuesta. El restaurant cuenta con 50 sucursales separadas, localizadas en todo
el pas.
c) Un Chef desea hacer una encuesta acerca de la aceptacin de un nuevo platillo
para nios en cierta zona de la ciudad.

2.2 Distribuciones Muestrales


Las muestras aleatorias obtenidas de una poblacin son, por naturaleza propias, impredecibles. No
se esperara que dos muestras aleatorias del mismo tamao y tomadas de la misma poblacin
tenga la misma media muestral o que sean completamente parecidas; puede esperarse que
cualquier estadstico, como la media muestral, calculado a partir de las medias en una muestra
aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribucin de
47

Gastronoma
todos los valores posibles de un estadstico. Tales distribuciones sern muy importantes en el
estudio de la estadstica inferencial, porque las inferencias sobre las poblaciones se harn usando
estadsticas muestrales. Como el anlisis de las distribuciones asociadas con los estadsticos
muestrales, podremos juzgar la confiabilidad de un estadstico muestral como un instrumento para
hacer inferencias sobre un parmetro poblacional desconocido.
Como los valores de un estadstico, tal como x, varan de una muestra aleatoria a otra, se le puede
considerar como una variable aleatoria con su correspondiente distribucin de frecuencias.
La distribucin de frecuencia de un estadstico muestral se denomina distribucin muestral. En
general, la distribucin muestral de un estadstico es la de todos sus valores posibles
calculados a partir de muestras del mismo tamao.
Supongamos que se han seleccionado muestras aleatorias de tamao 20 en una poblacin
grande. Se calcula la madia muestral x para cada muestra; la coleccin de todas estas medias
muestrales recibe el nombre de distribucin muestral de medias, lo que se puede ilustrar en la
siguiente figura:

Supongamos que se eligen muestras aleatorias de tamao 20, de una poblacin grande, y se
calcula la deviacin estndar de cada una. La coleccin de todas estas desviaciones estndar
muestrales se llama distribucin muestral de la desviacin estndar, y lo podemos ver en la
siguiente figura:

48

Gastronoma

Ejemplo
Se eligen muestras ordenadas de tamao 2, con reemplazo, de la poblacin de valores 0, 2, 4 y 6.
Encuentre:
, la media poblacional.
, la desviacin estndar poblacional.
x, la

x,

media de la distribucin muestral de medias.

la desviacin estndar de la distribucin muestral de medias.

Adems, grafique las frecuencias para la poblacin y para la distribucin muestral de medias.
Solucin:
a. La media poblacional es:

49

Gastronoma

b. La desviacin estndar de la poblacin es:

c.

A continuacin se listan los elementos de la distribucin muestral de la media y la


correspondiente distribucin de frecuencias.

La media de la distribucin muestral de medias es:

d) La desviacin estndar de la distribucin muestral de medias es:

50

Gastronoma

De aqu que podemos deducir que:


Como para cualquier variable aleatoria, la distribucin muestral de medias tiene una media o valor
esperado, una varianza y una desviacin estndar, se puede demostrar que la distribucin
muestral de medias tiene una media igual a la media poblacional. Esto es:

Distribuciones muestrales
Despus de haber realizado el ejercicio anterior se puede ver que una distribucin muestral se
genera extrayendo todas las posibles muestras del mismo tamao de la poblacin y calculndoles
a stas su estadstico.
Si la poblacin de la que se extraen las muestras es normal, la distribucin muestral de medias
ser normal sin importar el tamao de la muestra.

Si la poblacin de donde se extraen las muestras no es normal, entonces el tamao de la muestra


debe ser mayor o igual a 30, para que la distribucin muestral tenga una forma acampanada.
Mientras mayor sea el tamao de la muestra, ms cerca estar la distribucin muestral de ser
normal.
Para muchos propsitos, la aproximacin normal se considera buena si se cumple n=30. La forma
de la distribucin muestral de medias sea aproximadamente normal, an en casos donde la
poblacin original es bimodal, es realmente notable.
51

Gastronoma

Teorema del lmite central


Si se seleccionan muestras aleatorias de n observaciones de una poblacin con media
desviacin estndar

, entonces, cuando n es grande, la distribucin muestral de medias tendr

aproximadamente una distribucin normal con una media igual a


de

y una desviacin estndar

. La aproximacin ser cada vez ms exacta a medida de que n sea cada vez mayor.

Ejemplo
Para la distribucin muestral de medias del ejercicio pasado, encuentre:
a. El error muestral de cada media
b. La media de los errores muestrales
c. La desviacin estndar de los errores muestrales.
Solucin:
a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores
muestrales:

52

Gastronoma
Muestra

(0,0)

0 - 3 = -3

(0,2)

1 - 3 = -2

(0,4)

2 - 3 = -1

(0,6)

33=0

(2,0)

1 3 = -2

(2,2)

2 3 = -1

(2,4)

33=0

(2,6)

43=1

(4,0)

2 3 = -1

(4,2)

33=0

(4,4)

43=1

(4,6)

53=2

(6,0)

33=0

(6,2)

43=1

(6,4)

53=2

(6,6)

63=3

b. La media de los errores muestrales es

c.

Error muestral, e=x-

e,

es:

La desviacin estndar de la distribucin de los errores muestrales

e, es

entonces:

La desviacin estndar de la distribucin muestral de un estadstico se conoce como error


estndar del estadstico.
53

Gastronoma
2.3 Distribucin Normal
La distribucin normal es una distribucin continua, en forma de campana en donde la media, la
mediana y la moda tienen un mismo valor y es simtrica.
Con esta distribucin podamos calcular la probabilidad de algn evento relacionado con la variable
aleatoria, mediante la siguiente frmula:

En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta
frmula se pueden a hacer los clculos de probabilidad para cualquier ejercicio, utilizando la tabla
de la distribucin z.
Sabemos que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao de
una poblacin normal, la distribucin muestral de medias tiene un comportamiento
aproximadamente normal, por lo que se puede utilizar la frmula de la distribucin normal
con
y
, entonces la frmula para calcular la probabilidad del comportamiento del
estadstico, en este caso la media de la muestra , quedara de la siguiente manera:

y para poblaciones finitas y muestro con reemplazo:

Ejemplo:
Una empresa elctrica fabrica focos que tienen una duracin que se distribuye aproximadamente
en forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la
probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775
horas.

54

Gastronoma
Solucin:

Este valor se busca en la tabla de z

La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor a
775 horas es de 0.0062.
Ejemplo:
Las estaturas de 1000 estudiantes estn distribuidas aproximadamente en forma normal con una
media de 174.5 centmetros y una desviacin estndar de 6.9 centmetros. Si se extraen 200
muestras aleatorias de tamao 25 sin reemplazo de esta poblacin, determine:
a. El nmero de las medias muestrales que caen entre 172.5 y 175.8 centmetros.
b. El nmero de medias muestrales que caen por debajo de 172 centmetros.
Solucin:
Como se puede observar en este ejercicio se cuenta con una poblacin finita y un muestreo sin
reemplazo, por lo que se tendr que agregar el factor de correccin. Se proceder a calcular el
denominador de Z para slo sustituirlo en cada inciso.

a.

55

Gastronoma

(0.7607)(200)=152 medias muestrales

b.

(0.0336)(200)= 7 medias muestrales


EJERCICIOS
1. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye normalmente
2
con media de 2000 libras y una varianza de 25,000 lbs . Si se selecciona una muestra
aleatoria de 100 cuerdas; determine la probabilidad de que en esa muestra:
a) La resistencia media encontrada sea de por lo menos 1958 libras.
b) La resistencia media se mayor de 2080 libras.
2. Como parte de un proyecto general de mejoramiento de la calidad, un fabricante de comida
rpida decide controlar el nmero de imperfecciones encontradas en cada comida
realizada. Se estima que el nmero promedio de imperfecciones por cada comida es de
12, determine la probabilidad de que en la prxima comida se encuentren:

56

Gastronoma
a) Entre 10 y 12 imperfecciones.
b) Menos de 9 y ms de 15 imperfecciones.
3. En una prueba de aptitud la puntuacin media de los estudiantes es de 72 puntos y la
desviacin estndar es de 8 puntos. Cul es la probabilidad de:
a) 3 o ms puntos.
b) 6 o ms puntos.
c) Entre 2 y 5 puntos.
2.4 Teora de Pequeas Muestras
Utilizaremos muestras pequeas siempre y cuando la distribucin de donde proviene la muestra
tenga un comportamiento normal. Esta es una condicin para utilizar las tres distribuciones que se
2
manejarn en esta unidad; t de student, X ji-cuadrada y Fisher.
A la teora de pequeas muestras tambin se le llama teora exacta del muestreo, ya que tambin
la podemos utilizar con muestras aleatorias de tamao grande.
Veremos un nuevo concepto necesario, este concepto es "grados de libertad".
Para definir grados de libertad se har referencia a la varianza muestral:

Esta frmula est basada en n-1 grados de libertad (degrees of freedom). Esta terminologa
2

resulta del hecho de que si bien s est basada enn cantidades

. . .

,
stas suman cero, as que especificar los valores de cualquier n-1 de las cantidades
determina el valor restante. Por ejemplo, si n=4 y

que slo tres de los cuatro valores de


libertad.

, entonces automticamente tenemos

, as

estn libremen te determinamos 3 grados de

Entonces, la frmula de grados de libertad ser n-1 y su simbologa

57

Gastronoma
2.4.1

Distribucin "T de Student"

Supngase que se toma una muestra de una poblacin normal con media
. Si

y varianza

es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la

distribucin
poblacin
reemplaza

es una distribucin normal estndar. Supngase que la varianza de la


2

es desconocida. Qu sucede con la distribucin de esta estadstica si se


por s? La distribucin t proporciona la respuesta a esta pregunta.

La media y la varianza de la distribucin t son


respectivamente.

=0y

para

>2,

La siguiente figura presenta la grfica de varias distribuciones t. La apariencia general de la


distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y unimodales,
y el valor mximo de la ordenada se alcanza en la media
= 0. Sin embargo, la distribucin tiene
colas ms amplias que la normal; esto es, la probabilidad de las colas es mayor que en la
distribucin normal. A medida que el nmero de grados de libertad tiende a infinito, la forma lmite
de la distribucin t es la distribucin normal estndar.

Propiedades de las distribuciones t

58

Gastronoma
1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, est ms dispersa que la curva normal estndar z.
3. A medida que

aumenta, la dispersin de la curva t correspondiente disminuye.

4. A medida que

, la secuencia de curvas t se aproxima a la curva normal

estndar, por lo que la curva z recibe a veces el nombre de curva t con gl =


La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con

grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales con media

desviacin estndar
con

. Entonces la variable aleatoria

tiene una distribucin t

= n-1 grados de libertad.

La distribucin de probabilidad de t se public por primera vez en 1908 en un artculo de W. S.


Gosset. En esa poca, Gosset era empleado de una cervecera irlandesa que desaprobaba la
publicacin de investigaciones de sus empleados. Para evadir esta prohibicin, public su trabajo
en secreto bajo el nombre de "Student". En consecuencia, la distribucin t normalmente se llama
distribucin t de Student, o simplemente distribucin t. Para derivar la ecuacin de esta
distribucin, Gosset supone que las muestras se seleccionan de una poblacin normal. Aunque
esto parecera una suposicin muy restrictiva, se puede mostrar que las poblaciones no normales
que poseen distribuciones en forma casi de campana an proporcionan valores de t que se
aproximan muy de cerca a la distribucin t.
La distribucin t difiere de la de Z en que la varianza de t depende del tamao de la muestra y
siempre es mayor a uno. nicamente cuando el tamao de la muestra tiende a infinito las dos
distribuciones sern las mismas.

Se acostumbra representar con

el valor t por arriba del cual se encuentra un rea igual a

Como la distribucin t es simtrica alrededor de una media de cero, tenemos


es decir, el valor t que deja un rea de

a la derecha y por tanto un rea de

izquierda, es igual al valor t negativo que deja un rea de


Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc.

.
;

a la

en la cola derecha de la distribucin.

59

Gastronoma
Para encontrar los valores de t se utilizar la tabla de valores crticos de la distribucin t del libro
Probabilidad y Estadstica para Ingenieros de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con
= 14 grados de libertad que deja un rea de 0.025 a la izquierda, y por tanto un
rea de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145

Si se observa la tabla, el rea sombreada de la curva es de la cola derecha, es por esto que se
tiene que hacer la resta de
de

. La manera de encontrar el valor de t es buscar el valor

en el primer rengln de la tabla y luego buscar los grados de libertad en la primer columna

y donde se intercepten

se obtendr el valor de t.

Ejemplo:
Encuentre la probabilidad de t0.025 < t < t0.05.
Solucin:

Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de 0.025 a la izquierda,
encontramos un rea total de 1-0.05-0.025 = 0.925.

60

Gastronoma
P( t0.025 < t < t0.05) = 0.925
Ejemplo:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamao 15 que se
selecciona de una distribucin normal.
Solucin:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad nos damos cuenta que a este
valor le corresponde un rea de 0.05 a la izquierda, por ser negativo el valor. Entonces si se resta
0.05 y 0.045 se tiene un valor de 0.005, que equivale a
. Luego se busca el valor de 0.005 en
el primer rengln con 14 grados de libertad y se obtiene un valor de t = 2.977, pero como el valor
de

est en el extremo izquierdo de la curva entonces la respuesta es t = -2.977 por lo tanto:


P(-2.977 < t < -1.761) = 0.045

Ejemplo:
Un ingeniero qumico afirma que el rendimiento medio de la poblacin de cierto proceso en lotes es
500 gramos por milmetro de materia prima. Para verificar esta afirmacin toma una muestra de 25
lotes cada mes. Si el valor de t calculado cae entre t0.05 y t0.05, queda satisfecho con su afirmacin.
Qu conclusin extraera de una muestra que tiene una media de 518 gramos por milmetro y una
desviacin estndar de 40 gramos? Supongamos que la distribucin de rendimientos es
aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.711. Por tanto, el fabricante
queda satisfecho con esta afirmacin si una muestra de 25 lotes rinde un valor t entre 1.711 y
1.711.
Se procede a calcular el valor de t:

61

Gastronoma
Este es un valor muy por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor
de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de
0.02. De aqu que es probable que el fabricante concluya que el proceso produce un mejor
producto del que piensa.
2.4.2 Intervalo de Confianza para
Si

; Con

Desconocida

y s son la media y la desviacin estndar de una muestra aleatoria de una poblacin normal

con varianza
(

donde
derecha.

, desconocida, un intervalo de confianza de

)100% para

/2

es:

es el valor t con

= n-1 grados de libertad, que deja un rea de

/2 a la

Se hace una distincin entre los casos de


conocida y
desconocida al calcular las
estimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza el
teorema del lmite central, mientras que para
desconocida se hace uso de la distribucin
muestral de la variable aleatoria t. Sin embargo, el uso de la distribucin t se basa en la premisa de
que el muestreo se realiza de una distribucin normal. En tanto que la distribucin tenga forma
aproximada de campana, los intervalos de confianza se pueden calcular cuando la varianza se
desconoce mediante el uso de la distribucin t y se puede esperar buenos resultados.
Con mucha frecuencia los estadsticos recomiendan que aun cuando la normalidad no se pueda
suponer, con
de confianza:

desconocida y n

30, s puede reemplazar a

y se puede utilizar el intervalo

Por lo general ste se denomina como un intervalo de confianza de muestra grande. La


justificacin yace slo en la presuncin de que con una muestra grande como 30, s estar muy
62

Gastronoma
cerca de la
real y de esta manera el teorema del lmite central sigue valiendo. Se debe hacer
nfasis en que esto es solo una aproximacin y que la calidad de este enfoque mejora a medida
que el tamao de la muestra crece ms.
Ejemplos:
1. El contenido de siete contenedores similares de cido sulfrico son 9.8, 10.2, 10.4, 9.8,
10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos
los contenedores si se supone una distribucin aproximadamente normal.
Solucin:
La media muestral y la desviacin estndar para los datos dados son:
10 y s= 0.283
En la tabla se encuentra que t0.025=2.447 con 6 grados de libertad, de aqu, el intervalo de
confianza de 95% para

es:

Con un nivel de confianza del 95% se sabe que el promedio del contenido de los
contenedores est entre 9.47 y 10.26 litros.
2. Un artculo publicado en el Journal of Testing and Evaluation presenta las siguientes 20
mediciones del tiempo de combustin residual en segundos de especmenes tratados de
ropa de dormir para nios:
9.85

9.93

9.75

9.77

9.67

9.87

9.67

9.94

9.85

9.75

9.83

9.92

9.74

9.99

9.88

63

Gastronoma
9.95

9.95

9.93

9.92

9.89

Se desea encontrar un nivel de confianza del 95% para el tiempo de combustin residual
promedio. Supngase que el tiempo de combustin residual sigue una distribucin normal.
Solucin:
La media muestral y la desviacin estndar para los datos dados son:
9.8525 y s= 0.0965
En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de aqu, el intervalo de
confianza de 95% para

es:

Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustin residual promedio se
encuentra entre 9.8073 y 9.8977 segundos.

64

Gastronoma
2.5 Anlisis de tendencias
2.5.1 Anlisis de Regresin y Correlacin
Un problema que se presenta con frecuencia en muchas de las actividades que realizamos, es
estimar la relacin entre dos variables. Por ejemplo el peso (y) de un beb sin duda est
relacionado con su edad(x); el salario (y) que percibe un individuo de edad determinada
probablemente est relacionada con el nmero de aos (x) de educacin formal que tenga; la
produccin de un terreno (y) con la cantidad de fertilizante usado. La teora de los mnimos
cuadrados y el mtodo de regresin se centran en el problema de estimar la relacin entre una
variable y, una variable x que vara independientemente(o ms de una x). La forma funcional
supuesta de la relacin y y x puede ser tericamente cualquier cosa; pero en estas notas solo se
hablara de la relacin lineal.
El anlisis de regresin se refiere a la formulacin de la ecuacin que describe la relacin entre las
variables, a su representacin grfica y a la estimacin de una variable dependiente a partir de
valores dados a las variables independientes. Mediante la utilizacin de la ecuacin mencionada
antes se emplea este mtodo de anlisis, es predecir o estimar el valor de una variable que
corresponde al valor dado de otra.
El anlisis de correlacin se refiere a la determinacin de coeficientes para medir el grado de
relacin entre variables.
El anlisis de regresin correlacin puede ser simple o mltiple. Es simple cuando se refiere a la
relacin entre dos variables una dependiente y la otra independiente. Es mltiple cuando se
relacionan varias variables entre s, una dependiente y las dems independientes.
Cuando el anlisis de regresin es simple se puede visualizar grficamente mediante una
representacin por puntos de las diferentes fases de datos la grfica correspondiente. Se llama
nube de puntos o diagrama de dispersin; cada punto corresponde a la representacin de un par
ordenado; el primer elemento x del par corresponde a una variable.
El diseo de nube de puntos permite tener en general una idea de la relacin que puede existir
entre dos variables.

2.5.2 Ajuste de Curvas


Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que
muestren valores correspondientes de las variables bajo consideracin. As por ejemplo
supongamos que x ^ y denotan respectivamente la altura y el peso de personas adultas, entonces
una muestra de N individuos revelar
El prximo paso es marcar los puntos

x1 , x2 ..., xn y los pesos y1 , y 2 ..., y n .

( x1 y1 ), ( x2 y 2 )..., ( xn y n ) sobre un sistema de coordenadas

rectangulares, El conjunto de puntos resultantes es el llamado diagrama de dispersin.


65

Gastronoma
A partir del diagrama de dispersin es posible con frecuencia visualizar una curva suave que
aproxima los datos, tal curva se llama una curva aproximante. Si es una recta decimos que hay
una relacin lineal entre las variables en caso contrario es una relacin no lineal.
El problema general de hallar ecuaciones de curvas aproximantes que se ajusten a un conjunto de
datos se llama ajuste de curvas.
2.5.3 Ajuste de Curvas a Mano
A menudo puede recurrirse a la intuicin personal a la hora de dibujar una curva que ajuste un
conjunto de datos. Esto se conoce como mtodo de ajuste de curvas a mano. Si el tipo de
ecuacin de la curva es conocido, es posible obtener las constantes de la ecuacin eligiendo
tantos puntos de la curva como constantes haya en la ecuacin. Por ejemplo si la curva es una
recta son necesarios dos puntos, si es una parbola son precisos tres puntos.
El mtodo tiene la desventaja de que diferentes observadores obtendrn distintas curvas y
ecuaciones.
Es entonces necesario establecer un criterio estndar para definir la ecuacin de la curva
(ecuacin de regresin) el mtodo se llama de mnimos cuadrados.
El criterio de mnimos cuadrados implica que la recta elegida para ajustar los puntos del diagrama
de dispersin sea tal que la suma de los cuadrados de las distancias verticales entre los puntos y
la recta sea lo ms pequea posible.

2.5.4

Coeficiente de Correlacin

Se requiere una cantidad que nos d un nmero que media la magnitud de la relacin entre x e
y. La cantidad que se usa para este fin se conoce como coeficiente de correlacin de la muestra
simbolizada por la letra r y se da por la frmula:

r=

x x y y ... (I)
x x y y
2

66

Gastronoma
r=

n xy x y

x n y y

n x
2

(II)

Al analizar la formula II vemos que para calcular r es necesario calcular cinco sumas:

x, y, x , y y xy,
2

Contando con una calculadora, es posible obtener todas estas sumas en una secuencia de
operaciones.
EJEMPLO.
Calcular el coeficiente de correlacin de la muestra segn los datos siguientes:
X
Y

10

12

12

16

12

18

12

14

16

10

10

15

11

13

Para usar la frmula II hacemos la tabla:


x

x2

y2

Xy

10

100

36

60

49

16

28

67

Gastronoma

12

144

49

84

12

144

64

96

10

81

100

90

16

256

49

112

12

10

144

100

120

18

15

324

225

270

64

25

40

12

144

36

72

14

11

196

121

154

16

13

256

169

208

102

1902

990

1334

146

Luego tenemos que:

x 146, y 102, x

, 1902, y 2 990 y

xy 1334

Al sustituir estos valores:

1334

146102

12

146
102
1902
990

12
12

r=

1334 1241

1902 1776990 867


=

93
93
93

.747
126123 15498 124.5

El valor del coeficiente de correlacin de la muestra flucta entre -1 y 1, un valor de r = -1 nos


indicara una relacin lineal perfecta entre los valores de x e y de la muestra siendo el valor de y
decreciente a medida que x aumente, as que mientras ms crece x, ms disminuye y, y a la
inversa, un valor r =+1 tambin indicar relacin lineal, pero en este caso el valor de y aumente al
aumentar x.

68

Gastronoma
Los valores altos de y estn aunados a los valores altos de x y los valores bajos de y estn
aunados a los valores bajos de x.
Si no hay relacin lineal entre x e y entonces r tendr un valor cercano a cero. Al aumentar el valor
de 0 a +1 (o disminuir de 0 a -1) la relacin lineal entre los valores de x e y de la muestra, destaca
ms.
El coeficiente de correlacin muestral tiene las siguientes propiedades:
1. No tiene dimensin
2. Su valor absoluto no puede exceder la unidad, es decir: 1 r 1
3. Si todos los puntos de un diagrama de dispersin caen sobre una lnea recta (la lnea de
regresin, las dos variables estn en correlacin perfecta y r 1 ) segn que la
pendiente de la lnea sea positiva o negativa, respectivamente.
4. Si todos los puntos de un diagrama de dispersin no caen sobre la lnea de regresin es la
mejor representacin de los datos en una forma lineal y en un sentido cuadrticos medio

1<r<1
5. Si r>0, o la pendiente de la lnea de regresin asciende hacia a la derecha; si r<0 la
pendiente de la lnea de regresin desciende hacia la derecha.
6. Obsrvese que la magnitud de r no indica inclinacin o pendiente de la lnea de
concentracin de los puntos de los datos respecto a la lnea.
7. Si

es prximo a cero, los puntos del diagrama de dispersin no muestran una tendencia

de la lnea recta, es decir, no hay correlacin lineal.

2.5.5 Regresin Lineal


El coeficiente de correlacin de la muestra es una medida de la relacin lineal entre dos variables x
e y, aunque no nos explica en qu consiste dicha relacin.
Por lo general es conveniente determinar esa relacin con el fin de usar el valor de una variable
para calcular el de otra.
El proceso de formular la ecuacin que nos da la relacin de la variables se conoce como el de
encontrar la lnea de regresin.
La ecuacin de una lnea recta puede expresarse en trminos de su interseccin y y su
pendiente. La interseccin y de una recta es la coordenada del punto en que la lnea cruza el eje
y. La pendiente de una recta, es el grado de cambio de y por unidad de cambio de x, una
pendiente de 2 significa que y aumenta 2 mientras que x aumente una unidad. Una pendiente de

significa que y aumenta 3 mientras que x aumenta una unidad etc. Si la pendiente es negativa,

significa que y disminuye.


Otra interpretacin de la pendiente sera que es la proporcin de alza de una lnea a la
trayectoria de la misma, es decir, la relacin que existe entre el cambio vertical y el horizontal, o
sea:
69

Gastronoma
Pendiente

alza
trayectori a

Consideremos que la trayectoria es siempre hacia la derecha. Por tanto el alza ir hacia arriba si la
pendiente es positiva y hacia abajo si es negativa.
La ecuacin de la lnea cuya interseccin con el eje y es el nmero a y cuya pendiente es el
nmero b, ser:
Y=bx+a
A la inversa, la ecuacin es de la forma anterior. Tiene pendiente b y una interseccin con el eje y
igual a a.
Ahora bien, volvamos al problema de encontrar la recta que exprese mejor la relacin lineal entre
los valores de x e y. Las observaciones se hacen por pares. Hay n nmeros de valores x1, x2xn;
y n valores y; y1 y2yn; y1 corresponde a x1, y2 a x2, etc. Los n pares de observaciones pueden
expresarse como (x1,y1), ( x2, y2)(xn,yn)
Se define como recta de mejor ajuste la recta en que la suma de los cuadrados de las
desviaciones de los valores y pronosticados (que estn sobre la recta) de los valores y
observados, o sea un mnimo, se puede demostrar por mtodos avanzados de clculo (que no
haremos) que la ecuacin de la recta mnimos cuadrados est dado como:
Y= bx+a
Donde:

b=

n xy x y
2
2
n x x

y x x xy
a=
n x x

VI

...V

En donde b es la pendiente y a la interseccin con el eje y.

Si se utilizan estas frmulas para calcular a y b con los datos el ejemplo anterior tenemos:

b=

121334 146102 16008 14892 1116

2
22824 21316 1508
121902 146

b=.74

70

Gastronoma
a=

1902102 1461334 194004 194764 760


2
22824 21316
1508
121902 146

a=-.504
Con lo que la ecuacin de mnimos cuadrados ser:
y= .74x-.504
Una vez que se determina la ecuacin de la recta de mnimos cuadrados es posible predecir para
otro valor de x, el valor correspondiente de y.

Ejercicio
Se realiza un experimento para determinar la relacin entre la precipitacin pluvial y el rendimiento
de trigo. Supngase que se obtienen los datos siguientes:

Precipitacin pluvial

Rendimiento de trigo

a) Ajstese una recta de mnimos cuadrados a los datos x como variable independiente y
grafique despus la recta sobre un diagrama de dispersin.
b) Estmese el rendimiento de trigo si la precipitacin pluvial es de 10 pulg.
SOLUCIN
a)
Construimos la tabla:

xy

16

25

20

71

Gastronoma
5

25

25

25

25

16

20

36

49

42

49

36

42

64

81

72

81

64

72

50

50

310

310

306

Calculando a y b se tiene:

n xy x y
b=

n x x

10306 5050 3060 2500 560

.933
2
3100 2500 600
10306 50

x y x xy 200 .333
a
600
n x x
2

Luego la ecuacin de la recta de mnimos cuadrados es:


Y= bx+a=.93x+.33
Solucin de b)
Y (10) =.93 (10)+.33=9.3+.33=9.63
Y=9.63

72

Gastronoma
PROBLEMAS COMPLEMENTARIOS
1.

Identifique cada variable como cuantitativa o cualitativa.

a)
b)
c)
d)

Tiempo que toma armar un rompecabezas sencillo.


Nmero de estudiantes en un saln de clases de primer grado.
Evaluacin del desempeo de un poltico recin elegido (excelente, bueno, regular, malo).
Estado donde vive una persona.

2. Identifique las siguientes variables cuantitativas como discretas o continuas.


a) Poblacin en un rea particular de Estados Unidos.
b) Peso de los peridicos recuperados para reciclaje en un da.
c) Tiempo para terminar un examen.
d) Nmero de consumidores en una encuesta aplicada a 1000 personas que consideran
importante la informacin nutrimental que contienen los empaques de los productos
alimenticios.

3. Un conjunto de datos consta de las edades que tenan al morir cada uno de los 41
presidentes anteriores de Estados Unidos.
a) Este conjunto de datos especficos es una poblacin o una muestra?
b) Cul es la variable que se est midiendo?
c) La variable del inciso b) es cuantitativa o cualitativa?

4. Un investigador mdico quiere estimar el tiempo de supervivencia de un paciente despus


del inicio de un tipo especfico de cncer y despus de un rgimen particular de radioterapia.

a) Cul es la variable de inters para el investigador mdico?


b) La variable del inciso a) es cualitativa, cuantitativa discreta o cuantitativa continua?
c) Identifique la poblacin de inters para el investigador mdico.
d) Describa cmo podra seleccionar el investigador una muestra de la poblacin.
e) Qu problemas podran surgir al tomar una muestra de la poblacin?

73

Gastronoma
5.

Identifique cada variable como cuantitativa o cualitativa:

a) Origen tnico de un candidato a un puesto pblico.


b) Calificacin (0-100) de un examen de colocacin.
c) Concentracin de mercurio en una muestra de atn.
d) Establecimiento de comida que prefiere un trabajador.

6.

Identifique cada variable como discreta o continua.

a) Nmero de homicidios en una ciudad.


b) Tiempo que transcurre entre la llegada de los pacientes en una clnica externa.
c) Nmero de errores al mecanografiar una pgina de un manuscrito.
d) Nmero de focos defectuosos en un paquete de cuatro.

7.

Seale si las variables son continuas o discretas.

a) Peso de dos docenas de camarones.


b) Temperatura corporal de una persona.
c) Personas que esperan atencin en la sala de urgencias de un hospital.
d) Nmero de propiedades en venta de una agencia de bienes races.

8. Seale si las variables son discretas o continuas.


a) Nmero de personas formadas en la caja de un supermercado.
b) Altura que alcanza la nieve en una tormenta.
c) Tiempo que tarda un conductor en reaccionar ante un choque inminente.
d) Nmero de aviones que llegan al aeropuerto de Mxico en una hora determinada.

9. Cincuenta personas estn agrupadas en cuatro categoras A, B, C y D, y el nmero de


personas que se encuentran en cada categora se muestra en la siguiente tabla.

74

Gastronoma
Categora

Frecuencia

11

14

20

a) Cul es la variable que se est midiendo? Es cualitativa o cuantitativa?


b) Trace una grfica de barras para describir los datos.
c) Elabore una grfica de sectores para describir los datos.
d) La forma de la grfica de barras del inciso b) cambia dependiendo del orden
presentacin de las cuatro categoras? Es importante el orden de presentacin?

de

e) Qu proporcin de las personas est en la categora B, C o D?


f)

Qu porcentaje de las personas no estn en la categora B?

10. El estado civil de 50 empleados recientemente contratadas por una compaa


expresada a continuacin en la siguiente tabla de frecuencias.
Empleados

Frecuencia

Solteros

25

Casados

15

Divorciados

Viudos

Total

50

est

Construya una grfica de sectores.


11. Los salarios semanales de 50 estudiantes universitarios se organizan en una distribucin
de frecuencias. Se emplea la letra x para denotar el punto medio del intervalo de clase, y sus
frecuencias se muestran a continuacin.

a)
b)

55

60

65

70

75

80

85

90

95

Fr (x)

10

Trcese un histograma para la distribucin de frecuencias relativas.


Trcese un polgono para la distribucin de frecuencias relativas
75

Gastronoma
c)

Trcese una ojiva para la distribucin de frecuencias relativas acumuladas.

12. Se seleccionaron aleatoriamente mil televidentes y se llev cabo una entrevista telefnica
para determinar el nivel educativo de aquellos que ven el noticiero vespertino. Se obtuvo la
siguiente informacin.
NIVEL EDUCATIVO

# DE ESPECTADORES

Escuela primaria

150

Secundaria o preparatoria

250

Universitarios sin graduar

300

Universitarios graduados

150

Maestra con grado

100

Doctorado o equivalente

50

Total

1000

Trcese una grfica de sectores y una de barras.


13.

La poblacin de una ciudad, era de 10000 habitantes en 1955. En 1965 era de 20000.

a) Cul es el promedio de crecimiento?


b) Si el presente promedio de crecimiento contina, Cul ser la poblacin proyectada para
1968?

14. Si la economa de los Estados Unidos crece un promedio del 4% anual, y es de 500
billones de dlares en 1962, En qu ao alcanzar los 700 billones?

15.

Los pesos de 5 estudiantes son como sigue: 120, 140, 150, 160, y 180 lbs.

a)
b)

Encontrar el peso promedio.


Encontrar la desviacin media de los pesos.

16.

Encontrar la varianza de los pesos en el problema 15.

17. El promedio de peso de 6 toros seleccionados al azar en un enorme rancho ganadero debe
ser por lo menos 425 Kg. Ya se han seleccionado 5 toros y sus pesos han sido 408, 441, 418,
76

Gastronoma
429 y 422 Kg. Cunto debe pesar el ltimo toro para que el peso promedio de los 6 toros sea el
que se quiere?
18.

Calcule la media, mediana y moda de la siguiente tabla de distribucin de frecuencias:

Clase

Lmite Inferior

Lmite Superior

Frecuencia Absoluta

115

145

6245

150

180

7264

185

215

11450

220

250

2923

255

285

8152

19.
Determine el tercer cuartil, el sptimo decil y el porcentil 29 de la siguiente tabla de
distribucin de frecuencias:
Clase

Lmite Inferior

Lmite Superior

Marca

Frecuencia

31

35

33

3758

36

40

38

3635

41

45

43

3084

46

50

48

3796

51

55

53

435

20.
A continuacin se presentan los valores de concentracin de grasa de leche condensada
azucarada (Exportacin).
8.39

8.51

8.52

8.40

8.42

8.43

8.52

8.43

8.51

8.50

8.37

8.39

8.43

8.41

8.45

8.35

8.32

8.52

8.49

8.51

8.36

8.44

8.54

8.48

8.46

8.48

8.55

8.48

8.20

8.50

8.47

8.50

8.33

8.48

8.55

8.50

8.52

8.48

8.44

8.40

77

Gastronoma
a)
b)
c)
d)
e)

Elabore una tabla de frecuencia para este conjunto de datos.


Elaborar el histograma que represente los datos de concentracin de grasa.
Construya un polgono de frecuencias.
Determine la ojiva.
Determine la clase donde se encuentra la mayor concentracin de grasa de leche
condensada.

21.
La siguiente tabla representa el anlisis de concentracin de cloro en agua potable durante
8 das, del que se obtuvieron los siguientes resultados (P. P. M.)

a)
b)
c)
d)
e)

0.6

0.5

0.8

0.8

1.0

0.5

0.8

0.2

0.8

0.7

0.6

0.6

1.0

0.5

0.6

0.6

0.8

0.8

0.9

0.6

1.2

0.6

0.6

0.4

0.6

0.6

0.5

0.6

0.8

0.6

0.9

0.6

0.6

0.6

0.5

0.6

0.8

0.6

1.0

0.6

0.4

0.6

0.4

0.6

0.6

0.5

0.8

0.6

Elabore una tabla de frecuencia para este conjunto de datos.


Elaborar el histograma que represente los datos de concentracin de cloro.
Construya un polgono de frecuencias.
Determine la ojiva.
Determine la clase donde se encuentra la mayor concentracin de cloro.

22.

Datos de TC final de leche condensada azucarada:

7258

7234

7243

7242

7238

7272

7234

7214

7214

7204

7256

7226

7230

7226

7258

7254

7206

7204

7226

7224

7246

7288

7242

7218

7225

7212

7212

7206

7232

7226

7245

7233

7205

7233

7250

7216

7210

7224

7228

7244

7204

7234

7220

7268

7210

7256

7210

7216

7224

7208

7218

7112

7252

7206

7230

7230

7210

7208

7210

7228

7226

7245

7232

7230

7250

7228

7212

7210

7244

7226

a)
b)
c)
d)

Elabore una tabla de frecuencia para este conjunto de datos.


Elaborar el histograma que represente los datos de concentracin de grasa.
Construya un polgono de frecuencias.
Determine la ojiva.

78

Gastronoma
23.
A continuacin se presentan los valores de concentracin de grasa de leche condensada
azucarada (Exportacin).
0.6

0.5

0.8

0.8

1.0

0.5

0.8

0.2

0.8

0.7

0.6

0.6

1.0

0.5

0.6

0.6

0.8

0.8

0.9

0.6

1.2

0.6

0.6

0.4

0.6

0.6

0.5

0.6

0.8

0.6

0.9

0.6

0.6

0.6

0.5

0.6

0.8

0.6

1.0

0.6

0.4

0.6

0.4

0.6

0.6

0.5

0.8

0.6

a)
b)
c)

Calcular la media.
Obtener la mediana.
Calcular la moda.

24.
La siguiente tabla representa el anlisis de concentracin de cloro en agua potable durante
8 das, del se obtuvieron los siguientes resultados (P. P. M.)

a)
b)
c)

0.6

0.5

0.8

0.8

1.0

0.5

0.8

0.2

0.8

0.7

0.6

0.6

1.0

0.5

0.6

0.6

0.8

0.8

0.9

0.6

1.2

0.6

0.6

0.4

0.6

0.6

0.5

0.6

0.8

0.6

0.9

0.6

0.6

0.6

0.5

0.6

0.8

0.6

1.0

0.6

0.4

0.6

0.4

0.6

0.6

0.5

0.8

0.6

Calcular la media.
Obtener la mediana.
Calcular la moda.

25.
Un ingeniero prob nueve muestras de cada uno de tres diseos de soporte para un nuevo
torno elctrico. Los datos que presentamos a continuacin corresponde al nmero de horas que
tard cada soporte en fallar teniendo el motor del torno funcionando continuamente a su mxima
potencia, con una carga en l equivalente a 1.9 veces su capacidad esperada.
DISEO
A

79

Gastronoma

a)
b)

16

18

31

16

27

16

53

23

42

15

21

20

31

22

18

17

26

17

14

39

16

30

17

15

20

28

19

Calcule la media y la mediana para cada grupo.


Basndose en la respuesta al inciso anterior, cul diseo es mejor y por qu?

26.
A continuacin se presentan los valores de concentracin de grasa de leche condensada
azucarada (Exportacin).

a)

0.6

0.5

0.8

0.8

1.0

0.5

0.8

0.2

0.8

0.7

0.6

0.6

1.0

0.5

0.6

0.6

0.8

0.8

0.9

0.6

1.2

0.6

0.6

0.4

0.6

0.6

0.5

0.6

0.8

0.6

0.9

0.6

0.6

0.6

0.5

0.6

0.8

06

1.0

0.6

0.4

0.6

0.4

0.6

0.6

0.5

0.8

0.6

Calcular la varianza y la desviacin estndar.

27.
A continuacin presentamos los datos de una muestra de la tasa de produccin diaria de
lotes de leche condensada.
17

21

18

27

17

21

20

22

18

23

El gerente de produccin de la compaa siente que una desviacin estndar de ms de tres lotes
por da indica variaciones de tasas de produccin inaceptables. Deber preocuparse por las tasas
de produccin de la planta?
28.
Determine el coeficiente de correlacin y una ecuacin que describa la relacin entre la
frecuencia de accidentes y el nivel de educacin preventiva en la planta en lo referente a los
siguientes datos:
80

Gastronoma
HORAS-HOMBRE
POR MES DE
INSTRUCCIN

ACCIDENTES POR
MILLN DE
HORAS-HOMBRE

200

7.0

500

6.4

450

5.2

800

4.0

900

3.1

150

8.0

300

6.5

600

4.4

29.
Determine el coeficiente de correlacin y una ecuacin que describa la relacin de los
siguientes datos.
VENTAS (EN MILES)

INGRESOS (EN MILES)

201

17

225

20

305

21

380

23

560

25

600

24

685

27

735

27

510

22

725

30

450

21

370

19

150

15

81

Gastronoma
30.
Determine el coeficiente de correlacin y una ecuacin que describa la relacin de los
siguientes datos.
TAMAO

COSTO TOTAL

25

$2000

20

3500

40

1000

45

800

22

3000

63

1300

70

1500

60

1100

55

950

50

900

30

1600

31.
Calcule el rango, la varianza y la desviacin estndar de la siguiente tabla de distribucin
de frecuencias:
Clase

Lmite inferior

Lmite superior

Frecuencia absoluta

115

145

6245

150

180

7264

185

215

11450

220

250

2923

255

285

8152

32.
Calcule el rango, la varianza y la desviacin estndar de la siguiente tabla de distribucin
de frecuencias:

82

Gastronoma
Clase

Lmite inferior

Lmite superior

Frecuencia absoluta

1.15

1.45

6245

1.50

1.80

7264

1.85

2.15

11450

2.20

2.50

2923

2.55

2.85

8152

33.
El nmero de trabajadores que se presentaron tarde a trabajar durante un mes en una
maquiladora han sido agrupados en la siguiente distribucin de frecuencias.

Nmero de
Trabajadores que llegaron tarde
das
O

10

14

15

19

20

ms

Total de das

30

a) Cuantos das del mes se presentaron tarde a trabajar 15 o ms trabajadores?


b) Determine los lmites superiores e inferiores de las clases, los intervalos de cada clase, los
valores divisorios de las clases y las marcas de cada clase.
c) Construye el histograma correspondiente a esta distribucin de frecuencias.

34.

Expresa la distribucin del problema anterior como una distribucin porcentual.

35.
La gerencia de relaciones pblicas de un hotel recibi las siguientes estimaciones de 40
huspedes sobre el servicio del restaurante: muy bueno, bueno, bueno, regular, excelente, bueno,
bueno, bueno, muy bueno, malo, bueno, bueno, bueno, bueno, muy bueno, bueno, regular, bueno,
83

Gastronoma
bueno, muy malo, muy bueno, regular, bueno, bueno, excelente, muy bueno, bueno, bueno,
bueno, regular, regular, muy bueno, bueno, muy bueno, excelente, muy bueno, regular, bueno,
bueno y muy bueno.

b)
c)
d)

a) Construye la distribucin de frecuencias de las diferentes evaluaciones de los huspedes.


Construye un diagrama de barras que represente esta distribucin.
Construye la distribucin de frecuencias porcentual de estas variaciones.
Determina los ngulos que corresponden a cada categora en el diagrama circular o de pie
de distribucin. Construye su diagrama circular.
e) por qu no es conveniente representar esta distribucin por medio de un
histograma?

36.
La siguiente tabla muestra la distribucin de ganado bovino en unidades de produccin
rural en 1990.
Tipo de ganado

Cabezas

Corriente

6979316

Fino

6749269

de Cruza

9860167

Total de Cabezas

23588752

a) Construye un diagrama de barras que represente esta distribucin.


b) Construye la correspondiente distribucin de frecuencias porcentual.
c) Determine los ngulos que corresponden a cada categora en, el diagrama circular o de
pie de esta distribucin. Construye su diagrama circular.
37.
Un elevador est diseado para cargar un mximo de 950 kg. En un viaje se suben 6
mujeres con un peso promedio de 62 Kg., 4 hombres con un peso promedio de 79 kg. Y 3 nios
con un peso promedio de 35 kg.
a) Determina si el elevador lleva sobrepeso.
b) Calcula el peso promedio por persona en este viaje de elevador.
38.
La produccin de automviles para el mercado internacional, de acuerdo con las
empresas, en el periodo 1990-1995, esta dada por la siguiente tabla:
Chrysler
Ford
G. M.
Ao
Nissan Volkswagen

a)

1990

52472

45987

32782

79953

134357

1991

64567

55021

38862

77967

142411

1992

83724

68167

49590

95776

131812

1993

57636

52533

50534

98946

129854

1994

46816

26804

41962

92286

14517

1995

15624

9317

14985

28039

33414

Determina la produccin media de cada una de las empresas durante este periodo.
84

Gastronoma
39.
Los registros mensuales de precipitacin pluvial (en milmetros) de una regin varan por la
presencia de un huracn en septiembre del segundo ao.
Ao Ene. Feb. Mzo. Abr. Mayo Jun.
Jul. Ag. Sep. Oct.
Nov. Dic.
1996
17
31
26
24
120 158 198 203 177
54
49
32
1997

a)
b)

13

28

19

32

115

154

209

198

379

57

45

27

Determina la precipitacin media mensual y la mediana de cada ao.


Explica por qu las medianas son casi iguales, pero las medias difieren ms.

40.
En la fecha 28-04-01 turno B, planta chocolate, se obtuvo la siguiente muestra de pesos
para el producto super 8 de 32 gramos.
Se pide:
a)
b)

Calcular peso promedio de la muestra en el turno B


Desviacin estndar
Peso
Peso
Peso 3
Peso
Hora
1(gr)
2(gr)
(gr)
4(gr)

Peso 5(gr)

7:00

30,1

31,3

32,7

32,9

33,0

8:30

33,0

31,7

32,5

30,0

32,3

10:00

31,7

32,3

32,0

32,3

31,6

11:30

32,3

32,1

32,4

32,0

31,2

13:00

30,3

33,0

32,0

31,9

32,0

14:30

32,2

32,5

32,0

31,9

31,8

Promedio
(gr)

41.
El diario corresponde a muestras de peso para el producto margarina bolsa 1(Kg.). Para
esta distribucin de pesos, se pide:
a)
b)
c)

Construir tablas de frecuencias considerando los datos agrupados en intervalos de


amplitud 0,9
Calcular la media aritmtica y la desviacin estndar.
Histograma ordinario y polgono de frecuencia acumulativo.

Diario

85

Gastronoma
1002,1

1000,5

1004,3

1004

1004,3

999,1

999,1

1000

1001,9

1001,2

1001,9

1003,1

996,2

1000,3

1001

1000,8

1002,3

1002

1000,5

1001,1

999,5

997,2

999,7

999,7

998,3

998,2

999,6

996,5

996,4

995,9

42.

Para el LP Diario entregado a continuacin, se pide:

a)

Construir tabla de frecuencias considerando los datos agrupados en intervalos de amplitud


0,2
Calcular media aritmtica y la desviacin estndar.
Histograma acumulativo, polgono de frecuencia ordinario y diagrama circular.

b)
c)

Diario
Hora
7:00

42,20

42,00

42,30

42,10

42,00

8:30

42,80

42,80

42,90

42,20

43,30

10:00

43,00

42,40

43,00

43,00

43,30

11:30

42,00

42,80

42,40

42,20

42,10

13:00

42,00

42,00

42,30

42,00

42,40

14:30

42,30

43,00

43,40

42,20

42,40

43.
Para el diario correspondiente al producto margarina sur (pote 500 gr), se pide calcular,
considerando los datos como variables discretas, lo siguiente:
a)
b)
c)
d)

moda
mediana
media aritmtica simple
desviacin estndar

86

Gastronoma
Diario
498,9

499,2

499,5

499,7

499,5

499.8

500

499,8

499,9

500,4

500,4

500,1

500,6

500,9

500,7

499,9

499,4

499,8

499,6

499,8

500,8

500,6

500,8

500,9

500,3

500,9

499,5

499,7

500,6

500,9

44.
Para el informe diario correspondiente al producto margarina LS Light 250(gr), se pide lo
siguiente:
a)
b)
c)
d)

peso promedio
desviacin estndar
tabla de frecuencias para variables discretas
representacin en el diagrama de barras

Diario
250,70

250,50

250,50

250,90

251,20

250,60

250,70

251,00

250,60

250,60

251,20

250,50

250,80

250,60

250,60

250,30

250,30

250,10

250,40

250,10

250,20

250,30

250,00

250,10

250,40

250,20

250,10

250,10

250,70

250,30

45.
En fecha 28/04/01 turno B, planta chocolate, se obtuvo la siguiente muestra de pesos para
el producto Classic tarro 67 (gr).

87

Gastronoma
Hora

Peso
1(gr)

Peso
2(gr)

Peso 3
(gr)

Peso
4(gr)

Peso 5(gr)

7:00

69,4

68,7

67,6

68,0

67,2

8:30

67,9

68,3

67,5

66,1

68,4

10:00

66,3

67,4

67,0

67,2

68,3

11:30

68,4

68,3

68,5

68,1

68,4

13:00

68,0

67,0

66,9

67,4

67,0

14:30

67,0

67,1

66,9

66,9

67,3

Promedio
(gr)

Se pide:
a)
b)

Determinar el peso promedio en el turno B


Desviacin estndar

46.
Para el informe diario correspondiente a la galleta Vino, formato 31x165, se pide lo
siguiente:
a)
b)
c)

Construir tabla de frecuencias considerando los datos agrupados en intervalos de amplitud


2.
Calcular media aritmtica ponderada y desviacin estndar.
Histograma ordinario y polgono de frecuencias.

Diario

47.

172,10

166,80

169,50

165,40

168,90

162,00

169,80

174,50

175,20

173,80

163,20

163,50

165,70

159,70

157,80

162,20

163,60

159,30

159,00

159,80

162,20

162,30

168,00

158,90

158,60

Para el diario entregado a continuacin, se pide:

88

Gastronoma
a)
b)
c)

Construir tabla de frecuencias considerando los datos agrupados en intervalos de amplitud


2
Calcular media aritmtica ponderada y desviacin estndar.
Histograma ordinario y polgono de frecuencia ordinario.

Diario
1002,00

1001,00

1001,00

1001,00

998,00

997,00

1000,00

995,00

997,00

1000,00

1001,00

1000,00

998,00

1000,00

1000,00

998,00

1000,00

999,00

998,00

1002,00

1002,00

995,00

1003,00

1004,00

1004,00

1002,00

1005,00

1002,00

1000,00

1000,00

La siguiente tabla muestra los casos de SIDA que han sido registrados en Mxico por la secretara
de salud en el periodo 1989-1995

a)
b)
c)

Ao

1989

1990

1991

1992

1993

1994

1995

Casos

1605

2587

3155

3210

5057

4112

4310

Determina la ecuacin de la recta de mnimos cuadrados.


Con la ecuacin anterior estima el nmero de casos de SIDA en 2015.
En qu ao alcanzaran 12000 casos registrados de SIDA?

50.
Un laboratorio investiga la efectividad de un medicamento para tratar el dolor y obtiene lo
siguientes porcentajes de alivio en relacin a la dosis:
Dosis(mg) %
Alivio

a)
b)

1
13.2

2
85.9

3
42.8

4
97.8

5
77.1

6
59

7
75.7

8
0.6

9
48.2

10
4.1

Determine si es razonable ajustar a ellos una recta.


Si es positiva la respuesta de a), determina la ecuacin de la recta de mnimos cuadrados.

51. Los siguientes datos muestran las unidades demandadas de un producto y su precio en cinco
tiendas de autoservicio de la misma rea.
Precio X
Demanda Y

45
32

40
40

43
35

48
20

50
19
89

Gastronoma
a)

Determina la ecuacin de la lnea de mnimos cuadrados y estima cual sera la lnea de


demanda en una de estas tiendas si el precio fuese 35.

b)

Determine el coeficiente de correlacin para estos datos.

90

Gastronoma
BIBLIOGRAFA
Bsica

Autor

Ao

Mode Elmer

2005

Castillo
Manrique,
Isabel

2006

Raya,
Mara

2004

2007

Jos

Blocker,
Linda;
Julia

Hill

Ttulo del Documento


Elementos
de
Probabilidad
y
Estadstica
Estadstica descriptiva
y
Clculo
de
Probabilidades

Ciudad

Pas

Editorial

Barcelona

Espaa

Revert

Madrid

Espaa

Pearson
Educacin

Estadstica aplicada al
turismo

Madrid

Espaa

Prentice Hall

CulinaryMath

Washington

United
States

Project Manager

Complementaria

Autor

Haeussler,
Ernest F.

Arya, J.C.;
Lardner R.W.
Douglas, A.
Lind;
Marchall, W;
Masson, R.

Douglas, A.
Lind

Mendenhall,
William

Ao

(2008)

(2002)

(2004)

(2008)

2002

Ttulo del Documento


Matemticas para
administracin y
economa
Matemticas aplicadas
a la administracin y
economa

Estadstica para
administracin y
economa
Estadstica aplicada a
los negocios y
economa
Introduccin a la
probabilidad y
estadstica

Ciudad

Pas

Editorial

D.F.

Mxico

Pearson
Prentice Hall

D.F.

Mxico

Prentice Hall

D.F.

Mxico

Alfa Omega
editores

D.F.

Mxico

Mc Graw Hill

D.F.

Mxico

Thomposon
Corporation

91

Das könnte Ihnen auch gefallen