Esta Dis Tical I Bro

Estadstica y probabilidad. Una introduccion. Notas de Clase. Dr. David Sierra Porta.
Laboratorio de Campos y Partculas. Departamento de Fsica. Facultad Experimental del

Ciencias. Universidad del Zulia. Maracaibo, Venezuela.
Este libro ha sido creado usando el sistema de edicion de textos de LATEX en un procesador
Atom Intel a 1.6GHz en una laptop hp-mini 1100. Esta editado especialmente para el uso
de los estudiantes de la Licenciatura de Fsica de la Facultad Experimental del Ciencias
de la Universidad del Zulia, sin embargo, su contenido es totalmente general y pudiera
ser usado por cualquier estudiante de ciencias o afines ya que su contenido se adapta a
muchos de los programas modernos de Metodos Matematicos. El programa que comprende
estas notas ha sido formateado a partir de los programas oficiales de la Facultad para esta
Licenciatura, de tal manera que se pueden encontrar en http://www.fec.luz.edu.ve y
esta a disposicion para todos. Todo el contenido ha sido compilado y creado por David
Sierra Porta. Diseno de la cubierta por David Sierra Porta. Imagen de la portada: www.
morguefile.com (2013). Escrito e ideado por David Sierra Porta. Notas de Clase - Libro
de Texto. Fsica-Matematica.
Estadstica y probabilidad. Una introduccion. Notas de Clase.
Fsica-Matematica
Estadstica y Probabilidad
David Sierra Porta
19 de mayo de 2015
David Sierra Porta Es graduado en la Licenciatura de Matematicas y Fsica en la Fa-
cultad de Humanidades y Educacion de la Universidad del Zulia, LUZ, en el ano 2001.
Es Magister Scientiarum en la Maestra de Fsica Fundamental del Postgrado en Fsica
Fundamental de la Facultad de Ciencias de la Universidad de los Andes, ULA, en 2004.
Tambien Doctor en Fsica Fundamental en la ULA (2015). Se desempena actualmente co-
mo profesor-investigador Asociado a dedicacion exclusiva de la Facultad Experimental de
Ciencias de la Universidad del Zulia desde el ano 2005, en el Departamento de Fsica. Miem-
bro fundador del Laboratorio de Astronoma y Fsica Teorica, LAFT, y del Laboratorio de
Campos y Partculas, LCP, de la Facultad Experimental de Ciencias de la Universidad del
Zulia. Autor de varios libros y publicaciones en el area de las Ciencias Fsicas. Sus intere-
ses personales en investigacion versan sobre gravitacion y cosmologa, teoras cuanticas de
campo, Relatividad General, modificacion de la gravedad y teoras de calibre.
A Mai, Santi y Sami.
Indice general
Presentacion 13
Prologo 15
1. Introduccion a la Estadstica 17
1.1. Pequena definicion y algunos conceptos basicos . . . . . . . . . . . . . . . . 17
1.2. Poblacion y muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3. Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4. Metodos de recoleccion de datos . . . . . . . . . . . . . . . . . . . . . . . . 21
1.4.1. La entrevista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.4.2. La encuesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.4.3. Cuestionario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.4.4. La observacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2. La estadstica descriptiva 25
2.1. Distribuciones de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.1.1. Terminologa adicional . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.1.2. Creando una tabla de frecuencias . . . . . . . . . . . . . . . . . . . . 28
2.1.3. Notacion Matematica . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.4. Frecuencia acumulada . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.5. La frecuencia relativa . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.1.6. Los histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2. Medidas de Tendencia Central (MTC) . . . . . . . . . . . . . . . . . . . . . 36
2.2.1. La Media Aritmetica . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.2. La Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2.3. La moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.2.4. Relacion emprica entre la media, mediana y moda . . . . . . . . . . 41
2.2.5. Propiedades de la media, mediana y moda . . . . . . . . . . . . . . . 42
2.2.6. El promedio ponderado . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.2.7. Otros tipos de medias . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2.8. Formas de las distribuciones de datos . . . . . . . . . . . . . . . . . 46
2.3. Medidas de variacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.3.1. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.3.2. La Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.3.3. La Desviacion Estandar . . . . . . . . . . . . . . . . . . . . . . . . . 51
7
Indice general
2.3.4. La Desviacion Media . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

2.3.5. Dispersion absoluta y relativa: coeficiente de variacion . . . . . . . . 52
2.3.6. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.3.7. Coeficiente de Correlacion de Pearson . . . . . . . . . . . . . . . . . 53
2.4. Medidas de simetra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.4.1. Coeficientes de asimetra y curtosis . . . . . . . . . . . . . . . . . . . 55
2.5. Teorema que envuelven cuestiones sobre la Desviacion Estandar . . . . . . . 57
2.5.1. La regla emprica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.5.2. Teorema de Chebychev . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.6. Medidas de Posicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.6.1. Cuartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.6.2. Deciles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.6.3. Centiles o percentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.7. Problemas de final de captulo . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3. Metodos cuantitativos de analisis predictivo, regresion 69

3.1. Correlacion y regresion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.2. Distribuciones bidimensionales . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3. La idea de la correlacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.4. Encontrando la relacion. Regresion . . . . . . . . . . . . . . . . . . . . . . . 72
3.4.1. El coeficiente de correlacion . . . . . . . . . . . . . . . . . . . . . . . 72
3.4.2. Regresion lineal. El Metodo de los Mnimos Cuadrados . . . . . . . . 73
4. Analisis Combinatorio 81
4.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.2. Principio Fundamental de Conteo . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3. Arreglos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.4. Variaciones (o arreglos) con repeticion . . . . . . . . . . . . . . . . . . . . . 83
4.5. Permutaciones (u ordenaciones) sin repeticion . . . . . . . . . . . . . . . . . 84
4.6. Permutaciones (u ordenaciones) con repeticion . . . . . . . . . . . . . . . . 84
4.7. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.8. Combinaciones con repeticion . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.9. Analisis y Metodologa propuesta para la resolucion de problemas de Teora
de conteo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5. Probabilidad 89
5.1. Introduccion: La probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.2. La probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.3. Experimentos de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 91
8
Indice general
5.4. Calculando la probabilidad de un evento . . . . . . . . . . . . . . . . . . . . 93

5.4.1. Probabilidad Emprica . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.4.2. Probabilidad clasica . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.5. Axiomas de la probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.6. Posibilidades y probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . 96
5.7. Propiedades de la probabilidad de eventos no elementales . . . . . . . . . . 97
5.8. Probabilidad condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.9. Probabilidad total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5.9.1. Teorema de la probabilidad total . . . . . . . . . . . . . . . . . . . . 99
5.10. Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6. Variable aleatoria y funcion de distribucion 105

6.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
6.2. Variable aleatoria unidimensional . . . . . . . . . . . . . . . . . . . . . . . . 106
6.3. Variables discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.4. Variables continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.5. Caractersticas de una v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.5.1. Definicion. (Esperanza Matematica) . . . . . . . . . . . . . . . . . . 108
6.5.2. Definicion. (Varianza) . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.6. Inecuacion de Chevyshev . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7. Distribuciones de Probabilidad Binomial y Normal 113

7.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.2. La distribucion binomial o de Bernoulli . . . . . . . . . . . . . . . . . . . . 113
7.2.1. Definicion de distribucion binomial . . . . . . . . . . . . . . . . . . . 114
7.2.2. El uso de las tablas de la distribucion binomial . . . . . . . . . . . . 115
7.2.3. Probabilidades acumuladas . . . . . . . . . . . . . . . . . . . . . . . 116
7.2.4. Media y desviacion tpica en una distribucion binomial . . . . . . . . 117
7.3. La distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.3.1. Uso de las tablas de la distribucion normal N (0; 1) . . . . . . . . . . 120
7.3.2. Calculo de otras probabilidades . . . . . . . . . . . . . . . . . . . . . 121
7.3.3. Calculo de probabilidades en normales N (x; ) . . . . . . . . . . . . 123
7.3.4. Otro uso de las tablas . . . . . . . . . . . . . . . . . . . . . . . . . . 124
7.4. Relacion entre la distribucion binomial y la distribucion normal . . . . . . . 125
7.4.1. Teorema del Lmite Central . . . . . . . . . . . . . . . . . . . . . . . 125
8. Estimacion puntual e intervalos de confianza. Inferencia estadstica. 127

8.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.2. Estimacion puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
8.2.1. Intervalo de Estimacion . . . . . . . . . . . . . . . . . . . . . . . . . 128
9
Indice general
8.3. Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

8.3.1. Intervalo de confianza para la media poblacional . . . . . . . . . . . 129
8.3.2. Intervalo de confianza para la media poblacional usando la desviacion
estandar de la muestra. Distribucion t de Student . . . . . . . . . . 130
8.3.3. Intervalo de confianza para la proporcion poblacional . . . . . . . . . 132
8.3.4. Estimador puntual para la desviacion estandar de la poblacion . . . 133
8.3.5. Intervalo de confianza para la varianza y desviacion estandar de la
poblacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
9. Pruebas de hipotesis de una poblacion 137

9.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
9.2. Procedimientos de comprobacion de hipotesis y el metodo cientfico . . . . . 137
9.3. Diseno de hipotesis de investigacion y la experimentacion . . . . . . . . . . 138
9.3.1. Las hipotesis y prueba de hipotesis . . . . . . . . . . . . . . . . . . . 138
9.3.2. Modelo estadstico y estadstico de prueba . . . . . . . . . . . . . . . 139
9.3.3. Los errores en la Toma de Decisiones . . . . . . . . . . . . . . . . . . 140
9.3.4. Valor Crtico y Region de Rechazo . . . . . . . . . . . . . . . . . . . 141
9.3.5. Pruebas de una y dos colas . . . . . . . . . . . . . . . . . . . . . . . 141
9.3.6. Recopilar y analizar los datos experimentales . . . . . . . . . . . . . 142
A. La redaccion de informes y presentacion de resultados 147

A.1. Definicion de Informe cientfico . . . . . . . . . . . . . . . . . . . . . . . . . 147
A.2. Tipos y clasificaciones del Informe cientfico . . . . . . . . . . . . . . . . . . 147
A.3. Caractersticas, particularidades y modalidades del Informe cientfico . . . . 148
A.3.1. Caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
A.3.2. Particularidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
A.3.3. Modalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
A.4. Forma de presentacion y estilos del Informe cientfico . . . . . . . . . . . . . 150
A.5. Diferencias con el resto de los trabajos cientficos . . . . . . . . . . . . . . . 151
B. Calculos de incertidumbre y de pequenas variaciones 153

B.1. Tipos de errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
B.1.1. Errores sistematicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
B.1.2. Errores aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
B.2. Precision y exactitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
B.3. Incertidumbre absoluta y relativa . . . . . . . . . . . . . . . . . . . . . . . . 155
B.4. Propagacion de los errores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
B.4.1. El metodo de las derivadas parciales . . . . . . . . . . . . . . . . . . 159
B.4.2. El metodo del Neperiano . . . . . . . . . . . . . . . . . . . . . . . . 162
10
Indice de figuras
2.1. Histograma de frecuencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.2. Construyendo un histograma simple. . . . . . . . . . . . . . . . . . . . . . . 35
2.3. Histograma de frecuencias acumuladas y histograma de frecuencias para dos
datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4. Histograma de datos apilados y diagrama circular de proporciones. . . . . . 36
2.5. Polgono de frecuencias y histograma 3D. . . . . . . . . . . . . . . . . . . . 36
2.6. Distribucion simetrica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.7. Distribucion sesgada a la derecha. . . . . . . . . . . . . . . . . . . . . . . . 48
2.8. istribucion sesgada a la izquierda. . . . . . . . . . . . . . . . . . . . . . . . . 48
2.9. Distribucion uniforme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.10. El coeficiente de correlacion de Pearson. . . . . . . . . . . . . . . . . . . . . 54
2.11. Coeficiente de Fisher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.12. Coeficiente de curtosis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.1. Diagrama de dispersion o nube de puntos. . . . . . . . . . . . . . . . . . . . 71

3.2. Regresion lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.3. Regresion lineal (Error). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.4. Ejemplo de regresion lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.5. Regresion no lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.6. La curva de regresion lineal en terminos de los cambios de la funcion. . . . . 74
3.7. Representacion para un cuerpo que se mueve con movimiento uniformemente
acelerado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4.1. Metodologa sencilla para la resolucion de problemas de conteo. . . . . . . . 86
7.1. Distribucion de estaturas de 1400 mujeres. . . . . . . . . . . . . . . . . . . . 118

7.2. Distribucion normal N (x; ). El maximo esta en (x, 1 2 ). . . . . . . . . . 119
2
7.3. Distribucion normal N (0; 1). El maximo esta en (0, 12 ). . . . . . . . . . . 119
7.4. Area encerrada por la curva normal desde hasta k. . . . . . . . . . . . 120
7.5. p(Z > k). Basta pasar al complementario. . . . . . . . . . . . . . . . . . . . 121
7.6. p(Z k). Las probabilidades de valores negativos no estan tabuladas. . . 121
7.7. p(Z k) = p(Z > k). La simetra permite reducir este caso al anterior. . . 122
7.8. p(Z > k). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
11
Indice de figuras
7.9. p(Z > k) = p(Z k). La simetra permite reducir este caso al que ya
esta tabulado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
7.10. p(k1 Z k2 ). Probabilidad comprendida entre dos valores. . . . . . . . . 122
7.11. p(Z k2 ) en la primera imagen. p(Z k1 ) en la segunda. Al restar obte-
nemos el area pedida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.1. Nivel de confianza para la media poblacional. . . . . . . . . . . . . . . . . . 129

8.2. Distribucion t de Student. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.3. Distribucion Chi-cuadrado. . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
9.1. Prueba de hipotesis de una y dos colas. . . . . . . . . . . . . . . . . . . . . 141
12
Presentacion
(...) Conseguimos obtener as la formula estadstica para conocer aproximadamente la posicion de
un electron en un instante determinado. Pero, personalmente, no creo que dios juegue a los dados.
- Albert Einstein
Se presentan a continuacion unas notas de Estadstica Elemental y Fundamental y pro-

babilidad, principalmente enfocado al curso de Estadstica y Metodos Numericos de la
Facultad Experimental de Ciencias de la Universidad del Zulia, LUZ, para la carrera de
Fsica. Las mismas contienen los elementos fundamentales para aprender a usar la es-
tadstica y la teora de la probabilidad para resolver problemas generales y especficos de
las ciencias. Este curso pudiera tambien entenderse como una introduccion en dos campos
diferentes que tambien tendran incidencia en el pensum de la licenciatura de fsica. Por
un lado provee un acercamiento a las tecnicas usadas para la descripcion y manipulacion
de datos experimentales a la vez que son la base matematica fundamental para definir
luego nuevos metodos (numericos) para el analisis de problemas. Por otro lado, son la base
de la descripcion de fenomenos mas complejos en la oportunidad de examinar procesos
fundamentales de partculas en el area de fsica estadstica. De tal manera que estas notas
se enfocan en ese sentido. Por ultimo, ensenaran a los lectores las herramientas basicas
con las que podran explorar de manera estadstica soluciones a sus problemas particulares
cuando esten estudiando y haciendos sus tesis. Una buena parte de la tesis de esta facul-
tad ameritan de tecnicas de procesamiento de datos y manipulacion de los mismos para
concluir y hacer inferencias de problemas particulares.
De este modo en resumen. El objetivo del curso es que el alumno se familiarice con
las herramientas analticas esenciales necesarias para comprender el funcionamiento y las
consecuencias de la aplicacion de la teora estadstica a la resolucion de problemas en fsica.
El contenido del libro se divide en nueve captulos bien diferenciados. Los tres primeros
captulos estan motivados justamente a la manipulacion estadstica de los datos experimen-
tales para resolver problemas. En estos apartados se estudian las estadsticas descriptivas
y un poco de inferencia estadstica con la determinacion de curvas de regresion. El captu-
lo cuatro, esta destinado a una pequena introduccion al analisis combinatorio. Esta aqu,
porque en la resolucion de problemas de probabilidad es algunas veces muy util la cuan-
tificacion de eventos en espacios muestrales, lo cual dtermina mas sencillamente el calculo
de ciertas probabilidades. En el captulo cinco se hace una introduccion a la probabilidad
y sus axiomas fundamentales, haciendo enfasis en la resolucion de problemas sencillos. En
el captulo seis, se estudia ahora la formaliazaicion matematica de la probabilidad. Esto es
muy conveniente, ya que el estudiante entendera que en adelante, no es necesario realizar
13
Indice de figuras
experimentos sino que bastara con la definicion matematicamente abstracta del mismo pa-
ra el calculo de probabilidades, es decir, se plantea de manera idealizada el experimento,
considerando las caractersticas del mismo y sus consecuencias, los resultados posibles del
experimento y as lograr una idealizacion matematica del mismo. Se encontrara esto muy
provechoso ya que no siempre se cuenta con el tiempo, los medios, la infraestructura fsi-
ca, humana y computacional para llevar a cabo los experimentos. En el captulo siete se
estudian las distribuciones de probabilidad como una generalizacion de experimentos alea-
torios haciendo enfasis en las mas usadas, la normal y la binomial y se resuelven problemas
usando estas tecnicas. En los captulos ocho y nueve, se presenta una introduccion al es-
tudio de pruebas de hipotesis como paso al estudio de estadstica inferencial. Por ultimo,
se presenta dos apendices, el primero, con una nota sobre la redaccion y presentacion de
informes y resultados, y el segundo, sobre calculo de errores y variaciones, muy importante
en la consideracion de medidas experimentales.
Buen provecho..!
14
Prologo
The same set of statistics can produce opposite conclusions at different levels of aggregation.
- Thomas Sowell. Penetrating the Rhetoric, The Vision of the Anointed (1996), 102.
A cargo de la Profesora M. Jeanette Stock...!
15
1. Introduccion a la Estadstica
The Charms of Statistics.It is difficult to understand why statisticians commonly limit their
inquiries to Averages, and do not revel in more comprehensive views. Their souls seem as dull to
the charm of variety as that of the native of one of our flat English counties, whose retrospect of
Switzerland was that, if its mountains could be thrown into its lakes, two nuisances would be got
rid of at once. An Average is but a solitary fact, whereas if a single other fact be added to it, an
entire Normal Scheme, which nearly corresponds to the observed one, starts potentially into
existence. Some people hate the very name of statistics, but I find them full of beauty and interest.
Whenever they are not brutalised, but delicately handled by the higher methods, and are warily
interpreted, their power of dealing with complicated phenomena is extraordinary. They are the
only tools by which an opening can be cut through the formidable thicket of difficulties that bars
the path of those who pursue the Science of man.
- Sir Francis Galton. Natural Inheritance (1889), 62-3.
1.1. Pequena definicion y algunos conceptos basicos

Las Estadstica es un area de la matematica muy importante con aplicaciones en un
gran numero de campos diferentes. En general uno puede decir que la Estadstica es una
ciencia cuya metodologa es la de recolectar, analizar e interpretar conclusiones a partir
de informacion inicial. Dicho en otras palabras, la Estadstica es la metodologa con la
cual los cientficos y matematicos desarrollan e interpretan conclusiones a partir de datos
recolectados. As el dominio de la Estadstica es muy amplio y recoge muchas tecnicas de
muchas areas y aplicables a otras tantas para resolver problemas en los cuales la informacion
que se tiene son basicamente conjunto de datos.
Definicion 1.1 (Estadstica) La Estadstica es la ciencia de recoger o colectar, organi-

zar, analizar e interpretar datos, en principio cualesquiera.
Los metodos estadsticos pueden ser usados para responder preguntas como:
De que tipo y cuantos datos se necesitan recoger para estimar algo?
Como se organizan y resumen los datos recogidos?
Como sacamos conclusiones a partir de estos y como evaluamos sus incertidumbres?
O sea, que la estadstica provee metodos para
17
1. Diseno: Planear e implementar estudios de investigacion.
2. Descripcion: Resumir y explorar datos.
3. Inferir: Hacer predicciones y generalizar fenomenos a partir de una data inicial.
Ejemplo 1.1 (Estadstica en la practica) Algunos problemas en los que la estadstica

es muy util. Considere los siguientes problemas. En agricultura: Es mas productivo sem-
brar nueva semilla o usar fertilizante? En medicina: Cual es la cantidad correcta de la
dosis del medicamento para un tratamiento? En ciencias polticas: Que tan exactas son los
sondeos de opinion? En economa: Cual sera la tasa de desempleo el ano que viene? Un
problema tecnico: Como mejorar la calidad de un producto? En fsica: Es mas efectiva
una bombilla LED o una convencional?, en las estrellas de la vecindad solar, cual elemen-
to qumico se encuentra con mayor abundancia?, Cuanta energa almacena un capacitor
luego de 20 segundos?
Existen dos tipos de estadsticas: Descriptiva: tabula, representa y describe una serie
de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones, y la Inferen-
cial: infiere propiedades de gran numero de datos recogidos de una muestra tomada de la
poblacion. La muestra se diferencia de la poblacion en el hecho de que la primera es un
subconjunto de la segunda, ademas, la muestra debe estar contenida necesariamente dentro
de la poblacion. La estadstica descriptiva es una ciencia que analiza series de datos (por
ejemplo, edad de una poblacion, altura de los estudiantes de una escuela, temperatura en
los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas
variables.
1.2. Poblacion y muestra

Cuando se recogen datos ya sea de las caractersticas que sea, suele a menudo ser im-
posible observar todo el conjunto de resultados, sobretodo si el conjunto es muy grande,
tabularlo es ademas un proceso mas tedioso y complicado, ordenarlos significa poner a
prueba nuestra paciencia e ingenio. Es por ello que suele trabajarse con una parte de ese
grupo de resultados. Cuando hablamos del conjunto completo de los datos de un estudio
nos referimos a ellos en terminos de la poblacion, mientras que al subconjunto mas pequeno,
a la parte de la primera, nos referimos como los resultados de la muestra.
Definicion 1.2 (Poblacion) Una poblacion (estadstica) es un conjunto de medidas o

datos correspondientes con el connjunto completo de las unidades de investigacion sobre
los cuales se quiere obtener algunas conclusion o estudio.
Definicion 1.3 (Muestra) Una muestra es un conjunto mas pequeno de medidas toma-
dos a partir de la poblacion.
18
1.3. Variables
Ejemplo 1.2 (Poblacion y muestra) En muchos casos la poblacion bajo consideracion

puede ser fsicamente escrita. Por ejemplo: los estudiantes de la Universidad Nacional, los
libros de una biblioteca, o la cantidad de atomos de hierro en una muestra cuadrada de
2cm de lado. Algunas veces la poblacion puede no ser finita o casi infinita (al menos en
terminos practicos), en estos casos la muestra es el siguiente paso para describir y analizar
un problema especfico. Por ejemplo: los decimales del numero irracional (poblacion), los
primeros cincuenta decimales del numero (muestra); la masa de los planetas del universo
(poblacion), la masa de los planetas del sistema solar (muestra); los ninos en edad escolar
en el mundo (poblacion), los ninos en edad escolar en Venezuela (muestra 1), los ninos en
edad escolar en Maracaibo (muestra 2).
Ejemplo 1.3 Por ejemplo, si estamos interesados en medir los salarios de todos los cientfi-
cos de las universidades del pas, el conjunto de datos que representan la poblacion sera en
este caso la lista de todos los salarios de cualquier universidad en Venezuela. Una mues-
tra podra ser obtenida seleccionando 10 universidades de una lista unos cuantos estados
seleccionados al azar con sus respectivos salarios, por su puesto.
1.3. Variables
Al conjunto de resultados posibles de una caracterstica que desea estuadiarse en un
cierto problema particular, suele llamarsele variable. En terminos mas formales, la variable
es basicamente la caracterstica que desea medirse o estudiarse, mientras que al conjunto
de resultados posibles se le llama dominio de la variable. Si la variable solo toma un valor
se le llama variable constante. Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numericamente (por ejem-

plo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numerico (edad, precio de un producto, in-

gresos anuales).
Las variables tambien se pueden clasificar en:
Variables unidimensionales: solo recogen informacion sobre una caracterstica

(por ejemplo: edad de los alumnos de una clase).
Variables bidimensionales: recogen informacion sobre dos caractersticas de la

poblacion (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen informacion sobre tres o mas caractersti-

cas (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
19
Discretas: solo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: numero
de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podra ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes
conceptos:
1. Individuo: cualquier elemento que porte informacion sobre el fenomeno que se es-
tudia. As, si estudiamos la altura de los ninos de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.
2. Poblacion: conjunto de todos los individuos (personas, objetos, animales, etc.) que
porten informacion sobre el fenomeno que se estudia. Por ejemplo, si estudiamos el
precio de la vivienda en una ciudad, la poblacion sera el total de las viviendas de
dicha ciudad.
3. Muestra: subconjunto que seleccionamos de la poblacion. As, si se estudia el precio

de la vivienda de una ciudad, lo normal sera no recoger informacion sobre todas las
viviendas de la ciudad (sera una labor muy compleja), sino que se suele seleccionar
un subgrupo (muestra) que se entienda que es suficientemente representativo.
A su vez, digamos que por ejemplo estuvieramos interesados en conocer la opinion de la

gente en Venezuela acerca de la posibilidad o necesidad de incrementar la cantidad de pues-
tos en los cuales de distribuye periodico a nivel nacional. Por su puesto, que la poblacion
estara integrada por todas las respuestas de todos los ciudadanos del territorio nacional.
Una muestra estara asegurada por ejemplo si tomasemos 1000 encuestas repartidas en
todos los estados de acuerdo con la densidad poblacional de cada uno, respondiendo a la
pregunta en cuestion.
Para medir en estadstica es obvio que necesitaremos ademas una definicion para la cuan-
tificacion de las cosas o fenomenos, de la misma manera como se hace una clasificacion en
la fsica para numeros ordinarios y vectores. Es decir, es importante, clasificar, que pode-
mos medir y como, toda vez, que existe una clasificacion para el comportamiento de una
variable. As entonces tendremos que definir los tipos de medida:
Parametro - una medida numerica (generalmente desconocida) hecha usando el

conjunto de datos de la poblacion en general,
estadstico - un valor numerico (conocida) soportado en el conjunto de datos del

espacio muestral.
Ejemplo 1.4 Usando el conjunto de datos que describen los salarios de los cientficos,
nosotros pudieramos calcular el salario promedio de los cientficos que laboran en las uni-
versidades Venezolanas. este promedio calculado debe tomarse por un parametro. Mientras
20
1.4. Metodos de recoleccion de datos
que si tomamos en cuenta la data proveniente de la escogencia al azar de las 10 universi-

dades, entonces, este valor debe nombrarse como un estadstico.
Es por su puesto, muy sencillo darse cuenta que la poblacion es un conjunto mucho
mas grande que la muestra. Note que la poblacion pudiera ser finita o infinita. En es-
te ultimo caso es donde la eleccion de una muestra es realmente indispensable. Ademas,
debe advertirse que si la poblacion tomada y seleccionada es muy grande, entonces proba-
blemente sera imposible poder calcular parametros de algun interes particular. A menos
que la poblacion sea bastante pequena calcular sera muy difcil. Sin embargo, seleccionar
poblaciones muy pequenas es problematico, ademas de peligroso, y miente en el sentido
cientfico. En esencia, la idea general es poder seleccionar siempre muestras, mas pequenas,
por su puesto, que la poblacion y encontrar o calcular estadsticos muestrales que pudie-
ran dar explicaciones preliminares de lo que pasa en la data total o poblacion. La idea
fundamental es usar estos estadsticos para inferir o estimar los parametros poblacionales,
que es lo que en realidad importa. La pericia de los cientficos se encuentra en tratar de
construir buenas muestras a partir de poblaciones muy grandes, tales que los estadsticos
calculados a partir de estas muestras, sean buenas para estimar los parametros necesarios.
Desafortunadamente, estimar estadsticos nunca es 100 % seguro, pero si que podra ser en
alguna medida cercana. Existen varios segun los valores que toman los datos.
1. Datos nominales: pueden ser del tipo cualitativos solamente. Los valores para
los datos sirven para etiquetar, pero las etiquetas no tienen atributo de orden. Por
ejemplo: el tipo de sangre, el grado de estudio, el tipo de raza, el tipo de bacteria en
el intestino de una cierta especie de pescado.
2. Datos ordinales: pueden tanto de tipo cualitativos como cuantitativos. Los valores
atribuidos a los datos son etiquetas, pero a diferencia de los anteriores, para estos si
esta prescrito un orden en particular. Por ejemplo: las posiciones del torneo de futbol
profesional Venezolano, el nivel de censura de una pelcula.
3. Datos intervalos: solo son cuantitativos. Los valores que toman los datos son
numericos, tienen un orden natural y la diferencia entre los valores que toman los
datos son significativas. Por ejemplo: la temperatura, el ano de nacimiento.
4. Datos razon: son siempre cuantitativos. Los valores son numericos, tienen orden, y
la tanto la diferencia como la razon entre los valores son significativas. Por ejemplo,
el peso de una persona, el volumen.

La recoleccion de datos se refiere al uso de una gran diversidad de tecnicas y herramientas
que pueden ser utilizadas por el analista para desarrollar los sistemas de informacion, los
21
cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observacion, el diagrama

de flujo y el diccionario de datos. Todas estos instrumentos se aplicara en un momento
en particular, con la finalidad de buscar informacion que sera util a una investigacion en
comun. En la presente investigacion trata con detalle los pasos que se debe seguir en el
proceso de recoleccion de datos, con las tecnicas ya antes nombradas. Los analistas utilizan
una variedad de metodos a fin de recopilar los datos sobre una situacion existente, como
entrevistas, cuestionarios, inspeccion de registros (revision en el sitio) y observacion. Cada
uno tiene ventajas y desventajas. Generalmente, se utilizan dos o tres para complementar
el trabajo de cada una y ayudar a asegurar una investigacion completa.
1.4.1. La entrevista
Las entrevistas se utilizan para recabar informacion en forma verbal, a traves de pre-
guntas que propone el analista. Quienes responden pueden ser gerentes o empleados, los
cuales son usuarios actuales del sistema existente, usuarios potenciales del sistema pro-
puesto o aquellos que proporcionaran datos o seran afectados por la aplicacion propuesta.
El analista puede entrevistar al personal en forma individual o en grupos algunos analistas
prefieren este metodo a las otras tecnicas que se estudiaran mas adelante. Sin embargo, las
entrevistas no siempre son la mejor fuente de datos de aplicacion. Dentro de una organiza-
cion, la entrevistas es la tecnica mas significativa y productiva de que dispone el analista
para recabar datos. En otras palabras, la entrevistas es un intercambio de informacion
que se efectua cara a cara. Es un canal de comunicacion entre el analista y la organiza-
cion; sirve para obtener informacion acerca de las necesidades y la manera de satisfacerlas,
as como concejo y comprension por parte del usuario para toda idea o metodo nuevos.
Por otra parte, la entrevista ofrece al analista una excelente oportunidad para establecer
una corriente de simpata con el personal usuario, lo cual es fundamental en transcurso del
estudio. Realizar entrevistas toma tiempo; por lo tanto no es posible utilizar este metodo
para recopilar toda la informacion que se necesite en la investigacion; incluso el analista
debe verificar los datos recopilados utilizando unos de los otros metodos de recoleccion de
datos. La entrevista se aplican en todos los niveles gerencial y de empleados y dependa de
quien pueda proporcionar la mayor parte de la informacion util para el estudio los ana-
listas que estudian la administracion de inventarios pueden entrevistar a los trabajadores
del embarque y de recepcion, al personal de almacen y a los supervisores de los diferentes
turnos, es decir. Aquellas personas que realmente trabajan en el almacen, tambien entre-
vistaran a los gerentes mas importante. La habilidad del entrevistador es vital para el exito
en la busqueda de hecho por medio de la entrevista. Las buenas entrevista depende del
conocimiento del analista tanto de la preparacion del objetivo de una entrevista especfica
como de las preguntas por realizar a una persona determinada.
22
1.4.2. La encuesta
Hoy en da la palabra encuesta se usa mas frecuentemente para describir un metodo de
obtener informacion de una muestra de individuos. Esta muestra es usualmente solo una
fraccion de la poblacion bajo estudio. Por ejemplo, antes de una eleccion, una muestra de
electores es interrogada para determinar como los candidatos y los asuntos son percibidos
por el publico - un fabricante hace una encuesta al mercado potencial antes de introducir
un nuevo producto - una entidad del gobierno comisiona una encuesta para obtener infor-
macion para evaluar legislacion existente o para preparar y proponer nueva legislacion. No
tan solo las encuestas tienen una gran variedad de propositos, sino que tambien pueden
conducirse de muchas maneras, incluyendo por telefono, por correo o en persona. Aun as,
todas las encuestas tienen algunas caractersticas en comun. A diferencia de un censo, don-
de todos los miembros de la poblacion son estudiados, las encuestas recogen informacion
de una porcion de la poblacion de interes, dependiendo el tamano de la muestra en el
proposito del estudio. En una encuesta, la muestra no es seleccionada caprichosamente o
solo de personas que se ofrecen como voluntarios para participar. La muestra es seleccio-
nada cientficamente de manera que cada persona en la poblacion tenga una oportunidad
medible de ser seleccionada. De esta manera los resultados pueden ser proyectados con
seguridad de la muestra a la poblacion mayor. La informacion es recogida usando procedi-
mientos estandarizados de manera que a cada individuo se le hacen las mismas preguntas
en mas o menos la misma manera. La intencion de la encuesta no es describir los individuos
particulares quienes, por azar, son parte de la muestra sino obtener un perfil compuesto
de la poblacion. El tamano de muestra requerido en una encuesta depende en parte de la
calidad estadstica necesaria para los establecer los hallazgos; esto a su vez, esta relacionado
en como esos hallazgos seran usados. Aun as, no hay una regla simple para el tamano de
muestra que pueda ser usada en todas las encuestas. Mucho de esto depende de los recur-
sos profesionales y fiscales disponibles. Los analistas frecuentemente encuentran que una
muestra de tamano moderado es suficiente estadstica y operacionalmente. Por ejemplo,
las muy conocidas encuestas nacionales frecuentemente usan cerca de 1,000 personas para
obtener informacion razonable sobre actitudes y opiniones nacionales.
1.4.3. Cuestionario
Los cuestionarios proporcionan una alternativa muy util para la entrevista; si embargo,
existen ciertas caractersticas que pueden ser apropiada en algunas situaciones e inapropia-
das en otra. Al igual que la entrevistas, deben disenarse cuidadosamente para una maxima
efectividad. Recabacion de datos mediante cuestionarios. Para los analistas los cues-
tionarios pueden ser la unica forma posible de relacionarse con un gran numero de personas
para conocer varios aspectos del sistema. Cuando se llevan a cabo largos estudios en varios
departamento, se puede distribuir los cuestionarios a todas las personas apropiadas para
recabar hechos en relacion al sistema. En mayor parte de los casos, el analista no vera a
los que responde; no obstante, tambien esto es una ventaja porque aplican muchas entre-
23
vista ayuda a asegurar que el interpelado cuenta con mayor anonimato y puedan darse
respuestas mas honesta ( y menos respuestas prehechas o estereotipadas). Tambien las
preguntas estandarizadas pueden proporcionar datos mas confiable. Seleccion de for-
mas para cuestionarios. El desarrollo y distribucion de los cuestionarios; por lo tanto,
el tiempo invertido en esto debe utilizarse en una forma inteligente. Tambien es importante
el formato y contenido de las preguntas en la recopilacion de hechos significativos. Exis-
ten dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados, y se
aplican dependiendo de si los analistas conocen de antemano todas las posibles respuestas
de las preguntas y pueden incluirlas. Con frecuencia se utilizan ambas formas en los estu-
dios de sistemas. Cuestionario Abierto. Al igual que las entrevistas, los cuestionarios
pueden ser abiertos y se aplican cuando se quieren conocer los sentimientos, opiniones y
experiencias generales; tambien son utiles al explorar el problema basico, por ejemplo, un
analista que utiliza cuestionarios para estudiar los metodos de verificacion de credito, es
un medio.El formato abierto proporciona una amplia oportunidad para quienes respondan
escriba las razones de sus ideas. Algunas personas sin embargo, encuentran mas facil esco-
ger una de un conjunto de respuestas preparadas que pensar por s mismas. Cuestionario
Cerrado. El cuestionario cerrado limita las respuestas posibles del interrogado. Por medio
de un cuidadoso estilo en la pregunta, el analista puede controlar el marco de referencia.
Este formato es el metodo para obtener informacion sobre los hechos. Tambien fuerza a los
individuos para que tomen una posicion y forma su opinion sobre los aspectos importantes.
1.4.4. La observacion
Otra tecnica util para el analista en su progreso de investigacion, consiste en observar
a las personas cuando efectuan su trabajo. Como tecnica de investigacion, la observacion
tiene amplia aceptacion cientfica. Los sociologos, sicologos e ingenieros industriales utilizan
extensamente esta tecnica con el fin de estudiar a las personas en sus actividades de grupo
y como miembros de la organizacion. El proposito de la organizacion es multiple: permite
al analista determinar que se esta haciendo, como se esta haciendo, quien lo hace, cuando
se lleva a cabo, cuanto tiempo toma, donde se hace y por que se hace. El analista de
sistemas puede observar de tres maneras basicas. Primero, puede observar a una persona
o actitud sin que el observado se de cuenta y su interaccion por aparte del propio analista.
Quiza esta alternativa tenga poca importancia para el analisis de sistemas, puesto que
resulta casi imposible reunir las condiciones necesarias. Segundo, el analista puede observar
una operacion sin intervenir para nada, pero estando la persona observada enteramente
consciente de la observacion. Por ultimo, puede observar y a la vez estar en contacto con
las personas observas. La interaccion puede consistir simplemente en preguntar respecto a
una tarea especfica, pedir una explicacion, etc.
24
2. La estadstica descriptiva
If we betake ourselves to the statistical method, we do so confessing that we are unable to follow
the details of each individual case, and expecting that the effects of widespread causes, though very
different in each individual, will produce an average result on the whole nation, from a study of
which we may estimate the character and propensities of an imaginary being called the Mean
Man.
- James Clerk Maxwell. Does the Progress of Physical Science tend to give any advantage to
the opinion of necessity (or determinism) over that of the continuency of Events and the Freedom
of the Will? In P. M. Hannan (ed.), The Scientific Letters and Papers of James Clerk Maxwell
(1995), Vol. 2, 1862-1873, 818.
La estadstica descriptiva es la disciplina de la estadstica que intenta describir cuan-

titativamente las caractersticas principales de un conjunto de datos. Una estadstica un
poco mas completa es la estadstica inferencial. La estadstica descriptiva se distingue de
la estadstica inferencial (o estadstica inductiva), en el hecho de que esta primera tiene
como principal objetivo resumir una muestra, en lugar de utilizar todos los datos de la po-
blacion para aprender y concluir algo acerca de lo que significa o representan los datos de
una situacion en particular. Otra cosa que las distingue es que en la estadstica descriptiva
solo se manipulan los datos cuantitativamente y analticamente para obtener conclusiones,
pero solo con los datos disponibles. Por otro lado la estadstica inferencial puede deducir,
o como su nombre lo indica, inferir, otras conclusiones que pudieran dar respuestas mas
alla de los datos que se tienen en la muestra. En general, esto significa que la estadstica
descriptiva, a diferencia de la estadstica inferencial, no se desarrollan sobre la base de la
teora de la probabilidad. El principal sustento de la estadsitica inferencial es la teora
de la probabilidad. Si la muestra es representativa de la poblacion, es posible inferir im-
portantes conclusiones sobre la poblacion a partir del analisis de la muestra. La fase de
la estadstica que trata con las condiciones bajo las cuales tales diferencias son validas es
la estadstiva inductiva. Ya que dicha induccion no es del todo exacta, el lenguaje de las
probabilidades aparecera al establecer conclusiones. Sin embargo, aun cuando hagamos un
analisis de los datos usando estadstica inferencial para sacar conclusiones principales, las
estadsticas descriptivas generalmente son una base y tambien se presentan. Por ejemplo,
en un reporte que informa sobre un estudio en seres humanos, suele aparecer un cuadro
en el que el tamano total de la muestra, el tamano de la muestra en subgrupos importan-
tes (por ejemplo, para cada grupo de tratamiento o de exposicion), y las caractersticas
demograficas o clnicas como la edad media , el porcentaje de sujetos de cada sexo, y la
proporcion de sujetos son relacionadas todas.
25
Estadstica descriptiva proporciona resultados simples sobre la muestra y sobre las obser-
vaciones que se han hecho. Estos resultados pueden ser tanto las estadsticas cuantitativas,
es decir, promedios, o graficos visuales, para entender mas facilmente la situacion. Estos
resultados o bien puede formar la base de la descripcion inicial de los datos como parte
de un analisis estadstico mas extenso, o pueden ser suficientes en s mismas para una
investigacion concreta.
Por ejemplo, el porcentaje de bateo en beisbol es una estadstica descriptiva que resume
el rendimiento de un jugador o un equipo. Este numero es el numero de hits realizados
dividido por el numero de total de veces que se ha presentado ante el pitcher. Por ejemplo,
un jugador que tiene average de 0.33, indica que de tres veces que va al bate, conecta
un hit. El porcentaje resume o describe varios eventos discretos. Otro ejemplo tambien
es el promedio de notas de un estudiante. Este numero unico describe el comportamiento
general de un estudiante en toda la gama de experiencias de un curso.
El uso de la estadstica descriptiva tiene una historia extensa y, de hecho, la simple
tabulacion de las poblaciones y de los datos economicos fue la primera forma en que el
tema de las estadsticas aparecio. Mas recientemente, una coleccion de tecnicas se han
formulado bajo el epgrafe de analisis exploratorio de datos: un ejemplo de esta tecnica es
el grafico de caja.
Los analisis que provienen de la estadstica pueden ser de situaciones de una variable o
de dos o mas variables.
El analisis univariante
El analisis univariante implica describir la distribucion de una sola variable, incluyendo
su tendencia central (incluyendo la media, mediana y moda) y de dispersion (incluyendo
la gama de percentiles del conjunto de datos, y las mediciones de propagacion de errores,
tales como la varianza y la desviacion estandar, etc.). La forma de la distribucion tambien
puede ser descrita a traves de ndices tales como la asimetra y curtosis. Las caractersticas
de distribucion de una variable tambien se pueden representar en forma grafica o tabular,
incluyendo histogramas y diagramas de tallo y hojas.
El analisis bivariado
Cuando una muestra se compone de mas de una variable, la estadstica descriptiva
se puede usar para describir la relacion entre los pares de variables. En este caso, las
estadsticas descriptivas incluyen: las tabulaciones cruzadas y las tablas de contingencia,
representacion grafica mediante diagramas de dispersion, las medidas cuantitativas de la
dependencia, y descripciones de distribuciones condicionales. Las medidas cuantitativas de
la dependencia incluyen la correlacion (como el coeficiente r de Pearson cuando ambas
variables son continuas, o -de Spearman si uno o los dos no lo son) y covarianza (que
refleja la escala de relacion en la que las variables se miden). La estadstica descriptiva es
limitada en tanto que solo permite hacer resultados sobre las personas u objetos que se
26
2.1. Distribuciones de frecuencia
han medido. Usted no puede utilizar los datos que ha recogido para generalizar a otras
personas u objetos (es decir, utilizando datos de una muestra para inferir las propiedades
/ parametros de una poblacion). Por ejemplo, si se prueba un medicamento para combatir
el cancer y trabajo en sus pacientes, no se puede afirmar que funcionara en otros pacientes
de cancer, sin embargo, la estadstica inferencial si dara esta oportunidad.
Para empezar nuestra discusion de la metodologa que usa la estadstica descriptiva
para resolver problemas, vamos a ir, paso a paso, determinando las cosas que pueden irse
haciendo. As, una vez que se tienen los datos que describen una cierta muestra de una
cierta situacion de la que quiera averiguarse algo, lo primero es reducir los datos para
presentarlos en una forma conveniente para trabajar y empezar la discusion.

Una distribucion de frecuencias es una tabla usada para describir un conjunto de da-
tos. Una tabla de frecuencias muestra datos particulares o intervalos o rangos de datos
llamados clases de datos. En el caso de mostrar intervalos de datos, se define un valor, que
consistira en el valor que representa a dicha clase, usualmente es llamado marca de clase.
Ademas la tabla de frecuencias muestra un numero a continuacion del dato o marca de
clase, que representa el numero de veces que este valor se repite en la data, a este numero
se le llama frecuencia, o frecuencia de la clase.
Ejemplo 2.1 Supongase que 20 estudiantes de estadstica poseen las siguientes notas a
continuacion en una escala de 0 a 100 puntos: 97, 92, 88, 75, 83, 67, 89, 55, 72, 78,
81, 91, 57, 63, 67, 74, 87, 84, 98, 46. Puede construirse una tabla de frecuencias para
cada nota, as en esta tabla tendramos unas 100 filas aproximadamente. Para resumir
espacio pudiera organizarse todo en clases tales como 90-99, 80-89, 70-79 etc. y contando
el numero de datos pertenecientes a cada intervalo. As obtendramos algo como sigue:
Intervalo Marca de Clase Frecuencia

90-99 94.5 4
80-89 84.5 6
70-79 74.5 4
60-69 64.5 3
50-59 54.5 2
40-49 44.5 1
Cuadro 2.1.: Una tpica tabla de distribucion de frecuencias.
Note que la suma de la columnas de frecuencias es igual a 20, el numero de todos los
datos existentes.
27
2.1.1. Terminologa adicional

1. Los datos: el conjunto total de datos de la muestra se denota por xi , de tal manera
que el ndice i = 1, 2, ..., N denota la posicion relativa de un dato respecto de los
demas.
2. Numero total de datos no agrupados: se denota por N .
3. Numero total de datos agrupados: se denota por n.
4. Lmite real inferior de la data: es el menor valor en la data. Lo denotaremos

como Li .
5. Lmite real superior de la data: es el mayor valor en la data. Lo denotaremos

como Ls .
6. Lmite inferior de clase: es el menor valor en el intervalo de clase. Lo denotaremos

como li .
7. Lmite superior de clase: es el mayor valor en el intervalo de clase. Lo denotaremos

como ls .
8. Ancho de clase: es la diferencia entre dos lmites de clases superiores (o inferiores)

consecutivos. Todos las clases deberan tener el mismo ancho, aunque esto no es una
regla.
9. Marca de clase: es por lo general el valor medio de los datos de cada intervalo.
Pudiera escogerse otro criterio para definir la marca de clase, no tiene mucha impor-
tancia, sin embargo, cualquiera sea la escogencia que se haga, lo importante es que
este dato represente todo el intervalo de clase. Lo denotaremos por xM i .
li + ls
xM
i = . (2.1)
2
Ejemplo 2.2 Para la tabla de frecuencias anterior de las notas de los examenes de es-
tadstica, se tiene que: los lmites superiores de clase son: 99, 89, 79, 69, 59, y 49; los
lmites inferiores de clase son: 90, 80, 70, 60, 50, y 40. Las marcas de clase son: 94.5,
84.5, 74.5, 64.5, 54.5, y 44.5. El ancho de cada clase es 10.
2.1.2. Creando una tabla de frecuencias

Para crear tabla de frecuencias es necesario seguir los pasos a continuacion.
1. Lo mas importantes es contar o disponer de alguna data que sea de utilidad y con la
cual se quisiera estimar algunos valores y/o caractersticas importantes de interes.
28
2. Decidir de acuerdo al numero de datos y las caractersticas de los mismos las clases
(N ) necesarias para optimizar los resultados y agilizar los calculos seguidos.
3. Dividir el rango de la data por el numero de clases para obtener un estimado del
ancho de las clases.
Rango de la data R
Rango del intervalo = = , (2.2)
Numero de clases N
recordando que el rango de la data esta dado por
Rango de la data := R = Mayor valor Menor valor = Ls Li . (2.3)
4. Decidir los lmites de las clases.
5. Construir la tabla de frecuencia contando el numero de datos en cada uno de los

intervalos de clase.
El numero de tramos en los que se agrupa la informacion es una decision que debe tomar
el analista: la regla es que mientras mas tramos se utilicen menos informacion se pierde,
pero puede que menos representativa e informativa sea la tabla. Sin embargo no todo es
tan libre de desicion. Existen algunas reglas que son reconocidas por todos y en las que
estamos de acuerdo para que todos usen una misma metodologa.
La formula de Sturges
Una manera de decidir el numero total de clases es usar lo que se conoce como la formula
de Sturges. La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla
practica acerca del numero de clases que deben considerar al elaborarse un histograma.
Este numero viene dado por la siguiente expresion:
N = 1 + log2 N, (2.4)
donde N es el tamano de la muestra. Que puede pasarse a logartmo base 10 de la siguiente

forma:
N = 1 + 3,322 log N, (2.5)
donde N es el numero de clases a escribir y N es el numero total de datos de la mues-

tra. As para una data de 100 datos tendremos que hacer una tablna de distribucion de
frecuencias de N := 1 + (3,3) log(100) = 7,6 7 intervalos de clase.
29
La tabla de Ryan
Es recomendable que no sean pocos los intervalos o clases debido a que al condensar la
perdida de informacion sera importante con relacion a los datos originales. Por otra parte,
el numeron excesivo de clases, si bien produce poca perdida de la informacion no simplifica
el trabajo.
Otro criterio para determinar el numero de clases es el propuesto por Ryan en 1982
presentado en la siguiente tabla:
Numero de datos Numero de Clases

8 a 16 4
17 a 32 5
33 a 64 6
65 a 128 7
129 a 256 8
257 a 512 9
mayor a 513 10
Cuadro 2.2.: Tabla de Ryan para la determinacion del numero de intervalos de clase.
Ejemplo 2.3 Construiremos a continuacion una tabla de frecuencias con 6 marcas de

clases o intervalos de clase para la data siguiente. Los datos se corresponden con los montos
pagados por 28 conductores diferentes en una estacion de gasolina, por el consumo de la
misma. Los montos son en Bolvares Fuertes (Bs.F): 7, 4, 18, 4, 9, 8, 8, 7, 6, 2, 9, 5, 9, 12,
4, 14, 15, 7, 10, 2, 3, 11, 4, 4, 9, 12, 5, 3. En este caso se tendra como dato que se quiere
hacer una tabla que tenga ni mas ni menos 6 intervalos de clase, por tanto, observando la
data nos daremos cuenta que el menor monto pagado es 2 mientras que el mayor es 18,
por tanto, el rango de la clase sera aproximadamente 18 2 = 16, y por tanto para estimar
el ancho de cada clase dividimos el numero calculado anteriormente entre el numero de
clases dispuesto, as cada clase tendra un ancho de 16 6 = 2,66. Tendremos en definitiva
algo como lo que sigue:
Clase Intervalo Marca de Clase Frecuencia

Clase I 1-3 2 4
Clase II 4-6 5 8
Clase III 7-9 8 9
Clase IV 10-12 11 4
Clase V 13-15 14 2
Clase VI 16-18 17 1
30
2.1.3. Notacion Matematica

En lo que sigue se usara la siguiente simbologa y las siguientes variables que usaremos
para referirnos a objetos o valores que definiremos en adelante, a menos que se indique
otra cosa.
Representaremos los valores que toma una cierta variable en una cierta data como xi ,
n representara el numero de valores en el conjunto de datos muestrales agrupados, N el
numero de valores en el conjunto poblacional o no agrupados, y fi la frecuencia de cada
datos o cada marca de clase,
P tambien es llamada la frecuencia absoluta. Como siempre
usaremos la simbologa para indicar la suma de todos los valores de una variable o
expresion. Usando esta notacion, y de manera obvia, pudiera escribirse la sentencia de que
la suma de todas las frecuencias en la tabla de frecuencias es igual al numero de valores
en el conjunto de los datos,
N
X
fi = f1 + f2 + ... + fN = N. (2.6)
i=1
2.1.4. Frecuencia acumulada

La frecuencia acumulada de una clase de datos es el numero de elementos que existe en
esa clase y todos los de las clases previas. En otras palabras, la frecuencia acumulada de
una clase es la frecuencia de la clase mas todas las frecuencias de las clases anteriores a
esta. Puede ser tanto decreciente como creciente, si se acumulan las frecuencias desde la
ultima clase o la primera clase respectivamente.
Ejemplo 2.4 En la data presentada acerca de las notas de los examenes de estadstica
pudiera construirse la siguiente tabla de frecuencias acumuladas:
Clase Intervalo Marca de Clase Frec. Frec. Acum. Frec. Acum.

I 90-99 94.5 4 4 20
II 80-89 84.5 6 10 16
III 70-79 74.5 4 14 10
IV 60-69 64.5 3 17 6
V 50-59 54.5 2 19 3
VI 40-49 44.5 1 20 1
Notese que la ultima entrada en la columna de la frecuencia acumulada creciente es

justamente N = 20, lo mismo sucede para la frecuencia acumulada decreciente.
Ejemplo 2.5 Anadiremos a la tabla de frecuencias para el caso de los consumos de gaso-
lina, dos nuevas columnas para la frecuencia acumulada creciente y decreciente respectiva-
mente. Tendremos en definitiva algo como lo que sigue:
31
Clase Intervalo Marca de Clase Frec. Frec. Acum. Frec. Acum.

Clase I 1-3 2 4 4 28
Clase II 4-6 5 8 12 24
Clase III 7-9 8 9 21 16
Clase IV 10-12 11 4 25 7
Clase V 13-15 14 2 27 3
Clase VI 16-18 17 1 28 1
2.1.5. La frecuencia relativa

La frecuencia relativa de un dato o marca de clase se define como el porcentaje de
elementos en esa clase en relacion con el total de datos de la muestra. Se denota por fri .
Es sencillo calcular la frecuencia relativa como:
fi
fri = . (2.7)
N
En vista que el numero fi es siempre menor que N , por razones mas que obvias, es
entonces inmediato que fri es un numero que puede oscilar entre los valores 0 y 1, es decir,
0 fri 1. Adicionalmente pudiera definirse la frecuencia relativa porcentual como:
fri % = fri 100 %. (2.8)
Las frecuencias relativas porcentuales son usadas a menudo para hacer descripciones en
terminos de proporciones de ocurrencias de ciertas caractersticas de la data.
Ejemplo 2.6 Para la tabla anterior tendremos:
Clase Intervalo Marca de Clase Frec. Frec. Acum. Frec. Relat.

Clase I 1-3 2 4 4 .142
Clase II 4-6 5 8 12 .285
Clase III 7-9 8 9 21 .321
Clase IV 10-12 11 4 25 .142
Clase V 13-15 14 2 27 .071
Clase VI 16-18 17 1 28 .035
Note que la suma de todas las frecuencias relativas en la columna, suma aproximada-
mente 1, coincidente con el hecho de que existe una posibilidad de 100 % de que pudiera
ocurrir cualquiera de las cosas que describen la data, si pasa alguna de ellas, por su
puesto.
32
2.1.6. Los histogramas

Un histograma es una representacion grafica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia de los valores representados. En el
eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables,
normalmente senalando las marcas de clase, es decir, la mitad del intervalo en el que estan
agrupados los datos. Un histograma es un resumen grafico de la variacion de un conjunto
de datos. La naturaleza grafica del histograma nos permite ver pautas que son difciles de
observar en una simple tabla numerica. Esta herramienta se utiliza especialmente en la
Comprobacion de teoras y Pruebas de validez.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la
muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores contiguos. En
los casos en los que los datos son cualitativos (no-numericos), como sexo, grado de acuerdo
o nivel de estudios, es preferible un diagrama de sectores. Sabemos que los valores varan
en todo conjunto de datos. Esta variacion sigue cierta pauta. El proposito del analisis
de un histograma es, por un lado, identificar y clasificar la pauta de variacion, y por
otro desarrollar una explicacion razonable y relevante de la pauta. La explicacion debe
basarse en los conocimientos generales y en la observacion de las situaciones especficas y
debe ser confirmada mediante un analisis adicional. Las pautas habituales de variacion mas
comunes son la distribucion en campana, con dos picos, plana, en peine, sesgada, truncada,
con un pico aislado, o con un pico en el extremo. Los histogramas son mas frecuentes en
ciencias sociales, humanas y economicas que en ciencias naturales y exactas. Y permite la
comparacion de los resultados de un proceso.
Construccion de un histograma
1. Paso 1: Determinar el rango de los datos. Rango es igual al dato mayor menos el
dato menor.
2. Paso 2: Obtener el numero de clases, existen varios criterios para determinar el

numero de clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno
de ellos es exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo
de como esten los datos y cuantos sean. Un criterio usado frecuentemente es que el
numero de clases debe ser aproximadamente a la raz cuadrada del numero de datos.
Por ejemplo, la raz cuadrada de 30 ( numero de artculos) es mayor que cinco, por
lo que se seleccionan seis clases.
3. Paso 3: Establecer la longitud de clase: es igual al rango entre el numero de clases.
4. Paso 4: Construir los intervalos de clases: Los intervalos resultan de dividir el rango
de los datos en relacion al resultado del PASO 2 en intervalos iguales.
5. Paso 5: Graficar el histograma: En caso de que las clases sean todas de la misma
amplitud, se hace un grafico de barras, las bases de las barras son los intervalos de
33
clases y altura son la frecuencia de las clases. Si se unen los puntos medios de la base
superior de los rectangulos se obtiene el polgono de frecuencias.
Ejemplo 2.7 A una fabrica de envases de vidrio, un cliente le esta exigiendo que la ca-
pacidad de cierto tipo de botella sea de 13 ml, con una tolerancia de mas menos 1 ml. La
fabrica establece un programa de mejora de calidad para que las botellas que se fabriquen
cumplan con los requisitos del cliente. Al realizar el muestreo se obtienen los siguientes
datos de las capacidades de botellas al azar: 11, 12, 13, 12, 13, 14, 14, 15, 11, 12, 13, 12,
14, 15, 11, 12, 16, 16, 14, 13, 14, 14, 13, 15, 15. En este caso puede seguirse los pasos
anteriormente explicitados y entonces:
Rango = Mayor valor Menor valor = 16 11 = 5.

# de clases = 25 = 5.
5
Longitud de la clase = 5 = 1.
Se tiene entonces:
Clase Intervalo Marca de Clase Frec. Frec. Acum. Frec. Relat.
Clase I 11-12 11.5 3 3 .12
Clase II 12-13 12.5 5 8 .20
Clase III 13-14 13.5 5 13 .20
Clase IV 14-15 14.5 6 19 .24
Clase V 15-16 15.5 6 25 .24
El histograma de frecuencias se muestra a continuacion:
Ejemplos de otros tipos de representaciones graficas

Hay histogramas donde se agrupan los datos en clases, y se cuenta cuantas observaciones
(frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas)
las clases estan definidas de modo natural, por ejemplo, sexo con dos clases: mujer, varon
o grupo sanguneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay
que definirlas explcitamente (intervalos de clase).
Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuen-
cias, absolutas o relativas, en el de ordenadas (eje vertical).
Un polgono de frecuencias es un grafico de linea que representa la informacion de la
tabla de frecuencias. Justo como los histogramas, el eje vertical representa las frecuencias,
que pueden ser tambien las relativas, mientras que el eje horizontal representa la medicion
de la variable en el conjunto de datos. Para construir el grafico, un punto es dibujado por
cada marca de clase, en el caso del histograma es el punto en la parte mas alta de la barra
y en la mitad de la misma, este punto representa, por su puesto, la frecuencia de la clase.
Para terminar se conectan todos los puntos con lineas rectas. Los polgonos de frecuencias
sera de mucha utilidad luego para estimar la curva de prediccion y para estimar el tipo de
distribucion particular que sigue el fenomeno.
34
Figura 2.1.: As luce un histograma de frecuencias.
Figura 2.2.: Ejemplo de como debe construirse un histograma simple.
35
Figura 2.3.: (a) Ojiva, histograma de frecuencias acumuladas y (b) Histograma de frecuen-
cias para dos datos.
Figura 2.4.: (a) Histograma de datos apilados y (b) Diagrama circular de proporciones.
Figura 2.5.: (a) Polgono de frecuencias y (b) Histograma 3D.
2.2. Medidas de Tendencia Central (MTC)

Una Medida de Tendencia Central es un valor usado para representar el promedio
tpico en el conjunto de los datos. En realidad una medida de tendencia central es cual-
36
quier medida que estime el centro o medida centarl de un conjunto de datos orenados por
magnitud. Al describir grupos de observaciones, con frecuencia se desea describir el grupo
con un solo numero. Para tal fin, desde luego, no se usara el valor mas elevado ni el valor
mas pequeno como unico representante, ya que solo representan los extremos. Mas bien
que valores tpicos. Entonces sera mas adecuado buscar un valor central. Las medidas que
describen un valor tpico en un grupo de observaciones suelen llamarse medidas de ten-
dencia central. Es importante tener en cuenta que estas medidas se aplican a grupos mas
bien que a individuos. un promedio es una caracterstica de grupo, no individual. Entre las
medidas de tendencia se encuentran las siguientes.
2.2.1. La Media Aritmetica

La medida de tendencia central mas obvia que se puede elegir, es el simple promedio de las
observaciones del grupo, es decir el valor obtenido sumando las observaciones y dividiendo
esta suma por el numero de observaciones que hay en el grupo. La media resume en un
valor las caractersticas de una variable teniendo en cuenta a todos los casos. Solamente
puede utilizarse con variables cuantitativas.
La suma de todos los valores de el conjunto de datos dividido por el numero de valores en
la data es lo que se conoce como la media. La media para el espacio muestral es denotada
por x mientras que para la poblacion es denotada por la letra griega .
Pn
xi
x = i=1 , para los valores de la muestra, (2.9)
n
PN
xi
= i=1 , para los valores de la poblacion. (2.10)
N
Ejemplo 2.8 El promedio o la media de los resultados en un examen de fsica cuyas notas
han sido: 10, 15, 17, 7, 16, 8, 10, 19, 15, 10, 8; es:
Pn
xi 135
x = i=1 = = 12,27. (2.11)
n 11
Ejemplo 2.9 Calcular la media de cada uno de los ejemplos explicitados en las secciones
anteriores.
Propiedades de la media aritmetica

La media aritmetica tiene cinco propiedades importantes, las cuales son:
1. La suma algebraica de las desviaciones de un conjunto de datos o numeros respecto

de su media aritmetica es cero. En notacion matematica puede escribirse que:
N
X N
X
desvi = (xi x) = 0. (2.12)
i=1 i=1
37
2. La suma de los cuadrados de las desviaciones de un conjunto de numeros xi rrspecto

de un cierto numero a es mnima, si y solo si a = x.
3. Si n1 numeros tienen media m1 y n2 numeros tienen media m2 , y as sucesivamente

nk numeros tienen media mk , entonces la media de todos los numeros es
n1 m1 + n2 m2 + n3 m3 + + nk mk
X = , (2.13)
n1 + n2 + n3 + + nk
es decir, una media ponderada de todas las medias (mas adelante vera esto).
4. Si a cada uno de los resultados de un conjunto de datos xi se les suma una cantidad
b, produciendo un nuevo conjunto de datos yi , entonces,
yi = b + xi 7 y = b + x. (2.14)
As mismo, si cada uno de los resultados de un conjunto de datos xi se les multiplica

por una cantidad c, produciendo un nuevo conjunto de datos zi , entonces,
zi = cxi 7 z = cx. (2.15)
La propiedad 4 es muy util para calcular el promedio de un conjunto de datos agru-

pados por clases, mas adelante se usa esta propiedad para obtener una formula para
este caso.
Ejemplo 2.10 Veamos de manera sencilla como las propiedades anteriores son ciertas en
general. La primera de las propiedades es se demuestra haciendo que:
N N N N N N N
X X X X xi X X xi X
(xi x) = xi x = N x = N x 1 = N xN x = 0. (2.16)
N N
i=1 i=1 i=1 i=1 i=1 i=1 i=1
La segunda propiedad es tambien facil de demostrar ya que:
N
X
(xi a)2 = f (xi ), (2.17)
i=1
por tanto la primera de las condiciones para maximos y mnimos de una funcion y el
teorema fundamental del calculo, se tiene que
N
d X
f (xi ) = 0 7 2 (xi a) = 0 7 xi = a. (2.18)
dxi
i=1
38
Para la tercera tenemos que si tenemos conjuntos de datos xi estan divididos en varias
partes de tamanos n1 , n2 ,..., nk , entonces el total de datos es N = n1 + n2 + n3 + + nk ,
por tanto,
N N
X xi X xi
X = =
N n1 + n2 + n3 + + nk
i=1 i=1
(x1,1 + + x1,n1 ) + (x2,1 + + x2,n2 ) + + (xk,1 + + xk,nk )
=
n1 + n2 + n3 + + nk
x1,1 + x1,2 + + x1,n1 x2,1 + x2,2 + + x2,n2 xk,1 + xk,2 + + xk,nk
= + ++
n1 + n2 + n3 + + nk n1 + n2 + n3 + + nk n1 + n2 + n3 + + nk
n1 x1,1 + x1,2 + + x1,n1 n2 x2,1 + x2,2 + + x2,n2
= + +
N n1 N n2
nk xk,1 + xk,2 + + xk,nk
++
N nk
PN
n1 m1 + n2 m2 + n3 m3 + + nk mk j=1 nj mj
= = PN , (2.19)
n1 + n2 + n3 + + nk k=1 nk
en la penultima lnea se ha multiplicado y dividido cada termino por n1 , n2 ,....., nk res-

pectivamente y en la ultima linea se ha definido
X xi,1 + xi,2 + + xi,n
i
mi = ni , (2.20)
ni
j=1
lo cual es la media de cada subconjunto de datos.

La cuarta propiedad es tambien sencilla, vease que dado un conjunto de datos xi a los
cuales se les suma o resta una cierta cantidad a, dando yi := a xi , se tiene que
N N N N
X yi X a xi X a X xi N
y = = = = a x = a x. (2.21)
N N N N N
i=1 i=1 i=1 i=1
Por ultimo si dado un conjunto de datos xi a los cuales se les multiplica una cierta
cantidad c, dando zi := cxi , se tiene que
N N N
X zi X czi X zi
z = = =c = z. (2.22)
N N N
i=1 i=1 i=1
Esta propiedades son muy utiles en algunos casos. Veamos algunos ejemplos.
Ejemplo 2.11 De los 80 empleados de una empresa, 60 cobran mil 30 bolvares la hora y
el resto 15 bolvares la hora. En este caso n1 = 60, n2 = 20, m1 = 30 y m2 = 15, luego la
media de todos es
n1 m1 + n2 m2 60 30 + 20 15 2100
X = = = 26, 25. (2.23)
n1 + n2 60 + 20 80
39
Ejemplo 2.12 Para hallar el promedio de los siguientes datos de un experimento x :=

{3 103 ; 4 103 ; 3,3 103 ; 5 103 ; 4,2 103 } se puede usar la cuarta propiedad para
observar que los datos xi = czi = {3; 4; 3,3; 5; 4,2} 103 , por tanto
3 + 4 + 3,3 + 5 + 4,2
x = 103 = 3,9 103 . (2.24)
5
Cuando los datos han sido agrupados por frecuencias la forma de calcular la media es
ligeramente distinta ya que hay que considerar las frecuencias de cada uno de los datos,
en este caso se tendra que la media de los datos xi correspondientes a sus frecuencias
respectivas fi es
N
X xi fi
x = . (2.25)
N
i=1
Vease que si tomamos todos los datos como distintos y por tanto sus frecuencias son iguales
a 1 todas, entonces la fotmula anterior se reduce a la primera.
Si por otro lado, los datos han sido agrupados por clases, entonces, todos los valores
que caen dentro de un intervalo de clase dado se consideran iguales a la marca de clase,
o al punto medio, del intervalo. Entonces en este caso la propiedad tercera de la media se
considera valida si interpretamos a yi como la marca de clase, fi como la correspondiente
marca de clase, b como cualquier marca de clase o numero dentro del intervalo de clase y
yi = xi b, en este caso se tendra que
N
X yi fi
x = b + c, (2.26)
N
i=1
donde c es el ancho de la clase.
2.2.2. La Mediana
La mediana es un valor el cual separa el 50 % de los valores mayores de la data del
50 % restante menor. Para calcular la mediana, lo mas sencillos es localizar todos los datos
en orden, y entonces buscar el punto medio de los mismos. Si n es impar, el valor medio
sera justamente la mediana; por el contrario si n es par, entonces la mediana sera el valor
medio de los dos valores centrales. Utilizaremos como notacion la siguiente para referirnos
a este valor, x0,5 .
Ejemplo 2.13 La mediana para el conjunto de datos de las notas del examen de fsica
puede calcularse ordenando as:
7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19 (2.27)
vemos el n = 11, por tanto la mediana es el dato del centro de esta distribucion ordenada,
el cual es el dato con el orden 6to, es decir x0,5 = 10.
40
Ejemplo 2.14 Calcular la mediana de cada uno de los ejemplos explicitados en las sec-
ciones anteriores.
En realidad la mediana corresponde al valor de una medida de posicion llamada cuartil

2, Q2 , que veremos mas adelante. Por eso esperaremos hasta entonces para dar una mejor
aproximacion a su calculo y significado verdadero.
2.2.3. La moda
De todos los valores de la data, la moda resulta ser el valor que aparece repetida el mayor
numero de veces en el conjunto, o lo que es lo mismo, el dato con mayor frecuencia. Pudiera
pasar que dos o varios datos se repitieran con la misma frecuencia, en este caso, se considera
llamar a la distribucion con un nombre particular en virtud de cuantos valores moda
existan, as, si solo un valor es que el tiene mayor frecuencia, entonces, a esta distribucion
se le llamara unimodal; si tiene dos modas, entonces, se le llamara bimodal y si tiene mas
se le llamara polimodal.
Ejemplo 2.15 La moda para el conjunto de datos de las notas del examen de fsica puede
calcularse ordenando as: 7, 8, 8, 10, 10, 10, 15, 15, 16, 17, 19. Vemos el dato con mayor
frecuencia es el 10, por tanto la moda es el 10.
Ejemplo 2.16 Calcular la moda de cada uno de los ejemplos explicitados en las secciones
anteriores.
En el caso de datos agrupados donde se haya construido una curva de frecuencia para
ajustar los datos, la moda sera el valor (o valores) de x correspondiente al maximo (o
maximos) de la curva, Ese valor se denota por x. La moda tambien puede deducirse de
una distribucion de frecuencias o de un histograma de frecuencias a partir de la formula

1
m = L1 + c, (2.28)
1 + 2
donde L1 es la frontera inferior de la clase modal (clase que contiene la moda), 1 es el

exceso de la frecuencia modal sobre la clase inferior inmediata, 2 es el exceso de frecuencia
modal sobre la clase superior inmediata y c es el ancho del intervalo de la clase modal.
2.2.4. Relacion emprica entre la media, mediana y moda

Para curvas de frecuencias unimodales que sean poco asimetricas tenemos la siguiente
relacion emprica
x m = 3(x x0,5 ), (2.29)
donde x es la media, m es la moda y x0,5 es la mediana.
41
2.2.5. Propiedades de la media, mediana y moda

Propiedades de la media, ampliado
1. La media es la mas comun de todas las medidas de tendencia central usadas para el
analisis de los datos.
2. Todo conjunto de datos de nivel de intervalo y de nivel de razon tiene un valor medio.
3. Al evaluar la media se incluyen todos los valores.
4. Un conjunto de datos solo tiene una media. Esta es un valor unico.
5. La media es una medida muy util para comparar dos o mas poblaciones.
6. Se interpreta como punto de equilibrio o centro de masas del conjunto de datos, ya

que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio
valor. La media es la unica medida de ubicacion donde la suma de las desviaciones
de cada valor con respecto a la media, siempre sera cero.
n n n
X (xi x)fi X xi fi X fi
= x = x x = 0. (2.30)
N N N
i=1 i=1 i=1
7. La media podra no ser un promedio adecuado para representar datos no regulares.

La media se ve afectada de modo notable por valores extraordinariamente grandes o
pequenos.
8. No se puede determinar la media de datos de extremo abierto (Ej: U$S 100.000 y

mayor).
9. Minimiza las desviacionesPn cuadraticas de los datos respecto de cualquier valor prefija-
2
i=1 (xi k)
do, esto es, el valor de N es mnimo cuando k = x. Este resultado se conoce
como Teorema de Konig. Esta propiedad permite interpretar uno de los parametros
de dispersion mas importantes: la varianza.
10. Si uno pudiera asumir que el polgono de frecuencia tiene una curva suave que lo re-
presenta, digamos f (x), entonces ahora los datos dejan de ser discretos y se convierten
en continuos, de este modo se demuestra que
Z x Z +
f (x)dx = f (x)dx. (2.31)
x
11. Si se suma (o se resta) una constante a cada una de las observaciones, el promedio
aritmetico se vera aumentado (o disminuido) en esa constante , es decir,
yi := xi 7 y = x . (2.32)
42
12. Si se multiplica (o se divide) cada una de las observaciones por una constante , el
promedio aritmetico se vera multiplicado (o dividido) por esa constante , es decir
yi := xi 7 y = x, (2.33)
xi x
yi := 7 y = . (2.34)

13. En general si los datos sufren una transformacion afn (cambios de origen y escala),
esto es, si yi = xi + entonces y = x + , donde y es la media aritmetica de los
yi , para i = 1, ..., N y y numeros reales.
Propiedades de la mediana
1. Es unica, solo existe una mediana para un conjunto de datos.
2. No se ve afectada por valores muy grandes o muy pequenos.
3. Puede calcularse para una distribucion de frecuencias con una clase de extremo abier-
to, si la medina no se encuentra en una clase de tal extremo.
4. Puede obtenerse para datos de nivel de razon, de intervalo y ordinal (excepto para
el nominal).
5. Es menos sensible que la media a oscilaciones de los valores de la variable. Un error

de transcripcion en la serie del ejemplo anterior en, pongamos por caso, el ultimo
numero, deja a la mediana inalterada.
6. No se ve afectada por la dispersion. De hecho, es mas representativa que la media

aritmetica cuando la poblacion es bastante heterogenea. Suele darse esta circunstan-
cia cuando se resume la informacion sobre los salarios de un pas o una empresa. Hay
unos pocos salarios muy altos que elevan la media aritmetica haciendo que pierda
representatividad respecto al grueso de la poblacion. Sin embargo, alguien con el sa-
lario mediano sabra que hay tanta gente que gana mas dinero que el, como que gana
menos.
Propiedades de la moda
1. Puede determinarse para todos los niveles de datos: nominal, ordinal, de intervalo y
de razon.
2. No se ve afectada por valores muy altos o muy bajos.
3. Al igual que la mediana, puede utilizarse como medida de tendencia central para
distribuciones con clases de extremo abierto.
43
4. Para muchos conjuntos de datos no hay valor modal porque ningun valor aparece
mas de una vez.
5. Para algunos conjuntos de datos hay mas de una moda (bimodal = que tiene dos
modas).
6. La moda, cuando los datos estan agrupados, es un punto que divide el intervalo modal
en dos partes de la forma p y c p, siendo c la amplitud del intervalo, que verifiquen
que:
p fi fi1
= , (2.35)
cp fi fi+1
siendo fi la frecuencia absoluta del intervalo modal y fi1 y fi+1 las frecuencias
absolutas de los intervalos anterior y posterior, respectivamente.
2.2.6. El promedio ponderado

Es una generalizacion de la media aritmetica. Se denomina media ponderada de un
conjunto de numeros al resultado de multiplicar cada uno de los numeros por un valor
particular para cada uno de ellos, llamado su peso, obteniendo a continuacion la suma de
estos productos, y dividiendo el resultado de esta suma de productos entre la suma de los
pesos segun la caracterstica de cada numero inicial. Este peso depende de la importancia
o significancia de cada uno de los valores.
Para una serie de datos, xi = x1 , x2 , ..., xn , a la que corresponden los pesos W =
w1 , w2 , ..., wn , la media ponderada se calcula como:
Pn
x i wi
xW = Pi=1 n , (2.36)
i=1 wi
o:
x1 w1 + x2 w2 + x3 w3 + ... + xn wn
xW = . (2.37)
w1 + w2 + w3 + ... + wn
Un ejemplo es la obtencion de la media ponderada de las notas de una oposicion en
la que se asigna distinta importancia (peso) a cada una de las pruebas de que consta el
examen.
Ejemplo 2.17 Promedio de puntos del grado. Asignamos a los grados las letra con los
valores: A = 4, B = 3, C = 2, D = 1, F = 0, y entonces cada valor del grado se cuenta
segun el numero de los creditos ganados con ese grado. Calcular el grado de un estudiante
que ha ganado 12 creditos de las A, 21 creditos de los B, 5 creditos de las C y 3 creditos
de Ds.
Ejemplo 2.18 Grado del curso. El nota final en este curso se calcula segun la escala
siguiente: La preparacion cuenta con el 15 %, el 20 % por cada examen de tres que hay, y el
examen final vale el 25 %. Podemos sacar la cuenta para cada componente del grado final
44
con su porcentaje para calcular el grado final. Calcular la cuenta final para un estudiante
que ha anotado 95 en la preparacion, tiene notas de los examenes de 83, 94, y 77, y una
nota en el examen final es de 88.
2.2.7. Otros tipos de medias

Media cuadratica
La media cuadratica es igual a la raz cuadrada de la suma de los cuadrados de los valores
dividida entre el numero de datos:
rP r
n 2 2 2 2
2 i=1 ai 2 a1 + a2 + + an
x = = . (2.38)
n n
Esta media como medida de asociacion tiene aplicaciones tanto en ciencias biologicas
como en medicina.
A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en
los errores de medida. En tal caso se puede estar interesado en obtener un promedio que
no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media
cuadratica. Consiste en elevar al cuadrado todas las observaciones (as los signos negativos
desaparecen), en obtener despues su media aritmetica y en extraer, finalmente, la raz
cuadrada de dicha media para volver a la unidad de medida original.
Media geometrica
La media geometrica de una cantidad finita de numeros (digamos n numeros) es la raz
n-esima del producto de todos los numeros.
v
u n
uY
x = tn
xi = n x1 x2 xn . (2.39)
i=1
Por ejemplo, la media geometrica de 2 y 18 es

2
2
2 18 = 36 = 6. (2.40)
Otro ejemplo, la media de 1, 3 y 9 seria

3

3
1 3 9 = 27 = 3. (2.41)
Solo es relevante la media geometrica si todos los numeros son positivos. Si uno de ellos
es 0, entonces el resultado es 0. Si hay un numero negativo (o una cantidad impar de ellos)
entonces la media geometrica es, o bien negativa o bien inexistente en los numeros reales.
En muchas ocasiones se utiliza su trasformacion en el manejo estadstico de variables con
distribucion no normal. La media geometrica es relevante cuando varias cantidades son
sumadas para producir un total.
45
Media armonica
La media armonica, representada por H, de una cantidad finita de numeros es igual al

recproco, o inverso, de la media aritmetica de los recprocos de dichos numeros. As, dados
los numeros a1 , a2 , ..., an , la media armonica sera igual a:
n n
H = Pn 1 = 1 . (2.42)
i=1 ai ( a11 + + an )
La media armonica resulta poco influida por la existencia de determinados valores mucho
mas grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho mas
pequenos que el conjunto. La media armonica no esta definida en el caso de la existencia
en el conjunto de valores nulos.
Media generalizada
La media generalizada es una abstraccion de los diversos tipos de media (geometrica,

aritmetica, armonica, etc).
Se define como:
( q P
m 1 n m m 6= 0
x(m) = n i=1 xi , (2.43)
n
p
n
Q
i=1 xi m=0
en donde el parametro m indica si la media es:
aritmetica, con m = 1,
geometrica, con m = 0,
armonica, con m = 1,
cuadratica, con m = 2.
Observese que para valores de m 0 la expresion solo tiene sentido si todos los xi 0.
Ejemplo 2.19 Calcule los valores de las medias anteriormente definidas para todas las
situaciones y conjunto de datos anteriores.
2.2.8. Formas de las distribuciones de datos

Podemos clasificar varias formas de las distribuciones de datos de-acuerdo al lugar que
ocupan las medidas de tendencia central mas usuales anteriormente definidas.
46
Figura 2.6.: Una distribucion simetrica. Vease la igual proporcion de barras con alturas
aproximadas a ambos lados de la media.
Simetrica
La distribucion de datos es aproximadamente de la misma forma a ambos lados de la
linea central, en donde se encuentra aproximadamente la media. La media y la mediada (y
la moda, si es modalidad) son practicamente iguales en una distribucion simetrica.
Sesgada a la derecha
Unos cuantos valores se encuentran la izquierda de la media, pero la mayora de todos los
datos se encuentran muy agrupados y acumulados a la derecha de la misma. Generalmente
la mediana es mas pequena que la media. Por lo tanto, en este caso, la media se encuentra
a la derecha de la mediana.
Sesgada a la izquierda
Unos cuantos valores se encuentran la derecha de la media, pero la mayora de todos los
datos se encuentran muy agrupados y acumulados a la izquierda de la misma. Generalmente
la mediana es mas grande que la media. Por lo tanto, en este caso, la media se encuentra
a la izquierda de la mediana.
Uniforme
Todos los datos estan igualmente representados.
47
Figura 2.7.: Una distribucion sesgada a la derecha. Vease la desigual proporcion de barras
con alturas mayores a la derecha de la media.
Figura 2.8.: Una distribucion sesgada a la izquierda. Vease la igual proporcion de barras
con alturas mayores a la izquierda de la media.
48
2.3. Medidas de variacion
Figura 2.9.: Una distribucion uniforme. Las barras tienen aproximadamente la misma al-
tura a ambos lados de la media.
Para conseguir una vision completa y comprensiva de los datos hay que complementar
las medidas de tendencia central con las de otras propiedades de los mismos. La dispersion
o variacion de los datos intenta dar una idea de cuan esparcidos se encuentran los datos
de una cierta distribucion de datos. Por ejemplo, el grado en que los datos se parecen o
diferencian entre s. A esta propiedad se la denomina variabilidad o variacion. Entre los
indicadores de variacion mas utilizados estan la varianza y la desviacion tpica.
Las medidas de dispersion, como tambien se les conoce, muestran la variabilidad de una
distribucion, indicando por medio de un numero o estadstico si las diferentes puntuaciones
de una variable estan muy alejadas de la media. Cuanto mayor sea ese valor mayor sera la
variabilidad, cuanto menor sea, mas homogeneo sera a la media. As se sabe si todos los
casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucion tiene respecto de su media, se calcula
la media de las desviaciones de las puntuaciones respecto a la media aritmetica. Pero la
suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias
para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacion
media) y otra es tomando las desviaciones al cuadrado (Varianza).
49
2.3.1. Rango
El rango estadstico es la diferencia entre el valor mnimo y el valor maximo en un grupo
de numeros. Para averiguar el rango de un grupo de numeros: ordenamos los numeros
segun su tamano, y luego restamos el valor mnimo del valor maximo.
2.3.2. La Varianza
Es el promedio de las distancias al cuadrado desde los valores en xi hasta la media x en
una muestra de n sujetos. Se denota usualmente por s2x
(xi x)2
P
s2x = i=1 , varianza muestral, (2.44)
n1
(xi )2
P
2
sx = i=1 , varianza poblacional. (2.45)
N
La varianza es una variable estadstica que mide la dispersion de los valores respecto a
un valor central (media), es decir, la media de las diferencias cuadraticas de n puntuaciones
respecto a su media aritmetica. Esta medida en unidades distintas de las de la variable.
Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros
al cuadrado. La varianza tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores atpicos
y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas
pesadas. En tales casos se recomienda el uso de otras medidas de dispersion mas robustas.
Propiedades
2 0.
La varianza es siempre positiva o 0: SX
Si a los datos de la distribucion les sumamos una cantidad constante la varianza no

se modifica. Sea Yi = Xi + k, entonces
(Yi Y )2 [(Xi + k) (X + k)]2 (Xi + k X k)2

P P P
2
SY = = =
P n n n
(Xi X)2 2
= = SX (2.46)
n
Si a los datos de la distribucion les multiplicamos una constante, la varianza queda

multiplicada por el cuadrado de esa constante. Si Yi = Xi k, entonces
(Yi Y )2 (Xi k X k)2 [k (Xi X)]2

P P P
2
SY = = =
P 2n n n
[k (Xi X)2 ]
= = k 2 SX
2
(2.47)
n
50
2
Propiedad distributiva: S(X+Y 2 2
) = SX + SY .
Si tenemos k grupos con tamanos n1 , ..., nk , y con medias y varianzas conocidas

(x1 , x2 , ..., xk ) y (S12 , S22 , ..., Sk2 ), entonces se puede definir la varianza total como:
2
P
ni Si2 j nj (xj xT )
P
2 i
sT = P + P , (2.48)
i ni j nj
donde P
ni xi
xT = Pi . (2.49)
i ni
2.3.3. La Desviacion Estandar

La varianza a veces no se interpreta claramente ya que se mide en unidades cuadraticas.
Para evitar ese problema se define otra medida de dispersion, que es la desviacion tpica,
que se halla como la raz cuadrada positiva de la varianza. La desviacion tpica nos informa
sobre la dispersion de los datos respecto al valor de la media; cuanto mayor sea su valor,
mas dispersos estaran los datos.
sP
n 2
i=1 (xi x)
Sx = , Desviacion tpica muestral (2.50)
n1
r Pn
2
i=1 (Xi )
x = , Desviacion tpica poblacional (2.51)
N
La desviacion estandar puede ser interpretada como una medida de incertidumbre. La
desviacion estandar de un grupo repetido de medidas nos da la precision de estas. Cuando
se va a determinar si un grupo de medidas esta de acuerdo con el modelo teorico, la
desviacion estandar de esas medidas es de vital importancia: si la media de las medidas
esta demasiado alejada de la prediccion (con la distancia medida en desviaciones estandar),
entonces consideramos que las medidas contradicen la teora. Esto es coherente, ya que las
mediciones caen fuera del rango de valores en el cual sera razonable esperar que ocurrieran
si el modelo teorico fuera correcto. La desviacion estandar es uno de tres parametros de
ubicacion central; muestra la agrupacion de los datos alrededor de un valor central (la
media o promedio).
Correccion de Sheppard para la varianza

El calculo de la desviacion tpica es algo erroneo como resultado del agrupamiento de
datos en clases (error de agrupamiento). Para correguirlo, se usa la formula
c2
s2correguida = s2calculada . (2.52)
12
donde c es la anchura del intervalo de clase. La correccion c2 /12 (que se resta) se llama
correccion de Sheppard.
51
2.3.4. La Desviacion Media

Es la otra posibilidad para conocer la variabilidad de los datos en la distribucion de
frecuencias sin tener que elevar al cuadrado la diferencia de datos respecto de la media:
P
(xi x)
dM = i . (2.53)
n
Ejemplo 2.20 Calcule todas la medidas de variabilidad definidas para todas las situaciones
y conjunto de datos anteriores.
2.3.5. Dispersion absoluta y relativa: coeficiente de variacion

La variacion o dispersion real, tal como se determina de la desviacion tpica u otra medida
de dispersion, se llama dispersion absoluta. Sin embargo, una dispersion (o variacion) de
10 pulgadas en la medida de 1000 pies es muy diferente de esa misma dispersion al medir
una distancia de 20 pies. Una medida de ese efecto la da la dispersion relativa, a saber
dispersion absoluta
dispersion relativa := . (2.54)
promedio
Si la dispersion absoluta es la desviacion estandar = s y el promedio es la media x,
entonces la dispersion relativa se llama coeficiente de variacion o coeficiente de dispersion
o tambien coeficiente de variabilidad de Pearson, en este caso se tendra que

coeficiente de variacion = p = . (2.55)
x
Una regla ampliamente usada por los estadsticos dice que el coeficiente de variabilidad,
debido a que debe ser un numero menor que 1, puede usarse para expresarse en terminos
de porcentajes. De hecho se establece que si p < 0,20, entonces se dice que la media es
representativa d elos datos, lo que quiere decir, que la media es buen estimador ya que el
error es considerablemente pequeno en comparacion con la media. Sin embargo, si p > 0,20,
se dice que la media no es representativa, lo que equivale a decir que el error es muy grande
en comparacion del promedio. En este ultimo caso es necesario descartar a la media o el
promedio como estimador global y hacer uso de otros estimadores para sacar conclusiones.
2.3.6. Covarianza
La covarianza entre dos variables es un estadstico resumen indicador de si las puntua-
ciones estan relacionadas entre s. La formulacion clasica, se simboliza por la letra griega
sigma (xy ) cuando ha sido calculada en la poblacion. Si se obtiene sobre una muestra, se
designa por la letra sxy .
La formula suele aparecer expresada como:
Pn Pn
i=1 xi yi (Xi X)(Yi Y )
Sxy = = i=1 . (2.56)
n1 n1
52
Este tipo de estadstico puede utilizarse para medir el grado de relacion de dos variables
si ambas utilizan una escala de medida a nivel de intervalo/razon (variables cuantitativas).
La expresion se resuelve promediando el producto de las puntuaciones diferenciales por
su tamano muestral (n pares de puntuaciones, n 1 en su forma insesgada). Este estadsti-
co, refleja la relacion lineal que existe entre dos variables. El resultado numerico fluctua
entre los rangos de +infinito a -infinito. Al no tener unos lmites establecidos no puede
determinarse el grado de relacion lineal que existe entre las dos variables, solo es posible
ver la tendencia.
Propiedades
Sxy +.
Se tiene que

> 0, Correlacion directa. Recta de regresion creciente.
Sxy = = 0, No hay correlacion. , (2.57)
< 0. Correlacion inversa. Recta de regresion decreciente.

2.3.7. Coeficiente de Correlacion de Pearson

El coeficiente de correlacion de Pearson, r, nos permite saber si el ajuste de la nube de
puntos a la recta de regresion obtenida es satisfactorio. Se define como el cociente entre la
covarianza y el producto de las desviaciones tpicas (raz cuadrada de las varianzas).
Vxy Sxy Sxy
r=p =q = . (2.58)
Vx Vy 2 2
Sx Sy S x Sy
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante

cualquiera de las dos expresiones siguientes:
P
xi yi
n xy
r = r P , (2.59)
x2i
P 2
yi
n x2 n y 2
P P P
n x i yi x i yi
r = rh . (2.60)
P 2 P 2i h P 2 P 2i
n xi ( xi ) n yi ( yi )
Propiedades
El coeficiente de correlacion, r, presenta valores entre -1 y +1.
Cuando r es proximo a 0, no hay correlacion lineal entre las variables. La nube de
puntos esta muy dispersa o bien no forma una lnea recta. No se puede trazar una
recta de regresion.
53
Cuando r es cercano a +1, hay una buena correlacion positiva entre las variables
segun un modelo lineal y la recta de regresion que se determine tendra pendiente
positiva, sera creciente.
Cuando r es cercano a -1, hay una buena correlacion negativa entre las variables
negativa: es decreciente.
Figura 2.10.: El coeficiente de correlacion de Pearson establece la posibilidad de un ajuste

de los puntos en la muestra. En la primera grafica de arriba no existe relacion
entre las variables y en la segunda hay relacion pero no puede ser ajustada
con una linea recta. En las siguientes la correlacion es positiva y negativa,
con pendientes positiva y negativa, respectivamente.
2.4. Medidas de simetra

Si xi son los N valores de la variable x, podemos definir la cantidad
N
(r)
X xr
x := , (2.61)
N
i=1
54
2.4. Medidas de simetra
a la cual podemos llamar el r-esimo momento. El primer momento, con r = 1, e sla media
aritmetica x. De esta manera puede definirse el r-esimo momento respecto de la media
como
N
(xi x)r
:= (x x)r .
X
mr := (2.62)
N
i=1
Vease que si r = 1, entonces m1 = 0, ya que hemos demostrado que las desviaciones
respecto de la media es cero. Mientras que si r = 2, entonces m2 = s2 , es decirl es el
segundo momento es la varianza.
Para evitar unidades particulares podemos definir momentos adimensionales respecto de
la media como:
mr mr
ar := r = r , (2.63)
s m2

donde s = m2 es la desviacion estandar, ya que m1 = 0 y m2 = s2 , entonces se tiene que
a1 = 0 y a2 = 1.
Las correciones de Sheppard para los momentos son como siguen:
c2
m2 (corregido) = m2 , (2.64)
12
c2 7c4
m4 (corregido) = m4 m2 + , (2.65)
2 240
los momentos m1 y m3 no requieren ninguna correccion.
2.4.1. Coeficientes de asimetra y curtosis

Asimetra
Hemos comentado que el concepto de asimetra se refiere a si la curva que forman los
valores de la serie presenta la misma forma a izquierda y derecha de un valor central.
Se conoce como sesgo el grado de asimetra de una distribucion , es decir, cuanto se
aparta de la simetra. Si la curva de frecuencias d euna distribucion tiene a la derecha una
cola mas larga que a la izquierda, se dice que es sesgada a la derecha, o de sesgo positivo,
mientras que en el caso contrario sesgada a la izquierda o de sesgo negativo.
Para distribuciones sesgadas, la media tiende a estar del mismo lado de la moda que la
cola larga. Luego una medida de la asimetra viene dada por la diferencia: media-moda,
que puede hacerse adimensional dividiendola por la medida de dispersion, tal como la
desviacion estandar, lo que lleva a la definicion
media moda x m
Sesgo = = . (2.66)
desviacion
Para evitar el uso de la moda podemos recurrir a la formula emprica anteriormente
estudiada para obtener
3(media mediana) 3(x x0,5 )
Sesgo = = . (2.67)
desviacion
55
Para medir el nivel de asimetra se utiliza mejor el llamado Coeficiente de Asimetra de

Fisher, que viene definido:
3
P
i (xi x)
n
g = hP i3/2 . (2.68)
2
i (xi x)
n
Los resultados pueden ser los siguientes:

g = 0 (distribucion simetrica; existe la misma concentracion de valores a la derecha
y a la izquierda de la media).
g > 0 (distribucion asimetrica positiva; existe mayor concentracion de valores a la
izquierda de la media que a su derecha).
g < 0 (distribucion asimetrica negativa; existe mayor concentracion de valores a la
derecha de la media que a su izquierda).
Figura 2.11.: Distintas posibilidades de la forma del histograma en relacion con el valor
numerico de el coeficiente de Fisher.
Curtosis
El Coeficiente de Curtosis analiza el grado de concentracion que presentan los valores
alrededor de la zona central de la distribucion. Esto se traduce en cuan puntiaguda es la
56
2.5. Teorema que envuelven cuestiones sobre la Desviacion Estandar
distribucion, en general por referencia a la normal.
Se definen 3 tipos de distribuciones segun su grado de curtosis:
1. Distribucion mesocurtica: presenta un grado de concentracion medio alrededor de los

valores centrales de la variable (el mismo que presenta una distribucion normal).
2. Distribucion leptocurtica : presenta un elevado grado de concentracion alrededor de

los valores centrales de la variable.
3. Distribucion platicurtica: presenta un reducido grado de concentracion alrededor de

los valores centrales de la variable.
El coeficiente de curtosis puede ser calculado usando el cuarto momento de la media en

forma adimensional, el cual esta dado por
m4 m4
coeficiente de momento de curtosis = a4 = = 2. (2.69)
4 m2
Para una distrubicion normal el coeficiente anterior es 3. De all que es usual encontrarse
que el Coeficiente de Curtosis viene definido por la siguiente formula:
4
P
i (xi x)
n
k = hP 3 (2.70)
x)2 2
i
i (x i
n
Los resultados pueden ser los siguientes:
k = 0 (distribucion mesocurtica).
k > 0 (distribucion leptocurtica ).
k < 0 (distribucion platicurtica).
Ejemplo 2.21 Calcule los valores de los coeficientes de simetra de Fisher y de Curtosis
para todas las situaciones y conjunto de datos anteriores. Identifique los tipos de graficas
que sean.
2.5. Teorema que envuelven cuestiones sobre la Desviacion

Estandar
La desviacion estandar de una data es una cantidad importante debido a que limita
el numero de valores que pueden ser encontrados en alguna determinada region de la
distribucion respecto del promedio.
57
Figura 2.12.: Distintas posibilidades de la forma del histograma en relacion con el valor
numerico de el coeficiente de curtosis.
2.5.1. La regla emprica

Aplica solo cuando la distribucion de datos es del tipo campana, y establece que:
Aproximadamente el 68 % de los datos se encuentran a una desviacion estandar de

la media, es decir en el intervalo [x , x + ],
aproximadamente el 95 % de los datos se encuentran a dos desviacion estandar de la

media, es decir en el intervalo [x 2, x + 2],
aproximadamente el 99 % de los datos se encuentran a tres desviacion estandar de la

media, es decir en el intervalo [x 3, x + 3].
2.5.2. Teorema de Chebychev

Aplica a cualquier tipo de data. Establece que la porcion de valores que deben estar a
k-desviaciones de la media esta como mnimo a 1 k12 .
Nota: el teorema de Chebychev establece solo los lmites inferiores para en los cuales
se encuentra una determinada cantidad de datos, mientras que la regla emprica si que da
58
2.6. Medidas de Posicion
buenas aproximaciones.
Ejemplo 2.22 Haga uso de los teoremas anteriores sobre la desviacion estandar para ha-
cer un analisis de las distribuciones de las situaciones y conjunto de datos anteriores.

Las medidas de posicion nos facilitan informacion sobre la serie de datos que estamos
analizando. La descripcion de un conjunto de datos, incluye como un elemento de impor-
tancia la ubicacion de estos dentro de un contexto de valores posible.
Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En
vez de manejar todos los datos sobre las variables, tarea que puede ser pesada, podemos
caracterizar su distribucion de frecuencias mediante algunos valores numericos, eligiendo
como resumen de los datos un valor alrededor del cual se encuentran distribuidos los valores
de la variable. Pero estas medidas de posicion de una distribucion de frecuencias han de
cumplir determinadas condiciones para que sean verdaderamente representativas de la
variable a la que resumen. Toda sntesis de una distribucion se considerara como operativa
si intervienen en su determinacion todos y cada uno de los valores de la distribucion, siendo
unica para cada distribucion de frecuencias y siendo siempre calculable y de facil obtencion.
A continuacion se describen las medidas de posicion mas comunes utilizadas en estadstica,
como lo son:
Cuartiles: Hay 3 cuartiles que dividen a una distribucion en 4 partes iguales: pri-
mero, segundo y tercer cuartil.
Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).
Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (pri-
mero al noventa y nueve percentil).
2.6.1. Cuartiles
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro
partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1 , Q2 , Q3 . El segundo cuartil es precisamente

la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25 %) de todos los valores de la sucesion (ordenada); el tercer cuartil, es el valor en el cual
o por debajo del cual quedan las tres cuartas partes (75 %) de los datos.
Como los cuartiles adquieren su mayor importancia cuando contamos un numero grande
de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos
59
en una tabla de frecuencia. La formula para el calculo de los cuartiles cuando se trata de
datos agrupados es la siguiente:
N

k 4 Fk
Qk = Lk + c, para k = 1, 2, 3 (2.71)
fk
donde:
Lk = Lmite real inferior de la clase del cuartil k,
N = Numero de datos,
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k,
fk = Frecuencia de la clase del cuartil k,
c = Longitud del intervalo de la clase del cuartil k.
2.6.2. Deciles
Los deciles son ciertos numeros que dividen la sucesion de datos ordenados en diez partes
porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados
en diez partes iguales, son tambien un caso particular de los percentiles. Los deciles se
denotan D1 , D2 ,..., D9 , que se leen primer decil, segundo decil, etc. Los deciles, al igual
que los cuartiles, son ampliamente utilizados. Para datos agrupados los deciles se calculan
mediante la formula.
N

k 10 Fk
Dk = Lk + c, para k = 1, 2, ..., 9 (2.72)
fk
donde:
Lk = Lmite real inferior de la clase del decil k,
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k,
fk = Frecuencia de la clase del decil k,
c = Longitud del intervalo de la clase del decil k.
60
2.6.3. Centiles o percentiles

Los percentiles son, tal vez, las medidas mas utilizadas para propositos de ubicacion o
clasificacion de las personas cuando atienden caractersticas tales como peso, estatura, etc.
Los percentiles son ciertos numeros que dividen la sucesion de datos ordenados en cien
partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales
el conjunto de datos ordenados. Los percentiles (P1 , P2 ,..., P99 ), ledos primer percentil,...,
percentil 99. Cuando los datos estan agrupados en una tabla de frecuencias, se calculan
mediante la formula:
N

k 100 Fk
Pk = Lk + c, para k = 1, 2, ..., 99 (2.73)
fk
donde:
Lk = Lmite real inferior de la clase del decil k,
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k,
fk = Frecuencia de la clase del decil k,
c = Longitud del intervalo de la clase del decil k.
Ejemplo 2.23 Calcule los valores de los tres cuartiles, los diez deciles y algunos de los
centiles para todas las situaciones y conjunto de datos anteriores.
Ejemplo 2.24 La tabla siguiente muestra una distribucion de frecuencias de 400 valvulas
de radio probadas en la empresa L&M. Vamos a hacer un estuido completo descriptivo de
la misma.
Vida media (horas100) Numero de tubos
3-3.99 14
4-4.99 46
5-5.99 58
6-6.99 76
7-7.99 68
8-8.99 62
9-9.99 48
10-10.99 22
11-11.99 6
Vease que aqu se presenta la tabla de los datos ya agrupados en clases, de hecho se han
dispuesto nueve clases. Esto esta aproximadamente de acuerdo con la regla de Sturges
dado que N = 1 + 3,3log(400) = 9,58. Los autores de la tabla han elegido un intervalo de
61
clase menos, sin embargo, la tabla anterior esta bastante bien construida. Para resolver el
problema de calcular todos los estadsticos para esta situacion se tiene que podemos ampliar
la tabla anterior como sigue:
li ls xM fi fr fr % Fa xi fi (xi x) |xi x|fi (xi x)2 fi (xi x)3 fi (xi x)4 fi
3 3.99 3.49 14 0.035 3.5 14 48,93 -3.65 51.17 187.02 -683.58 2498.48
4 4.99 4.49 46 0.115 11.5 60 206.77 -2.65 122.13 324.25 -860.89 2285.68
5 5.99 5.49 58 0.145 14.5 118 318.71 -1.65 95.99 158.86 -262.91 435.13
6 6.99 6.49 76 0.19 19 194 493.62 -0.65 49.78 32.60 -21.35 13.98
7 7.99 7.49 68 0.17 17 262 509.66 0.34 23.46 8.09 2.79 0.96
8 8.99 8.49 62 0.155 15.5 324 526.69 1.34 83.39 112.15 150.85 202.89
9 9.99 9.49 48 0.12 12 372 455.76 2.34 112.56 263.95 618.97 1451.48
10 10.99 10.49 22 0.055 5.5 394 230.89 3.34 73.59 246.15 823.40 2754.27
11 11.99 11.49 6 0.015 1.5 400 68.97 4.34 26.07 113.27 492.17 2138.50
400 1 100 2860 638.14 1446.39 259.43 11781.41
A partir de la tabla anterior podemos ver que la media esta dada por
X xi fi 2860
x = = = 7,15. (2.74)
N 400
Para el calculo de la mediana, veamos que basta con calcular el cuartil 2, en este caso se
tendra que N/2 = 200, por lo que la mediana se encuentra en la clase (7;7.99), el lmite
inferior de esta clase es 7, la frecuencia acumulada de la clase que antecede a esta es 194,
mientras que la frecuencia absoluta de la clase que lo contiene es 68, el ancho de la clase
es 1.99, por tanto,
200 194
x0,5 = Q2 = 7 + 1,99 = 7,17. (2.75)
68
La moda es claramente m = 7,49, aunque usando la correccion dada para la moda dada en
la formula (2.28), se tiene que Delta1 = 68 62 = 6, Delta2 = 76 68 = 8, luego

1 8
m = L1 + c = 7,49 + 1,99 = 8,62. (2.76)
1 + 2 14
Por otro lado viendo ahora las medidas de dispersion tendremos que el rango es 7.99,
mientras que la desviacion media dara
X |xi x|fi 638,14
dM := = = 1,59. (2.77)
N 400
La varianza dara
X (xi x)2 fi
1446,39
s2 := = = 3,61, (2.78)
N 400
p
y por tanto la desviacion estandar sera de = (s2 ) = 1,90. Notese que ambas desvia-
ciones dan como resultado un valor cercano. El coeficiente de dispersion de Pearso o de
variabilidad para esta situacion es entonces p := /x = 0,26, lo que es obviamente mayor
que 0.20 y por tanto la media no es muy representativa. Por ultimo las medidas de simetra
daran como resultado
P (xi x)3 fi
N 0,64
Coef. Fisher g := = = 0,09,
P (xi x)2 fi 3/2 6,87
N
62
2.7. Problemas de final de captulo
P (xi x)4 fi
N 29,45
Coef. curtosis k := P 2 3 = 3 = 0,74.
2
(xi x) fi 13,07
N
Como conclusion general puede verse que la media de los tubos es de 715 horas, por lo que
se espera que la mayora de los tubos duren este tiempo. Ademas se conoce que 200 tubos
tienen tiempos menores o iguales a 717 horas, mientras que otros 200 tubos tienen tiempos
mayores a 717 horas. Tambien 68 tubos, lo cual representa el 17 % de todos los tubos tienen
un tiempo de 749 horas. El error cometido al tratar de estimar la duracion de los tubos
es 190 horas, lo cual representa mucho en virtud del coeficiente de variabilidad p = 0,26,
que es mayor que 0.20 y por tanto la media deja de ser representativa de los datos. Esto
quiere decir que no pueden establecerse conclusiones fiables a partir de la media, lo que
obliga a estimar con otras medidas como la mediana y algunos percentiles. La distribucion
de los datos es ademas simetrica pero ligeramente platicurtica, lo cual esta de acuerdo con
el hecho de que el error sea un poco grande para esta media.

A continuacion una serie de problemas de repaso y estudio para fijar los conceptos
anteriores. En cada uno de los problemas pudiera usarse todo lo reflejado en estas notas,
as como tambien cualquier herramienta computacional o tecnologica disponible.
1. Probar que N
P PN PN PN
j=1 (axj + byj + czj ) = a j=1 xj + b j=1 yj + c j=1 zj , donde a, b
y c son constantes.
2. Las medidas del diametro de un cilindro en un laboratorio fueron medidas por un
cientfico dando como resultado 15cm, 16cm, 16.5cm, 40cm. Calcule la media y diga
si ese promedio es tpico o representativo de dichas medidas.
3. Probar que la suma de las desviaciones de x1 , x2 ,...,xN respecto de la media x es
cero.
4. Tome los primeros 100 decimales del numero irracional y calcule la media, mediana
y moda, haciendo para tal fin una tabla de distribucion de frecuencias o otra agrupada
por clases.
5. Pruebe usando argumentos geometricos la ecuacion para la moda (2.28). Use esta
para encontrar la moda para los datos del problema anterior.
6. Use la regla emprica expresada en (2.29) para obtener el valor de la moda en el
problema 2. Compare con el valor obtenido en el problema anterior.
7. Un avion vuela d1 , d2 y d3 millas a velocidades v1 , v2 y v3 millas/horas respectiva-
mente. Probar que su velocidad media es V , dada por
d1 + d2 + d3 d1 d2 d3
= + + , (2.79)
V v1 v2 v3
63
es una media armonica ponderada.
8. Hallar los tres cuartiles Q1 , Q2 y Q3 para el problema de los decimales de .
9. Hallar el segundo decil, el cuarto decil, el percentil noventa y el percentil 68 para los
datos de los decimales de .
10. Dado un conkunto de datos cuyos cuartiles son conocidos, pudiera establecerse otro
coeficiente de variacion sabiendo que dado los cuartiles Q1 y Q3 determinan que:
1 1
2 (Q1 + Q3 ) es una medida de tendencia central o promedio, mientras que 2 (Q3 Q1 )
es el rango intercuartil, es una medida de dispersion, entonces un coeficiente de
variacion pudiera estar dado por
1
2 (Q3 Q1 ) (Q3 Q1 )
VQ := 1 = , (2.80)
2 (Q3 + Q1 ) (Q3 + Q1 )
a este coeficiente pudieramos llamarlo el coeficiente de variacion cuartil. Use los datos
del problema de los decimales de para hallar el coeficiente de variacion de Pearson
(el estandar) y compare con el conseguido con la formula anterior.
11. Considere ahora los primeros 100 decimales del numero irracional e, el usado como la
base del logaritmo neperiano, para calcular el porcentaje de datos entre x , x 2
y x 3 y compare con la regla emprica para la desviacion estandar.
12. Use los datos de los problemas de los decimales de y de los decimales de e para
hallar la desviacion corregida de Sheppard y comparar con los nuevos coeficientes de
variabilidad.
13. Una compana de farmacos en La Coruna, Espana, esta probando un nuevo medica-
mento experimental para los espasmos musculares, al cual se le ha dado el nombre de
ESPASMIN. Se les suministra dicho medicamento a un grupo de pacientes de control
durante 5 das, todos ellos padecen de espasmos musculares (todos los das tienen los
musculos contraidos). Se realiza un estudio sobre el numero de das que un paciente
sufre mejora con el anterior medicamento obteniendo la tabla:
Datos (xi ) (das) Frecuencias

0 100
1 250
2 300
3 500
4 450
5 2000
(a) Realizando el grafico adecuado y hallando los promedios (Media aritmetica, Me-
dia armonica, Media geometrica, Moda, y Mediana), indicar cual sera el que mejor
64
representara los datos, (Contesta razonadamente y con el mayor detalle posible). (b)
Calcula tambien el porcentaje de pacientes que sienten mejora con el medicamento
en todos los das del tratamiento. (c) Por que no calculamos el coeficiente de varia-
cion para ver la representatividad de la media? (d) Habra que hallarlo?. (e) Calcula
el D3 , Q3 , P65 . Que significados tienen?
A aquellos pacientes que sienten mejora todos los das del tratamiento se les realiza
un estudio sobre el tiempo de reaccion del medicamento (en minutos), encontrandose
recogido los datos en la siguiente tabla:
Tiempo de reaccion Numero de pacientes

0-10 300
10-20 500
20-30 400
30-40 500
40-50 300
Se pide: (a) Escribir las formulas de las diferentes medias e indicar cual de las tres te
parece mas adecuada para aplicar en este ejercicio (Razonadamente). (b) A todos los
pacientes que tardan en reaccionar mas de 35 se le aplica el medicamento comple-
mentario MUSCULING para acelerar los efectos de ESPASMIN. Hallar el numero de
pacientes a los que se le aplica este segundo medicamento. (c) Estudiar la representa-
tividad del tiempo medio de reaccion. Es representativo? Por que? (d) El Gobierno
esta pensando en introducir un medicamento con las caractersticas de ESPASMIN.
Existen en el mercado junto con este dos productos mas. El tiempo medio de reaccion
de cada uno de ellos es respectivamente 25 y 30 minutos, con una varianza de 200
y 300 minutos2 . Explica detalladamente que criterio de seleccion estadstico podra
aplicar el Gobierno. Segun el criterio anterior que medicamento sera el que pasara
a engrosar la lista de medicamentos de la Seguridad Social.
14. Se ha realizado una encuesta a 30 personas en la que se les pregunta el numero de
personas que conviven en el domicilio habitualmente. Las respuestas obtenidas han
sido las siguientes: 1, 4, 4, 1, 3, 5, 3, 2, 4, 1, 6, 2, 3, 4, 5, 5, 6, 2, 3, 3, 2, 2, 1, 8, 3,
5, 3, 4, 7, 2, 3. (a) Calcule la distribucion de frecuencias de la variable obteniendo
las frecuencias absolutas, relativas y sus correspondientes acumuladas. (b) Que pro-
porcion de hogares esta compuesta por tres o menos personas? Que proporcion de
individuos vive en hogares con tres o menos miembros? (c) Dibuje el diagrama de
barras de frecuencias y el diagrama en escalera. (d) Agrupe por intervalos de ampli-
tud 2 los valores de la variable, calcule su distribucion de frecuencias y represente el
histograma correspondiente.
15. Tenemos la siguiente informacion sobre el gasto semanal en ocio de un grupo de
estudiantes universitarios.
65
Nivel de gastos # de Jovenes

0-5 4
5-10 11
10-15 16
15-20 22
20-25 8
25-30 6
(a) Calcule la distribucion de frecuencias de la variable y las densidades de frecuen-

cias. (b) Dibuje el histograma de frecuencias. (c) Dibuje el polgono de frecuencias
acumuladas.
16. En un estudio sobre consumo de gasolina en una gran ciudad se eligio una muestra de
100 vehculos y se observo el numero de litros que consuman en un da, obteniendose
la siguiente distribucion de frecuencias.
# de Litros # de Automoviles
1-7 4
7-10 8
10-12 35
12-14 30
14-18 20
18-25 3
(a) Calcule la distribucion de frecuencias, obteniendo, ademas, la amplitud de cada

intervalo as como sus respectivas marcas de clase y las densidades de frecuencia. (b)
Represente graficamente la distribucion de frecuencias mediante un histograma.
17. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observa-
do el numero de empleados que hay en cada una de ellas para un estudio posterior.
Las observaciones obtenidas han sido: 12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13,
14, 15, 11, 11, 12, 16, 17, 17, 16, 16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14,
16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12. (a) Calcule la distribu-
cion de frecuencias de la variable obteniendo las frecuencias absolutas, relativas y
sus correspondientes acumuladas. (b) Que proporcion de sucursales tiene mas de 15
empleados? (c) Dibuje el diagrama de barras y el diagrama en escalera correspon-
dientes. (d) Agrupe en intervalos de amplitud 3 los valores de la variable, calcule su
distribucion de frecuencias y represente su histograma y su polgono de frecuencias
acumuladas. (e) Agrupe la variable en los intervalos que considere conveniente de
amplitud variable, calcule las densidades de frecuencia de cada intervalo y represente
el histograma correspondiente.
18. La siguiente distribucion expresa el numero de coches vendidos durante una semana
por cada uno de los 50 concesionarios que una determinada firma tiene en Espana:
66
# de autos vendidos # de Concesionarios

1 5
3 12
4 20
6 8
10 5
Se pide: (a) Media aritmetica, mediana y moda. (b) Desviacion tpica, coeficiente
de correlacion, coeficiente de variacion de Pearson. (c) Coeficientes de asimetra de
Fisher y de Curtosis, compruebe con la forma del polgono de frecuencias. Para todo
haga siempre un analisis de los datos y los estimadores calculados.
19. Sea la distribucion referida a beneficios anuales de 38 empresas madrilenas:
Beneficio (Miles de Euros) # de Empresas

230-280 5
280-330 7
330-580 14
580-630 9
630-780 3
Se pide: (a) Calcular el beneficio medio de estas 38 empresas madrilenas. (b) Cual
es el beneficio mayor de la mitad de las empresas mas modestas? (c) Determinar el
beneficio mas frecuente. (d) Estudiar la dispersion de esta distribucion a partir del
recorrido intercuartlico, desviacion tpica y coeficiente de variacion de Pearson. (e)
Estudiar la forma de esta distribucion.
20. La distribucion del importe de las facturas por reparacion de carrocera de una mues-
tra de 80 vehculos en un taller, viene dada por la tabla siguiente:
Importe (Euros) # de Vehculos

0-60 10
60-80 20
80-120 40
120-240 10
Se pide: (a) Calcular el importe medio. Estudiar la representatividad de esta media.

(b) Calcular el importe mediano y el importe mas frecuente. (c) Que interpretacion
tienen en este caso los deciles? Calcular el tercer decil. (d) Cual es el importe maximo
pagado por las 60 reparaciones mas baratas? (e) Estudiar la asimetra a partir del
coeficiente de asimetra de Fisher. (f) Estudiar la curtosis.
67
21. Una empresa tena a finales de 2003 mil seiscientos cincuenta accionistas distribuidos
de la siguiente forma:
# de acciones # de accionistas
0-20 1030
20-60 380
60-100 180
100-500 50
500-1000 10
Se pide: (a) Hallar el numero medio de acciones por accionista y su desviacion tpica.
(b) Hallar la mediana. (c) Decida, con base estadstica, el grado de concentracion
de las acciones. (d) Que porcentaje del total de acciones poseen los accionistas
mayoritarios? (e) Que porcentaje de los accionistas minoritarios posee el 20 % del
total de acciones?
22. Suponga que usted es el estadstico oficial de lneas aereas KLM y que el presidente
del consejo de administracion le ha pedido que recoja y organice datos relativos a las
operaciones de vuelo. Su interes principal a partir de los valores diarios se centra en
la variable de numero de pasajeros. Ha obtenido estos datos de los diarios de vuelo
de los ultimos 50 das y ha reflejado esta informacion:
68, 71, 77, 83, 79, 72, 74, 57, 67, 69, 50, 60, 70, 66, 76, 70, 84, 59, 75, 94, 65, 72, 85,
79, 71, 83, 84, 74, 82, 97, 77, 73, 78, 93, 95, 78, 81, 79, 90, 83, 80, 84, 91, 101, 86, 93,
92, 102, 80, 69.
Usted debe analizar la situacion completa. Calcule todos los estadsiticos descriptivos,
haga graficos, calcule las medidas de posicion que crea convenientes e interesantes.
De una conclusion general de la situacion.
23. Mr. Bissey, el vicepresidente del Bank One de Indianapolis, lleva tambien un registro
de las cuentas de ahorro personal. Los saldos de las 40 nuevas cuentas que se abrieron
el ultimo mes fueron:
179.8, 1200, 293, 602.02, 1482, 579, 312.52, 100, 695.15, 287, 1175.00, 952.51, 1112.52,
783.00, 1212.43, 510.52, 1394.05, 1390.00, 783, 1101, 666.66, 780, 793.1, 501.01,
1555.10, 352, 112.17, 470.53, 415.00, 1009.1, 712.1, 1150, 890, 937.01, 711.11, 1422.03,
1595.1, 217, 1202, 1273.01. Haga el mismo analisis que para el problema anterior.
68
3. Metodos cuantitativos de analisis
predictivo, regresion
One of the main purposes of scientific inference is to justify beliefs which we entertain already;
but as a rule they are justified with a difference. Our pre-scientific general beliefs are hardly ever
without exceptions; in science, a law with exceptions can only be tolerated as a makeshift.
Scientific laws, when we have reason to think them accurate, are different in form from the
common-sense rules which have exceptions: they are always, at least in physics, either differential
equations, or statistical averages. It might be thought that a statistical average is not very
different from a rule with exceptions, but this would be a mistake. Statistics, ideally, are accurate
laws about large groups; they differ from other laws only in being about groups, not about
individuals. Statistical laws are inferred by induction from particular statistics, just as other laws
are inferred from particular single occurrences.
- Bertrand Russell. The Analysis of Matter (1927), 191.
3.1. Correlacion y regresion

En fsica como en otras areas es importante a veces, tener una relacion entre muchos datos
de los que se estudian para una situacion dada. Por ejemplo, en un caso sencillo, digamos
que alguien esta interesado un pequeno problema para estudiar una cierta caracterstica en
unos moluscos muy raros con caparazon. Para dicho estudio digamos que el investigador,
como primer paso, toma datos de los pesos y las dimensiones del caparazon de dichos
moluscos. Como usted podra inferir, es muy posible, que para la poblacion de estudio,
una dimension grande en la muestra de los caparazones pudiera corresponder a caracoles
o moluscos mas pesados. As, uno estara tentado a decir que el tamano del caparazon
esta relacionado con el peso del molusco. Esto, por su puesto, es una suposicion ya que
podra haber resultados para los cuales esto no sea cierto. As que desde luego, como
siempre todo debe tomarse supuesto, en el sentido estricto estadstico.
Como veremos mas adelante, algunas veces es posible emparentar, o en otras palabras
mas tecnicas, relacionar ambas caractersticas de alguna manera funcional, o mejor dicho,
a traves de una funcion. Si este fuera el caso entonces uno pudiera inferir, a partir de
la funcion que relaciona dichas variables, una descripcion de la poblacion de estudio y/o
catalogar especies en terminos de sus caractersticas. Hay que advertir, que pudieramos
tener tambien una relacion entre ambas variables o caractersticas que no sea funcional, es
posible, sin embargo, no nos interesaremos por ese tipo de relaciones. Estamos interesado
69
3. Metodos cuantitativos de analisis predictivo, regresion
en las relaciones que se pueden hacer cuando una o mas variables estan emparentadas a
traves de alguna(s) funcion(es) matematicas. El presente captulo esta dedicado a estas
cuestiones. Esto sera, como veremos util para resolver muchos problemas.
3.2. Distribuciones bidimensionales

Cuando sobre una poblacion estudiamos simultaneamente los valores de dos variables
estadsticas, el conjunto de los pares de valores correspondientes a cada individuo se deno-
mina distribucion bidimensional.
Ejemplo 3.1 Las notas de 10 alumnos en Matematicas y en Fsica vienen dadas en la
siguiente tabla:
Fsica 4 10 10 12 12 14 14 16 18 16
Matematicas 4 4 10 12 10 14 10 16 14 20
Los pares de valores (4,4),(10,4),(10,10),...;(18,14),(16,20), forman la distribucion bidi-
mensional.
3.3. La idea de la correlacion

Es frecuente que estudiemos sobre una misma poblacion los valores de dos variables
estadsticas distintas, con el fin de ver si existe alguna relacion entre ellas, es decir, si los
cambios en una de ellas influyen en los valores de la otra. Si ocurre esto decimos que las
variables estan correlacionadas o bien que hay correlacion entre ellas.
En el ejemplo anterior parece que hay cierta tendencia a que cuanto mejor es la nota en
Fsica, mejor es la de Matematica.
La primera forma de describir una distribucion bidimensional (y por tanto, saber si lo
es) es representar los pares de valores en el plano cartesiano. El grafico obtenido recibe el
nombre de nube de puntos o diagrama de dispersion.
Cuando observamos una nube de puntos podemos apreciar si los puntos se agrupan
cerca de alguna curva. Aqu nos limitaremos a ver si los puntos se distribuyen alrededor
de una recta. Si as ocurre diremos que hay correlacion lineal. La recta se denomina recta
de regresion.
Hablaremos de correlacion lineal fuerte cuando la nube se parezca mucho a una recta
y sera cada vez mas debil (o menos fuerte) cuando la nube vaya desparramandose con
respecto a la recta.
En el grafico observamos que en nuestro ejemplo la correlacion es bastante fuerte, ya que
la recta que hemos dibujado esta proxima a los puntos de la nube.
Cuando la recta es creciente la correlacion es positiva o directa: al aumentar una variable,
la otra tiene tambien tendencia a aumentar, como en el ejemplo anterior. Cuando la recta
es decreciente la correlacion es negativa o inversa: al aumentar una variable, la otra tiene
tendencia a disminuir.
70
3.3. La idea de la correlacion
Figura 3.1.: Ejemplo de de un diagrama de dispersion o nube de puntos.
Figura 3.2.: Regresion lineal: Los puntos tienden a describirse a partir de una recta que los
representa aproximadamente a todos.
Ejemplo 3.2 Una persona se entrena para obtener el carnet de conducir repitiendo un
test de 50 preguntas. En la grafica se describen el numero de errores que corresponden a
los intentos realizados. Observa que hay una correlacion muy fuerte (los puntos estan casi
alineados) y negativa (la recta es decreciente).
Ejemplo 3.3 A 12 alumnos de un centro se les pregunto a que distancia estaba su resi-
dencia de la Universidad, con fin de estudiar si esta variable estaba relacionada con la nota
media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla:
Distancia (en Km) 0.05 0.1 0.12 0.4 0.5 0.7 1 1.2 2.1 2.5 3 3
Nota media 8.4 4 5.7 9.1 6.3 6.7 4.3 5.4 7.8 4.5 7.2 8.1
71
Figura 3.3.: Regresion lineal: la cantidad de intentos a medida que aumenta hace que el
numero de error disminuya.
Observamos una nube de puntos que no nos sugiere ninguna recta concreta, porque la
correlacion es practicamente inexistente, es decir, no tiene nada que ver con el rendimiento
academico la distancia del domicilio a la Universidad.
Figura 3.4.: Regresion lineal: Al parecer existe relacion entre la distancia a la que se vive
de la Universidad y la calificacion que se obtiene.
3.4. Encontrando la relacion. Regresion

3.4.1. El coeficiente de correlacion
Solo para recordar, tenga en cuenta la leccion aprendida en la seccion (2.3.7). Tenamos
que el coeficiente de correlacion de Pearson, r, nos permite saber si el ajuste de la nube de
72
puntos a la recta de regresion obtenida es satisfactorio. Se define como el cociente entre la

covarianza y el producto de las desviaciones tpicas (raz cuadrada de las varianzas).
Vxy Sxy Sxy
r=p =q = . (3.1)
Vx Vy Sx2 Sy2 Sx Sy
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante

cualquiera de las dos expresiones siguientes:
P
xi yi
n xy
r = r P , (3.2)
x2i
P 2
2 yi 2
n x n y
P P P
n x i yi x i yi
r = rh . (3.3)
P 2 P 2i h P 2 P 2i
n xi ( xi ) n yi ( yi )
El coeficiente de correlacion tena las siguientes propiedades muy interesantes:

El coeficiente de correlacion, r, presenta valores entre -1 y +1.
Cuando r es proximo a 0, no hay correlacion lineal entre las variables. La nube de

puntos esta muy dispersa o bien no forma una lnea recta. No se puede trazar una
recta de regresion.
Cuando r es cercano a +1, hay una buena correlacion positiva entre las variables
positiva, sera creciente.
Cuando r es cercano a -1, hay una buena correlacion negativa entre las variables
negativa: es decreciente.
3.4.2. Regresion lineal. El Metodo de los Mnimos Cuadrados

Hemos enfatizado sobre la importancia de las representaciones graficas y hemos visto la
utilidad de las versiones linealizadas de los graficos (X,Y). A menudo nos confrontamos con
situaciones en las que existe o suponemos que existe una relacion lineal entre las variables
X e Y.
Surge de modo natural la pregunta: cual es la relacion analtica que mejor se ajusta
a nuestros datos? El metodo de cuadrados mnimos es un procedimiento general que nos
permite responder esta pregunta. Cuando la relacion entre las variables X e Y es lineal, el
metodo de ajuste por cuadrados mnimos se denomina tambien metodo de regresion lineal.
En este captulo discutiremos este ultimo caso. El lector puede consultar a continuacion
73
Figura 3.5.: Regresion no lineal.
una discusion del caso general de cuadrados mnimos cuando el modelo es no lineal y los
datos estan afectados de errores.
La dispersion de los valores esta asociada a la fluctuacion de los valores de cada variable.
Observamos o suponemos una tendencia lineal entre las variables y nos preguntamos sobre
cual es la mejor recta:
y(x) = ax + b, (3.4)
que representa el caso de interes.
Figura 3.6.: La curva de regresion lineal en terminos de los cambios de la funcion.
74
Es util definir la funcion 2 (Chi-cuadrado):

X
2 = [yi (axi + b)]2 , (3.5)
i
que es una medida de la desviacion total de los valores observados yi respecto de los
predichos por el modelo lineal ax + b. Los mejores valores de la pendiente a y la ordenada
al origen b son aquellos que minimizan esta desviacion total, o sea, son los valores que
remplazados en la ecuacion (3.4) minimizan la funcion 2 , ecuacion (3.5). Los parametros
a y b pueden obtenerse usando tecnicas matematicas que hacen uso del calculo diferencial.
Aplicando estas tecnicas, el problema de minimizacion se reduce al de resolver el par de
ecuaciones:
d 2 d 2
= 0, = 0, (3.6)
da db
de donde resulta despues de algunos calculos
P P P
N x i yi x i yi
a= , (3.7)
N x2i ( xi )2
P P
N x2i
P P P P
yi x i x i yi
b= . (3.8)
N x2i ( xi )2
P P
Actualmente, la mayora de los programas de analisis de datos y plantillas de calculo,

realizan el proceso de minimizacion en forma automatica y dan los resultados de los mejores
valores de a y b, o sea los valores indicado por la ecuaciones anteriores.
El criterio de mnimos cuadrados reemplaza el juicio personal de quien mire los graficos
y defina cual es la mejor recta. En los programas como Excel, Origin, etc., este calculo se
realiza usando la herramienta regresion lineal o ajuste lineal.
Los resultados en las ecuaciones anteriores se aplican en el caso lineal cuando todos los
datos de la variable dependiente tienen la misma incertidumbre absoluta y la incertidumbre
de la variable independiente se considera despreciable.
Una medida de la calidad o bondad del ajuste realizado viene dado por el coeficiente de
correlacion de Pearson entre las variables X e Y, escrito ahora equivalentemente como:
Cov(x, y)2
r2 = , (3.9)
V ar(x) V ar(y)
P P P
N x i yi x i yi
Cov(x, y) = , (3.10)
N2
P 2 P 2
xi xi
V ar(x) = =< x2 >< x >2 , (3.11)
N N
P 2 P 2
yi yi
V ar(y) = =< y 2 >< y >2 . (3.12)
N N
El valor de r vara entre -1 y 1 como siempre. Si r es 1 o proximo a estos valores,
decimos que el modelo lineal es adecuado para describir los datos experimentales. Cuando
75
r se aparta de estos extremos decimos que una expresion lineal no es una buena descripcion
de los datos. En este caso, conviene analizar el grafico y buscar una relacion no-lineal que
aproxime mejor la dependencia. Dado que r mide el grado de correlacion lineal entre los
datos, si, por ejemplo, los pares de puntos (X,Y) tienen una relacion tal que caen sobre
un crculo, aunque ellos estan correlacionados, tendramos r 0. Desde luego, si los pares
(X,Y) no tienen correlacion alguna entre ellos, tambien tendramos r 0.
Frecuentemente el resultado que deseamos determinar de nuestro experimento es alguno
de los parametros de la ecuacion (3.4). Por ejemplo, si deseamos determinar la constante
elastica k de un resorte a partir de mediciones de fuerzas aplicadas Fi y estiramientos xi
que le producen al resorte, k sera precisamente la pendiente de la recta que mejor se ajusta
a los datos. Otro ejemplo es la obtencion de la resistencia electrica R de un conductor, que
deseamos determinar a partir de mediciones de tension Vi y la corriente que lo atraviesa
Ii . Por consiguiente, es util disponer de un modo de estimar las incertidumbres asociadas
a la determinacion de los parametros a y b de la ecuacion (3.4).
La importancia del metodo de cuadrados mnimos reside en el hecho que nos permite
obtener valores de la desviacion estandar o sea los errores asociados a los parametros
a y b, que denotaremos con los smbolos a y b . En esta seccion solo presentamos los
resultados de utilidad mas frecuente en el laboratorio; el lector interesado podra encontrar
un tratamiento mas exhaustivo en las referencias. Las incertidumbres de los parametros
del ajuste vienen dadas por las expresiones:
s
2N
a = , (3.13)
N V ar(x)
s
2N x2i
P
b = , (3.14)
N V ar(x)
donde 2N , conocido como el valor de Chi-cuadrado por grado de libertad, viene dada por:
1
2N = 2 . (3.15)
N 2
Las incertidumbres de los parametros a y b tambien pueden escribirse en terminos del
coeficiente de correlacion r del siguiente modo:
s
a2

1
a = 1 , (3.16)
N 2 r2

b = a < x2 >, (3.17)
donde
x2i
P
2
< x >= . (3.18)
N
Estas expresiones son de mucha utilidad para estimar a y b , ya que la mayora de
las plantillas de calculo y programas de ajuste, por los regular indican los valores de los
parametros a y b que mejor ajustan los datos y el valor de r.
76
Precauciones en el analisis
No siempre es suficiente admitir que dos variables siguen una relacion lineal guiandonos
por lo que muestra un grafico de los datos en escalas lineales. Menos aun si solo evaluamos
el coeficiente de correlacion del ajuste lineal que propondramos a partir de este grafico.
Un grafico de Y = X 1,1 (variables sin correlacion lineal) puede ajustarse por una recta y
obtenerse a la vez un coeficiente de correlacion lineal (inexistente) de, por ejemplo, 0,998.
Un grafico de datos experimentales de Y = X con algo de dispersion fortuita de los puntos,
podra devenir en un coeficiente de, por ejemplo, 0,995, menor que el anterior. Entre los
coeficientes hay una diferencia, apenas, del 3 por mil. Pero en un grafico log-log, la diferen-
cia de pendientes sera la que hay entre 1.1 y 1.0, lo que representa un 10 % de discrepancia
entre los exponentes de la variable X.
Estos metodos de analisis nos ensenan que los efectos de correlacion pueden estar en-
mascarados por el efecto del ruido de los datos. En ocasiones lo difcil es establecer si
existe correlacion entre las variables, aun cuando los datos provengan de fuentes limpias
que hayan producido datos con relativamente poca dispersion.
Muchas veces la decision entre dos alternativas debe hacerse usando otros criterios. Por
ejemplo, la consistencia con otros conjuntos de datos o sobre la base de consideraciones de
simetra o concordancia con teoras bien establecidas.
Ejemplo 3.4 Imaginemos un experimento donde se mide la distancia que recorre un movil
sobre una lnea recta mientras una fuerza constante actua sobre el. Esperamos que el mo-
vimiento sea uniformemente acelerado. Supongamos que el cuerpo parte del reposo, que
medimos x(t) a tiempos largos. En la figura se ven los resultados.
Si los datos experimentales se analizan sobre el grafico de escalas lineales, el ajuste por
un modelo lineal es mas que tentador. Hecho esto, se obtiene la ecuacion de la mejor recta
y un coeficiente de correlacion muy alto, r = 0,99959. Sin embargo, un modelo basado en
las ecuaciones de la dinamica dice que
1
x = at2 , (3.19)
2
donde a es la aceleracion. En la Figura estan los logaritmos de los mismos datos, de donde
se ve claramente la proporcionalidad x t2 que predice el modelo, difcilmente demostrable
a partir del grafico de la Figura. Evidentemente, el uso de una aproximacion lineal no
es buena en este problema y el mero juicio del valor del coeficiente de correlacion no es
suficiente.

77
Figura 3.7.: Representacion de x(t) para un cuerpo que se mueve con movimiento unifor-
memente acelerado. (a) A tiempos largos no se aprecia bien la curvatura de
la curva y, dado que el coeficiente de correlacion lineal es muy cercano a la
unidad, podra suponerse que la correlacion es lineal. (b) log(x) en funcion de
log(t), de donde se deduce que la relacion no es lineal sino cuadratica.

1. La siguiente data representa las puntuaciones de 10 estudiantes que han tomado
cursos de matematicas y de fsica en la Universidad de Zaragoza para el programa
de nivelacion de la carrera en Fsica Aplicada de esta universidad.
Estudiante 1 2 3 4 5 6 7 8 9 10
Matematicas (< 30) 20 23 8 29 14 11 11 20 17 17
Fsica (< 40) 30 35 21 33 33 26 22 31 33 36
Haga un grafico de dispersion de estos datos y marque en dicho diagrama la media

de cada una de las variables y calcule el coeficiente de correlacion para estos datos.
Determine si existe o no relacion. El profesor a cargo tiene la impresion de que quien
sabe mucha fsica tambien sabe mucha matematica. Es esto cierto?
78
2. Un grupo de doce ninos participaron en un estudio psicologico disenado para evaluar

la relacion, si la hay, entre la edad, x (anos), y el tiempo promedio total de sueno
(ATST), en minutos y. Para obtener una medida de ATST, las grabaciones fueron
tomadas en cada nino en cinco noches consecutivas y un promedio de entonces. Los
resultados obtenidos se muestran en la tabla.
1 2 3 4 5 6 7 8 9 10 11 12
x 4.4 6.7 10.5 9.6 12.4 5.5 11.1 8.6 14.0 10.1 7.2 7.9
y 586 565 515 532 478 560 493 533 575 490 530 515
Calcular el valor del coeficiente de correlacion del momento del producto entre x e
y. Evaluar la significacion estadstica de su valor e interpretar sus resultados.
3. El diametro de las plantas tipo lquenes mas largas que crecen en lapidas se midieron
y se presentan los resultados en la siguiente tabla
Edad de la lapida (anos) Diametro del lquen (mm)

9 2
18 3
20 4
31 20
44 22
52 41
53 35
61 22
63 28
63 32
64 35
64 41
114 51
141 52
Haga un diagrama de sipersion de los puntos. Calcule las media de cada variable
as como sus varianzas y tambien el coeficiente de correlacion entre ambas variables.
Concluya.
4. Calcule el coeficiente de correlacion de la siguiente data con variables aleatorias X e

2
Y , RXY
X 11 17 26
Y 23 18 19
79
Ahora suponga que la variable aleatoria Y es convertida a otra variable aleatoria Z

por medio de la aplicacion de la formula
Y
Z= + 3,
10
entonces se tiene una nueva tabla para variables aleatorias X y Z que debe construir
X 11 17 26
Z
Complete la tabla anterior y evalue el coeficiente de correlacion ahora entre las varia-
2 . Establezca ademas el resultado del coeficiente de correlacion entre
bles X y Z, RXZ
2
Y y Z, RY Z Trate de hacer relaciones entre estos tres coeficientes de correlacion.
5. En un experimento de biologa una serie de bacterias fueron cultivadas en el la-

boratorio. Los numeros de las bacterias, en millones, y sus edades, en das, son a
continuacion.
Edad 1 2 3 4 5 6 7 8
No. de bacterias 34 106 135 181 192 231 268 300
Grafique estos en un diagrama de dispersion con el x-eje con una escala de hasta 15
das, y el eje-y de hasta 410 millones. Calcular el valor de R2 y comentar sobre sus
resultados.
Algunas lecturas finales se tomaron y se les da a continuacion.
Edad 13 14 15
No. de bacterias 400 403 405
Agrega estos puntos a tu grafica y describir lo que que muestran. Calcule de nuevo
el coeficiente de correlacion con estas nuevas medidas.
6. Una varilla de metal se calento gradualmente y su longitud, L, se midio a diversas

temperaturas, T.
Temperatura (o C) 15 20 25 30 35 40
Longitud (cm) 100 103.8 106.1 112 116.1 119.9
Dibujar un diagrama de dispersion para mostrar los datos y evaluar R2 . (L vs. T.)
Sospecha una inexactitud importante en cualquiera de los valores registrados? Si es
as, deseche cualquiera que usted considere indigno de confianza y encontrar el nuevo
valor de R2 .
80
4. Analisis Combinatorio
Whenever you can, count.
- Sir Francis Galton. Quoted in James R. Newman, Commentary on Sir Francis Galton (1956),
1169.
4.1. Introduccion
Hay muchas situaciones en las que sera demasiado difcil y / o demasiado tedioso enume-
rar todos los resultados posibles de un espacio muestral. En esta leccion, vamos a aprender
diferentes maneras de contar el numero de elementos en un espacio de muestra sin tener
que identificar los resultados especficos. Las tecnicas especficas de recuento que explora-
remos incluyen la regla de la multiplicacion, permutaciones y combinaciones. El analisis
combinatorio, o calculo combinatorio, permite enumerar tales casos o sucesos y as obtener
la probabilidad de eventos mas complejos.
La Teora Combinatoria estudia las agrupaciones que pueden ser formadas cuando se
toman todos, o algunos, de los elementos de un conjunto ...nito. Los elementos del conjunto
pueden ser de cualquier naturaleza: numeros, personas, empresas, artculos producidos por
una fabrica, etc. La Teora Combinatoria estudia especialmente el numero de agrupaciones
que pueden ser obtenidas bajo algun modo de composicion de los elementos. Para ello,
distingue basicamente tres conceptos: arreglos, permutaciones y combinaciones.
Para calcular probabilidades, muchas veces es necesario determinar la cantidad de ele-
mentos de un conjunto dado (cardinal del conjunto), o la cantidad de elementos del conjunto
integrado por las agrupaciones que podemos realizar tomando algunos de los elementos.
A menudo, la tarea de contarlos uno a uno resulta tediosa. En cambio, para poder con-
tar resulta de mucha utilidad el llamado Principio Fundamental de Conteo y los aportes
realizados por la Teora Combinatoria.
4.2. Principio Fundamental de Conteo

En el caso de que existan mas de un suceso a observar, habra que contar el numero de
veces que pueden ocurrir todos los sucesos que se desean observar, para ello se utiliza el
principio fundamental de conteo:
81
Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas,

entonces el numero de formas en que ambos sucesos pueden presentarse en ese orden es
de n1 n2 .
En otras palabras, basta multiplicar el numero de formas en que se pueden presentar
cada uno de los sucesos a observar.
Este principio nos remite automaticamente al factorial de un numero natural, que se
puede pensar como una funcion con dominio los numeros naturales junto con el cero y
codominio los numeros naturales. El factorial de un numero n, denotado n!, se define
como:
n! = n.(n 1).(n 2)..,2,1, si n > 0, (4.1)

= 1, si n = 0.
Ahora, n es muy grande el proceso de calculo se vuelve tedioso y muy cargado, incluso
para una computadora, por lo que se utiliza la aproximacion de Stirling a n!:
2n+1
n! 2n 2 en . (4.2)
donde e 2,71828..., que es la base de los logaritmos neperianos.

En el analisis combinatorio se definen las permutaciones, con o sin repeticion, y las
combinaciones.
Ejemplo 4.1 Una familia desea adquirir una vivienda en un balneario y se le presentan
las siguientes posibilidades: casa o apartamento. A su vez, cada una puede ser de 1, 2 o
3 dormitorios. Cuantos tipos posibles de vivienda tiene a disposicion? Como existen dos
niveles, y se tienen 2 opciones para el primer nivel (casa o apartamento) y 3 opciones para
el segundo (numero de dormitorios), se puede aplicar el principio fundamental de conteo
para obtener la respuesta: 2 3 = 6 tipos de vivienda. Este resultado puede ser visualizado
claramente con la ayuda de un diagrama de arbol.
4.3. Arreglos
Dado un conjunto de n elementos, se define como arreglo de n de orden k (k < n)
a cada k-upla ordenada que puede formarse tomando k elementos diferentes entre los
n dados. Como una k-upla esta constituida por k elementos dispuestos en determinado
orden, dos arreglos seran diferentes, aun conteniendo los mismos elementos, si los mismos
se encuentran en distinto orden. Al numero de arreglos de n de orden k lo notaremos como
Ank .
Para calcular dicho numero, es posible utilizar el principio fundamental de conteo. El
primer lugar de la k-upla puede estar ocupado por uno cualquiera de los n elementos,
mientras el segundo lugar puede estar ocupado por cualquiera de los elementos que no
estan en el primer lugar, es decir por uno de los (n 1) elementos restantes, ya que los k
82
4.4. Variaciones (o arreglos) con repeticion
elementos deben ser diferentes. El tercer lugar puede estar ocupado por cualquiera de los
elementos que no estan ni en el primer lugar ni en el segundo, es decir por uno cualquiera
de los (n 2) elementos restantes. Si se continua el razonamiento, para ocupar el k-esimo
lugar se tendran (n k + 1) elementos posibles. Entonces, el numero de arreglos de n de
orden k es:
Ank = n(n 1)(n 2)...(n + k 1), (4.3)
recordando la definicion de factorial de un numero natural puede obtenerse otra formula
para el calculo del numero de arreglos:
(n k)(n k 1)..,1 n!
Ank = n(n 1)(n 2)...(n + k 1) = , (4.4)
(n k)(n k 1)..,1 (n k)!
Los arreglos reciben tambien el nombre de Variaciones.
Ejemplo 4.2 De una caja que contiene cuatro bolillas numeradas del 1 al 4 se extraen su-
cesivamente 2 sin reposicion. Cuantas extracciones diferentes pueden resultar si se supone
que interesa el orden de extraccion? Las diferentes posibilidades son todos los arreglos de
4 de orden 2, es decir todos los pares ordenados posibles: (1,2), (1,3), (1,4), (2,1), (2,3),
(2,4), (3,1), (3,2), (3,4), (4,1), (4,2), (4,3). Entonces, pueden resultar A42 = 4 (4-1) = 12
extracciones posibles.
Ejemplo 4.3 Sea el mismo conjunto A = {a, b, c, d}, cuantas ordenaciones sin repeticion
se pueden obtener? Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12
en total.
4.4. Variaciones (o arreglos) con repeticion

En la definicion anterior se ha supuesto que los elementos con los cuales se trabaja son
diferentes: se trataba de arreglos sin repeticion o de arreglos simples. Ahora se considerara el
caso de que en un mismo grupo, algun elemento pueda figurar varias veces.
Al numero de arreglos con repeticion de n de orden k lo notaremos como RPkn , que
obviamente sera mayor que Pkn . Para calcular dicho numero es posible utilizar nuevamente
el principio fundamental de conteo. El primer lugar de la k-upla puede estar ocupado por
uno cualquiera de los n elementos. Como los elementos pueden repetirse, el segundo lugar
tambien puede estar ocupado por uno cualquiera de los n elementos y as sucesivamente
con los k lugares, por lo cual el numero de arreglos con repeticion de n de orden k sera:
(RA)rn = (RV )rn = nr . (4.5)
Ejemplo 4.4 Sea A = {a, b, c, d}, cuantas palabras de dos letras se pueden obtener?. Se
pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras es 4. En
este caso r = 2 y n = 4. Las palabras formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb,
cc, cd, da, db, dc, dd. En total son 16.
83
Ejemplo 4.5 Se lanza un dado tres veces. Cuantos resultados diferentes pueden obte-
nerse? Obviamente, es posible que el mismo numero salga dos o incluso tres veces. Los
resultados seran todos los arreglos con repeticion de 6 (cantidad de caras numeradas del
dado) de orden 3 (cantidad de veces que se lanza el dado). Entonces la cantidad de resul-
tados posibles sera: (AP )63 = 63 = 216.
Ejemplo 4.6 De una bolsa que contiene tres fichas numeradas del 1 al 3 se extraen sucesi-
vamente 4 con reposicion. Cuantas extracciones diferentes pueden resultar? Las diferentes
posibilidades son todos los arreglos con repeticion de 3 de orden 4, es decir todas las cuater-
nas posibles, donde los elementos no son necesariamente distintos. Uno de ellos sera, por
ejemplo: (3,2,3,1). Entonces, la cantidad de extracciones posibles sera: (AR)34 = 34 = 81.
4.5. Permutaciones (u ordenaciones) sin repeticion

Dado un conjunto de n elementos, llamaremos permutacion de n a cada forma de ordenar
los n elementos dados. Se observa que las permutaciones constituyen un caso particular de
los arreglos (k = n). Por consiguiente el numero de permutaciones de n (Pkn ) es igual al
numero de arreglos de n de orden n. O sea,
n! n!
Pnn = Pn = = = n!. (4.6)
(n n)! 0!
Ejemplo 4.7 De cuantas maneras podemos colocar cuatro bolas de distintos colores en
fila? La primera puede ser cualquiera de las cuatro. La segunda, cualquiera de las tres
restantes, etc. La respuesta es 4 3 2 1 = 4! = 24.
Ejemplo 4.8 Cuantas palabras, con o sin sentido, pueden obtenerse usando todas las
letras de la palabra PRENSA? Como la palabra no tiene letras repetidas, la respuesta es
6! = 720. Mas adelante nos encontraremos la situacion de palabras con letras repetidas.
4.6. Permutaciones (u ordenaciones) con repeticion

A diferencia del caso anterior, podemos suponer que todos los elementos no son distintos,
es es, que algunos elementos pudieran estar repetidos. Permutaciones con repeticion de n
elementos donde el primer elemento se repite a veces , el segundo b veces , el tercero c
veces, es decir, n = a + b + c + ..., son los distintos grupos que pueden formarse con esos n
elementos de forma que
Pn
(RP )a,b,c,...
n = . (4.7)
a! b! c! ...
84
4.7. Combinaciones
4.7. Combinaciones
Dado un conjunto de n elementos, llamaremos combinacion de n de orden k (k < n) a
cada subconjunto que puede formarse tomando k elementos diferentes entre los n dados.
Como en los conjuntos no interesa el orden de los elementos, dos combinaciones seran
diferentes si contienen por lo menos algun elemento diferente.
Considerese, por ejemplo, un conjunto de n elementos diferentes del cual se extraen k
sucesivamente y sin reposicion, sin que interese el orden de extraccion, o del cual se extraen
k elementos simultaneamente. En cualquiera de estos dos casos las extracciones posibles
son todas las combinaciones de n de orden k.
El numero de combinaciones de n de orden k se denota Ckn (tambien llamado numero
combinatorio). Para calcular este numero buscaremos la relacion existente entre este y los
numeros Ank y Pk .
Ejemplo 4.9 Si tomamos el mismo conjunto A = {a, b, c, d}, cuantos subconjuntos de

2 elementos cada uno se pueden obtener? Haciendolos se obtienen: a,b, a,c, a,d, b,c, b,d,
c,d. Son seis los subconjuntos.
En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el

numero de combinaciones obtenidas estan relacionadas por medio de Ank = Ckn Pk , as:
Ank

n n.(n 1).(n 1)...(n r + 1) n!
Cnr = = = = , (4.8)
Pk r r! r!(n r)!
o, que es lo mismo,
Pr

n
Cnr = = n. (4.9)
r r!
4.8. Combinaciones con repeticion

A diferencia del caso anterior cuando podemos imponer la condicion de que los elementos
puedan repetirse, entonces lo que tenemos es combinaciones con repeticion. Al numero de
arreglos (combinaciones) con repeticion de n de orden k lo notaremos como RCkn ,

n+k1 (n + k 1)!
RCkn = = . (4.10)
n n!(k 1)!
Ejemplo 4.10 En una bodega hay cinco tipos diferentes de botellas. De cuantas formas
se pueden elegir cuatro botellas? Exactamente de

4 4+51 (4 + 5 1)! 8!
RC5 = = = = 70. (4.11)
4 4!(5 1)! (4!)2
85
4.9. Analisis y Metodologa propuesta para la resolucion de

problemas de Teora de conteo
Para resolver problemas basicos y sencillos de teora de conteo basta con seguir el si-
guiente diagrama.
Figura 4.1.: Metodologa sencilla para la resolucion de problemas de conteo.

1. Cuantos resultados distintos pueden producirse al lanzar una moneda cuatro veces
al aire.
2. Cuantos numeros de cuatro cifras distintos pueden formarse con los elementos del
conjunto 1, 2, 3, 4, 5, 6, 7.
86
3. De cuantas formas diferentes se pueden repartir tres juguetes diferentes entre cuatro
ninos, de manera que ningun nino tenga mas de un juguete?
4. De cuantas formas diferentes se pueden distribuir cinco bolas distintas en tres cajas
diferentes?
5. En un examen se proponen diez preguntas; cada pregunta tiene tres respuestas posi-
bles (a,b,c). Si se contestan al azar, cuantos examenes distintos pueden producirse?
6. Se extraen sucesivamente dos bolas de una bolsa que contiene seis de diferentes
colores. Cuantos resultados distintos pueden producirse? a) Con devolucion. b) Sin
devolucion.
7. El viaje de la ciudad A a la ciudad B se puede realizar por cinco carreteras distintas.

De cuantas formas puede realizarse el viaje de ida y vuelta?
8. De A a B puede irse en coche, avion, moto, tren o barco. De cuantas formas posibles
se puede hacer el viaje de ida y vuelta?
2
9. Resuelve: Vm2 + Vm2 2
+ Vm4 = 98.
10. Una matrcula de coche de un pas europeo esta formada por 3 letras elegidas entre 27
y 4 numeros escogidos entre los numeros comprendidos entre 0 y 9. Cuantos coches
se pueden matricular en cada pas con este sistema?
11. Tiras dos dados diferentas al aire. Cuantos resultados distintos pueden producirse?
12. De Cuantas formas distintas pueden sentarse cuatro personas alrededor de una mesa.
13. De Cuantas formas pueden alinearse dos chicas y tres chicos.
14. De Cuantas formas pueden actuar en T.V. cuatro cantantes y tres humoristas.
15. De Cuantas formas distintas puede obtenerse la suma 8 al lanzar tres dados distintos
y sumar los numeros aparecidos.
16. De cuantas formas pueden ordenarse siete personas, entre las que figuran Juan y
Mara de manera que Juan y Mara esten colocados uno al lado de otro.
17. Se lanza una moneda ocho veces seguidas y se anotan sucesivamente los resultados
obtenidos en cada uno de los lanzamientos. Los ocho lanzamientos constituyen una
experiencia. En cuantas experiencias se pueden obtener cinco caras y tres cruces?
18. Cuantas de las permutaciones formadas por los numeros 3, 4, 5, 6, 7, 8 empezaran

por 3? Cuantas por 64? Cuantas terminaran por 875?
19. Cuantos numeros de cinco cifras distintas se pueden formar con los numeros 0, 1, 2,
3, 4.
87
20. De cuantas maneras pueden permutarse las letras de la palabra ESCAPARATE

dejando fija la P y de modo que los lugares ocupados por vocales no puedan ser
ocupados por consonantes y viceversa?
21. Cuantas comisiones de tres alumnos pueden formarse con los 35 alumnos de una
clase?
22. Cuantos equipos de 5 atletas se podran formar para participar en una competicion
con los doce atletas mejor preparados?
23. En una carrera en la que toman parte 8 caballos se juega una apuesta que consiste en
acertar los dos primeros sin tener en cuenta el orden. Cuantas apuestas diferentes
pueden jugarse en esa carrera?
24. De los 48 trabajadores de una empresa se presentan 6 como candidatos a ocupar dos
puestos de representante de los trabajadores. Cuantas elecciones son posibles?
25. En un salon hay 6 matrimonios. Se eligen al azar dos de esas personas: (a) Cuantas
elecciones distintas son posibles? (b) En cuantas de las elecciones posibles habra dos
hombres? (c) En cuantas habra una mujer y un hombre? (d) En cuantas de las
posibles elecciones habra un matrimonio?
26. En una lnea ferrea hay 18 estaciones. Si el tren para en todas las estaciones, cuantos
viajes distintos pueden realizarse entre ellas?
27. Un alumno puede elegir 3 entre sus 15 companeros de clase para realizar un viaje,
cuantas elecciones distintas pueden hacerse?
28. Con 5 clase de vino, cuantas mezclas se pueden formar de tres vinos?
29. De cuantas formas posibles pueden elegirse dos botellas entre 18 existentes.
30. Con seis pesas de 1, 2, 5, 10, 20 y 50 gr, cuantas pesadas posibles pueden realizarse?
88
5. Probabilidad
What the use of P [the significance level] implies, therefore, is that a hypothesis that may be true
may be rejected because it has not predicted observable results that have not occurred.
- Sir Harold Jeffreys. Theory of Probability (1939), 316.
5.1. Introduccion: La probabilidad

La palabra probabilidad no tiene una definicion consistente. De hecho, hay dos amplias
categoras de interpretaciones de la probabilidad: los frecuencistas hablan de probabilida-
des solo cuando se trata de experimentos aleatorios bien definidos. La frecuencia relativa
de ocurrencia del resultado de un experimento, cuando se repite el experimento, es una
medida de la probabilidad de ese suceso aleatorio. Los bayesianos, no obstante, asignan
las probabilidades a cualquier declaracion, incluso cuando no implica un proceso aleatorio,
como una manera de representar su verosimilitud subjetiva.
El estudio cientfico de la probabilidad es un desarrollo moderno. Los juegos de azar
muestran que ha habido un interes en cuantificar las ideas de la probabilidad durante
milenios, pero las descripciones matematicas exactas de utilidad en estos problemas solo
surgieron mucho despues.
Segun Richard Jeffrey, Antes de la mitad del siglo XVII, el termino probable (en latn
probable) significaba aprobable, y se aplicaba en ese sentido, unvocamente, a la opinion y
a la accion. Una accion u opinion probable era una que las personas sensatas emprenderan
o mantendran, en las circunstancias. [Vease: Jeffrey, R.C., Probability and the Art of
Judgment, Cambridge University Press. (1992). pp. 54-55. ISBN 0-521-39459-7].
Dos aplicaciones principales de la teora de la probabilidad en el da a da son en el analisis
de riesgo y en el comercio de los mercados de materias primas. Los gobiernos normalmente
aplican metodos probabilsticos en regulacion ambiental donde se les llama analisis de
vas de dispersion, y a menudo miden el bienestar usando metodos que son estocasticos
por naturaleza, y escogen que proyectos emprender basandose en analisis estadsticos de su
probable efecto en la poblacion como un conjunto. No es correcto decir que la estadstica
esta incluida en el propio modelado, ya que tpicamente los analisis de riesgo son para una
unica vez y por lo tanto requieren mas modelos de probabilidad fundamentales, por ej.
la probabilidad de otro 11-S. Una ley de numeros pequenos tiende a aplicarse a todas
aquellas elecciones y percepciones del efecto de estas elecciones, lo que hace de las medidas
probabilsticas un tema poltico.
89
5. Probabilidad
Un buen ejemplo es el efecto de la probabilidad percibida de cualquier conflicto genera-

lizado sobre los precios del petroleo en Oriente Medio - que producen un efecto domino en
la economa en conjunto. Un calculo por un mercado de materias primas en que la guerra
es mas probable en contra de menos probable probablemente enva los precios hacia arriba
o hacia abajo e indica a otros comerciantes esa opinion. Por consiguiente, las probabilida-
des no se calculan independientemente y tampoco son necesariamente muy racionales. La
teora de las finanzas conductuales surgio para describir el efecto de este pensamiento de
grupo en el precio, en la poltica, y en la paz y en los conflictos.
Se puede decir razonablemente que el descubrimiento de metodos rigurosos para calcular
y combinar los calculos de probabilidad ha tenido un profundo efecto en la sociedad moder-
na. Por consiguiente, puede ser de alguna importancia para la mayora de los ciudadanos
entender como se calculan los pronosticos y las probabilidades, y como contribuyen a la
reputacion y a las decisiones, especialmente en una democracia.
Otra aplicacion significativa de la teora de la probabilidad en el da a da es en la
fiabilidad. Muchos bienes de consumo, como los automoviles y la electronica de consumo,
utilizan la teora de la fiabilidad en el diseno del producto para reducir la probabilidad de
avera. La probabilidad de avera tambien esta estrechamente relacionada con la garanta
del producto.
Se puede decir que no existe una cosa llamada probabilidad. Tambien se puede decir
que la probabilidad es la medida de nuestro grado de incertidumbre, o esto es, el grado
de nuestra ignorancia dada una situacion. Por consiguiente, puede haber una probabilidad
de 1 entre 52 de que la primera carta en un baraja de cartas es la J de diamantes. Sin
embargo, si uno mira la primera carta y la reemplaza, entonces la probabilidad es o bien
100 % o 0 %, y la eleccion correcta puede ser hecha con precision por el que ve la carta. La
fsica moderna proporciona ejemplos importantes de situaciones determinsticas donde solo
la descripcion probabilstica es factible debido a informacion incompleta y la complejidad
de un sistema as como ejemplos de fenomenos realmente aleatorios.
En un universo determinista, basado en los conceptos newtonianos, no hay probabilidad
si se conocen todas las condiciones. En el caso de una ruleta, si la fuerza de la mano y el
periodo de esta fuerza es conocido, entonces el numero donde la bola parara sera seguro.
Naturalmente, esto tambien supone el conocimiento de la inercia y la friccion de la ruleta,
el peso, lisura y redondez de la bola, las variaciones en la velocidad de la mano durante
el movimiento y as sucesivamente. Una descripcion probabilstica puede entonces ser mas
practica que la mecanica newtoniana para analizar el modelo de las salidas de lanzamientos
repetidos de la ruleta. Los fsicos se encuentran con la misma situacion en la teora cinetica
de los gases, donde el sistema determinstico en principio, es tan complejo (con el numero
de moleculas tpicamente del orden de magnitud de la constante de Avogadro 6 1023 )
que solo la descripcion estadstica de sus propiedades es viable.
La mecanica cuantica, debido al principio de indeterminacion de Heisenberg, solo puede
ser descrita actualmente a traves de distribuciones de probabilidad, lo que le da una gran
importancia a las descripciones probabilsticas. Albert Einstein comento estupendamente
90
5.2. La probabilidad
en una carta a Max Born: Jedenfalls bin ich uberzeugt, da der Alte nicht wurfelt. (Estoy
convencido de que Dios no tira el dado). No obstante hoy en da no existe un medio mejor
para describir la fsica cuantica si no es a traves de la teora de la probabilidad. Mucha
gente hoy en da confunde el hecho de que la mecanica cuantica se describe a traves de
distribuciones de probabilidad con la suposicion de que es por ello un proceso aleatorio,
cuando la mecanica cuantica es probabilstica no por el hecho de que siga procesos aleatorios
sino por el hecho de no poder determinar con precision sus parametros fundamentales,
lo que imposibilita la creacion de un sistema de ecuaciones determinista. (Tomado de
wikipedia, busque probabilidad).
5.2. La probabilidad
La probabilidad es una medida de la posibilidad de que un evento ocurra. En vista de
la caracterstica de esta medida, la cantidad que la describe es siempre un numero que se
encuentra en un intervalo [0, 1], donde o equivale a una posibilidad nula de que el evento
ocurra mientras que 1 representa el hecho de que evento va a ocurrir con toda seguridad. En
otras palabras, la medida de la probabilidad es siempre una fraccion o decimal indicando
la porcion o porcentaje de la veces que un evento ocurre.
Ejemplo 5.1 40 % de chance de que llueva, average de bateo de .313, la probabilidad de
obtener un royal flush en poker es 1:649740. La interpretacion: Un 40 % de chance de
que llueva significa que si nosotros miramos todos los das con caractersticas similares,
entonces de cada 100 das con estas condiciones, 40 de ellos seran das con lluvia; un
porcentaje de bateo de .313 significa que el jugado llegara a una base o hara un hit en el
31.3 % (.313) de todos los intentos al bateo, es decir, de cada 100 veces que batea, solo 31
veces aproximadamente hace un hit; dramaticamente se tendra que si uno quiere obtener
un royal flush en una partida de poker, entonces quizas tenga que esperar hasta 649740
manos para obtener uno.
5.3. Experimentos de Probabilidad

Un experimento probabilstico es cualquier proceso que produce un resultado o una
observacion y tiene por finalidad de determinar posibilidades.
Ejemplo 5.2 Lanzar un dado o una moneda, escoger un nombre de varios revueltos en
un vaso, sacar una carta de un mazo.
Cuando se realiza un experimento, se obtienen un conjunto de valores. A este conjunto
de valores que puede tomar una variable se le denomina espacio muestral.
Ejemplo 5.3 El universo de el experimento de lanzar una moneda tiene dos resultados:
cara y sello, as podemos escribir:
S = {cara, sello} (5.1)
91
5. Probabilidad
En el experimento de lanzar un dado, se tienen 6 posibles resultados, as:
S = {1, 2, 3, 4, 5, 6} (5.2)
Desde ahora definiremos evento como cualquier coleccion de resultados de un espacio

de eventos o universo, es decir, pudiera confeccionarse subconjuntos del universo de un
evento y crear nuevos eventos.
Si existen mas de una variable, el espacio muestral esta formado por las combinaciones
de valores de cada una de las variables.
Ejemplo 5.4 En el caso de el experimento de lanzar un dado, uno podra definir dos
nuevos eventos del universo tomando algunos que tienen una caracterstica comun, as
P = {Resultados pares} = {2, 4, 6},

I = {Resultados impares} = {1, 3, 5},
As mismo podran confeccionarse eventos en el experimento de sacar una carta de un

mazo, uno podra inventar nuevos eventos, por ejemplo, los resultados posibles de sacar un
rey, tiene cuatro resultados correspondientes con los cuatro reyes de los cuatro distintos
tipos de dibujo que tienen las cartas, o bien, el rey de corazones, el rey de picas, el rey de
espadas y el rey de treboles.
Un evento E para un experimento se dice que ocurre si y solo si el resultado de el

experimento es uno de los que pertenecen a E.
Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina
un evento, y si este consta de un solo elemento entonces es un evento elemental.
Ejemplo 5.5 Si P es el evento descrito anteriormente de obtener los numeros pares en

el lanzamiento de un dado, entonces si al lanzar el dado el numero mostrado es un 4,
entonces uno podra decir que el evento P ocurre, si el numero mostrado es 1, entonces
uno debe decir que el evento P no ocurre.
Como se puede uno imaginar, existen eventos que siempre, no importa el numero de
experimentos o su situacion, ocurren, y en cambio existen otros que nunca ocurren. Los que
siempre ocurren son los eventos seguros, y los que nunca son los eventos imposibles.
Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier
proceso entonces los resultados pueden tomar cualquier tipo de valor. Por esta razon, se
define como experimento aleatorio al proceso en el que se pueden predecir con certeza
la ocurrencia de sus eventos, con excepcion del seguro o del imposible. Hay que hacer la
observacion que esta definicion habla en terminos generales y no especficamente sobre
algun experimento en particular.
92
5.4. Calculando la probabilidad de un evento
A aquella variable que esta asociada a un experimento de este tipo se le denomina va-
riable aleatoria. En cambio, a un experimento no aleatorio se le denomina experimento
determinstico.
Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar va-
rios casos. Si dos o mas eventos no pueden ocurrir simultaneamente, se llaman eventos
mutuamente excluyentes, es decir, que la interseccion de ambos eventos es vaca.
Por otro lado, en ocasiones un evento o mas eventos dependen de otro evento previo, es
decir, un evento A ocurre dado que ocurrio un evento B. Si existe este tipo de relacion entre
eventos se dice que son eventos dependientes o condicionados (el evento A depende
del evento B, o el resultado del evento A esta condicionado al resultado del evento B). Por
otro lado, si no existe tal relacion entre eventos se dice que son eventos independientes.
Los criterios de dependencia o de independencia se definiran mas adelante, en terminos de
probabilidad condicional.
5.4. Calculando la probabilidad de un evento

Para calcular la probabilidad de eventos es necesario que estos se comporten de una
manera mas o menos estable. Precisamente, se echa mano de la regularidad estadstica,
que es la propiedad de los fenomenos aleatorios, y que consiste en que al aumentar el
numero de repeticiones de un experimento en condiciones practicamente constantes, la
frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo.
La probabilidad de un evento E es denotada por P (E) y siempre representa la fraccion o
porcentaje de ocurrencia de que E ocurra. Algunas caractersticas exhibe esta formulacion:
Para un evento E, se tiene que 0 P (E) 1.
Un evento E es llamado evento imposible si ocurre que P (E) = 0.
Un evento E es llamado evento cierto si ocurre que P (E) = 1.
La probabilidad P (E) puede ser calculada de dos modos distintos.
5.4.1. Probabilidad Emprica

Tambien llamada la probabilidad frecuencial de un evento es el valor fijo al que tienden
las frecuencias relativas de ocurrencia del evento de acuerdo a la regularidad estadstica.
Esta definicion sera la mas real, pero proporciona probabilidades aproximadas, es decir,
proporciona estimaciones y no valores reales. Ademas, los resultados son a posteriori, pues
se necesita realizar el experimento para poder obtenerlo.
Por ejemplo, uno podra calcular la probabilidad de obtener una suma de 7 cuando dos
dados son lanzados muchas veces, digamos 100 veces, y calculando que porcentaje de las
veces sale 7. As mismo tambien se podra calcular la probabilidad de que un jugador de
93
5. Probabilidad
basketball anote una cesta libre de tablero calculando el porcentaje de las veces que lo ha
hecho en el pasado con estadsticas anteriores.
Para calcular la probabilidad de esta manera podra usarse la siguiente formula:
numero de intentos en los que ocurre E
P (E) = . (5.3)
numero de intentos totales
Ejemplo 5.6 Digamos que la siguiente tabla representa las notas que obtienen en un
examenes en base a 100 puntos un grupo de estudiantes:
Notas Numero de estudiantes
90-99 4
80-90 6
70-79 4
60-69 3
50-59 2
40-49 1
Si el evento A es evento en el que un estudiante obtiene entre 90 y 99 puntos, la probabilidad
de sacar un examen al azar y que sea una nota entre 90 y 99 puntos sera:
cantidad de estudiantes que obtienen notas entre 90 y 99 puntos 4
P (A) = = = 0,20.
cantidad total de estudiantes 20
(5.4)
5.4.2. Probabilidad clasica

La probabilidad clasica de un evento E, que denotaremos por P (E), se define como el
numero de eventos elementales que componen al evento E, entre el numero de eventos
elementales que componen el espacio muestral:
numero de eventos elementales que componen al evento E
P (E) = . (5.5)
numero de eventos elementales que componen el espacio muestral
Es la definicion mas utilizada porque supone de antemano, y se necesita como requisito
indispensable, que todos los eventos elementales tienen la misma probabilidad de ocurrir.
Ejemplo 5.7 Cuando se lanza una moneda, se obtienen dos resultados posibles: cara o
sello. Digamos que el evento que salga cara lo denotamos por A y a la de sello B. La
probabilidad de que salga una cara al lanzar la moneda sera
1
P (A) = P (B) = P (cara) = P (sello) = . (5.6)
2
En el caso del ejemplo en el que uno lanza un dado, entonces se tendra
1
P (sale 1) = P (sale 5) = . (5.7)
6
94
5.5. Axiomas de la probabilidad
Note que para el calculo de la probabilidad desde esta perspectiva clasica no es necesario
de ninguna manera que se tenga que confeccionar y realizar el experimento. Vasta, como se
ve, que uno tenga pleno conocimiento de el espacio muestral y sus respectivos resultados,
por su puesto.
5.5. Axiomas de la probabilidad

Recordemos primero que las frecuencias relativas de una distribucion tenan las siguientes
propiedades:
Las frecuencias relativas son mayores o iguales que cero.
La frecuencia relativa del espacio muestral es igual a la unidad.
Si dos eventos son mutuamente excluyentes, es decir que no ocurren simultaneamente,

entonces la frecuencia relativa de su union es la suma de las frecuencias relativas de
cada uno.
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definicion ya

expuesta, es la frecuencia relativa cuando se aumenta el tamano de la muestra, se tienen
lo siguiente.
Si E es un evento de un espacio muestral S y P (E) es la probabilidad de E, entonces se
satisfacen los axiomas de la probabilidad:
1. La probabilidad de un evento E, es un numero siempre entre 0 y 1, es decir, 0

P (E) 1.
2. Se le llama a E evento seguro a un evento cuando P (E) = 1. Por otro lado, se le

llama evento imposible si P (E) = 0.
3. La probabilidad del universo es la maxima, P (S) = 1.
4. Si E1 , E2 ,..., En , son eventos mutuamente excluyentes, entonces
n n
!
[ X
P (E1 E2 ... En ) = P Ei = P (Ei ). (5.8)
i=1 i=1
Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de

eventos.
95
5. Probabilidad
5.6. Posibilidades y probabilidades

En los escrito anteriormente hemos utilizada indistintamente en algunos momentos las
palabras posibilidad y probabilidad. La principal motivacion de esta seccion es hacer una
diferenciacion de estas dos cosas. En principio pareciera logico que uno pudiera definir
la probabilidad en termino de las posibilidades de que un evento ocurra, sin embargo,
hablando en terminos generales, la palabra posibilidad proviene de referirse a ciertos juegos
de apuestas en las que se utiliza la frase: la posibilidad de ganar es de x a y, por ejemplo,
la posibilidad de que gane es de 3 a 1.
Cuando uno habla de esa manera es inevitable pensar en que tal frase esta ligada de
alguna manera a razones, en el sentido matematico de la palabra. Efectivamente, la posi-
bilidad de que ocurra un evento se determina mediante la razon de la probabilidad de que
ocurra a la probabilidad de que no ocurra.
Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las
posibilidades de que ocurra son x a y, si
x p
= , (5.9)
y 1p
de tal manera que x y y son numeros enteros.
Ejemplo 5.8 Si se tiran dos monedas normales (no trucadas), la probabilidad de que las
dos monedas caigan cara es de 41 . Esto quiere decir si alguien apuesta a que las dos monedas
no caen simultaneamente en cara, la posibilidad de ganar la apuesta es de
3
4 0,75 3
3 = = , (5.10)
1 4
0,25 1
es decir, la posibilidad de ganar la apuesta es de 3 a 1.
Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento, entonces

se acostumbra mencionar las posibilidades en contra del evento.
Ejemplo 5.9 Si se tira un dado no trucado, sabemos que la probabilidad de obtener un

cuatro es 16 , es decir que la posibilidad de obtener un cuatro es de 1 a 6; pero se acostumbra
decir que las posibilidades en contra, esto es, de no obtener un cuatro es de 6 a 1.
Inversamente, en el caso de tener las posibilidades de un evento, entonces es facil obtener

su probabilidad, pues si la posibilidad de un evento es de x a y, entonces la probabilidad
p de que ocurra tal evento es
x
p= . (5.11)
x+y
96
5.7. Propiedades de la probabilidad de eventos no elementales
Ejemplo 5.10 En la Copa Mundial de Futbol Francia 1998 se deca que el equipo mexicano
tena una posibilidad de 1 a 75 de llegar a ser el campeon del torneo. Si se desea encontrar
la probabilidad de que el equipo mexicano llegase a ser campeon, entonces se tiene que
x 1 1
p= = = = 0,01311, (5.12)
x+y 1 + 75 76
es la probabilidad de que ocurriese el evento. J
Esto tiene la ventaja de que permite, en combinacion con el tercer axioma de la probabi-
lidad, medir la confiabilidad que tienen las opiniones de las personas sobre las posibilidades
que le asignan a algunos eventos. Esto quiere decir que el calculo de las probabilidades de
dos eventos mutuamente excluyentes a partir de las posibilidades otorgadas de manera
subjetiva resulta como un criterio de consistencia.
Ejemplo 5.11 Un criminologo piensa que las posibilidades de que en la proxima semana
la cantidad de delitos en una ciudad aumente con respecto a la anterior es de 5 a 2, de que
sea la misma cantidad de delitos es de 1 a 3 y las posibilidades de que aumente la cantidad
o sea la misma es de 7 a 4. Si se desea saber si son consistentes las probabilidades corres-
pondientes habra que hacer los calculos. Las probabilidades de que aumente la cantidad de
delitos, que sea igual la cantidad de delitos, y de que aumente o sea igual la cantidad de
delitos es, respectivamente, de
5 5 1 1 7 7
paumente = = , pigual = = , paumente = = , (5.13)
5+2 7 1+3 4 7+4 11
y dado que 57 + 14 = 2827
(como son eventos mutuamente excluyentes) no es lo mismo que
7
11 , entonces los criterios del criminologo pueden ser cuestionados.
5.7. Propiedades de la probabilidad de eventos no elementales

Cuando se tienen eventos elementales no existe mucho problema en el sentido del calculo
de las probabilidades, pues basta con una contabilizacion o el uso directo del calculo com-
binatorio. Pero en el caso de eventos no elementales, que son los compuestos por mas de un
evento elemental, el proceder de manera analoga resulta muy complejo y las operaciones
pueden sobrepasar la capacidad de calculo existente. Sin embargo, utilizando los axiomas
de la probabilidad y las siguientes propiedades, se podran expresar las probabilidades de
estos eventos en terminos de los eventos elementales que lo componen, siempre y cuando
se conozcan las probabilidades de estos.
Veamos la probabilidad de una union de eventos, la cual la podremos calcular de la
siguiente manera:
1. Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es igual

a la suma de las probabilidades de ocurrencia de A y de B, menos la probabilidad
97
5. Probabilidad
de que ocurran A y B simultaneamente. Es decir,

P (A B) = P (A) + P (B) P (A B) (5.14)
Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene:
2. Propiedad 2. Si dos eventos, A y B, son mutuamente excluyentes entonces la pro-
babilidad de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia
de A y de B. Es decir
P (A B) = P (A) + P (B). (5.15)
Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del
complemento de un evento E, que denotaremos como E:
3. Propiedad 3. Si E es un evento y E su complemento, entonces
P (E) = 1 P (E). (5.16)
5.8. Probabilidad condicionada

En el calculo de las probabilidades de algunos sucesos, el valor de dicha probabilidad
dara en funcion del conocimiento de determinadas informaciones relativas a estos sucesos.
Ejemplo 5.12 Si disponemos de una urna que contiene cuatro bolas numeradas del 1 al
4, extraemos una bola y seguidamente la volvemos a introducir para realizar una segunda
extraccion, la probabilidad de extraer, por ejemplo, la bola numero 3 en la segunda extrac-
cion es la misma que en la primera. Si realizamos el mismo proceso sin reemplazar la bola
extrada la probabilidad de extraer, por ejemplo, la bola numero 3 en la segunda extraccion
dependera de la bola extrada en primer lugar.
Definicion. Sean A y B dos sucesos tal que P (A) 6= 0, se llama probabilidad de B

condicionada a A, P (B|A), a la probabilidad de B tomando como espacio muestral A,
es decir, la probabilidad de que ocurra B dado que ha sucedido A. La probabilidad de que
ocurra un evento A dado que ocurrio el evento B (el evento A depende del evento B) es:
P (A B)
P (A|B) = . (5.17)
P (B)
Hay que notar que esta propiedad no es conmutativa, situacion que s ocurre con la pro-
babilidad de union o la interseccion de eventos, por lo que no hay que confundir P (A|B)
y P (B|A).
Ejemplo 5.13 Consideremos el experimento de lanzar un dado al aire. Calculemos,
por ejemplo, la probabilidad de obtener un 3 sabiendo que ha salido un numero impar.
Definimos los sucesos A = {sacar 3} y B = {1, 3, 5}; entonces, P (A|B) = 1/3, puesto
que si sabemos que ha salido un numero impar, los casos posibles ahora son 3 y los casos
favorables al suceso A solo 1.
98
5.9. Probabilidad total
El conocimiento de que ha ocurrido el suceso A modifica, en algunas ocasiones, la pro-

babilidad del suceso B, pero en otras no. Los sucesos en los que, conociendo que uno ha
ocurrido, no se modifica la probabilidad del otro, decimos que son independientes y, si se
modifica, decimos que son dependientes entre s.
Finalmente, el criterio para la independencia de eventos queda como sigue:
Definicion. Dos eventos A y B son independientes si y solo si
P (A|B) = P (A), P (B|A) = P (B), (5.18)
o, lo que es lo mismo,
P (A|B) = P (A)P (B). (5.19)
5.9. Probabilidad total

Llamamos sistema completo de sucesos a una familia de sucesos A1 , A2 , ..., An que cum-
plen:
Son incompatibles dos a dos, Ai Aj = .

Sn
La union de todos ellos es el suceso seguro, i=1 Ai = S.
5.9.1. Teorema de la probabilidad total

Sea A1 , A2 , ..., An un sistema completo de sucesos tales que la probabilidad de cada uno
de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades
condicionales P (B|Ai ), entonces la probabilidad del suceso B viene dada por la expresion:
P (B) = P (A1 )P (B|A1 ) + P (A2 )P (B|A2 ) + ... + P (An )P (B|An ). (5.20)
5.10. Teorema de Bayes

En el ano 1763, dos anos despues de la muerte de Thomas Bayes (1702-1761), se pu-
blico una memoria en la que aparece, por vez primera, la determinacion de la probabilidad
de las causas a partir de los efectos que han podido ser observados. El calculo de dichas
probabilidades recibe el nombre de teorema de Bayes.
Sea A1 , A2 , ..., An un sistema completo de sucesos, tales que la probabilidad de cada uno
de ellos es distinta de cero, y sea B un suceso cualquier del que se conocen las probabilidades
condicionales P (B|Ai ). entonces la probabilidad P (Ai |B) viene dada por la expresion:
P (Ai )P (B|Ai ) P (Ai )P (B|Ai )

P (Ai |B) = = .
P (B) P (A1 )P (B|A1 ) + P (A2 )P (B|A2 ) + ... + P (An )P (B|An )
(5.21)
99
5. Probabilidad

1. Con los jugadores de un club de futbol se forman dos equipos para jugar un partido
de entrenamiento; entre los dos equipos se reunen 6 defensas, 8 medios, 6 delanteros
y 2 porteros. El entrenador sabe que en estos partidos, la probabilidad de que se
lesione un jugador es 0.22 si es delantero, 0.11 si es medio, 0.055 si es defensa y 0
si es portero. (a) Calcular la probabilidad de que se lesione uno cualquiera de los
jugadores en este partido. (b) Si se sabe que un jugador se ha lesionado, determinar
la probabilidad de que haya sido un defensa.
2. Tras un estudio estadstico en una ciudad se observa que el 70 % de los motoristas son
varones y, de estos, el 60 % llevan habitualmente casco. El porcentaje de mujeres que
conducen habitualmente con casco es del 40 %. Se pide: (a) Calcular la probabilidad
de que un motorista elegido al azar lleve casco. (b) Se elige un motorista al azar y se
observa que lleva casco. Cual es la probabilidad de que sea varon?
3. En una ciudad, el 35 % vota al partido A, el 45 % vota al partido B y el resto se

abstiene. Se sabe ademas que el 20 % de los votantes de A, el 30 % de los de B
y el 15 % de los que se abstienen, son mayores de 60 anos. Se pide: (a) Hallar la
probabilidad de que un ciudadano elegido al azar sea mayor de 60 anos. (b) Hallar
la probabilidad de que un ciudadano mayor de 60 anos se haya abstenido.
4. Los alumnos de Primero de Biologa tienen que realizar dos pruebas, una teorica y
otra practica. La probabilidad de que un estudiante apruebe la parte teorica es de
0.6, la probabilidad de que apruebe la parte practica es de 0.8 y la probabilidad de
que apruebe ambas pruebas es 0.5. (a) Son independientes los sucesos aprobar la
parte teorica y la parte practica? (b) Cual es la probabilidad de que un alumno no
apruebe ninguno de los dos examenes? (c) Cual es la probabilidad de que un alumno
apruebe solamente uno de los dos examenes? (d) Se sabe que un alumno aprobo la
teora. Cual es la probabilidad de que apruebe tambien la practica?
5. En una baraja de 40 cartas. (a) Se toman dos cartas sin reemplazamiento. Cual es
la probabilidad de que las dos sean de distinto numero? (b) Y si se toman tres cartas,
Cual es la probabilidad de que los tres numeros sean distintos?
6. Tenemos un dado con tres 1, dos 2 y un 3. Lo tiramos dos veces consecutivas

y anotamos la suma de los resultados. (a) Cual es el Espacio Muestral? (b) Cual es
la probabilidad de que la suma sea 4? (c) Cual es la suma mas probable? Cuanto
vale su probabilidad?
100
7. Tenemos dos dados A y B, ambos trucados. En el dado A hay tres 1 y tres 2 y

en el dado B hay dos 1 y cuatro 2. Se elige un dado al azar y se tira. (a) Cual
es la probabilidad de obtener un 1? (b) Sabiendo que se ha obtenido un 2, Cual
es la probabilidad de que se haya elegido el dado B?
8. En una caja hay x bolas blancas y 1 bola roja. Al extraer de la caja dos bolas al azar
sin reemplazamiento, la probabilidad de que sean blancas es 1/2. Calcula el numero
de bolas blancas que debe tener la caja.
9. El 35 % de los creditos de un banco es para vivienda, el 50 % para industrias y el

15 % para consumo diverso. Resultan fallidos el 20 % de los creditos para vivienda, el
15 % de los creditos para industrias y el 70 % de los creditos para consumo. Calcula
la probabilidad de que se pague un credito elegido al azar.
10. El volumen de produccion en tres plantas diferentes de una fabrica es de 500 unidades
en la primera, 1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el
porcentaje de unidades defectuosas producidas en cada planta es del 1 %, 0.8 % y
2 %, respectivamente, calcula la probabilidad de que al seleccionar una unidad al
azar sea defectuosa.
11. El 20 % de los empleados de una empresa son ingenieros y otro 20 % son economistas.
El 75 % de los ingenieros ocupan un puesto directivo y el 50 % de los economistas
tambien, mientras que de los no ingenieros y no economistas solamente el 20 % ocupan
un puesto directivo. Cual es la probabilidad de que un empleado directivo elegido
al azar sea ingeniero?
12. Se toman dos barajas espanolas de 40 cartas. Se extrae al azar una carta de la primera
baraja y se introduce en la segunda baraja. Se mezclan las cartas de esta segunda
baraja y se extrae una carta, que resulta ser el dos de oros. Cual es la probabilidad
de que la primera carta extrada fuese una espada?
13. En un conjunto de estudiantes el 15 % estudia aleman, el 30 % estudia frances y el

10 % ambas materias. (a) Son independientes los sucesos estudiar aleman y estudiar
frances?. (b) Si se elige un estudiante al azar, calcule la probabilidad de que no estudie
frances ni aleman.
14. Un ladron, al huir de un polica, puede hacerlo por las calles A, B o C, con probabi-
lidades p(A) = 0, 25, p(B) = 0, 6 y p(C) = 0, 15 respectivamente. La probabilidad de
ser alcanzado por la calle es 0,4 si huye por la calle B es 0,5 y si huye por la calle C
es 0,6. (a) Calcule la probabilidad de que la polica alcance al ladron. (b) Si el ladron
ha sido alcanzado, cual es la probabilidad de que haya sido en la calle A?
15. De una urna con 4 bolas blancas y 2 negras se extraen al azar, sucesivamente y sin
reemplazamiento, dos bolas, (a) Cual es la probabilidad de que las bolas extradas
101
5. Probabilidad
sean blancas? (b) Si la segunda bola ha resultado ser negra, cual es la probabilidad
de que la primera tambien lo haya sido?
16. Sean A y B dos sucesos de un experimento aleatorio tales que: P (A) = 0, 6, P (B) =
0, 5 y P (Ac B c ) = 0, 7. (a) Calculese P (A B) y razonese si los sucesos A y B son
independientes. (b) Calculese P (A B).
17. En un estudio realizado en cierta Universidad se ha determinado que un 20 % de

sus estudiantes no utilizan los transportes publicos para acudir a sus clases y que
un 65 % de los estudiantes que utilizan los transportes publicos tambien hacen uso
del comedor universitario. Calcular la probabilidad de que seleccionado al azar un
estudiante en esa Universidad resulte ser usuario de los transportes publicos y del
comedor universitario. Justificar la respuesta.
18. Una urna contiene dos monedas de plata y tres de cobre. Otra contiene cuatro mo-
nedas de plata y tres de cobre. Si se elige una urna al azar y se extrae una moneda
al azar. Cual es la probabilidad de que la moneda extrada sea de plata?.
19. Un dado esta trucado de manera que son iguales las probabilidades de obtener 2, 4
o 6, tambien son iguales las probabilidades de obtener 1, 3 o 5 y la probabilidad de
obtener 2 es doble que la probabilidad de sacar 1. Deducir razonadamente cual es la
probabilidad de que al lanzar el dado dos veces se obtenga una suma igual a 7.
20. Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas
al azar, si son partidarias o no de consumir un determinado producto. (a) Escribe
el espacio muestral asociado a dicho experimento, utilizando la letra s para las res-
puestas afirmativas y n para las negativas. (b) Que elementos del espacio muestral
anterior constituyen el suceso A:={al menos dos de las personas son partidarias de
consumir el producto}? (c) Describe el suceso contrario de A:={mas de dos personas
son partidarias de consumir el producto}.
21. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras
realizadas por estas, el 80 % supera las 600 BsF, mientras que de las compras reali-
zadas por hombres solo el 30 % supera esa cantidad. (a) Elegido un ticket de compra
al azar, cual es la probabilidad de que supere las 600 BsF? (b) Si se sabe que el
ticket de compra no supera las 600 BsF cual es la probabilidad de que la compra
haya sido hecha por una mujer?
22. Se extrae una carta de una baraja espanola de 40 cartas. Si la carta extrada es un rey,
nos dirigimos a la urna I; en caso contrario a la urna II. A continuacion, extraemos
una bola. El contenido de la urna I es de 7 bolas blancas y 5 negras y el de la urna II
es de 6 bolas blancas y 4 negras. Halla: (a) La probabilidad de que la bola extrada
sea blanca y de la urna II. (b) La probabilidad de que la bola extrada sea negra.
102
23. En una ciudad el 55 % de los habitantes consume pan integral, el 30 % consume pan
de multicereales y el 20 % consume ambos. Se pide: (I) Sabiendo que un habitante
consume pan integral, cual es la probabilidad de que coma pan de multicereales? (II)
Sabiendo que un habitante consume pan de multicereales, cual es la probabilidad
de que no consume pan integral? (III) Cual es la probabilidad de que una persona
de esa ciudad no consuma ninguno de los dos tipos de pan?
24. Si A y B son dos sucesos tales que: P (A) = 83 , P (B) = 1

2 y P (A B) = 14 . Calcula
P (Ac B c ).
25. Tengo dos urnas, dos bolas blancas y dos bolas negras. Se desea saber como debo
distribuir las bolas en las urnas para que, al elegir una urna al azar, sea maxima la
probabilidad de obtener una bola blanca. La unica condicion exigida es que cada una
tenga al menos una bola.
26. Se estima que solo un 20 % de los que compran acciones en Bolsa tienen conocimientos
bursatiles. De ellos el 80 % obtienen beneficios. De los que compran acciones sin
conocimientos bursatiles, solo un 10 % obtienen beneficios. Se desea saber: (a) El
tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios. (b)
Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha
obtenido beneficios, cual es la probabilidad de que tenga conocimientos bursatiles?
27. El equipo directivo de cierta empresa del sector de hostelera esta constituido por 25
personas de las que un 60 % son mujeres. El gerente tiene que seleccionar a una per-
sona de dicho equipo para que represente a la empresa en un certamen internacional.
Decide lanzar una moneda: si sale cara, selecciona a una mujer y si sale cruz, a un
hombre. Sabiendo que 5 mujeres y 3 hombres del equipo directivo no hablan ingles,
determina, justificando la respuesta, la probabilidad de que la persona seleccionada
hable ingles.
28. Dos personas piensan cada una de ellas un numero del 0 al 9. Calcula la probabilidad
de que las dos personas no piensen el mismo numero.
29. Dos sucesos tienen probabilidades 0,4 y 0,5. Sabiendo que son independientes, calcula
la probabilidad de que no suceda ninguno de los dos.
30. En una Universidad existen tres facultades: A, B y C. En A hay matriculadas 150

chicas y 50 chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos.
(a) Calcula la probabilidad de que un estudiante, elegido al azar, sea chico. (b) Si un
estudiante elegido al azar resultara ser chico, cual es su facultad mas probable?
31. Se escuchan tres discos y se vuelven a guardar al azar. Cual es la probabilidad de que
al menos uno de los discos haya sido guardado en el envoltorio que le corresponda?
103
5. Probabilidad
32. Se considera una celula en el instante t=0. En el instante t=1 la celula puede: bien
reproducirse, dividiendose en dos, con probabilidad 3/4, o bien morir con probabi-
lidad 1/4. Si la celula se divide, entonces en el tiempo t=2 cada uno de sus dos
descendientes puede tambien subdividirse o morir, con las mismas probabilidades
que antes, independientemente uno de otro. (a) Cuantas celulas es posible que haya
en el tiempo t=2? (b) Con que probabilidad?
33. Una caja contiene 10 bolas blancas, 5 negras y 5 rojas. Se extraen dos bolas conse-
cutivamente de la caja. Calcula la probabilidad de que las dos sean blancas si: (a)
Antes de extraer la segunda bola se vuelve a meter la primera en la caja. (b) La
segunda bola se extrae sin haber metido la primera en la caja.
34. Un monedero contiene 2 monedas de plata y 3 de cobre, y otro contiene 4 de plata

y 3 de cobre. Si se elige un monedero al azar y se extrae una moneda Cual es la
probabilidad de que sea de plata?
35. En una oficina el 70 % de los empleados son asturianos. De entre los asturianos,
el 50 % son hombres, mientras que de los no asturianos, solo son hombres el 20 %.
Que porcentaje de empleados no asturianos son mujeres? (a) Calcula la probabilidad
de que un empleado de la oficina sea mujer. (b) Fernando trabaja en dicha oficina.
Cual es la probabilidad de que sea asturiano?
36. El 12 % de los habitantes de un pas padece cierta enfermedad. Para el diagnostico

de esta, se dispone de un procedimiento que no es completamente fiable ya que da
positivo en el 90 % de los casos de personas realmente enfermas, pero tambien da
positivo en el 5 % de personas sanas. Cual es la probabilidad de que este sana una
persona a la que el procedimiento le ha dado positivo?
37. En un ayuntamiento hay 5 concejales del partido A, 4 del B y 1 del C. Si se eligen

al azar y sucesivamente tres concejales, cual es la probabilidad de que los tres sean
del partido A? y la de que pertenezcan a partidos distintos?
38. Un dado ha sido trucado de manera que la probabilidad de sacar un numero par es el
doble que la de sacar un numero impar. Se lanza el dado y se pide: La probabilidad de
obtener un numero par (a) Si, a la vez, se lanza un dado no trucado, la probabilidad
de obtener un numero par y un numero impar. (b) Si, a la vez, se lanza un dado no
trucado, la probabilidad de obtener, al menos, un numero impar.
104
6. Variable aleatoria y funcion de
distribucion
Whether statistics be an art or a science... or a scientific art, we concern ourselves little. It is the
basis of social and political dynamics, and affords the only secure ground on which the truth or
falsehood of the theories and hypotheses of that complicated science can be brought to the test.
- Lambert-Adolphe-Jacques Quetelet. Letters on the Theory of Probabilities (1846), trans.

O. G. Downes (1849).
6.1. Introduccion
En este tema se tratara de formalizar numericamente los resultados de un fenomeno
aleatorio. Por tanto, una variable aleatoria es un valor numerico que corresponde a un
resultado de un experimento aleatorio. Algunos ejemplos son: numero de caras obtenidas
al lanzar seis veces una moneda, numero de llamadas que recibe un telefono durante una
hora, tiempo de fallo de una componente electrica, etc.
El estudio que se hara en este tema sera analogo al que se hace con las variables es-
tadsticas en descriptiva. As retomaremos el concepto de distribucion y las caractersticas
numericas, como la media y varianza. El papel que all jugaba la frecuencia relativa lo
juega ahora la probabilidad. Esto va a proporcionar aspectos y propiedades referentes a
fenomenos aleatorios que permitiran modelos muy estudiados en la actualidad.
En este tema se introduce el concepto de variable aleatoria y se estudian los distintos
tipos de variables aleatorias a un nivel muy general, lo que nos permitira manejar los
modelos estadsticos para describir los posibles resultados de un experimento aleatorio y
asignar probabilidades a los diferentes sucesos que nos interesen.
Tanto en la vida cotidiana como en el campo cientfico estamos habituados a observar
fenomenos aleatorios cuyos resultados se expresan mediante numeros; por ejemplo el vol-
taje de salida en una fuente de alimentacion, el numero de personas en la cola del cine, la
velocidad de conexion a la red, etc. Incluso en problemas de naturaleza puramente cuali-
tativa es muy frecuente recurrir a la codificacion numerica; en situaciones tales como: el
diagnostico de un paciente sano o enfermo, preguntas del tipo estudias o trabajas?, etc.,
las respuestas son usualmente codificadas con 0 y 1, aunque en realidad podra emplearse
cualquier pareja de smbolos con igual precision.
105
6. Variable aleatoria y funcion de distribucion
6.2. Variable aleatoria unidimensional

Este proceso de cuantificacion nos lleva de manera natural a considerar la siguiente
definicion: Dado un experimento aleatorio y asociado al mismo, un espacio probabilstico
(E, A, P ), una variable aleatoria (V.A.) es una aplicacion X : E 7 R, a cada valor de X,
del espacio muestral le hace corresponder un numero real. Se dice que X es una variable
aleatoria si para cualquier x perteneciente a R, el conjunto de los sucesos elementales le
hace corresponder un valor que verifica:
X R, X(S) X (6.1)
Ejemplo 6.1 Consideramos un experimento aleatorio de lanzar una moneda al aire tres
veces y anotamos el resultado. Se define la variable aleatoria X como numero de caras
aparecidas en los tres lanzamientos. Calcular el espacio muestral y comprobar que es una
variable aleatoria.
La solucion es la siguiente, el espacio muestral esta dado por E = (C, X, X), (X, C, X), (X, X, C), (C, C, X
en donde
Eventos Valor de la v.a.
X0
(X, X, X) 0X1
(C, C, C)(X, C, X)(X, X, C) 1X2
(C, C, X)(C, X, C)(X, C, C) 2X3
(C, C, C) X>3
En general emplearemos las siglas v.a. para referirnos a una variable aleatoria.
Para caracterizar la distribucion de probabilidad inducida por una v.a. X definiremos
una nueva funcion mas sencilla de manejar:
Definicion. (Funcion de distribucion). Dada la v.a. X se denomina funcion de dis-
tribucion asociada a X, a la funcion F : R 7 R definida por:
F (t) = P r[X t] = P r(X (, t]), t R. (6.2)
Las propiedades mas importantes de las funciones de distribucion son:

1. F () = lmn7 P r[X t] = 0.
2. F () = lmn7 P r[X t] = 0.
3. La funcion es continua por la derecha, es decir, lmh70+ F (t + h) = F (t)
4. F es no decreciente, es decir, si t1 < t2 entonces F (t1 ) F (t2 ).
Teorema. Una funcion F : R 7 R se dice que es de distribucion si y solo si verifica las

cuatro propiedades anteriores.
106
6.3. Variables discretas
6.3. Variables discretas

Definicion. (Variable discreta). Una variable aleatoria discreta es aquella que solo
puede tomar valores dentro de un conjunto finito o infinito numerable.
Definicion. (Funcion de probabilidad). Sea XPuna v.a. discreta que toma los va-
lores xi con probabilidades pi = P r(X = xi ), con i pi = 1. Se denomina funcion de
probabilidad de la variable X a la funcion que asigna a cada xi su probabilidad pi .
En las variables aleatorias discretas la funcion de distribucion viene dada por la siguiente
expresion:
X
F (t) = P r[X t] = P r(xi ). (6.3)
xi t
Esta funcion es escalonada, no decreciente, con saltos de discontinuidad en los puntos

xi . El valor del salto en xi coincide con la probabilidad, pi , de dicho valor.
6.4. Variables continuas

Definicion. (Variable continua). Una variable aleatoria continua es aquella que toma
valores en uno o varios intervalos de la recta real.
En las v.a. continuas la funcion de distribucion no se puede calcular como la suma de
las probabilidades de ciertos puntos porque el conjunto de posibles valores de la variable
es no numerable. Para abordar esta nueva situacion necesitamos la nocion de funcion de
densidad.
Definicion. (Funcion de densidad). Dada una v.a. continua X, su funcion de densi-
dad es la funcion real de variable real
P r(x h X x + h)
f (x) = lm . (6.4)
h70+ 2h
De este modo, surge el concepto de funcion de densidad como la funcion lmite a la cual
se aproxima el histograma. As, la probabilidad de un intervalo (a, b) sera el area limitada
por esta funcion de densidad, las rectas x = a, x = b y el eje de abscisas.
Aunque, de acuerdo con la anterior, la probabilidad de que la variable aleatoria tome un
valor concreto es igual a cero, tiene sentido analizar lo denso que esta repartida la proba-
bilidad en torno a ese valor.
De la definicion anterior, se deduce que la funcion de densidad verifica las siguientes

propiedades:
f (x) > 0, x R, (6.5)

Z
f (x)dx = 1. (6.6)

107
En general, cualquier funcion real que verifica las propiedades anteriores es la funcion
de densidad de alguna v.a. continua X.
La funcion de distribucion de una v.a. continua X se expresa a partir de la funcion de
densidad como: Z t
F (t) = f (x)dx, x R (6.7)

Esta funcion es continua.
Por lo tanto, la funcion de densidad de una v.a. continua es la derivada de su funcion de
distribucion, f (x) = F 0 (x).
6.5. Caractersticas de una v.a.

Las medidas resumen definidas para v.e. pueden generalizarse al caso de variables alea-
torias, sin mas que equiparar las frecuencias relativas de variables estadsticas con las
probabilidades de las variables aleatorias. Entre los descriptores mas habituales de las
variables aleatorias se encuentran los siguientes.
6.5.1. Definicion. (Esperanza Matematica)

Cuando se realiza un experimento determinista el resultado del experimento es unico
en contraposicion con un experimento aleatorio en el cual existen un intervalo de valores,
segun la variable aleatoria definida, donde es posible que ocurra cualquier resultado. En
ocasiones, por simplicidad, se aproxima la forma de explicar un experimento aleatorio en
terminos de un experimento determinista pero con la dificultad de no tener argumentos
suficientes para escoger el resultado unico que se asociara al experimento determinista. El
conocimiento del concepto de valor esperado ayuda a eliminar la dificultad planteada.
Dada una v. a. X definida sobre (E,A,Pr), se denomina esperanza o valor medio de X a
la siguiente expresion
X
= E(X) = xi P (xi ), si X es discreta, (6.8)
xi SX
Z
= E(X) = xf (x)dx, si X es continua (6.9)

La esperanza de una v.a. verifica las siguientes propiedades:

E(aX + b) = aE(X) + b. (6.10)
E(X Y ) = E(X) E(Y ). (6.11)
Si X e Y son independientes, entonces E(XY ) = E(X)E(Y ). (6.12)
La estructura de la Ecuacion 4.1 se presenta en otros contextos, como por ejemplo en
Mecanica, donde la funcion de densidad de probabilidades tiene el sentido de la distribucion
de la masa a lo largo de un eje y el valor esperado se corresponde con el centro de esa masa.
108
6.6. Inecuacion de Chevyshev
En el contexto de la teora de probabilidades una variable aleatoria estara definida en

un cierto intervalo cuyo centro es su valor esperado. En este sentido, se podra decir que el
experimento aleatorio esta definido alrededor del valor esperado y la ponderacion de cada
uno de los posibles resultados viene dada en terminos del valor de la funcion de densidad
correspondiente en cada punto. El concepto del valor esperado permite aglutinar en un
numero los aportes ponderados de cada uno de los posibles resultados del experimento.
Ejemplo 6.2 Una v.a. Y cuya funcion de densidad de probabilidad esta dada por la ex-
presion: f (y) = exp(y), cuando y 0 y cero para cualquier otro valor. Hallar el valor
esperado de dicha funcion de densidad de probabilidad.
6.5.2. Definicion. (Varianza)

En la seccion anterior se analizo la definicion de valor esperado tanto desde el punto de
vista matematico como desde el punto de vista del fenomeno aleatorio involucrado. Este
valor permite ubicar rapidamente la region donde esta definida la variable como aquella
region que se encuentra alrededor del valor esperado. Pero no proporciona informacion
acerca del tamano de esa region. Una medida de la dispersion o de la concentracion de la
variable alrededor de su valor esperado lo proporciona la varianza.
La varianza de una v.a. X viene dada por la expresion
X
2 = V ar(X) = E (X )2 = (xi )2 P (xi ), si X es discreta, (6.13)

xi SX
Z
2 = V ar(X) = E (X )2 = (x )2 f (x)dx,

si X es continua (6.14)

La varianza de una v.a. verifica las siguientes propiedades:
V ar(X) > 0. (6.15)

2
V ar(aX + b) = a V ar(X). (6.16)
2 2
V ar(X) = E(X ) E(X) . (6.17)
Si X e Y son independientes, V ar(X + Y ) = V ar(X Y ) = V ar(X) + V ar(Y
(6.18)
).
Ejemplo 6.3 Una v.a. Y cuya funcion de densidad de probabilidad esta dada por la expre-
sion: f (y) = exp(y), cuando y 0 y cero para cualquier otro valor. Hallar la varianza
de dicha funcion de densidad de probabilidad.
6.6. Inecuacion de Chevyshev

La definicion de variable aleatoria y de las funciones de distribucion y de densidad refleja
el comportamiento del experimento aleatorio que se esta analizando. Se ha verificado en
diversas oportunidades que la forma de las funciones de distribucion y de densidad debe
109
seguir un cierto patron que obliga a que no todo tipo de funcion puede ser considerada
para este tipo de representacion. En este orden de ideas, el conocimiento del valor esperado
y la varianza proporciona informacion adicional acerca de la forma de estas funciones y,
en consecuencia, de las probabilidades asignadas a diversos tipos de eventos. Este tipo
de informacion llega hasta el extremo de indicar topes en el valor de la probabilidad de
ocurrencia de ciertos eventos para cualquier tipo de variable aleatoria.
La inecuacion de Chevyschev permite conocer un lmite al valor que puede tener la
probabilidad de un cierto tipo de evento independientemente de la forma de su funcion de
densidad de probabilidades.
Definicion: Sea una variable aleatoria X de la cual solo conocemos su valor esperado
E(X) y su varianza V (X). Sea un evento del tipo kX E(X)k kX , entonces la pro-
babilidad de ocurrencia de este evento tiene un valor mnimo que es una funcion del valor
real positivo k y no depende de la forma de la funcion de densidad de probabilidades de
X.
1
P kX E(X)k kX > 1 2 (6.19)
k
Notas:
El valor mnimo de la probabilidad del evento mencionado se calcula utilizando el

lado derecho de la Ecuacion anterior.
La expresion anterior se conoce como la inecuacion de Chevyschev.

1. Se lanza al aire una moneda tres veces. Calcula la funcion de masa y la de distribucion
de X: No de cruces obtenido.
2. Se ha comprobado experimentalmente que la vida util de una batera es una variable

aleatoria cuya funcion de densidad es:
f (x) = beax , si x 0, con a, b 0. (6.20)
Determina la relacion entre a y b. Obten la funcion de distribucion de la variable y

calcula la probabilidad de que una batera dure un tiempo mayor a 1/a. Sol. P=0,3678
3. Un PEQ consta de 10 preguntas tipo test, cada una de ellas con 4 posibles respues-
tas. Cada pregunta contestada correctamente es un punto. Cada fallo descuenta 0,5
puntos. Como sera la calificacion del alumno si este contesta a todas al azar.
110
4. Por experiencia se sabe que la probabilidad de que llames al ambulatorio y no comu-

nique es de 0,25. Demuestra matematicamente que el numero esperado de llamadas
que debes hacer para que te cojan es de 4.
5. Una variable aleatoria tiene por funcion de densidad:

1 2
f (x) = (x + 1), si 0 x 3. (6.21)
12
Calcular la media de X y su varianza. Sol. = 2,0625, 2 = 0,5461.
6. Los retrasos en las entregas de los pedidos en una fabrica respecto de la planificacion
establecida siguen una variable aleatoria cuya funcion de densidad es:
2 1
f (x) = , si 1 x 1. (6.22)
1 + x2
Cual es el retraso medio de un pedido y la desviacion tpica. Propone un intervalo
de tiempos de retraso, centrado en el retraso medio, para el 90 % de los casos. Sol.
= 0, 2 = 2,28, (-0,84; 0,84)
7. Una fabrica de coches vende de media, al ano, 50 unidades de su modelo mas caro,
con una desviacion tpica de 10. Cuantos coches de este modelo debe de tener dis-
ponibles si se quiere garantizar la demanda al momento de estos vehculos, con una
probabilidad del 95 %? Sol. 95 coches
111
7. Distribuciones de Probabilidad Binomial y
Normal
If we betake ourselves to the statistical method, we do so confessing that we are unable to follow
the details of each individual case, and expecting that the effects of widespread causes, though very
different in each individual, will produce an average result on the whole nation, from a study of
which we may estimate the character and propensities of an imaginary being called the Mean
Man.
- James Clerk Maxwell. Does the Progress of Physical Science tend to give any advantage to
the opinion of necessity (or determinism) over that of the continuency of Events and the Freedom
of the Will? In P. M. Hannan (ed.), The Scientific Letters and Papers of James Clerk Maxwell
(1995), Vol. 2, 1862-1873, 818.
7.1. Introduccion
Estudiaremos en este tema dos de las distribuciones de probabilidad mas importantes y
que son imprescindibles a la hora de adentrarnos en el estudio de la inferencia estadstica.
La distribucion binomial es uno de los primeros ejemplos de las llamadas distribuciones
discretas (que solo pueden tomar un numero finito, o infinito numerable, de valores). Fue
estudiada por Jakob Bernoulli (Suiza, 1654-1705), quien escribio el primer tratado impor-
tante sobre probabilidad, Ars conjectandi (El arte de pronosticar). Los Bernoulli formaron
una de las sagas de matematicos mas importantes de la historia. La distribucion normal
es un ejemplo de las distribuciones continuas, y aparece en multitud de fenomenos sociales
y cientficos. Fue estudiada, entre otros, por J.K.F. Gauss (Alemania, 1777-1855), uno de
los mas famosos matematicos de la historia. La grafica de la distribucion normal en forma
de campana se denomina Campana de Gauss.
7.2. La distribucion binomial o de Bernoulli

La distribucion binomial esta asociada a experimentos del siguiente tipo:
Realizamos n veces cierto experimento en el que consideramos solo la posibilidad de
exito o fracaso.
La obtencion de exito o fracaso en cada ocasion es independiente de la obtencion de
exito o fracaso en las demas ocasiones.
113
7. Distribuciones de Probabilidad Binomial y Normal
La probabilidad de obtener exito o fracaso siempre es la misma en cada ocasion.

Veamoslo con un ejemplo.
Tiramos un dado 7 veces y contamos el numero de cincos que obtenemos. Cual es la
probabilidad de obtener tres cincos?.
Este es un tpico ejemplo de distribucion binomial, pues estamos repitiendo 7 veces el
experimento de lanzar un dado. Cual es nuestro exito?.
Evidentemente, sacar un 5, que es en lo que nos fijamos.
El fracaso, por tanto, sera no sacar 5, sino sacar cualquier otro numero. Por tanto, exito
= E = {sacar un 5} 7 p(E) = 16 , Fracaso = F = {no sacar un 5} 7 p(F ) = 56 .
Para calcular la probabilidad que nos piden, fijemonos en que nos dicen que sacamos
3 cincos y por lo tanto tenemos 3 exitos y 4 fracasos, de cuantas maneras pueden darse
estas posibilidades?. Podramos sacar 3 cincos en las 3 primeras tiradas y luego 4 tiradas
sin sacar cinco, es decir: EEEFFFF. Pero tambien podramos sacar EFEFFFE, es decir
que en realidad estamos calculando de cuantas maneras se pueden ordenar 4 fracasos y
3 exitos. Recordando las tecnicas combinatorias, este problema se reduce a calcular las
permutaciones con elementos repetidos:
7! 765
P73,4 = = = 35 formas (7.1)
3!4! 321
1 5
Y por tanto, como p(E) = 6 y tengo 3 exitos y p(F ) = 6 y tengo 4 fracasos:
1 1 1 5 5 5 5
p(tener 3 exitos y 4 fracasos) = 35 = 0,0781 (7.2)
6 6 6 6 6 6 6
Formalizando lo obtenido, en una variable binomial con 7 repeticiones y con probabilidad
de exito 16 , la probabilidad de obtener 3 exitos es 0.0781, y lo expresaramos:

1
Bin 7; , entonces p(x = 3) = 0,0781 (7.3)
6
Como repetir este proceso sera bastante penoso en la mayora de los casos, lo mejor es
recurrir a la siguiente formula que expresa la probabilidad de obtener cierto numero de
exitos en una distribucion binomial.
7.2.1. Definicion de distribucion binomial

Si realizamos n veces un experimento en el que podemos obtener exito, E, con proba-
bilidad p y fracaso, F, con probabilidad q (q = 1 p), diremos que estamos ante una
distribucion binomial de parametros n y p, y lo representaremos por Bin(n; p). En este
caso la probabilidad de obtener k exitos viene dada por:

n k (nk) n k
p(x = k) = p q = p (1 p)(nk) (7.4)
k k
114
7.2. La distribucion binomial o de Bernoulli
Observar que las probabilidades de exito y fracaso son complementarias, es decir, q = 1p

y p = 1 q, por lo que basta saber una de ellas para calcular la otra.
Ejemplo 7.1 Antes tenamos Bin 7; 16 , y queramos calcular p(X = 3) (obtener 3 exi-

tos). Aplicando la formula:

3 4
7 1 5
p(x = 3) = = 0,0781. (7.5)
3 6 6
J
Ejemplo 7.2 Supongamos que la probabilidad de que una pareja tenga un hijo o una hija
es igual. Calcular la probabilidad de que una familia con 6 descendientes tenga 2 hijos. En
este caso Exito = E = tener hijo y p(E) = 0,5. F racaso = F = tener hija y p(F ) = 0,5.
Estamos por tanto ante una binomial Bin(6; 0,5) y nos piden p(X = 2). Si aplicamos la
formula es:
6
p(x = 2) = 0,52 0,54 = 0,2344. (7.6)
2
La eleccion de exito o fracaso es subjetiva y queda a eleccion de la persona que resuelve

el problema, pero teniendo cuidado de plantear correctamente lo que se pide. En el caso
concreto del ejemplo anterior, si: Exito = tener hija, como nos piden la probabilidad de
que una familia con 6 hijos tenga 2 hijos, si el exito es tener hija hemos de plantearnos
cual es la probabilidad de tener 4 exitos (4 hijas), es decir:

6
p(x = 4) = 0,54 0,52 = 0,2344. (7.7)
4
Evidentemente sale lo mismo, pero hay que ser consecuente a la hora de elegir el exito y
el fracaso y la pregunta que nos hagan.
7.2.2. El uso de las tablas de la distribucion binomial

La distribucion binomial se encuentra tabulada por lo que es facil calcular probabilidades
sin necesidad de hacer demasiadas cuentas. Para usar las tablas de la distribucion binomial
es necesario conocer:
El numero de veces que se realiza el experimento (n).
La probabilidad de exito (p).
El numero de exitos (k).
La probabilidad p se busca en la primera fila (valores desde 0.01 hasta 0.5).

El numero de veces que se realiza el experimento, en la primera columna (valores desde
2 a 10) y el numero de exitos a su lado.
115
Ejemplo 7.3 Por ejemplo en el caso anterior, Bin(6; 0,5) , p(X = 2), la columna p = 0,5
es la ultima, y cuando n = 6 y k = 2 encontramos 0.2344, el valor que habamos calculado.
El caso en que p > 0,5, no se encuentra tabulado. La razon es bien sencilla. Si p > 0,5,
entonces q < 0,5 y basta intercambiar los papeles de exito y fracaso para que podamos
utilizar la tabla.
Ejemplo 7.4 La probabilidad de que un alumno de 2do de Bachillerato apruebe las Ma-
tematicas es de 0.7. Si consideramos un grupo de 8 alumnos, cual es la probabilidad de
que cinco de ellos aprueben las Matematicas?. Si exito = aprobar y fracaso = suspender,
entonces p = 0,7 y q = 0,3. Tenemos, por tanto, una Bin(8; 0,7). Nos piden calcular
p(X = 5), que no se puede calcular mediante las tablas porque p = 0,7 y solo tenemos has-
ta p = 0,5. Por tanto si intercambiamos exito = suspender y fracaso = aprobar entonces
p = 0,3, q = 0,7, es decir la nueva binomial es Bin(8; 0,3) y nos piden que aprueben 5 de
8, es decir que suspendan 3 de 8 o lo que es lo mismo, que tengamos 3 exitos, p(X = 3), y
buscando en la tabla es p(X = 3) = 0,2541. Tambien, desde luego podramos haber utilizado
la formula desde el principio, utilizar la Bin(8; 0,7) y olvidarnos de tablas para hacer:

8
p(x = 5) = 0,75 0,33 = 0,254. (7.8)
5
7.2.3. Probabilidades acumuladas

Es posible que nos pidan no solo la probabilidad de que ocurran un cierto numero
de exitos en concreto, sino que ocurran como mucho k exitos o preguntas similares. En
el ejemplo anterior, por ejemplo, podran pedirnos: a) Cual es la probabilidad de que
aprueben como mucho 2 alumnos?.
Si exito = aprobar y fracaso = suspender, p = 0,7 y q = 0,3, entonces nos piden p(X 2).
En este caso, basta pensar en que para que aprueben 2 alumnos como mucho, puede que
aprueben 2, 1 o ninguno, es decir:
p(X 2) = p(X = 0) + p(X = 1) + p(X = 2) = 0,0001 + 0,0012 + 0,01 = 0,1013 (7.9)
(haz las cuentas).

b) Cual es la probabilidad de que aprueben entre 3 y 6 alumnos (inclusive)?. Del mismo
modo:
p(3 X 6) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6)

= 0,0467 + 0,1361 + 0,2541 + 0,2965 = 0,7334
Hemos de tener en cuenta que para la distribucion binomial, en las tablas solo se ad-
miten valores hasta n = 10 (10 repeticiones del experimento). Para valores de n > 10,
inevitablemente hemos de utilizar la formula.
116
7.3. La distribucion Normal
Ejemplo 7.5 Los alumnos de cierta clase se encuentran en una proporcion del 67 % que
estudian ingles y el resto frances. Tomamos una muestra de 15 alumnos de la clase, calcu-
lar: a) Probabilidad de que al menos encontremos tres alumnos de ingles. b) Probabilidad de
que los 15 alumnos estudien ingles. c) Probabilidad de que estudien ingles entre 7 y 10 alum-
nos. Si exito = estudiar ingles, p = 0,67 y fracaso = estudiar frances, q = 1 0,67 = 0,33.
Manejamos por tanto una Bin(15; 0,67). Para la parte a), se tendra
p(X > 3) = p(X = 3) + p(X = 4) + p(X = 5) + p(X = 6) + ... + p(X = 15). (7.10)
Una opcion es calcular estas 13 probabilidades y sumarlas. Como hay que aplicar la formula
para calcular cada una, la tarea se puede hacer bastante larga. Otra opcion, mas sencilla,
es pasar al complementario. El complementario de encontrar al menos 3 alumnos de ingles
es encontrar como mucho 2 alumnos de ingles, p(X 2). Es decir,
p(X > 3) = 1 p(X < 3) = 1 p(X 2) = 1 (p(X = 0) + p(X = 1) + p(X = 2)) (7.11)
y solo tenemos que calcular 3 probabilidades: p(X = 0) 0 , p(X = 1) = 0,000001,

p(X = 2) = 0,000026 (compruebalo!). Por lo cual,
p(X > 3) = 1 (0 + 0,000001 + 0,000026) = 1 0,000027 = 0,999973 (7.12)
Para la parte b), se tendra

p(X = 15) = 0,0025 (7.13)
(aplica la formula). Para la parte c), se tendra
p(7 X 10) = p(X = 7) + p(X = 8) + p(X = 9) + p(X = 10) =

= 0,0549 + 0,1114 + 0,1759 + 0,2142 = 0,5564.
7.2.4. Media y desviacion tpica en una distribucion binomial

Aunque no se demostrara, en una distribucion binomial Bin(n; p), el numero esperado
de exitos o media, viene dado por x = np. (Recordemos que la media es una medida de
centralizacion).
La desviacion tpica, , que es una medida de dispersion y mide lo alejados que estan

los datos de la media, viene dada por = npq.

Al estudiar aspectos tan cotidianos como:
Caracteres morfologicos de individuos ( personas, animales, plantas) de una misma

raza. como tallas, pesos, envergaduras, etc.
117
Caracteres fisiologicos, como el efecto de una misma dosis de un farmaco, o de una

misma cantidad de abono.
Caracteres sociologicos, como el consumo de ciertos productos por individuos de un

mismo grupo humano.
Caracteres psicologicos, como el cociente intelectual, grado de adaptacion a un medio.
Caracteres fsicos, como la resistencia a la rotura de ciertas piezas.
todos ellos tienen en comun que se distribuyen normalmente. Que quiere decir esta expre-
sion?. Pues, por ejemplo, si hacemos una estadstica para conocer la altura de 1400 mujeres
y representamos los resultados en un diagrama de barras, obtenemos:
Figura 7.1.: Distribucion de estaturas de 1400 mujeres.
Las graficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un
aumento paulatino hasta llegar a la parte central del recorrido, donde esta la mayora de
ellos.
Definicion: Diremos que una distribucion de probabilidad sigue una distribucion normal
de media x y desviacion tpica , y lo representaremos por N (x; ) cuando la representacion
grafica de su funcion de densidad es una curva positiva continua, simetrica respecto a la
media, de maximo en la media, y que tiene 2 puntos de inflexion , situados a ambos lados
de la media (x y x + respectivamente) y a distancia de ella, es decir de la forma:
Dependiendo de los valores que tomen x y , la grafica de esta funcion puede ser mas
o menos alargada, achatada, etc..., pero en cualquier caso siempre tiene las mismas condi-
ciones de simetra, continuidad, etc, resenadas anteriormente.
El concepto de funcion de densidad introducido anteriormente no se estudiara con pro-
fundidad. Baste decir que la funcion de densidad determina la forma de cada distribucion
de probabilidad. En el caso de la distribucion normal de parametros x y , dicha funcion
viene dada por:
1 (xx)2
f (x) = e 22 (7.14)
2 2
118
1
Figura 7.2.: Distribucion normal N (x; ). El maximo esta en (x, ).
2 2
Propiedad: El area encerrada bajo la curva normal N (x; ) siempre es 1.

La demostracion de este resultado no es nada sencilla e implica el uso de resultados
matematicos que exceden el nivel de este curso.
De entre todas las curvas normales N (x; ), la mas sencilla, usada y conocida es aquella
que tiene por media 0 y por desviacion tpica 1, N (0, 1).
Esta normal estandar se suele representar por Z. La grafica de esta curva se denomina
campana de Gauss y se puede observar en la figura:
Figura 7.3.: Distribucion normal N (0; 1). El maximo esta en (0, 12 ).
Su funcion de densidad sera:

1 x2
f (x) = e 2 (7.15)
2
Puesto que el area bajo esta curva normal es 1, podemos definir una probabilidad de la
siguiente manera: Para un valor cualquiera k, definimos la probabilidad de que la distribu-
cion Z, N (0; 1), sea menor o igual que k como:
p(Z k) = Area encerrada bajo la curva normal N (0, 1) desde hasta k (7.16)
(es decir la parte rayada de la figura siguiente).

Ahora bien, como calcular dicha area?. Facil: Dichas areas o probabilidades se encuen-
tran tabuladas.
119
Figura 7.4.: Area encerrada por la curva normal desde hasta k.
7.3.1. Uso de las tablas de la distribucion normal N (0; 1)

La normal N (0; 1) se encuentra tabulada, para valores a partir de 0 y hasta 3.99. Si por
ejemplo queremos calcular p(Z 2,78), hemos de realizar los pasos:
Buscar la parte entera y las decimas en la primera columna (en este caso 2.7).
Buscar las centesimas en la primera fila (en este caso 8).
En el punto comun a la fila y la columna que hemos encontrado, tenemos la proba-

bilidad buscada, en este caso 0.9973. Por tanto p(Z 2,78) = 0,9973.
Si queremos calcular una probabilidad de un valor mayor que 3.99, basta fijarse en que
las probabilidades correspondientes a valores tales como 3.62 y mayores ya valen 0.9999
(practicamente 1). Por eso, para estos valores mayores que 3.99, diremos que la probabilidad
es aproximadamente 1. As: p(Z 5,62) 1 aunque no aparezca en la tabla.
Por otra parte, fijemonos en que en este tipo de distribuciones no tiene sentido plantearse
probabilidades del tipo p(Z = k), ya que siempre valen 0, al no encerrar ningun area. Por
tanto, si nos pidiesen p(Z = 3,2), basta decir que p(Z = 3,2) = 0.
Este tipo de distribuciones en las cuales la probabilidad de tomar un valor concreto es
0 se denominan distribuciones continuas, para diferenciarlas de otras en las que esto no
ocurre, como por ejemplo la binomial, que es una distribucion discreta.
As, al pasar al complementario, si tenemos Z > k, su complementario sera Z < k, pero
como incluir k no influye en la probabilidad, al calcular probabilidades podemos escribir:
p(Z > k) = 1 p(Z < k) = 1 p(Z k) (7.17)
Solo se puede hacer esto en distribuciones continuas, en el caso de la binomial esto no

se puede hacer y hay que ser cuidadosos con el paso al complementario.
Ejemplo 7.6 Buscar en la tabla de la normal estandar N (0; 1) las probabilidades: a)

p(Z 1,15), b) p(Z 0,5), c) p(Z 0,82), d) p(Z 1,05), e) p(Z 4,27), f )
p(Z 18,09).
120
7.3.2. Calculo de otras probabilidades

Si k es positivo y queremos calcular p(Z > k), es decir el area rayada: basta pasar
Figura 7.5.: p(Z > k). Basta pasar al complementario.
al complementario, es decir: p(Z > k) = 1 p(Z k) y esta ultima probabilidad ya se

encuentra tabulada.
Ejemplo 7.7 Calcular p(Z > 0,3) y p(Z > 2,07).
Si k es positivo y queremos calcular p(Z k), es decir el area: por simetra,

p(Z k) = p(Z > k) y esta se calcula como en el caso anterior. Se puede observar la
Figura 7.6.: p(Z k). Las probabilidades de valores negativos no estan tabuladas.
igualdad de areas en la figura:
Ejemplo 7.8 Calcular p(Z 0,78) y p(Z 3,2).
Si k es positivo y queremos calcular p(Z > k), es decir el area rayada: entonces,
por simetra p(Z > k) = p(Z k):
Ejemplo 7.9 Calcular p(Z > 0,96) y p(Z > 1,01).
121
Figura 7.7.: p(Z k) = p(Z > k). La simetra permite reducir este caso al anterior.
Figura 7.8.: p(Z > k).
Figura 7.9.: p(Z > k) = p(Z k). La simetra permite reducir este caso al que ya
esta tabulado.
Figura 7.10.: p(k1 Z k2 ). Probabilidad comprendida entre dos valores.
Probabilidades comprendidas entre dos valores, p(k1 Z k2 ) ,es decir el area

rayada: se calcula restando las areas:
122
Figura 7.11.: p(Z k2 ) en la primera imagen. p(Z k1 ) en la segunda. Al restar obtene-

mos el area pedida.
Ejemplo 7.10 Calcular p(0,96 Z 1,49) y p(1,32 Z 0,57).
Ejemplo 7.11 Calcular p(Z = 2), p(Z 2), p(Z > 2), p(Z 2), p(Z > 2), p(2
Z 2), p(0,81 Z 1,33).
7.3.3. Calculo de probabilidades en normales N (x; )

Si no tenemos una distribucion N (0; 1), sino una N (x; ) cualquiera, como calcular
probabilidades, si no tenemos tabla salvo para N (0; 1)?.
El siguiente resultado nos da la respuesta.
Propiedad: Si X sigue una distribucion N (x; ), entonces la variable Z = Xx sigue
una distribucion N (0, 1).
(El paso de la variable X 7 N (x; ) a la Z 7 N (0; 1) se denomina tipificacion de la
variable X).
Ejemplo 7.12 Las estaturas de 600 soldados se distribuyen de acuerdo a una distribucion
normal de media 168 y desviacion tpica 8 cm. Cuantos soldados miden entre 166 y 170
cm?. Sea X la distribucion de los soldados , X es una N (168, 8). Nos piden p(166
X 170). Utilizando el resultado anterior, primero restamos x = 168 en la desigualdad:
p(166 X 170) = p(166 168 X 168 170 168) = p(2 X 168 2).
Y ahora dividimos entre = 8, con lo que acabamos de tipificar: p(166 X 170) =
p(2 X 168 2) = p 82 X168 8 28 . Llamando a X168
8 = Z, esta ya es normal
N (0, 1) y se encuentra en las tablas: p(166 X 170) = p(0,25 Z 0,25) = p(Z
0,25) p(Z 0,25) = (tablas) = 0,5987 0,4013 = 0,1974, (pues p(Z 0,25) = p(Z >
0,25) = 1 p(Z 0,25) = 1 0,5987 = 0,4013).
Ejemplo 7.13 En una distribucion N (22, 5), calcula: p(X 27), p(X > 27), p(X > 125),
p(15 X 20), p(17 X 30).
123
Ejemplo 7.14 Los pesos de 60 soldados siguen una distribucion N (67, 5). Calcula la pro-
babilidad de que el peso sea: a) mayor de 80 kg, b) 50 kg. o menos, c) menos de 60 kg, d)
70 kg, e) entre 60 y 70 kg inclusive.
7.3.4. Otro uso de las tablas

Hasta ahora nos han dado la distribucion normal N (0; 1) y nos pedan p(Z k) siendo
k un cierto numero, y nos pedan calcular dicha probabilidad.
Ahora bien, otra pregunta puede ser: Dado que en una normal N (0; 1) sabemos que
p(Z k) = 0,9573, quien es k?.
La resolucion es bien sencilla. Basta buscar 0.9573 dentro de la tabla de la distribucion
normal, y lo encontramos en el cruce de la fila 1.7 con la columna 2, y por lo tanto k debe
ser 1.72.
Ejemplo 7.15 Calcular k si: a) p(Z k) = 0,8078. b) p(Z k) = 0,0028.
En caso de que el valor a buscar no aparezca directamente dentro de la tabla de la

distribucion normal, pueden ocurrir dos posibilidades:
Si el valor se encuentra entre dos valores de la tabla y a la misma distancia (aproxi-

madamente) de cada uno de ellos, por ejemplo: p(Z k) = 0,7982. En este caso el
valor buscado sera la media entre los valores extremos. Si buscamos en la tabla este
valor no aparece directamente, sino que se encuentra entre los valores 0.7967 (que
corresponde a 0.83) y 0.7996 (que corresponde a 0.84). Por tanto el valor de k sera:
k = 0,83+0,84
2 = 0,835.
Si el valor esta entre dos valores, pero muy cercano a uno de ellos, directamente
tomamos este valor, por ejemplo: p(Z k) = 0,7970. El valor mas cercano es 0.9767
(que corresponde a 0.83) y como el valor buscado esta muy cerca de el, entonces
directamente k = 0,83.
Si la distribucion no es normal N (0; 1), sino N (x; ), tendremos que tipificar previamente.
Ejemplo 7.16 si X sigue y p(X k) = 0,9082, calcula k. Ti-

una normal N (6; 3)k6
X6 k6
pificando: p 3 3 = 0,9082 7 p Z 3 = 0,9082, y buscando en la tabla,
k6
3 = 1,33
7 k 6 = 3,99
7 k = 9,99.
Ejemplo 7.17 Calcular k si p(X k) = 0,6141 y X sigue una N (15, 4).
Ejemplo 7.18 De una variable normal N (x; ) se sabe que p(X 7) = 0,9772 y p(X
6,5) = 0,8413. Calcular: a) x y . b) p(5,65 X 6,25). c) El numero k tal que p(X >
k) = 0,3.
124
7.4. Relacion entre la distribucion binomial y la distribucion normal
7.4. Relacion entre la distribucion binomial y la distribucion

normal
Es un hecho comprobado que cuando tenemos una distribucion Bin(n; p), a medida que
n crece, es difcil hacer uso de las formulas y/o tablas.
Por ejemplo, tiramos un dado 100 veces, calcular la probabilidad de obtener entre 20 y
33 cincos (inclusive).
Si exito = obtener cinco entonces p = 1/6 y fracaso = no obtener cinco y q = 5/6.
1
Tenemos una Bin 100; 6 , y nos piden p(20 X 33). Es inviable aplicar las tablas
(pues repetimos el experimento 100 veces) y tampoco la formula pues es inviable calcular,
por ejemplo,
3 6
100 1 5
p(X = 32) = 2 8 (7.18)
32 6 6
Como resolver el problema?. Del siguiente modo.
7.4.1. Teorema del Lmite Central

La distribucion binomial Bin(n; p) se aproxima a una curva normal de media x = np y

desviacion tpica = npq, cuando n tiende a , es decir, cuando n se hace muy grande.
La aproximacion se puede aplicar (es una buena aproximacion) solo si n es grande, en
concreto n > 30 y ademas np > 5 y nq > 5. Si no se cumplen estas condiciones NO
podemos aproximar la binomial que tengamos por una distribucion normal.
En caso de que podamos aproximar, debemos tener en cuenta que estamos pasando de
una variable discreta (binomial) a una continua (normal), y por tanto son distribuciones
diferentes. El precio que hay que pagar por pasar de una a otra se denomina correccion por
continuidad y consiste en hacer determinados ajustes para que la aproximacion realizada
sea lo mas precisa posible.
As, si nos piden p(X = k) en una distribucion binomial X, y aproximamos X por una
distribucion normal, y, no podemos calcular directamente p(Y=k) porque, como ya se ha
comentado anteriormente, en una distribucion continua todas estas probabilidades valen
0. La correccion por continuidad consiste en tomar un pequeno intervalo de longitud 1
alrededor del punto k.
De otro modo, si nos piden p(X = k) con X binomial, con la aproximacion normal Y
deberemos calcular p(k 0,5 Y k + 0,5).
Del mismo modo se razona en el caso de probabilidades acumuladas en la binomial.
Algunos ejemplos.
Si nos piden p(X < k) con X binomial, aproximando por Y normal calcularemos p(Y
k 0,5). La explicacion de que haya que restar 0.5 y no sumarlo es que queremos que X
sea menor estrictamente que k, con lo cual, si sumase 0.5 , el propio k aparecera en la
probabilidad a calcular y NO debe aparecer.
125
Por contra, si debiesemos calcular p(X k), con X binomial, fijemonos que ahora k
SI esta incluido en la probabilidad y por tanto al aproximar por la normal Y deberamos
calcular p(Y k + 0,5).
Comprender estos dos hechos es fundamental para realizar bien la correccion por conti-
nuidad al aproximar una distribucion binomial por una normal.

q
Ejemplo 7.19 En el caso anterior, x = np = 100 6 = 16,67 y = npq = 500
36 = 3,73.
De modo que, como n > 30, np = 16,67 > 5 y nq = 83,33 > 5, se pude aproximar la
binomial por la normal, es decir:

1
X 7 Bin 100; Y 7 N (16,67; 3,73) (7.19)
6

Y 16,67
Entonces: p(20 X 33) p(200,5 Y 33+0,5) = p 19,516,673,73 3,73 33,516,67
3,73 =
p(0,89 Z 4,51) = p(Z 4,51) p(Z 0,89) 1 0,8133 = 0,1867. Notemos que en
el paso senalado por (*) hemos cambiado X(binomial) por Y (normal) y se ha realizado la
correccion por continuidad.
126
8. Estimacion puntual e intervalos de
confianza. Inferencia estadstica.
To call in the statistician after the experiment is done may be no more than asking him to
perform a postmortem examination: he may be able to say what the experiment died of.
- Sir Ronald Aylmer Fisher. Indian Statistical congress, Sankhya, c.1938.
8.1. Introduccion
La razon por la que llevamos a cabo una investigacion estadstica es para obtener una
comprension de los fenomenos en una poblacion de estudio. Por ejemplo, si uno quisiera
tratar de averiguar si un cierto tratamiento basado en una cierta medicina es eficaz en el
tratamiento de una cierta enfermedad, uno debera levar a cabo un experimento para saber
esto. Sn embargo, dos cosas pasan. En primer lugar no es etico distribuir a una poblacion
el medicamento sin tener conclusiones acerca de su funcionamiento y consecuencias. Esto
no es parte de la estadstica, aqu no nos preocupamos por eso. En segundo lugar no es
factible distribuir un farmaco experimental para toda la poblacion, la cual pudiera ser
mucha cantidad. En lugar de esto, uno pudiera estudiar un pequeno subconjunto de la
poblacion la cual sabemos se llama muestra. A continuacion, se analiza la muestra y se
tratan de hacer inferencias acerca de la poblacion basandose en la muestra. Usando la
teora de la probabilidad y el lmite central Teorema, se puede entonces medir la fiabilidad
de la inferencia. Esto puede no ser siempre una tarea facil. A menudo se encuentra bastante
complicado. Sin embargo, tenemos metodos que nos aseguran buenas inferencias. Veamos
como se hace esto.
Ejemplo 8.1 Lupe esta tratando de vender su casa y tiene que determinar el valor de
mercado de la vivienda. la poblacion en este ejemplo sera todos los hogares que son simi-
lares a la suya en el barrio.El agente de bienes races de Lupe elige para la muestra las
ultimas nueve casas en ese barrio que se venden en los ultimos seis meses. El agente de
bienes races a continuacion, ajusta algunos de los precios de venta para dar cuenta de las
diferencias entre la casa de Lupe y las casas otras vendidas.
Imagine que la muestra de las ultimas 9 casas vendidas determinan los precios en miles
de Bs.F, Muestra=420, 430, 430, 440, 450, 460, 470, 470, 480. A continuacion, el agente
de bienes races toma la media de la muestra ajustada y recomienda a Lupe un valor de
mercado de su casa de Bs.F. 450.000. La inmobiliaria ha hecho una inferencia sobre el
127
8. Estimacion puntual e intervalos de confianza. Inferencia estadstica.
valor de la media de la poblacion. Para medir la fiabilidad de la inferencia, el agente de

bienes races debe tener en cuenta factores como: el tamano de la muestra pudiera ser muy
pequeno, las casas puede haber cambiado su valor en los ultimos seis meses, o que la casa
de Lupe no es exactamente igual la muestra hogares.
En lo que sigue vamos a empezar a definir y establecer la metodologa para probar

fiabilidades de este tipo.
8.2. Estimacion puntual

El ejemplo anterior es un ejemplo de estimacion, una rama de la estadstica inferencial
donde las estadsticas de la muestra se utilizan para estimar los valores de un parametro
de la poblacion. El agente de bienes races de Lupe estaba tratando de estimar la media
de la poblacion (), basado en la media de la muestra (x).
De ahora en adelante es necesario hacer una distincion entre estimadores y parametros.
LLamaremos estimadores a las medidas que corresponden a la descripcion de la muestra,
miestras que llamaremos parametros de la descripcion de la poblacion.
Estadsticos (Muestra) Parametros (Poblacion)

Media x
Varianza s2 2
Desv. estandar s
Proporcion p p
Cuadro 8.1.: Definicion de estadisticos y parametros.
En el ejemplo anterior, el agente inmobiliario de Lupe calcula la media poblacional de

las casas similares en el barrio de Lupe mediante el uso de la media muestral de Bs.F.
450.000 el precio ajustado de los hogares incluidos en la muestra.
8.2.1. Intervalo de Estimacion

Una estimacion puntual es nuestra mejor estimacion de un parametro de la poblacion,
sin embargo, probablemente no es exactamente igual al parametro. En su lugar, podemos
elegir un rango de valores que se denomina, intervalo de estimacion, que es probable que
incluya el valor del parametro de la poblacion.
Si el intervalo de estimacion es simetrico, la distancia entre el estimador puntual a los
puntos finales del intervalo de estimacion, se llama el margen de error.
Ejemplo 8.2 En el ejemplo anterior, el agente inmobiliario de Lupe podra decir que
la media de la poblacion real esta entre Bs.F. 425.000 y Bs.F. 475.000, lo que permite
128
8.3. Intervalos de confianza
un margen de Bs.F. 25.000 de error de la estimacion original de Bs. F. 450.000. Este

intervalo de estimacion tambien puede ser escrito tambien como Bs.F. 450.000 25.000.

Con probabilidad y el teorema del lmite central, podemos disenar un intervalo de es-
timacion que podemos llamar intervalo de confianza que tiene una probabilidad conocida
(nivel de confianza) de capturar el parametro real de la poblacion.
8.3.1. Intervalo de confianza para la media poblacional

Para encontrar un intervalo de confianza para la media poblacional () cuando la des-
viacion estandar de la poblacion () es conocida, y n es suficientemente grande, podemos
usar la funcion de distribucion de probabilidad normal estandar para calcular los valores
crticos para el Nivel de Confianza:
Figura 8.1.: Nivel de confianza para la media poblacional.

Intervalo de confianza = x Zc , (8.1)
n
donde x es la media de la muestra y Zc es el valor crtico en la distribucion normal. Se
tendra revisando una tabla de la distribucion normal que:
Ejemplo 8.3 El Decano de la Facultad quiere estimar el numero medio de horas trabajadas
por semana por los estudiantes. La muestra de 49 estudiantes mostro una media de 24 horas
con una desviacion estandar de 4 horas. El punto estimacion es de 24 horas (media de la
129
c: nivel de confianza Zc : valor crtico

0.90 1.645
0.95 1.960
0.99 2.578
Cuadro 8.2.: Valores crticos para distintos niveles de confianza.
muestra). Cual es el intervalo de confianza del 95 % para el numero promedio de horas

trabajadas a la semana por los estudiantes?
(1,96) 4
24 = 24 1,12 = [22,88; 25,12]horas por semana. (8.2)
49
El margen de error para el intervalo de confianza es de 1.12 horas. Podemos decir con
confianza del 95 % que el numero de horas trabajadas por los estudiantes es de entre 22.88
y 25.12 horas a la semana.
Si el nivel de confianza es mayor, entonces el margen de error tambien se incremen-

tara. Por ejemplo, si se aumentar el nivel de confianza de 99 % para el ejemplo anterior,
entonces:
(2,578) 4
24 = 24 1,47 = [22,53; 25,47]horas por semana. (8.3)
49
Algunos puntos importantes acerca de los intervalos de confianza

El intervalo de confianza se construye con variables aleatorias calculado a partir
de datos de la muestra y los intentos de predecir un parametro desconocido de la
poblacion fija con un determinado nivel de confianza.
Aumentar el nivel de confianza siempre aumentara el margen de error.
Es imposible construir un intervalo de confianza del 100 % sin hacer un censo de toda
la poblacion.
Piense en la media de la poblacion como un dardo que siempre va al mismo lugar,
y el intervalo de confianza como un blanco en movimiento que trata de atrapar el
dardo. Un intervalo de confianza del 95 % sera como un objetivo que tiene un 95 %
de posibilidades de agarrar el dardo.
8.3.2. Intervalo de confianza para la media poblacional usando la desviacion

estandar de la muestra. Distribucion t de Student
La formula para el intervalo de confianza para la media requiere el conocimiento de la
desviacion estandar de la poblacion (). En la mayora de los problemas de la vida real,
130
no conoce este valor por las mismas razones por las que no se conoce la media poblacional.
Este problema fue resuelto por el estadstico irlandes William Sealy Gosset, un empleado
de elaboracion de la cerveza Guiness. Gosset, sin embargo, fue castigado por Guiness por
el uso de su propio nombre en la publicacion de artculos cientficos. El publico bajo el
nombre de A Student, y por lo tanto la distribucion que descubrio fue llamada distribucion
t de Student.
Caractersticas de la distribucion t de Student

Es continua, con forma de campana, y simetrica alrededor de cero como la distribucion
normal. Existe una familia de t-distribuciones que comparten una media de cero pero con
diferentes niveles desviaciones estandares basadas en grados de libertad. La distribucion t
de Student esta mas dispersa y mas plana en el centro que la distribucion normal, pero se
aproxima a la distribucion normal cuando el tamano de la muestra se hace mas grande. Su
intervalo de confianza para es
Figura 8.2.: Distribucion t de Student.
s
Intervalo de confianza = x tc , (8.4)
n
donde x es la media de la muestra y tc es el valor crtico en la distribucion t de Student y
tiene n 1 grados de libertad.
131
Ejemplo 8.4 El ano pasado, un estudiante trabajaba en una Organizacion de No Guber-

namental (ONG) que tena una calificacion de 62 (en una escala de 0-100) en un rating
internacional que evalua el desempeno de organizaciones; esto se baso en los registros acu-
mulados sobre la ONG durante un largo perodo de tiempo. Este ano el estudiante cambio a
una nueva ONG. Para evaluar la calificacion de la nueva ONG, 20 miembros de la ONG
se sondearon y se consiguio una nueva calificacion promedio de 65 con una desviacion
estandar de 10. Encontrar e interpretar un intervalo de confianza del 95 % para el prome-
dio de la calificacion de la nueva ONG.
Para este caso, la distribucion t de Student tendra 20-1 = 19 grados de libertad. Usando
una tabla para esta distribucion o una calculadora, el valor crtico para el intervalo de
confianza del 95 % sera tc = 2, 093, as
(2,093) 10
65 = 65 4,68 = [60,32; 69,68]calificacion de la ONG. (8.5)
20
Con un 95 % de confianza, podemos decir que la calificacion de la nueva ONG es de
entre 60,32 y 69,68. As la calificacion de 62 de la anterior ONG esta en el intervalo de
confianza, por lo cual, no podemos decir con una certeza del 95 % que la nueva ONG sea
mejor o peor que la anterior ONG.
8.3.3. Intervalo de confianza para la proporcion poblacional

Recordemos de los captulos anteriores sobre variables aleatorias de la distribucion bi-
nomial, donde se representaba a la proporcion de exitos en una poblacion dada. El modelo
binomial era analogo a la situacion de lanzar una moneda con resultados de cara o sello, es
decir, una dicotoma en los resultados del muestreo. En la practica, algunas veces, queremos
utilizar las estadsticas de la muestra para estimar la proporcion de la poblacion.
La proporcion de la muestra (p) es la proporcion de exitos en una muestra de tamano n,
y es un estimador puntual de p, es decir, la proporcion poblacional. Segun el teorema del
lmite central, si np > 5 y n(1 p) = nq > 5, la distribucion de la proporcion de laq
muestra
tendra una distribucion aproximadamente normal. En este caso p = p y p = p(1p) n .
Usando esta informacion podemos construir un intervalo de confianza para p, la proporcion
de la poblacion tiene un intervalo de confianza
r r
p(1 p) p(1 p)
Intervalo de confianza = p Z p Z . (8.6)
n n
Ejemplo 8.5 A 200 conductores de Maracaibo se les muetreo mientras manejaban por la
cuidad al azar y se descubrio que 25 de estos conductores estuvieron ilegalmente hablando
por telefono celular sin el uso de un dispositivo de manos libres. Encuentre el estima-
dor puntual para la proporcion de conductores que estan utilizando sus telefonos celulares
ilegalmente y construir un intervalo de confianza del 99 %.
25
El estimador puntual para p es p = 200 = 0,125 o 12.5 %.
132
Un intervalo de confianza del 99 % para p es:

r
0,125(1 0,125)
Intervalo de confianza = 0,125 2,576 = 0,125 0,060. (8.7)
200
El margen de error para esta encuesta es del 6 % y se puede decir con un 99 % de con-
fianza que el porcentaje real de los conductores que usan sus telefonos celulares ilegalmente
oscila entre 6,5 % y 18,5 %.
8.3.4. Estimador puntual para la desviacion estandar de la poblacion

A menudo queremos estudiar la variabilidad, la volatilidad o la consistencia de una
poblacion. Por ejemplo, digamos que hacemos dos inversiones en la bolsa de valores tal
que ambas tienen ingresos esperados de 6 % por ano, pero una inversion es mucho mas
arriesgada que la otra, teniendo mayores altibajos. Para estimar la variacion o la volatilidad
de un conjunto de datos, vamos a utilizar la desviacion estandar de la muestra como un
estimador puntual de la desviacion estandar de la poblacion.
Por ejemplo, las inversiones A y B son ambas conocidas por tener una tasa de rendimiento
de 6 % al ano. En los ultimos 24 meses, la inversion A tiene desviacion estandar muestral
del 3 % por mes, mientras que para la inversion B, la desviacion estandar muestral es del
5 % mensual. Diramos que la inversion B es mas volatil y riesgosa que la inversion A debido
a la mayor estimacion de la desviacion estandar.
Para crear un intervalo de confianza para la estimacion de la desviacion estandar, tene-
mos que introducir una nueva distribucion, llamada la distribucion Chi-cuadrado (2 ).
La distribucion Chi-cuadrado
La distribucion Chi-cuadrado es una familia de distribuciones relacionadas con la dis-
tribucion normal, ya que representa una suma de cuadrados de las variables aleatorias
normales independientes. Al igual que la distribucion t de Student, esta tiene grados de
libertad iguales a n 1 y determinan la forma de la distribucion. Ademas, como el Chi-
cuadrado representa datos al cuadrado, la inferencia sera aproximadamente la varianza en
lugar de la desviacion estandar.
La distribucion Chi-cuadrado (2 ) es asimetrica positiva y ademas es no negativa. Se
basa en grados de libertad (n 1) igual como la t de Student.
8.3.5. Intervalo de confianza para la varianza y desviacion estandar de la

poblacion
Dado que la distribucion Chi-cuadrado representa datos al cuadrado, podemos construir
intervalos de confianza para la poblacion y sacar la raz cuadrada de la varianza de los
extremos para obtener un intervalo de confianza para la desviacion estandar de la poblacion.
Debido a la asimetra de la distribucion Chi-cuadrado el intervalo de confianza resultante
133
Figura 8.3.: Distribucion Chi-cuadrado.
no estara centrada en el estimador puntual, por lo que el margen de error no se entiende

como en los casos anteriores.
Intervalo de confianza para la varianza de la poblacion

La confianza no es simetrica ya que la distribucion Chi-cuadrado no es simetrica. Tome
la raz cuadrada de ambos extremos para obtene el intervalo de confianza de la desviacion
estandar de la poblacion. As se tendra que
(n 1)s2 (n 1)s2

Intervalo de confianza = , . (8.8)
2R 2L
Ejemplo 8.6 En la medicion del rendimiento de las inversiones, la desviacion estandar
es una medida de la volatilidad o el riesgo. Veinte meses de rentabilidades de un fondo
de inversion muestran un rendimiento medio mensual del 1 % y muestra una desviacion
estandar de 5 %. Encuentre un intervalo de confianza del 95 % para la desviacion estandar
mensual de los fondos de inversion.
La distribucion Chi-cuadrado tendra 20 1 = 19 grados de libertad. Usando una calcu-

ladora, los dos valores crticos para la Chi-cuadrado son: 2L = 9,90655 y 2R = 32,8523,
134
con lo cual se tendra que
19 52 19 52

Intervalo de confianza = , = [3,8; 7,3]. (8.9)
32,8523 8,90655
Se puede decir con un 95 % de confianza de que la desviacion estandar para este fondo
de inversion es de entre 3,8 % y 7,3 % por mes.
135
9. Pruebas de hipotesis de una poblacion
What the use of P [the significance level] implies, therefore, is that a hypothesis that may be true
may be rejected because it has not predicted observable results that have not occurred.
- Sir Harold Jeffreys. Theory of Probability (1939), 316.
9.1. Introduccion
En la seccion anterior hemos utilizado la inferencia estadstica para hacer una estimacion
de un parametro de la poblacion y medir la fiabilidad de la estimacion a traves de un
intervalo de confianza. En esta seccion, vamos a explorar en detalle el uso de la inferencia
estadstica en la prueba de una afirmacion sobre un parametro de la poblacion, que es el
corazon del metodo cientfico utilizado en la investigacion.
9.2. Procedimientos de comprobacion de hipotesis y el metodo

cientfico
La realizacion real de una prueba de hipotesis es solo una pequena parte del metodo
cientfico. Despues de formular una pregunta general, el metodo cientfico consiste en: el
diseno de un experimento, la recogida de datos a traves de la observacion y la experi-
mentacion, la comprobacion de hipotesis y elaboracion de informes de la de conclusiones
generales. Las conclusiones se llevan a otras ideas de investigacion haciendo de este proce-
so de un flujo continuo de incorpora al acervo de conocimientos sobre los fenomenos que
se estudian. Otros pueden elegir un conjunto mas formal y detallado de los procedimien-
tos, pero los conceptos generales de la inspiracion, diseno, experimentacion y conclusion
permiten ver todo el proceso.
Las preguntas mas generales comenzar con una inspiracion o una idea sobre un tema o
fenomeno de interes. Algunos ejemplos de preguntas generales:
(Cuidado de la Salud) Un sistema de servicio publico de salud sera mas eficaz que
un sistema de seguro privado en terminos de atencion?
(Mano de obra) Cual es el efecto de la inmigracion indocumentada y la externaliza-

cion de puestos de trabajo en la tasa de desempleo.
137
(Economa) es el paquete de medidas del gobierno un estmulo economico eficaz para

disminuir el impacto de la recesion?
(Educacion) son demasiado caros los colegios para los estudiantes de hoy?
Es importante no ser tan especfico en la eleccion de estas cuestiones generales. Sobre

la base de datos potencialmente disponibles, podemos decidir mas tarde que hipotesis
especficas de la investigacion se formulara y se probaran para abordar la cuestion general.
Durante la recopilacion de datos algunas otras ideas de pruebas pueden resultar y podemos
optar por redefinir la pregunta general.
9.3. Diseno de hipotesis de investigacion y la experimentacion

Despues de desarrollar un problema general y que tengan algun sentido a los datos que
estan disponibles o para ser recogidos, es tiempo de disenar un experimento y un conjunto
de hipotesis.
9.3.1. Las hipotesis y prueba de hipotesis

Para propositos de prueba, es necesario disenar hipotesis que son declaraciones sobre los
parametros de la poblacion. Algunos ejemplos de hipotesis son:
Al menos el 20 % de los delincuentes juveniles son capturados y condenados a prision.
El ingreso promedio mensual de los graduados universitarios es de Bs.F. 1500.
Las tasas de cancer de pulmon en Maracaibo son mas bajas que las tasas de Caracas.
La desviacion estandar de la Bolsa de Caracas hoy es mayor 10 puntos porcentuales

que la de anos anteriores.
Estas mismas hipotesis podra escribirse en notacion simbolica: pdelincuentes > 0,20,
ingresos > 1500, pM ar < pCar y bolsa > 10, respectivamente.
La prueba de hipotesis es un procedimiento basado en la evidencia muestral y la teora
de probabilidades, que se utiliza para determinar si la hipotesis es una afirmacion razonable
y no debe ser rechazada, o no es razonable y por tanto debe ser rechazada. La hipotesis
que se prueba se llama la hipotesis nula designado por el smbolo H0 . Si la hipotesis nula
no es razonable y debe ser rechazada, entonces la investigacion estara apoyada por una
hipotesis alternativa designada por el smbolo Ha . As entonces, la hipotesis nula (H0 ):
es una declaracion sobre el valor del parametro de una poblacion que se supone que es
cierto para el proposito de la prueba. Por el contrario, la hipotesis alternativa (Ha ): es una
declaracion sobre el valor del parametro de una poblacion que se supone que es verdadera
si la hipotesis nula es rechazada durante la prueba.
138
A partir de estas definiciones, es claro que la hipotesis alternativa debe contradecir la

hipotesis nula, ambas no pueden ser verdad al mismo tiempo. Otros puntos importantes
acerca de hipotesis:
Las hipotesis deben ser enunciados acerca de los parametros de poblacion, nunca
acerca de las estadsticas de la muestra.
En la mayora de las pruebas de hipotesis, la igualdad (=, , ) se asocia con la
hipotesis nula, mientras la desigualdad (6=, <, >) se asociara con la hipotesis alterna-
tiva.
La hipotesis nula es la que siempre se prueba en un intento de refutarla y apoyar por
tanto apoyar la hipotesis alternativa. Este proceso es analogo al concepto de un prueba
por contradiccion, o reduccion al absurdo, en matematicas o en logica, pero apoyar una
hipotesis con un nivel de confianza no es lo mismo que una prueba matematica absoluta.
Algunos ejemplos de hipotesis nulas y alternativas, son los siguientes:
Hipotesis nula Hipotesis alternativa

H0 : pdelincuentes 0,20 Ha : pdelincuentes > 0,20
H0 : ingresos 1500 Ha : ingresos > 1500
H0 : pM ar pCar Ha : pM ar < pCar
H0 : pM ar = pCar Ha : pM ar 6= pCar
H0 : bolsa > 10 Ha : bolsa 10
9.3.2. Modelo estadstico y estadstico de prueba

Para probar la hipotesis tenemos que utilizar un modelo estadstico que describe el
comportamiento de los datos y el tipo de parametro de la poblacion que se esta probando.
Debido al teorema del lmite central, muchos modelos estadsticos son de la familia normal,
los mas importantes, las distribuciones Z, t de Student, 2 , y F . Otros modelos en los que
no es apropiado usar el teorema del lmite central se llaman modelos no parametricos y no
seran discutidos aqu.
Cada modelo elegido tiene requisitos para los datos, llamados supuestos del modelo, que
deben revisarse para su adecuacion. Por ejemplo, muchos modelos requieren la media de
la muestra, estos tienen aproximadamente una distribucion normal. Una vez que se elije el
modelo, podemos determinar un estadstico de prueba, un valor derivado de los datos que
se utilizara para decidir si rechazar o no rechazar la hipotesis nula.
Algunos ejemplos de modelos estadstico y estadsticos de prueba, son los siguientes:
Modelo estadstico Estadstico de prueba

Media vs. valor hipotetico t := x
s
0
n

Proporcion vs. valor hipotetico Z := pp0 n
p0 (1p0 )
2
Varianza vs. valor hipotetico 2 := (n1)s
2
139
9.3.3. Los errores en la Toma de Decisiones

Cada vez que tomamos una decision o apoyamos una posicion, siempre hay una posi-
bilidad de que se haga mal la eleccion. El proceso de comprobacion de hipotesis requiere
que sea para rechazar la hipotesis nula y apoyar la hipotesis alternativa o no rechazar la
hipotesis nula. Esto crea la posibilidad de dos tipos de error:
Error de tipo I: Rechazar la hipotesis nula cuando en verdad es esta verdadera.
Error de tipo II: No rechazar la hipotesis nula cuando en realidad es falsa.
No se rechaza H0 Se rechaza H0
H0 es verdadera Desicion correcta Error de tipo I
H0 es falsa Error de tipo II Desicion correcta
En el diseno de las pruebas de hipotesis, tenemos que considerar cuidadosamente la

probabilidad de cometer cualquiera de estos errores.
Ejemplo 9.1 Imagine que una compana farmaceutica intento comercializar una droga
que mas adelante se determino ser ineficaz (y quizas peligrosa) en el tratamiento de una
enfermedad. Antes de la comercializacion del farmaco, la compana determino que el farma-
co era eficaz en el tratamiento, lo que significa que la empresa rechazo la hipotesis nula de
que la droga no tuvo efecto sobre la enfermedad. Este es un ejemplo de error del tipo I.
Ejemplo 9.2 Imagine que la misma compana en su investigacion decidieron abandonar

las pruebas cuando mostraron que la droga fue ineficaz en el tratamiento de la enfermedad.
La empresa, en este caso no pudo rechazar la hipotesis nula de que la droga era ineficaz.
Que sucede si el medicamento realmente era eficaz? La empresa tiene un error de Tipo
II? Es posible, pero ya que el farmaco nunca se comercializo, no tenemos forma de saber
la verdad.
Estos ejemplos nos acercan al problema de la investigacion estadstica: los errores pueden
ser analizados utilizando los modelos de probabilidad, pero a menudo no hay manera de
identificar errores especficos. Por ejemplo, existen personas inocentes en prision en este
momento debido a que un jurado cometio un error de tipo I en condenar injustamente a
los demandados.
En el diseno de un experimento, hemos creado una probabilidad maxima de toma de error
de tipo I. Esta probabilidad es llamada el nivel de significacion o nivel de significancia de la
prueba y designada por la letra griega . El analisis del error de tipo II es mas problematico,
ya que hay muchos valores posibles que satisfacen la hipotesis alternativa. Para un valor
especfico de la hipotesis alternativa, la probabilidad de diseno toma de error de tipo II se
llama Beta (), que se analizara en detalle mas adelante en esta seccion.
140
9.3.4. Valor Crtico y Region de Rechazo

Una vez que el nivel de significacion de la prueba se elija, es entonces posible encontrar
la region (o las regiones) de la funcion de distribucion de probabilidad del estadstico de
prueba que permita que la hipotesis nula sea rechazada. Esta es llamada la region de
rechazo y la frontera entre la region de rechazo y la de no rechazo es llamada el valor
crtico. No puede haber mas de un valor crtico y una region de rechazo. Lo que importa es
que el area total de la region de rechazo sea igual al nivel de significacion . En la figura
siguiente se clarifica este punto.
Figura 9.1.: Prueba de hipotesis de una y dos colas.
9.3.5. Pruebas de una y dos colas

Una prueba es de una cola cuando la hipotesis alternativa, Ha , se encuentra en una sola
direccion, como por ejemplo:
H0 : el ingreso medio de las mujeres es menor o igual a la renta media de los hombres.
Ha : El ingreso medio de las mujeres es mayor que la de los hombres.
Dado que la igualdad es generalmente parte de la hipotesis nula, entonces la hipotesis

alternativa queda determinada por cola. Por el contrario una prueba es de dos colas cuando
no se especifica la direccion en la hipotesis alternativa Ha , tales como:
H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
Ha : El ingreso medio de las mujeres no es igual a la renta media de los varones.
En una prueba de dos colas, el nivel de significacion se divide en dos partes ya que hay
dos regiones de rechazo. en una prueba de hipotesis el modelo estadstico es simetrico, (por
ejemplo, la distribucion normal Z o la t de Student), y por lo tanto, estas dos regiones
seran iguales. Existe una relacion entre un intervalo de confianza y una prueba de dos
colas: Si el nivel de confianza para un intervalo de confianza es igual a 1-, donde es
141
el nivel de significacion de la prueba de dos colas, entonces los valores crticos seran los
mismos.
Estos son algunos ejemplos de las pruebas de media contra un valor hipotetico 0 :
Ha : > 0 significa probar la cola superior y tambien se llama una prueba de extremo
derecho.
Ha : < 0 significa probar la cola inferior y tambien se llama una prueba de extremo
izquierdo.
Ha : =6= 0 significa probar las dos colas.
Decidir cuando llevar a cabo una prueba de una o dos colas es a menudo controvertido y
muchas autoridades van mas lejos como para decir que solo las pruebas de dos colas deben
llevarse a cabo. En ultima instancia, la decision depende de la formulacion del problema.
Si queremos demostrar que una nueva dieta es efectiva para reducir el peso, se llevara a
cabo una prueba de una cola, ya que no importa si la dieta causa aumento de peso. Si por
el contrario, hemos querido determinar si la tasa de criminalidad en Maracaibo es diferente
de la tasa de criminalidad media en Venezuela, sera una conveniente mas bien una prueba
de dos colas, ya que no hemos preguntado especficamente si es mayor o igual.
9.3.6. Recopilar y analizar los datos experimentales

Despues de disenar el experimento, el siguiente procedimiento sera recoger los datos
de la situacion y verificar los datos. A efectos de la estadstica y el analisis, supondremos
que todas las muestras sean al azar, o utilizando alguna otra alternativa, simularan una
muestra aleatoria.
Verificacion de Datos
Despues de recoger los datos, pero antes de ejecutar la prueba, tenemos que verificar los
datos. En primer lugar, obtener una grafica (histograma, punto, grafico de caja, etc) sera
conveniente. Es importantes compruebe la asimetra, forma y cualquiera posibles valores
atpicos en los datos.
Operaciones con valores atpicos
Un valor atpico es punto de los datos que esta muy alejado de los otros en el conjunto
de datos. Los valores extremos pueden ser causados por:
Errores cometidos en el registro de datos.
Datos que no pertenecen a la poblacion.
Los verdaderos eventos raros.
142
Los dos primeros casos son faciles de tratar y por tanto se pueden corregir los errores o
eliminar los datos que no pertenecen a la poblacion. El tercer caso es mas problematico,
ya que los valores extremos aumentaran la desviacion estandar dramaticamente y sesgaran
fuertemente los datos.
La logica de la prueba de hipotesis

Despues que los datos se verifican, queremos llevar a cabo la prueba de hipotesis y llegar
a una decision, ya sea o no rechazar la hipotesis nula. El proceso de decision es similar a
una prueba por la contradiccion que se utiliza en las matematicas, como ya lo hemos dicho:
Suponemos H0 es cierta antes de observar los datos y Ha se disena tal que sea el
complemento de H0 .
Observe los datos (evidencia). Cuan inusuales son estos datos respecto de H0 ?
Si los datos son demasiado inusuales, hemos probado que H0 es falsa: Se rechaza H0
y se apoya Ha (declaracion fuerte).
Si los datos no son demasiado inusuales, no rechazamos H0 . Esta no prueba nada y

nos dicen que los datos son inconcluyentes. (Declaracion debil).
Nunca se puede probar H0 , solo refutar la misma.
Demostrar en las estadsticas se refiere al soporte con (1 ) 100 % de certeza.

(Ejemplo: si = 0,05, entonces estamos en al 95 % de confianza en nuestra decision
de rechazar H0 .
Regla de Decision - Dos metodos, la misma decision

Anteriormente hemos introducido la idea de una prueba estadstica que es un valor
calculado a partir de los datos en virtud del modelo estadstico apropiado de los datos
que se pueden comparar con el valor crtico de la prueba de hipotesis. Si el estadstico
de prueba cae en la region de rechazo del modelo estadstico, rechazamos la hipotesis
nula nula. Recordemos que el valor crtico se determina por el diseno basado en el nivel
deseado de significacion . El metodo mas preferido de la toma de decisiones es calcular la
probabilidad de obtener un resultado tan extremo como el valor del estadstico de prueba.
Esta probabilidad se llama el valor-p, y se puede comparar directamente a el nivel de
significacion.
valor-p: es la probabilidad, en el supuesto de que la hipotesis nula es cierta, de obtener

un valor del estadstico de prueba por lo menos tan extremo como el valor calculado
para la prueba.
Si el valor-p es menor que el nivel de significacion , se rechaza H0 .
143
Si el valor-p es mayor que el nivel de significacion , H0 no se rechaza.
Tanto el valor-p y son las probabilidades de obtener resultados tan extremos como
los datos asumiendo H0 es cierta. El valor-p se determina por los datos y esta relacionado
con la probabilidad real de tomar error de Tipo I (Rechazar una hipotesis nula cuando
es verdadera). Cuanto menor sea el valor-p, menor sera la posibilidad de tener error de
tipo I y, por tanto, mas posibilidades tendremos de rechazar la hipotesis nula. El nivel de
significacion se determina por diseno y es la probabilidad maxima que estamos dispuestos
a aceptar de rechazar una verdadera H0 .
Dos reglas de decision conducen a la misma decision.
1. Si el estadstico de prueba se encuentra en la region de rechazo, se rechaza H0 .

(metodo del valor crtico)
2. Si el valor-p < , se rechaza H0 . (metodo del valor-p)
Este metodo valor-p de comparacion se prefiere del metodo del valor crtico, porque la
regla es la mismo para todos los modelos estadsticos: Rechazar H0 si el valor-p si es menor
a .
Ejemplo 9.3 (Prueba de media vs. valor hipotetico. Un ejemplo completo) Suponga
que una empresa de alimentacion tiene una poltica que el contenidos vertido de un producto en
su envase coincide perfectamente con lo que dice la etiqueta. Una pregunta general podra ser: El
peso expresado neto del producto alimenticio esta de acuerdo con el peso real? El departamento de
control de calidad decide poner a prueba la botella de 16 onzas de salsa de soja y ahora debe disenar
el experimento.
El estadstico de control de calidad ha tomado muestras de 36 botellas de salsa de soja y sabe
a partir de unas pruebas anteriores que la desviacion estandar de la poblacion es de 0,5 onzas. El
modelo sera una prueba de media poblacional vs. al valor hipotetico de 16 oz. Una prueba de dos
colas se selecciona debido a que es preocupante el llenado insuficiente ya que no cumple con las
normas, as como tambien el llenado excesivo ya que produce perdidas en la empresa. Recuerdese
que la poltica de la empresa es llenar las botellas con el peso real del producto.
As podemos estableces la hipotesis de investigacion.
H0 : = 16 (La maquina de llenado esta funcionando correctamente)
Ha : 6= 16 (La maquina de llenado no esta funcionando correctamente).
Dado que la desviacion

estandar d ela poblacion se conoce de pruebas pasadas el estadstico de
prueba sera Z = x n. Este modelo es apropiado, ya que el tamano de la muestra asegura que
la distribucion de la media muestral es aproximadamente normal, tomando base en el Teorema del
Lmite Central.
Recordemos que error de tipo I sera rechazar la hipotesis nula y decimos que la maquina no
funciona correctamente cuando en realidad esta funcionando adecuadamente. Dado que la compana
no quiere dejar innecesariamente la produccion y recalibrar la maquina, el estadstico elige limitar
la probabilidad de error de tipo I mediante el establecimiento del nivel de significacion () a 5 %.
El estadstico ahora lleva a cabo el experimento con las muestras de las 36 botellas y determina
a partir de un diagrama de caja que existe un dato inuasual de 17.56 oz. El valor es revisado de
nuevo y se mantiene en el conjunto de datos.
144
A continuacion, la media de la muestra y el estadstico de prueba se calculan.

16,12 16
x = 16,12oz., Z= 36 = 1,44. (9.1)
0,5
La regla de decision bajo el metodo del valor crtico sera rechazar la hipotesis nula cuando el
valor de estadstico de prueba esta en la region de rechazo. En otras palabras, rechazar H0 cuando
Z > 1, 96 o Z < 1, 96. En base a este resultado, la decision es no rechazar H0 ya que el estadstico
de prueba no cae en la region de rechazo.
Alternativamente (y preferiblemente) el estadstico utiliza el metodo del valor-p de regla de deci-
sion. El valor-p para una prueba de dos colas debe incluir todos los valores (positivos y negativos)
mas extremos del estadstico de prueba, por lo que en este ejemplo, hallar la probabilidad de que
Z < 1,44 o Z > 1, 44. Usando una calculadora, o software informatico o una tabla normal
estandar, el valor-p = 0,1498. Puesto que el valor-p es mayor que , la decision es de nuevo no
rechazar H0 .
Por ultimo, el estadstico debe reportar las conclusiones y hacer una recomendacion a la com-
pana: No hay pruebas suficientes para concluir que la maquina que llena botellas de salsa de soja
de 16 oz esta funcionando correctamente. Esta conclusion esta basada en 36 mediciones tomada
durante una hora corrida de produccion. Recomiendo el seguimiento continuado de la maquina con
empleados diferentes para una potencial posibilidad de error humano.
El estadstico hace la declaracion debil y no indica que la maquina esta funcionando correcta-
mente, solo que no hay pruebas suficientes para determinar si esta funcionando correctamente. El
estadstico tambien informa preocupaciones sobre el muestreo de un solo turno de empleados (res-
tringiendo la inferencia a la muestra poblacional) y recomienda repetir el experimento en varios
turnos.
145
A. La redaccion de informes y presentacion
de resultados
A.1. Definicion de Informe cientfico
Los informes cientficos aparecen en la decada del cuarenta como una modalidad de lite-
ratura gris. Es un documento confeccionado de forma ordenada para describir los aspectos
de una investigacion especialmente las relacionadas con los resultados obtenidos. Su objeti-
vo no es la publicacion en una revista, sino que va dirigido, o bien, actua como instrumento
para comunicar los resultados a la comunidad cientfica o quien haya encargado el trabajo.
En ningun trabajo cientfico se aceptan los hallazgos con independencia del procedimiento
mediante el cual se obtuvieron, y dicho procedimiento debe poder reproducirse en otros
lugares y oportunidades.
Los objetivos del Informe cientfico son:
Su contenido esta destinado a contribuir al acopio de conocimientos.
Exponer y declarar los procedimientos y tecnicas utilizados en la investigacion para
que pueda ser producida, constatada y verificada por otros cientficos, al fin de juzgar
la validez y fiabilidad de las nuevas aportaciones cientficas que se proponen.
Constituyen fuentes de informacion para una nueva investigacion.
A.2. Tipos y clasificaciones del Informe cientfico

Existen cuatro tipos de investigaciones: investigaciones empricas, revisiones, replicacio-
nes de investigaciones anteriores y artculos teoricos. Las clases de informes son:
El informe cientfico: aquel basado en la observacion directa, se trabaja con la reali-
dad inmediata. Por ejemplo, el trabajo de laboratorio, fundamental en las ciencias
naturales. Consiste en la descripcion de los fenomenos observados y en una interpre-
tacion de ellos en terminos de conocimiento teorico. Se cine a los pasos del metodo
experimental: observacion de un fenomeno, formulacion de una hipotesis, realizacion
experimental, conclusion del hecho, en el cual se comprueba o refuta la hipotesis
planteada.
El informe de investigacion: que consiste en reproducir en forma objetiva el pensa-
miento vertido en una obra, ensayo, artculo, etc. Constara de una breve introduccion,
147
A. La redaccion de informes y presentacion de resultados
en la cual se indica el tema y el objetivo que tiene el trabajo, de un cuerpo donde se

expone la materia y una conclusion, sntesis de los elementos rescatados; son primor-
diales la objetividad y la claridad.
El informe de suceso: el mismo de los anteriores, vara solamente en la materia. Es

el quehacer que se realiza cuando se asiste a exposiciones, encuentros literarios, etc.
y luego se vuelca la informacion en tipo informe.
A.3. Caractersticas, particularidades y modalidades del Informe

cientfico
A.3.1. Caractersticas
Al tener un objetivo concreto, responde a la exigencia o a la necesidad de dar cuenta de
algo determinado. Por eso, su tema no es de libre eleccion del autor. Los informes pueden
contener diagramas, estadsticas, cuadros numericos y pueden y acompanados de anexos
que prueban o ilustran lo informado en el texto. Deben reunir las siguientes cualidades:
Claridad y sencillez. Exigen dos explicaciones, de dos formas, la mas elemental, de dos
palabras, la mas breve. La claridad del escrito deriva de su correccion morfologica y
sintactica. Un texto no sera sencillo ni claro si no sigue un ordenamiento y se emplean
palabras artificiosas y vacas, terminos no conocidos o definidos.
Precision. Estrechamente vinculado con la claridad y sencillez. La precision debe

emplearse en cada momento se utilicen las palabras justas y las expresiones que co-
rrespondan exactamente a la idea que se quiere expresar. No debe haber ambiguedad
en los terminos. Es necesaria en la redaccion cientfica porque esta exige la mayor
exactitud terminologica posible y porque su fin es exponer de modo concreto y sin
rodeos, los resultados de la investigacion.
Sinceridad y originalidad. Escribir conforme a nuestra propia manera y segun nuestro

estilo y en ningun caso se pretenda con las palabras disfrazar la verdad ni enganar.
Viveza. Debe proporcionar un mnimo interes. Se debe evitar el estilo monotono,

plano, amorfo, inerte y pesado. Que se sepa destacar la importancia de lo que se
escribe, su actualidad, vigencia y utilidad y explicaciones, que se de un cierto relieve
a las ideas expresadas.
Rigor y sistema. El rigor consiste en la propiedad y exactitud del contenido. Aqu se

puede distinguir tres dimensiones: extension, profundidad y seriedad cientfica. Un
informe sera riguroso en la extension si abarca todos los aspectos del tema. Sera ri-
guroso en la profundidad si se buscan los fundamentos ultimos de las cuestiones y
se llega, respecto a ellas, hasta el lmite intelectual posible. Y seriedad cientfica en
cuanto al cuidado en demostrar las tomas de posicion, en demostrar las pruebas que
148
A.3. Caractersticas, particularidades y modalidades del Informe cientfico
justifiquen las aportaciones y descubrimientos, en sus referencias y citas y en el cum-

plimiento de todas las prescripciones metodologicas y expositivas que garantizan la
solidez y la seriedad de la exposicion de una investigacion cientfica. En cuanto a la
cualidad de sistematizacion, la redaccion debe ser sistematica de modo que presente
integrados en su totalidad los aspectos del tema desarrollados en el.
A.3.2. Particularidades
El informe debe contener una ordenada secuencia logica, haciendo que los hechos se
encadenen entre s y tratando de organizarlos de un modo coherente, sin fracturas. Debe
tener una estructura de modo tal que permita su comprension sin mayores dificultades.
Orden al hacer el informe cientfico:

Generalmente se necesita: materiales y metodos, resultados, discusion y conclusion, intro-
duccion y resumen. Materiales y metodos se suele al escribir primero, ya que los materiales
deben estar listos antes de comenzar la investigacion, los metodos deben estar claros y
descriptos detalladamente antes de comenzar a obtener los datos. Luego, se organizan los
datos y se escriben los resultados, seguidos de la discusion y de la conclusion. La intro-
duccion es lo ultimo en escribir. Puede ir redactandose en cualquier momento, pero no es
hasta el final del informe que verdaderamente se organiza para ser presentado.
Orden al presentar el informe cientfico:

Se da cuando a traves de la lectura contestamos las siguientes preguntas: que se hizo?,
para que? (introduccion), como se hizo?, quien?, cuando?, donde? (metodos y mate-
riales), que se encontro? (resultados), por que?, que significa? (discusion y conclusion).
A.3.3. Modalidades
El informe cientfico posee la siguiente estructura formal:
Portada. Incluye el ttulo de la investigacion, el cual debe expresar el contenido del

trabajo de forma breve, concisa y clara (longitud maxima recomendada es de 12
palabras), el nombre del autor o autores y su afiliacion institucional o el nombre de
la organizacion que patrocina el estudio y la fecha en que se presenta el reporte.
Indice. Con apartados y subapartados.
Resumen. Constituye el contenido esencial del reporte de investigacion, usualmente

incluye el planteamiento del problema, la metodologa, los resultados mas importantes
y las principales conclusiones. Se presenta en una hoja aparte sin superar 120 palabras
aproximadamente.
149
A. La redaccion de informes y presentacion de resultados
Introduccion. Incluye el planteamiento del problema (objetivos y preguntas de inves-

tigacion, as como la justificacion del estudio), el contexto general de la investigacion
(como y donde se realizo), las variables y terminos de la investigacion y sus defini-
ciones, as como las limitaciones de esta.
Marco teorico. (marco de referencia o revision de la literatura) En el que se desarrollan
los estudios e investigaciones antecedentes y las teoras a manejar.
Metodo. Esta parte del reporte describe como fue llevada a cabo la investigacion:
Hipotesis y especificacion de las variables. Material, si es standard solo es necesario
dar el nombre, pero si es especfico, es relevante describirlo con detalle. Diseno utiliza-
do (experimento o no experimento) Sujetos, universo y muestra (procedencia, edades,
sexo y/o aquellas caractersticas que sean relevantes de los sujetos; descripcion del
universo y muestra; y procedimiento de seleccion de la muestra). Instrumentos de
medicion aplicados (descripcion precisa, confiabilidad, validez y variables medidas).
Procedimiento (un resumen de cada paso en el desarrollo de la investigacion. Se inclu-
yen en este paso los problemas enfrentados y la manera de como se resolvieron. Por
ejemplo, en una encuesta se describe como se contacto a los sujetos y se realizaron
las entrevistas, en un experimento se describen la manera de asignar a los sujetos,
las instrucciones, los materiales, etc.
Resultado. Aqu el investigador se limita a describir los resultados, obtenidos del
producto del analisis de los datos. Una manera de hacerlo es mediante tablas, dibujos,
graficas y figuras. Cada uno de estos elementos debe ir numerado (en arabigo o
romanos y con el ttulo que lo identifica.
Conclusiones, recomendaciones e implicaciones (o discusion). En este apartado se de-
rivan conclusiones, se hacen recomendaciones para otras investigaciones, se analizan
las implicaciones de la investigacion y se establece como se respondieron las preguntas
de investigacion y si se cumplieron o no los objetivos. Debe redactarse de tal manera
que se facilite la toma de decisiones respecto a una teora, un curso de accion o una
problematica.
Bibliografa. Que son las referencias utilizadas por el investigador para elaborar el
marco teorico. Se incluyen al final de los informes ordenados alfabeticamente.
Apendices. Son utiles para describir con mayor profundidad ciertos materiales sin dis-
traer la lectura del texto principal del informe. Por ejemplo, el cuestionario utilizado,
el desarrollo de una formula, fotografas, etc.
A.4. Forma de presentacion y estilos del Informe cientfico

Puede presentarse de las siguientes maneras. Algunas veces solamente se entrega el re-
porte publicado y se explica verbalmente. Otras veces la entrega del informe acompanado
150
A.5. Diferencias con el resto de los trabajos cientficos
con diversos apoyos como son graficas, audiovisuales, videos y sistemas computarizados.
Hoy en da los informes se elaboran utilizando distintos procesadores de textos y progra-
mas: Word, Works (textos y dibujos); PageMaker, PowrPoint, Harvard Graphics, Publisher
(textos y graficos); SPSS (analisis estadstico y graficos), Excel (hoja de calculo y graficos)
A.5. Diferencias con el resto de los trabajos cientficos

Suele confundirse informe cientfico con artculo cientfico, sin embargo entre ellos hay
una marcada diferencia. Mientras que el informe cientfico es un documento que reporta
los resultados de una investigacion, no tiene como finalidad la publicacion en una revista
(aunque en agencias gubernamentales normalmente se agrupan en volumenes que repre-
sentan una publicacion interna de la agencia), el artculo cientfico presenta informacion
acumulativa que provee para el conocimiento cientfico, presenta analisis y conclusiones
que pueden ser preliminares o finales acerca de los hallazgos que el investigador ha logrado
a traves del trabajo cientfico. Su meta es que sea revisado por expertos y que se publique
en una revista cientfica.
151
B. Calculos de incertidumbre y de pequenas
variaciones
En el laboratorio a la hora de realizar experimentos y hacer mediciones para comprobar
diversos procesos de la naturaleza, se cometen inevitablemente errores. Algunos errores
en el laboratorio son mas evidentes que otros, sin embargo, como quiera que sea o por
muy pequeno que sea, existe siempre un error asociado a cada una de las medidas que
se toman en la experiencia. Lo curioso de la ciencia es que no existe una manera para
encontrar el valor real de todas las cosas. Por muy exacto que sea el instrumento, por
muy preciso y cuidadoso que sea el investigador, siempre encontrara un valor aproximado
de la medida en estudio. El valor verdadero de una medida depende de tantas cosas, que
es imposible sellar todas las incertidumbres para lograr exactitud perfecta. Inclusive la
misma tecnologa tiene un lmite, cuando ese lmite es sobrepasado, el instrumento ya deja
de ser exacto para dar lugar a errores esperados. La mayora de las veces la repeticion
muchas veces del experimento logra minimizar estos errores, pero el investigador, sabe que
existen. Lo mas interesante de todo es que el conocimiento de estos errores son la base
de la confiabilidad de la medida estudiada. Si en la repeticion simultanea, inclusive por
distintos metodos, al medir una cierta cantidad, se encuentra que todos los resultados estan
cuidadosamente cercanos, entonces uno pudiera pensar que se tendra una medida cercana
al valor real.
Supongase que se ha medido la masa y e volumen de un cierto objeto en el laboratorio.
Digamos, por ejemplo, que la masa esta dada por m = 4,635 0,002g y el volumen
V = 1,13 0,05mL. Mas adelante explicaremos que significan estas expresiones, por ahora
bastara con decir que el primer de los numeros de la medida es el valor cercano al real,
mientras que el segundo numero es la incertidumbre o el error cometido, cualquiera que
fuera la fuente de su procedencia. La cuestion es: si sabemos que estas son las medidas,
cual sera la medida de la densidad y cual sera su incertidumbre asociada? Mas aun, como
procedemos al calculo de la densidad?, en que afectan los errores individuales de la masa
y el volumen a la densidad?, es posible que el calculo de la densidad no conlleve errores?
Estas son algunas de las dudas que podemos respondernos en este captulo.
B.1. Tipos de errores

Cada medida tiene asociada un incertidumbre, la cual de ahora en adelante usaremos
como sinonimo y/o definicion de error experimental. Cada vez que sacamos conclusiones
de una experiencia de laboratorio, estas pueden estar escritas en terminos de un muy
153
B. Calculos de incertidumbre y de pequenas variaciones
alto grado o un nivel mnimo de confidencialidad, es decir, con mucho error o con poco
error, pero jamas con seguridad absoluta. Los errores experimentales son clasificados en
sistematicos o aleatorios.
B.1.1. Errores sistematicos

El error sistematico, tambien llamado error determinado, se debe a una falla en el
equipo o el diseno de un experimento. Esto quiere decir, que si la medida se hace varias
veces repitiendo el experimento para reproducir el valor de la medida, entonces se conse-
guira el mismo resultado. El error no depende, en otras palabras, del investigador, sino
del instrumento usado o del diseno. Seguramente este error pudiera ser salvado pero la
mayora de las veces resulta difcil.
Los errores sistematicos pueden detectarse mediante tres acciones, a saber, al menos.
Pudiera analizarse con el diseno o con el aparato en cuestion alguna medida de la cual
se sepa cuanto es su valor, de tal manera que conviene escoger una que sea referencia
estandar de calibracion, por ejemplo, con la metodologa usada debera obtenerse el mismo
valor, sino, entonces existen errores sistematicos. Otra manera de darse cuenta cuando se
tiene un error sistematico, es usar un metodo diferente para medir la misma cantidad,
si con este metodo nuevo se reproduce la medida estandar, entonces estara en presencia
tambien de este tipo de error. Por ultimo, otra manera de darse cuenta es hacer que varias
personas midan exactamente la misma cantidad en distintos laboratorios, de no tener
errores sistematicos, entonces las medidas deberan coincidir.
B.1.2. Errores aleatorios

El error aleatorio, tambien llamado error indeterminado, se debe a los efectos de
que las variables no estan controladas en la medicion. El error aleatorio tiene la misma
probabilidad de ser positivos o negativos. Siempre esta presente y no puede corregirse.
El error aleatorio esta la mayora de las veces asociado con la lectura de una escala en
los aparatos de medicion. Diferentes personas leyendo la escala reportaran una serie de
valores que representan sus interpolaciones subjetivas entre las marcas. Una persona que
lee el mismo instrumento varias veces podra informar de varias lecturas diferentes.
B.2. Precision y exactitud

La precision de una medida esta normalmente asociada a la capacidad de que el re-
sultado pueda ser reproducible todas las veces. Una medida precisa es una medida que
se puede volver a obtener por cualquiera otro metodo o por cualquier otro investigador,
salvando, por su puesto, que se haya hecho una eleccion cuidadosa de aparatos y metodos
de medicion. En otras palabras, si medimos una cierta cantidad muchas veces y los valores
estan cercanamente iguales entre si, entonces uno pudiera decir que la medida es precisa.
Si los valores difieren significativamente entonces la medida no es precisa.
154
B.3. Incertidumbre absoluta y relativa
Por otro lado la exactitud esta usualmente relacionada con el hecho de cuan cercano
es el valor de la medida con el valor real de dicha medida. En otras palabras, para darse
cuenta de si una medida es exacta, entonces lo que hay que hacer es buscar una medida de
referencia para esa cantidad y determinar si es significativamente cercana o no. De serlo,
entonces nuestra medida sera exacta.
Aun cuando una medida pudiera ser reproducibles, hay que tener en cuenta, que esto
no quiere decir que dicha medida sea verdadera. Es decir, aunque midamos algo muchas
veces, no podemos estar seguro de que ese valor sea verdaderamente bueno. Por ejemplo,
imagnese que se quisiera medir la densidad de un lquido en el laboratorio, pero por un
descuido inesperado del que no se dio cuenta, se mezclo un poco de ese lquido con otro.
Entonces, usted pudiera hacer el procedimiento y conseguir un conjunto de medidas para
la densidad del lquido, en el reporte, usted pudiera conseguir medidas muy cercanas entre
si en la sucesiva repeticion del experimento. En este caso usted tendra mucha precision
pero su exactitud sera bastante pobre. Por el contrario, usted pudiera haber hecho muchas
mediciones y no coincidir mucho entre todas, sin embargo, en terminos promedios el valor
de la medida es bastante cercano a su valor real. En este caso se tendra muy poca precision
pero bastante exactitud. Un proceso ideal sera tener tanto buena precision como buena
exactitud.
Otro termino merece tambien ser aunque sea definido. Estrechamente ligado a la pre-
sentacion precisa y exacta de los datos esta tambien el asunto de la sensibilidad. Que el
aparato sea sensible esta estrechamente ligado al aumento de precision y exactitud. La
sensibilidad de un aparato es el valor mnimo de la magnitud que es capaz de medir.
As, si la sensibilidad de una balanza es de 5mg significa que para masas inferiores a la
citada, la balanza no podra medir significativamente. Normalmente, se admite que la sen-
sibilidad de un aparato viene indicada por el valor de la division mas pequena de la escala
de medida. En general, se puede decir que es mas facil conocer la precision de un aparato
que su exactitud.

Las incertidumbre relativas y absolutas se refieren a los errores relativos y absolutos
respectivamente. Un error absoluto determina el margen de error asociado con una me-
dida particularmente. El error absoluto en una medida x de determinada magnitud es la
diferencia entre dicho valor y el valor verdadero de la medida; se notara por x y, por
tanto, su expresion es:
x := |x x0 |, (B.1)
donde x0 representa el valor verdadero de la medida. El error absoluto cuantifica la desvia-

cion en terminos absolutos respecto al valor verdadero. No obstante, en ocasiones es mas
interesante resaltar la importancia relativa de esa desviacion. Por ello, se define el error
relativo como el cociente entre el error absoluto y el valor verdadero; notandolo por su
155
expresion es:
x |x x0 |
:= = , (B.2)
x0 x0
y suele expresarse porcentualmente sin mas que multiplicar por 100, a lo que llamamos
comunmente error relativo porcentual.
En Fsica, presentar una medida experimental significa dar el valor de dicha cantidad y
expresar cual es su error; no tiene sentido establecer un determinado valor si no se acota
debidamente el mismo. As, la expresion correcta de una medida debe ser:
x |x| 7 x+
probable = x + |x|, x
probable = x |x|, (B.3)
y por lo tanto el intervalo [x() , x(+) ] es el rango en el que las medidas de la cantidad x es
valido en relacion con el error cometido.
Dado el significado de cota de imprecision que tiene el error absoluto, este siempre se
expresa con una unica cifra significativa, es decir, con el primer dgito comenzando por la
izquierda distinto de cero; este numero debe ser redondeado por exceso en una unidad si la
segunda cifra significativa es 5 o mayor de 5. Este convenio de expresion del error encuentra
dos excepciones: que la primera cifra significativa sea un 1 o que siendo la primera un 2,
la segunda no llega 5; en estos casos, el error vendra dado por las dos primeras cifras
significativas, procediendose al redondeo de la segunda en el mismo sentido que ya se ha
explicado.
Hay que resaltar que el valor de una magnitud debe tener el mismo orden decimal que
el error absoluto. Esto es razonable dado que no tendra sentido encontrar el valor de una
magnitud con un grado de precision superior al del error de la medida. As, no podemos
medir decimas de milmetro con una regla cuya sensibilidad es del milmetro. Finalmente,
se acepta como criterio que si el valor de una medida es ledo de una tabla u otro lugar,
sin indicacion de su error, se tomara como error una unidad del orden de la ultima cifra
con que se expresa; por ejemplo, si en una tabla aparece que el valor de una medida es
de 0.056 sin ninguna indicacion de error, se conviene en que el mismo es de 0,001. En la
siguiente tabla se dan distintos ejemplos.
Expresion incorrecta Expresion correcta

3,418 0,123 3,42 0,12
6,3 0,09 6,30 0,09
46288 1551 46300 1600
428,351 0,27 428,4 0,3
0,01683 0,0058 0,017 0,006
Cuadro B.1.: Ejemplos de expresiones correctas e incorrectas en la descripcion de

incertidumbres.
156
Como ya se ha explicado, cuando se realice la medida de cualquier magnitud hay que

indicar el error asociado a la misma. Dado que no conocemos el valor verdadero de la
magnitud que deseamos medir, se siguen ciertos procedimientos para hacer una estimacion
del mismo y de su cota de error.
Con el fin de alcanzar cierta validez estadstica en los resultados de las medidas es muy
conveniente repetir varias veces su determinacion; por convenio, se ha establecido en 3 este
numero mnimo. No obstante, es posible que en alguna ocasion no tenga sentido llevar a
cabo estas repeticiones, en cuyo caso se considera que el error absoluto coincide con el
valor de la sensibilidad del aparato utilizado para realizar la medida. En el caso habitual,
cuando son 3 las medidas tomadas, pueden presentarse poco o muy dispersas y en funcion
de esta dispersion ser conveniente aumentar o no el numero de determinaciones del valor
de la magnitud. Para decidir el numero determinaciones del valor de una magnitud fsica
que se desea medir se sigue el siguiente procedimiento: se realizan las 3 mediciones xi de
la magnitud en cuestion y se calcula su valor medio:
n=3
X xi
x := , con N = 3 en este caso. (B.4)
N
i=1
A continuacion se determina su dispersion o lo que es llamado Rango D, esto es, la

diferencia entre los valores extremos de las medidas:
D := xmax xmin , (B.5)
finalmente, se obtiene el tanto por ciento de dispersion, T , que viene dado por:
D
T := 100 . (B.6)
x
Con estos parametros se pasa al siguiente cuadro que establece la casustica que puede
darse; S representa la sensibilidad del aparato de medida, D6 es la dispersion para seis
medidas y N el numero de medidas necesarias en cada caso.
As, por ejemplo, si se ha obtenido que la dispersion es mayor que la sensibilidad y el
tanto por ciento de dispersion esta comprendido entre el 2 % y el 8 %, son necesarias 6
medidas; el valor verdadero queda establecido en la media aritmetica de las 6 medidas y
su error corresponde al maximo de entre la dispersion de las seis medidas dividido por 4 o
la sensibilidad.
Si se han realizado 15 o mas medidas, en realidad se esta buscando que el conjunto de
las mismas sea una distribucion gaussiana o normal, en cuyo caso, el error que se considera
corresponde con el error cuadratico medio (ECM)1 o desviacion standard; el significado
1
La varianza representa la media aritmetica de las desviaciones con respecto a la media que son elevadas
al cuadrado. Si atendemos a la coleccion completa de datos (la poblacion en su totalidad) obtenemos
la varianza poblacional; y si por el contrario prestamos atencion solo a una muestra de la poblacion,
obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a
157
D T N x0 x
D<S 3 S
T 2% 3 S
PN xi
2% T 8% 6 xN := i=1 N max{D6/4,
r S}
D>S 8 % T 15 % 15 Pn
i=1 (xxN )
2
15 % T > 50 x = N (N 1)
Cuadro B.2.: Modelo sencillo para la determinacion de incertidumbres.
de este parametro puede encontrarse en cualquier volumen de estadstica basica aunque

podemos sintetizarlo de forma cuantitativa como sigue. En el intervalo:
x x x x + x, (B.7)
se encuentra el 68,3 % de las medidas realizadas en una gran serie de las mismas. De igual
forma, es posible demostrar que en el intervalo:
x 2x x x + 2x, (B.8)
se encuentra el 95,4 % de las medidas realizadas. Por ultimo, en el intervalo:
x 3x x x + 3x, (B.9)
continuacion.
n
P 2
Xi X
2 i=1
SX = , Expresion de la varianza muestral,
n
una segunda manera de expresarla es:
n
Xi2
P
2 i=1 2
SX = X
n
Por otro lado, la expresion de la cuasivarianza muestral (estimador insesgado de la varianza poblacional):
n
P 2
Xi X
2 i=1
SX =
n1
Mientras que Expresion de la desviacion estandar poblacional:
v
u N
uP 2
t i=1 (Xi )
u
2 = .
N
El termino desviacion estandar fue incorporado a la estadstica por Karl Pearson en 1894. Por la formu-
lacion de la varianza podemos pasar a obtener la desviacion estandar, tomando la raz cuadrada positiva
de la varianza. As, si efectuamos la raz de la varianza muestral, obtenemos la desviacion tpica mues-
tral; y si por el contrario, efectuamos la raz sobre la varianza poblacional, obtendremos la desviacion
tpica poblacional.
158
B.4. Propagacion de los errores
se encuentra el 99,7 % de las medidas realizadas en una gran serie de las mismas.

Recordemos la pregunta principal al iniciar el captulo. La idea es poder describir de
que manera puede ser calculado el error de una expresion que es la composicion de dos
magnitudes distintas, cada una con su respectivo error. Esta seccion intenta responder a
esa pregunta fundamental.
Existen varias metodologas para poder ver esto.
B.4.1. El metodo de las derivadas parciales

Empecemos por decir, que una cierta medida pudiera escribirse como la composicion
de varias otras medidas. En este caso estamos en la presencia de una medida indirecta.
Digamos que a esta medida puede asociarse un funcional que se componga de varias medidas
directas, es decir,
y = f (xi , aj ), (B.10)
donde f es una funcion, en principio de cualquier dependencia, que relaciona las medidas
directas xi (i = 1, 2, ..., n) con la medida indirecta y, mientras que aj (j = 1, 2, ..., m)
representan constantes de la fsica (las cuales por cierto, dado que han sido medidas tambien
tienen su incertidumbre asociada).
Luego, dado que el error absoluto es en esencia la diferencia entre el valor real y el valor
medido, entonces el error es x, de esta manera, y sabiendo que la funcion en principio
es continua, se tendra que el error absoluto se convierte en la diferencial total de dicha
funcion, por tanto,
y y y
error absoluto := dy = dx1 + dx2 + dxn
x1 x2 xn
| {z }
medidas
y y y
+ da1 + da2 + dam
a1 a2 am
| {z }
constantes
n m
X y X y
= dxi + daj . (B.11)
xi aj
i=1 j=1
Recuerdese que en este caso hemos cambiado los incrementos x a diferenciales dx por
el caracter continuo de la funcion f (xi , aj ). De esta manera la expresion anterior pudiera
ser escrita equivalentemente como
n m
X y X y
y = xi xi +

aj aj .
(B.12)
i=1 j=1
159
As con el valor absoluto aseguramos que no importe si la desviacion a sido superior al

valor real o inferior, lo que interesa en fin ultimas es reconocer la diferencia entre ambos
valores. As pues, la ecuacion anterior representa el caso mas favorable. Para hacer esto
menos dependiente de las constantes universales, uno pudiera escoger una cantidad de
cifras significativas convenientemente de tal manera que el ultimo termino de la ecuacion
no influya de manera importante. As uno pudiera, hacer
n m
X y X y
y = xi xi +

aj aj = E1 + E2 = (1 + )E1 ,
(B.13)
i=1 j=1
P y Pm y
donde hemos hecho que E1 := ni=1 x i
x i y E2 := j=1 aj aj y luego escoger el
nivel de cifras significativas tal que E2 := E1 , de tal manera que si = 0,1, por ejemplo,
n
X y
y = (1 + )E1 = 1,1E1 E1 xi xi .
(B.14)
i=1
Veamos como se aplica esto con algunos casos particulares.
Caso: la funcion es una suma algebraica de medidas
Digamos que y = f (x1 , x2 ) = x1 + x2 , entonces,

y y
y =
x1 +
x2 = x1 + x2 7 y = x1 + x2 , (B.15)
x1 x2 y x1 + x2
de esta manera, el error absoluto de una medida indirecta que es la suma de dos medidas
directas, resulta ser la suma de los valores absolutos de cada una de las medidas directas.
Caso: la funcion es una multiplicacion de medidas
Digamos que y = f (x1 , x2 ) = x1 x2 , entonces,

y y
y =
x1 +
x2 = x2 x1 + x1 x2 7 y = x1 + x2 . (B.16)
x1 x2 y x1 x2
Caso: la funcion es un cociente de medidas

x1
Digamos que y = f (x1 , x2 ) = x2 , entonces,

x2 = x2 x1 x1 x2 7 y = x1 x2 .
y y
y = x1 + (B.17)
x1 x2 x22 y x1 x2
160
Caso: la funcion es una medida potencial cuyo exponente es otra medida

Digamos que y = f (x1 , x2 ) = xx1 2 , entonces,

y y
y =
x1 +
x2 = x2 xx2 1 x1 + xx2 ln x1 x2 7 y = x2 x1 + ln x1 x2 .
1 1
x1 x2 y x1
(B.18)
Caso: la funcion es exponencial

Digamos que y = f (x1 , x2 ) = exp(x1 ), entonces,

y y
y = x1 = ex1 x1
7 = x1 . (B.19)
x1 y
Caso: la funcion es logartmica

Digamos que y = f (x1 , x2 ) = ln(x1 ), entonces,

y
y = x1 = x1 7 y = x1 . (B.20)
x1 x1 y x1 ln(x1 )
Caso: la funcion es una composicion de funciones trigonometricas

Digamos que y = f (x1 , x2 ) = x1 sin(x2 ), entonces,

y y 1
y = x1 +
x2 x2 = x1 sin(x2 )x1 + x1 cos(x2 )x2

x1
y x1
7 = + x2 cotg(x2 ). (B.21)
y x1
Cuando se trata de la teora de analisis de errores puede ser obtenida una formula general
para la incertidumbre de una coleccion de las mediciones. La formula se basa en la idea
de un desarrollo en serie de Taylor de primer orden de funciones de muchas variables. Es
valida cuando las diversas incertidumbres i de las variables son pequenas en comparacion
con los valores de las cantidades y con la exigencia de que las incertidumbres no estan
correlacionadas entre s. En concreto, si se tiene el comportamiento de f (x, y, z, ...) de
las variables fsicas x, y, z,. . . que tienen incertidumbres x , y , z . . ., entonces la
incertidumbre en el valor del resultado de f viene dada por la formula
2 2 2
2 2 f 2 f 2 f
f = x + y + z + , (B.22)
x y z
donde f , x , y , z , son los errores de la funcion f y de x, y, z, respectivamente, los cuales
denotaremos por
a
a := a = , (B.23)
a
161
de acuerdo con la ecuacion (B.2).
Por ejemplo, en Relatividad General para un universo plano, la definicion del parametro
de desaceleracion gravitacional, permite calcular la densidad crtica del universo, de tal
manera que es posible calcular
3H 2
c = , (B.24)
8G
donde H := R
R es la constante de Hubble, la cual mide la velocidad con la cual las galaxias
se mueven alejandose unas de las otras, las ultimas mediciones estiman su valor en H
(75 25)Km s1 M pc1 . De tal manera que el error cometido al tratar de medir la
densidad del universo puede ser conseguida tal que,
3H 3H 2 3H 2
c = H 2 G, (B.25)
4G 8 G 8G2
con lo cual
H G
=2 , (B.26)
H G
por tanto, sabiendo la incertidumbre de H, recordemos que el valor mas preciso de la
constante de Gravitacion Universal esta dado por G := (6,67428 0,00067) 1011 m3
Kg 1 s2 , luego, se tendra que
3H 2 Kg Kg
= 0,66651 7 = = 1,0616879 1038 3 7 = 7,07634 1039 3 , (B.27)
8G m m
lo cual quiere decir entonces que la densidad crtica pudiera estar medida en
Kg
= (1,0616879 0,707634) 1038 , (B.28)
m3
por ultimo
2 f 2
2
f 2

f
2 = = H 2 2
+ 2
+ G = 0,44424
H G
q
= 22H + 2 + 2G = 7,07634 1039 . (B.29)
B.4.2. El metodo del Neperiano

La regla de las derivadas parciales es valida siempre. Sin embargo, cuando la funcion f
solo tiene productos, divisiones o potencias (o es una combinacion de estas operaciones),
una forma alternativa de calcular el error de y es proceder de la siguiente forma:
Se determina el logaritmo neperiano de los dos miembros de la ecuacion y = f (xi , aj )
ln y = ln f (x1 , x2 , ..., xn ) (B.30)
162
Se toman diferenciales de ambos miembros de la ecuacion anterior.
Se identifican los elementos diferenciales con los errores de las variables (dy 7 y,
dxi 7 x), y se sustituyen los valores correspondientes de y y xi en la expresion
final:
Por ejemplo, imagnese que para un cierto experimento se tiene una dependencia de la
forma
xy
w = f (x, y, z) = , (B.31)
z
por tanto se sabe que cada una de las medidas directas x, y y z, tienen errores absolutos
asociados x, y y z. Por tanto tomando logaritmos neperianos a ambos lados de la
expresion se obtiene que

xy
ln(w) = ln = ln(x) + ln(y) ln(z), (B.32)
z
luego ahora derivamos a ambos lados y tendremos que
dw dx dy dz w x y z
= + 7 = + . (B.33)
w x y z w x y z
Vease que este resultado es exactamente el mismo que se conseguira con el metodo de
las derivadas parciales.
Por ejemplo, la frecuencia emitida o absorbida en el transcurso de una transmision entre

los niveles p y n del hidrogeno esta dada por la relacion
me4

1 1
= 2 3 , (B.34)
80 h n2 p 2
donde n y p son numeros enteros y m es la masa del electron de carga e, siendo
me4
R= , (B.35)
820 h3 c
es la constante de Rydberg. Lo primero es verificar las unidades de dicha constante, digamos
me4 (M )(I 4 T 4 ) me4 1

1
= = T
7 [R] = = T 1 T L1 = L1 .
820 h3 (L6 M 2 T 8 I 4 )(L6 M 3 T 3 ) 820 h3 c
(B.36)
Ahora imaginemos que conocemos la relacion de la constante de Rydberg y quisieramos
saber la incertidumbre en su medida en terminos de las cantidades anteriores, en este caso,
podemos escribir, tomando logaritmos en ambos lados
1
ln(R) = (ln(m) + 4 ln(e) 2 ln(0 ) 3 ln(h) ln(c)) , (B.37)
8
163
luego derivando a ambos lados de la igualdad, se tiene que

ln(R) 1 ln(m) ln(e) ln(0 ) ln(h) ln(c)
= +4 2 3 , (B.38)
R 8 m e 0 h c
y conociendo las incertidumbres en cada una de las medidas se tiene que c = (2,997925
0,000003) 108 )m/s, h = (6,6260693 0,000000011) 1034 )J s, e = (1,602176487
0,00000000040) 1019 C, m = (9,10938215 0,0000000045) 1031 kg, o sea,
ln(R)
R := = 6,66 1012 . (B.39)
R
Un ejemplo mas. Piense en el pendulo de torsion. La constante de Torsion C de un
alambre, determinada por el metodo de oscilaciones de un pendulo esta dada por la relacion
a22 a21
C = 8 2 m , (B.40)
T22 T12
donde m es la masa de cada uno de los disco fijados sobre una barra horizontal a la distancia
a del eje de rotacion. T1 y T2 son los periodos del pendulo correspondientes a dos valores
de a1 y a2 de a. Imagnese que se hizo la experiencia sobre un alambre de acero de masa
(m = 354,0 0,5)g y las otras medidas fueron a1 = (17,3 0,2)cm y a2 = (37,3 0,2)cm,
ademas de T1 = (14,3 0,1)seg y T2 = (17,6 0,1)seg.
Luego
dC m a2 a2 + a1 a1 T2 T2 + T1 T1
= 2 + +2 2 2 +2
C m a2 a1 T22 T12
m a T
= + +2 +2
m a2 a1 T2 T1
3
= (1,5 + 20 + 60) 10 10 %, (B.41)
ya que a1 = a2 := a = 0,2cm y T1 = T2 := T = 0,1seg. Por otro lado, la incer-
tidumbre relativa mas pequena es m/m = 1,5 103 (mucho menor que la incertidumbre
resultante). El error de , para que sea despreciable, debera ser, por consiguiente, inferior
a ese valor, esto se logra, tomando = 3,14, lo que conduce a

= 15 103 , = 5 104 , y 2 103 . (B.42)

Con lo cual
8 9,86 0,354 1092 104 N w m Nw m
C= = 2,89 2 , (B.43)
105,3 rad rad
por consiguiente
C Nw m
C = = 0,3 102 , (B.44)
10 rad
y por ultimo
Nw m
C = (2,9 0,3) 102 . (B.45)
rad
164
Bibliografa
[1] Jeffrey, R.C., Probability and the Art of Judgment, Cambridge University Press.
(1992). pp. 54-55 . ISBN 0-521-39459-7.
[2] Olav Kallenberg, Probabilistic Symmetries and Invariance Principles. Springer -

Verlag, New York (2005). 510 pp. ISBN 0-387-25115-4.
[3] Kallenberg, O., Foundations of Modern Probability, 2nd ed. Springer Series in Sta-
tistics. (2002). 650 pp. ISBN 0-387-95313-2.
[4] P. Bevington and D. K. Robinson, Data reduction and error analysis for the physical
sciences, 2nd ed. (McGraw Hill, New York, 1993).
[5] Stuardt L. Meyer, Data analysis for scientists and engineers (John Willey & Sons,
Inc., New York, 1975).
[6] D. C. Baird, Experimentacion, 2a ed. (Prentice-Hall Hispanoamericana S.A., Mexico,

1991).
[7] J. Higbie, Uncertainty in the linear regression slope. Am. J. Phys. 59, 184 (1991)
[8] J. Orear, Least squares when both variables have uncertainties, Am. J. Phys. ibid.,
50, 912 (1982).
[9] Simple method for fitting data when both variables have uncertainties. D. Barker
and L.M. Diana Am. J. Phys. 42, 224 (1974).
[10] Linear least-squares fits with errors in both coordinates. II: Comments on parameter
variances - B. Cameron Reed - Am. J. Phys., Vol. 60, No. 1, 1992.
[11] Estadstica - M. Spiegel - McGraw Hill 2da. Ed. Bogota 1997
[12] S. Gil y E.Rodrguez, Fsica re-Creativa, Prentice Hall, Buenos Aires 2001.
[13] Agresti, A. and Finlay, B., Statistical Methods for the Social Sciences, 3th Edition.
Prentice Hall, 1997.
[14] Anderson, T. W. and Sclove, S. L., Introductory Statistical Analysis. Houghton Mif-
flin Company, 1974.
[15] Clarke, G.M. and Cooke, D., A Basic course in Statistics.
165
Bibliografa
[16] Arnold, 1998. Electronic Statistics Textbook,

http://www.statsoftinc.com/textbook/stathome.html.
[17] Freund, J.E., Modern elementary statistics. Prentice-Hall, 2001.
[18] Johnson, R.A. and Bhattacharyya, G.K., Statistics: Principles and Methods, 2nd
Edition. Wiley, 1992.
[19] Leppala, R., Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows
-ohjelmiston avulla, Tampereen yliopisto, Matematiikan, tilastotieteen ja filosofian
laitos, B53, 2000.
[20] Moore, D., The Basic Practice of Statistics. Freeman, 1997.
[21] Moore, D. and McCabe G., Introduction to the Practice of Statistics, 3th Edition.
Freeman, 1998.
[22] Newbold, P., Statistics for Business and Econometrics. Prentice Hall, 1995.
[23] Weiss, N.A., Introductory Statistics. Addison Wesley, 1999.
166

Esta Dis Tical I Bro

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Esta Dis Tical I Bro

Hochgeladen von

Copyright:

Verfügbare Formate

Estadstica y probabilidad. Una introduccion. Notas de Clase. Dr. David Sierra Porta.

Laboratorio de Campos y Partculas. Departamento de Fsica. Facultad Experimental del

David Sierra Porta

2.3.4. La Desviacion Media . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3. Metodos cuantitativos de analisis predictivo, regresion 69

5.4. Calculando la probabilidad de un evento . . . . . . . . . . . . . . . . . . . . 93

6. Variable aleatoria y funcion de distribucion 105

7. Distribuciones de Probabilidad Binomial y Normal 113

8. Estimacion puntual e intervalos de confianza. Inferencia estadstica. 127

8.3. Intervalos de confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

9. Pruebas de hipotesis de una poblacion 137

A. La redaccion de informes y presentacion de resultados 147

B. Calculos de incertidumbre y de pequenas variaciones 153

2.1. Histograma de frecuencias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.1. Diagrama de dispersion o nube de puntos. . . . . . . . . . . . . . . . . . . . 71

4.1. Metodologa sencilla para la resolucion de problemas de conteo. . . . . . . . 86

7.1. Distribucion de estaturas de 1400 mujeres. . . . . . . . . . . . . . . . . . . . 118

8.1. Nivel de confianza para la media poblacional. . . . . . . . . . . . . . . . . . 129

9.1. Prueba de hipotesis de una y dos colas. . . . . . . . . . . . . . . . . . . . . 141

Se presentan a continuacion unas notas de Estadstica Elemental y Fundamental y pro-

A cargo de la Profesora M. Jeanette Stock...!

- Sir Francis Galton. Natural Inheritance (1889), 62-3.

1.1. Pequena definicion y algunos conceptos basicos

Definicion 1.1 (Estadstica) La Estadstica es la ciencia de recoger o colectar, organi-

De que tipo y cuantos datos se necesitan recoger para estimar algo?

Como se organizan y resumen los datos recogidos?

Como sacamos conclusiones a partir de estos y como evaluamos sus incertidumbres?

O sea, que la estadstica provee metodos para

1. Diseno: Planear e implementar estudios de investigacion.

2. Descripcion: Resumir y explorar datos.

3. Inferir: Hacer predicciones y generalizar fenomenos a partir de una data inicial.

Ejemplo 1.1 (Estadstica en la practica) Algunos problemas en los que la estadstica

1.2. Poblacion y muestra

Definicion 1.2 (Poblacion) Una poblacion (estadstica) es un conjunto de medidas o

Ejemplo 1.2 (Poblacion y muestra) En muchos casos la poblacion bajo consideracion

Variables cualitativas o atributos: no se pueden medir numericamente (por ejem-

Variables cuantitativas: tienen valor numerico (edad, precio de un producto, in-

Las variables tambien se pueden clasificar en:

Variables unidimensionales: solo recogen informacion sobre una caracterstica

Variables bidimensionales: recogen informacion sobre dos caractersticas de la

Variables pluridimensionales: recogen informacion sobre tres o mas caractersti-

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

3. Muestra: subconjunto que seleccionamos de la poblacion. As, si se estudia el precio

A su vez, digamos que por ejemplo estuvieramos interesados en conocer la opinion de la

Parametro - una medida numerica (generalmente desconocida) hecha usando el

estadstico - un valor numerico (conocida) soportado en el conjunto de datos del

que si tomamos en cuenta la data proveniente de la escogencia al azar de las 10 universi-

1.4. Metodos de recoleccion de datos

cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observacion, el diagrama

La estadstica descriptiva es la disciplina de la estadstica que intenta describir cuan-

2.1. Distribuciones de frecuencia

Intervalo Marca de Clase Frecuencia

Cuadro 2.1.: Una tpica tabla de distribucion de frecuencias.

2.1.1. Terminologa adicional

2. Numero total de datos no agrupados: se denota por N .

3. Numero total de datos agrupados: se denota por n.

4. Lmite real inferior de la data: es el menor valor en la data. Lo denotaremos

5. Lmite real superior de la data: es el mayor valor en la data. Lo denotaremos

6. Lmite inferior de clase: es el menor valor en el intervalo de clase. Lo denotaremos

7. Lmite superior de clase: es el mayor valor en el intervalo de clase. Lo denotaremos

8. Ancho de clase: es la diferencia entre dos lmites de clases superiores (o inferiores)

2.1.2. Creando una tabla de frecuencias

recordando que el rango de la data esta dado por