Sie sind auf Seite 1von 80

Yery Cristell Prez Olmedo

1ra Edicin

1ra Edicin

Yery Cristell
Prez Olmedo

No trates de ser una


persona de xito, sino una
persona de valor.
Albert Einstein

Para ser exitoso no tienes que


hacer cosas extraordinarias.
Haz cosas ordinarias
extraordinariamente bien.
Jim Rohn

Probabilidad y Estadstica
INDICE
TEMARIO ................................................................................................................ 4
BIBLIOGRAFA BSICA ......................................................................................... 7
CRITERIOS DE EVALUACIN ............................................................................... 8
Ensayos .................................................................................................................. 9
Formato para el Texto del Ensayo ....................................................................... 9
Tablas ................................................................................................................... 10
Proyectos .............................................................................................................. 13
Unidad I ................................................................................................................. 14
Distribuciones de frecuencias ............................................................................ 14
Frecuencias Absoluta ..................................................................................... 14
Frecuencias Relativas..................................................................................... 14
Frecuencia Acumulada ................................................................................... 15
Frecuencia Relativa Acumulada ..................................................................... 15
Distribucin de Frecuencias Agrupadas ......................................................... 15
Construccin de una tabla de datos agrupados: ................................................ 16
Representacin grfica de datos. ...................................................................... 17
Histogramas, Polgonos de Frecuencias............................................................ 17
Histograma ..................................................................................................... 17
Polgono de Frecuencias ................................................................................ 18
Tipo de Tendencia Modal ............................................................................... 18
Tipos de curvas de frecuencia ........................................................................ 18
Medidas de tendencia central: ........................................................................... 20
La media, la moda, la mediana. ......................................................................... 20
La Media Aritmtica: ....................................................................................... 20
Media para datos agrupados .......................................................................... 20
La Mediana: .................................................................................................... 20
Mediana para datos agrupados ...................................................................... 21
La Moda: ......................................................................................................... 21
Moda para datos agrupado ............................................................................. 21

Medidas de dispersin: La Desviacin Media, ................................................... 22


La Varianza y La Desviacin Estndar. ............................................................. 22
Desviacin media ........................................................................................... 22
Varianza.......................................................................................................... 23
Desviacin Estndar ....................................................................................... 24
Momentos de Orden k .................................................................................... 25
Momentos de Orden 2 (k=2) ........................................................................... 25
Unidad II ................................................................................................................ 28
Experimentos Aleatorios .................................................................................... 28
Modelos de asignacin de probabilidades, clsico, de frecuencia relativa,
subjetiva.......................................................................................................... 29
Axiomas y Teoremas Bsicos de Probabilidad ............................................... 32
Teoremas de la suma de Probabilidades........................................................ 33
Anlisis combinatorio y Diagrama de rbol ........................................................ 36
Probabilidad Condicional e Independencia de Eventos ..................................... 38
Teorema de Bayes ......................................................................................... 40
PRACTICAS .......................................................................................................... 43
Unidad III ............................................................................................................... 44
Variable Aleatoria Discreta ................................................................................. 44
Valor esperado ............................................................................................... 47
Propiedades del valor esperado ..................................................................... 48
Varianza.......................................................................................................... 48
Propiedades de la varianza V[x] ..................................................................... 50
Distribuciones y Teoras Discretas ..................................................................... 52
Distribucin Binomial o de Bernouilli. .............................................................. 52
Condiciones de un proceso de Bernoulli......................................................... 52
Distribucin de Poisson .................................................................................. 53
La Distribucin Binomial; .................................................................................... 57
Teorema del binomio ...................................................................................... 57
La Distribucin de Poisson; ................................................................................ 57
La Distribucin de Geomtrica; .......................................................................... 57
Hipergeometrica ............................................................................................. 58

Unidad IV............................................................................................................... 59
Variable Aleatoria Continua ............................................................................... 59
Caractersticas de la variable aleatoria contina ............................................ 60
Modelos probabilsticos para variables continuas .............................................. 62
Distribuciones tericas continuas ....................................................................... 63
Distribucin Normal estndar.......................................................................... 63
Funcin de densidad ...................................................................................... 63
Distribucin Exponencial................................................................................. 64
Distribucin T Student..................................................................................... 65
Distribucin chi cuadrada................................................................................ 65
Funcin de distribucin acumulada ................................................................ 66
Aplicaciones.................................................................................................... 66
Unidad V................................................................................................................ 67
Distribuciones mustrales .................................................................................. 67
Distribuciones mustrales de medias ............................................................. 68
Distribucin muestral de varianzas ................................................................. 70
Teora del muestreo ........................................................................................... 71
Teora del lmite central .................................................................................. 71
Calculo del tamao adecuado de una muestra .................................................. 73
Tipos de muestras .......................................................................................... 73
Nmero de sujetos necesario: ........................................................................ 74
Variables de las que depende el tamao de la muestra ................................. 74
CREDITOS ............................................................................................................ 76

UNIVERSIDAD AUTNOMA DE CHIAPAS


FACULTAD DE INGENIERA
CAMPUS I

PROBABILIDAD Y ESTADSTICA
NIVEL:
CLAVE:
SEMESTRE:
REQUISITOS:
MATERIA:

LICENCIATURA
ICAD24.500919
CUARTO
CLCULO INTEGRAL
OBLIGATORIA

CRDITOS:
HORAS TEORA:
HORAS PRCTICA:
HORAS POR SEMANA:

9
4.5
0
4.5

TEMARIO
OBJETIVO GENERAL:
Proporcionar al alumno elementos formativos en la teora
de la probabilidad y estadstica que le permitan analizar
y asignar valores reales a fenmenos aleatorios
relacionados con la ingeniera.

UNIDAD 1.- Estadstica Descriptiva


Objetivo Particular:
El alumno generar un conjunto de datos al azar con
base a los cuales construir una tabla de distribucin de
frecuencias; elaborar una representacin grfica de los
datos y calcular las medidas de tendencia central y de
dispersin.

1.1. Distribuciones de frecuencias.


1.1.1. Frecuencias acumuladas.
1.1.2. Frecuencias relativas.
1.2. Representacin grfica de datos. Histogramas, Polgonos de Frecuencias,
1.3. Medidas de tendencia central. La media, la moda, la mediana.
1.4. Medidas de dispersin. La Desviacin Media, la Varianza, la Desviacin
Estndar.
TIEMPO ESTIMADO: 4.5 Hrs

UNIDAD 2.- Elementos de la Teora de la Probabilidad


Objetivo Particular:
El alumno aprender a:
Asignar valores reales a experimentos aleatorios
basndose en los modelos probabilsticos clsicos y
de frecuencia relativa.
Usar el anlisis combinatorio para el clculo de
probabilidades.
Usar el teorema de Bayes.

2.1. Experimentos aleatorios, espacio muestral y eventos.


2.1.1. Modelos de asignacin de probabilidades; Clsico, de Frecuencia
Relativa, Subjetivo.
2.1.2. Axiomas y teoremas bsicos de probabilidad.
2.2. Anlisis combinatorio y diagramas de rbol.
2.3. Probabilidad condicional e independencia de eventos.
2.3.1. Teorema de Bayes.
TIEMPO ESTIMADO: 18.0 Hrs

UNIDAD 3.- Modelos Probabilsticos para Variables Discretas


Objetivo Particular:
El alumno aprender a usar los modelos probabilsticos
de manera correcta diferenciando a una variable discreta
de una continua e identificando los parmetros de cada
modelo, tales como: la media, la probabilidad de xito, el
nmero de eventos o el nmero de ensayos.

3.1. Variables aleatorias discretas. Definicin, Valor esperado y Varianza.


3.2. Propiedades del valor esperado y la varianza.
3.3. Distribuciones tericas discretas: Bernoulli, Poisson, Geomtrica,
Hipergeomtrica.
TIEMPO ESTIMADO: 15.0 Hrs

UNIDAD 4.- Modelos Probabilsticos para Variables Contnuas


Objetivo Particular:
El alumno aprender a usar las distribuciones tericas
continuas para el clculo de probabilidades,
diferenciando correctamente a las variables aleatorias
continuas de las discretas.

4.1. Variables aleatorias continuas. Definicin, valor esperado y varianza.


4.2. Distribuciones tericas continuas. Gauss, Exponencial, Gama, Student,
Chi-cuadrada.
TIEMPO ESTIMADO: 16.5 Hrs

UNIDAD 5. Inferencia Estadstica


Objetivo Particular:
El alumno aprender a aplicar los conceptos de
probabilidad para recabar, interpretar y analizar una
muestra de datos para la toma de decisiones con
respecto a un fenmeno aleatorio.

5.1. Distribuciones muestrales.


5.1.1. de Medias.
5.1.2. de varianzas.
5.2. Teora de muestreo.
5.2.1. Teorema del lmite central.
5.3. Teora de estimacin.
5.3.1. Estimacin por intervalos de confianza para medias.
5.3.2. Estimacin por intervalos de confianza para varianzas.
5.3.3. Clculo del tamao adecuado de una muestra.
5.4. Comprobacin de hiptesis referida a medias poblaciones.

TIEMPO ESTIMADO: 18.0 Hrs

BIBLIOGRAFA BSICA
WALPOLE, R. Y MYERS, R. H.
Probabilidad y Estadstica para Ingenieros.
Editorial Interamericana,
Mxico, 1982.
CANAROS, G. C.
Probabilidad y Estadstica con Aplicaciones y Mtodos.
Editorial Mc.
Graw Hill, Mxico, 1988.

BIBLIOGRAFA COMPLEMENTARIA
FREUND, J. E. Y SIMN, G. A.
Estadstica Elemental.
8 ed. Editorial
Prentice Hall, Mxico, 1994.
FREUND, J. E.
Probabilidad y Estadstica para Ingenieros.
Editorial Prentice Hall,
Mxico, 1992.
JAY L. DEVORE .
Probabilidad y Estadstica
Ingeniera y Ciencias, Ed. Thomson Paraninfo
Mxico, 2006.

CRITERIOS DE EVALUACIN

PORCENTAJE

Unidad I
( Tarea_1* / Participacin )

0%

Ensayos
30 %

(3 x 10)

Evaluacin Mensual
Unidad II
0 Puntos.
Unidades III, IV y V
10 Pts.
Unidad V
10 pts.

20 %

Prcticas, Ejercicios y Tareas

20 %

(2 pts. Menos x tareas faltantes)

Proyecto:

Reporte

Aplicacin

15%

15%

100%

Programa

Ensayos
Ensayo #1:
Todos los temas de la Unidad II
- Explicacin de la teora principalmente.
- Algunos ejercicios y ejemplos.

Toda la Teora de los


ensayos se entregar de
forma electrnica en
archivos PDF.

Ensayo #2:
Todos los temas de la Unidad IV.
Los ejercicios de los
ensayos se entregarn
en hojas blancas tamao
carta y escritos a mano.

Ensayo #3:
Presentar un punto de vista personal de los
Temas sealados con
de la Unidad V.

Formato para el Texto del Ensayo

Estructura:
Explicar principalmente la teora de los ejercicios, dar solo el enunciado, excepto
que el ejercicio sea indispensable para la comprensin.
La solucin de los ejercicios dados con enunciado presentarlos por escrito en hojas
blancas.

Formato de Texto:
Arial 12 con espaciado 1.0 y agregar un espacio despus de cada prrafo, cada
prrafo de 5-6 lneas justificadas.
Ttulos en negrita Arial 14 y Subttulos en negrita Arial 12; Ttulos justificados a la
derecha y subttulos justificados a la izquierda.
Solo las numeraciones indicadas en el programa de curso. Otros subttulos solo en
negritas, no se aceptan vietas. Ttulos en Maysculas y Minsculas. Se pueden
utilizar tablas y grficas.

Nmeros de Pginas:
Ensayo 1.-

8 10

Pginas

Ensayo 2.-

12 14

Pginas

Ensayo 3.-

12 14

Pginas

Tablas

10

11

12

Proyectos
1) Estadstica y Test para identificar el nivel de la educacin en
Mxico y en el Mundo.
2) Test para las competencias; Saber hacer, Saber ser y Saber
saber.
3) Estadsticas del campo laboral.
4) Definir el nivel de satisfaccin en la facultad
a) De los catedrticos
b) De los alumnos (Referente a servicios)
c) Nivel de los estudios
5) Correlacin: actitud de compromiso de rendimiento escolar.
6) Correlacin: Numero de seres queridos (amigos, familiares,
profesores) vs felicidad.
7) Estudio sobre Diabetes
8) Estudios sobre Unos Kilitos de ms, ndice corporal.
9) Estudio sobre el Bulling.
10) La influencia del aprendizaje debido al lugar donde se siente.

Los Proyectos sern


entregados como
programaciones y se
presentarn la fecha acordada.

Todas las Tareas y


Ejercicios se entregarn
en hojas blancas escritos
a mano.

13

Unidad I
Estadstica Descriptiva
Distribuciones de frecuencias
En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en
categoras mutuamente excluyentes que indican el nmero de observaciones en
cada categora. Esto proporciona un valor aadido a la agrupacin de datos. La
distribucin de frecuencias presenta las observaciones clasificadas de modo que se
pueda ver el nmero existente en cada clase.
Tipos de frecuencias:

Frecuencias Absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en
un estudio estadstico. Se representa por f i. La suma de las frecuencias absolutas
es igual al nmero total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma
mayscula) que se lee suma o sumatoria.

=
=1

Frecuencias Relativas
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado
valor y el nmero total de datos. Se puede expresar en tantos por ciento y se
representa por ni.

La suma de las frecuencias relativas es igual a 1, siempre y cuando no sea igual


que 7 o por debajo de los 7 primeros nmeros sucesivos. Frecuencia relativa (ni),
es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). Es decir:

=
=1

14

Siendo el ni para todo el conjunto i. Se presenta en una tabla o nube de puntos en


una distribucin de frecuencias. Si multiplicamos la frecuencia relativa por 100
obtendremos el porcentaje o tanto por ciento (pi).

Frecuencia Acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado. La frecuencia acumulada es la
frecuencia estadstica F(XXr) con que el valor de un variable aleatoria (X) es menor
que o igual a un valor de referencia (Xr). La frecuencia acumulada relativa se deja
escribir como Fc(XXr), o en breve Fc(Xr), y se calcula de:
Fc (Xr) = MXr / N
donde MXr es el nmero de datos X con un valor menor que o igual a Xr, y N es
nmero total de los datos. En breve se escribe:

Cuando Xr=Xmin, donde Xmin es el valor mnimo observado, se ve que Fc=1/N,


porque M=1. Por otro lado, cuando Xr=Xmax, donde Xmax es el valor mximo
observado, se ve que Fc=1, porque M=N. En porcentaje la ecuacin es:
Fc(%) = 100 M / N

Frecuencia Relativa Acumulada


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de
un determinado valor y el nmero total de datos. Se puede expresar en tantos por
ciento.

Distribucin de Frecuencias Agrupadas


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si
las variables toman un nmero grande de valores o la variable es continua. Se
agrupan los valores en intervalos que tengan la misma amplitud denominados
clases. A cada clase se le asigna su frecuencia correspondiente.

Lmites de la clase. Cada clase est delimitada por el lmite inferior de la


clase y el lmite superior de la clase.

Amplitud de la clase. Es la diferencia entre el lmite superior e inferior de la


clase.

15

Marca de clase. Es el punto medio de cada intervalo. Es el valor que


representa a todo el intervalo para el clculo de algunos parmetros y se
obtiene sumando los lmites inferior y superior de la clase y dividiendo por 2.
As, la marca de clase del intervalo 60 - 62 es (60 + 62)/2 = 61. La marca de
clase se llama tambin punto medio de la clase.

Construccin de una tabla de datos agrupados:


1) Se localiza el valor mximo y el mnimo de la distribucin.
2) Se restan los valores, es decir, calculamos el rango; Luego se busca un nmero
entero un poco mayor que el rango obtenido y que sea divisible por el nmero
de intervalos que queramos establecer. Lo llamaremos r .
3) Usamos la frmula 1 para determinar el nmero de intervalos m y lo

n = tamao de la muestra.

aproximamos al siguiente nmero entero.

= 1 + 3.3 log()
4) Escogemos un nmero impar de intervalos y teniendo a r . Calculamos el
incremento de x.

5) Graficamos los datos de la tabla. (Llenar la tabla con los datos obtenidos)
Distribucin de Frecuencias
Intervalo de
clase

Marca
de clase

Histograma

Frecuencia Frecuencia Frecuencia


absoluta
acumuladas Relativas

(Tarea N1)

16

Representacin grfica de datos.


Histogramas, Polgonos de Frecuencias.
Las tablas estadsticas representan toda la informacin de modo esquemtico y
estn preparadas para los clculos posteriores. Los grficos estadsticos nos
transmiten esa informacin de modo ms expresivo, nos van a permitir, con un slo
golpe de vista, entender de que se nos habla, observar sus caractersticas ms
importantes, incluso sacar alguna conclusin sobre el comportamiento de la muestra
donde se est realizando el estudio. Los grficos estadsticos son muy tiles para
comparar distintas tablas de frecuencia.

Histograma
Se utiliza para la representacin de variables cuantitativas continuas, cada
intervalo se representa sobre el eje OX, este ser la base del rectngulo que se
dibuja sobre l con altura igual o proporcional a su frecuencia absoluta. Como los
intervalos son consecutivos, los rectngulos quedan adosados. Si se utilizarn
rectngulos de amplitud diferente, el rea del rectngulo es la que tendra que ser
proporcional a la frecuencia absoluta correspondiente a ese intervalo. Histograma
acumulativo, si se utiliza la frecuencia absoluta acumulativa.
Ejemplo de la grfica:

17

Polgono de Frecuencias
Se utilizan para variables estadsticas cuantitativas, discretas o continuas. Para una
variable discreta, el polgono de frecuencias se obtiene uniendo por una
poligonal, los extremos superiores de las barras. Para una variable continua, el
polgono de frecuencias se obtiene uniendo por una poligonal los puntos medios de
la base superior de los polgonos del histograma. Las escalas utilizadas para
representar los polgonos de frecuencias influyen mucho por el impacto visual de
los mismos.
Ejemplo de la grfica:

Tipo de Tendencia Modal

Tipos de curvas de frecuencia


Las curvas de frecuencia presentan determinadas formas caractersticas que les
distinguen como se indica en la Figura siguiente:

18

a) Las curvas de frecuencia simtricas o bien formadas se caracterizan por el


hecho de que las observaciones que equidistan del mximo central tienen la
misma frecuencia. Un ejemplo importante es la curva normal.
b) En las curvas de frecuencia moderadamente asimtricas o sesgadas la cola
de la curva a un lado del mximo central es mayor que al otro lado. Si la cola
mayor se presenta a la derecha de la curva se dice que sta est sesgada a
la derecha o que tiene sesgo positivo, mientras que si ocurre lo contrario se
dice que la curva est sesgada a la izquierda o que tiene un sesgo negativo.
c) En las curvas en forma de J o de J invertida, el mximo se presenta en un
extremo.
d) Las curvas de frecuencias en forma de U tienen el mximo en ambos
extremos.
e) Una curva de frecuencias bimodal tiene dos mximos.
f) Una curva de frecuencias multimodal tiene ms de dos mximos.

19

Medidas de tendencia central:


La media, la moda, la mediana.
La Media Aritmtica:
La

media aritmtica

o media

de un

conjunto de

n datos

xn ordenados en Clases, se define Media Aritmtica (

x1, x2, x3,,

como:

O sea:

=
Donde:

n es la frecuencia total, es decir, el nmero total de datos.


fi es la Frecuncia Absoluta de cada Clase.
Xi es la Marca de Clase de cada una de ellas.
Media

1 +2 ++

Media para datos agrupados


= 1 + [ 2
]

k1 = Limite inferior de la clase que influye a la mediana.


n = nmero de datos.
fi = frecuencia absoluta de la clase donde est la mediana.
fa = acumulada que procede.

La Mediana:
Se define a la Mediana de un conjunto de datos, como aquel valor que divide al
conjunto en dos partes iguales, de forma que el nmero de valores mayor o igual a
la mediana es igual al nmero de valores menores o igual a estos. Tambin puede
definirse, como el trmino de la serie supera y a la vez es superado a lo sumo por
la mitad de los datos.
Para datos No Agrupados en Clases, el clculo de la Mediana es la siguiente:

20

A) Si la Serie tiene un nmero par de datos, como por ejemplo la siguiente serie:
1, 3, 4, 5, 6 y 9

B) Si la Serie tiene un nmero impar de datos, como por ejemplo la siguiente serie:
1, 2, 3, 4, 5

Mediana para datos agrupados


Donde:

fi = frecuencia absoluta.
xci = marca de clase (valor medio).

La Moda:
Se define a la Moda como el valor de mayor frecuencia en una serie de datos. El
clculo de la Moda es el siguiente:

Moda para datos agrupado


1
= 1 + [
]
1 + 2
Donde

d = ancho del intervalo.

21

Medidas de dispersin: La Desviacin Media,


La Varianza y La Desviacin Estndar.
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la
variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes
puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea
ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a
la media. As se sabe si todos los casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviacin media) y otra es tomando las desviaciones
al cuadrado (varianza).

Desviacin media
En estadstica la desviacin absoluta promedio o, sencillamente desviacin media o
promedio de un conjunto de datos es la media de las desviaciones absolutas y es un
resumen de la dispersin estadstica. Se expresa, de acuerdo a esta frmula:

La desviacin absoluta respecto a la media,

, la desviacin absoluta respecto a

la mediana,
, y la desviacin tpica, , de un mismo conjunto de valores cumplen
la desigualdad:
Siempre ocurre que

donde el Rango es igual a:

El valor:
Ocurre cuando los datos son exactamente iguales e iguales a la media aritmtica.

22

Por otro lado:

Cuando solo hay dos valores en el conjunto de datos.

Varianza
La varianza (que suele representarse como
) de una variable aleatoria es una
medida de dispersin definida como la esperanza del cuadrado de la desviacin de
dicha variable respecto a su media. Si tenemos un conjunto de datos de una misma
variable, la varianza se calcula de la siguiente forma:

Siendo:
: cada dato
: El nmero de datos
: la media aritmtica de los datos
Aplicando este concepto a una variable aleatoria con media = E[X], se define
su varianza, Var(X) (tambin representada como
o, simplemente 2), como:

Desarrollando la definicin anterior, se obtiene la siguiente definicin alternativa (y


equivalente):

23

Desviacin Estndar
La desviacin estndar o desviacin tpica (denotada con el smbolo o s,
dependiendo de la procedencia del conjunto de datos) es una medida de dispersin
para variables de razn (variables cuantitativas o cantidades racionales) y de
intervalo. Se define como la raz cuadrada de la varianza de la variable.
La Desviacin Estndar es la raz cuadrada de la varianza de la distribucin de
probabilidad discreta:

Cuando los casos tomados son iguales al total de la poblacin se aplica la frmula
de desviacin estndar poblacional. As la varianza es la media de los cuadrados
de las diferencias entre cada valor de la variable y la media aritmtica de la distribucin.
Aunque esta frmula es correcta, en la prctica interesa el realizar inferencias
poblacionales, por lo que en el denominador en vez de , se usa
segn
la correccin de Bessel.
Esta ocurre cuando la media de muestra se utiliza para centrar los datos, en lugar
de la media de la poblacin. Puesto que la media de la muestra es una combinacin
lineal de los datos, el residual a la muestra media se extiende ms all del nmero
de grados de libertad por el nmero de ecuaciones de restriccin en este caso
una. Dado esto a la muestra as obtenida de una muestra sin el total de la
poblacin se le aplica esta correccin con la frmula desviacin estndar muestral.

24

Momentos de Orden k
Una formula general es:

1
= (1 )

=1

Momentos de Orden 2 (k=2)


Donde:

k = momento de orden 2
fi = frecuencia absoluta de la marca.
xi = marca de clase.
= media

2 =

1
(1 )2

=1

Modelo para las prcticas y tareas:

Frase Celebre:

PREZ OLMEDO
FIC / UNACH

Cada da sabemos ms y entendemos

PROB. Y ESTADIS.

menos.
Albert Einstein

Practica_1

No se acepta trabajos
con clip o carpetas. Solo
grapados. A menos que
el profesor lo solicite.

25

Tarea
Ejemplo
738

729

743

740

736

741

735

731

726

737

728

737

736

735

725

733

742

736

739

735

745

736

742

740

728

738

725

733

734

732

733

730

732

730

739

734

738

739

727

735

735

732

735

727

734

732

736

741

726

744

732

737

731

746

735

735

729

734

730

740

Con los datos de la anterior serie de nmeros, realizar los pasos necesarios para:
A. Construir un histograma para frecuencias absolutas, un polgono de
frecuencias acumuladas y una distribucin o grfica de frecuencias
acumuladas relativas. (Todo lo requerido para las 3 grficas solicitadas
sern tomados de los datos obtenidos de la tabla Distribucin de
Frecuencias antes mencionada.
B. Encontrar la media, la mediana, la moda, la varianza y la desviacin
estndar.
C. Calcular el primer cuartil, el tercer decil y el percentil 75. (Para su mayor
facilidad, apoyarse de la grfica de frecuencias acumuladas relativas
obtenida en el punto A.
Es necesario marcar lo
solicitado en el punto C, en
la grfica de frecuencias
acumuladas relativas.

Cuartiles:
Son tres valores que
dividen el conjunto de
datos ordenados en
cuatro partes iguales.

Deciles:
Son los nueve valores que dividen el conjunto de datos
ordenados en diez partes iguales, es decir, cada parte
representa un dcimo del total. Son tambin un caso
particular de los percentiles.

26

Tarea
Estadsticas de Calificaciones
1) Realizar cuatro tablas de cada uno de los semestres cursados:

1
2
O
O
O

NUMERO DE REPETICIONES

2) Hacer una grfica de Calificaciones:


17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
6

10

CALIFICACIONES

3) Tabla de Medidas de Tendencia Central.


Media

Mediana

Moda

4) Tipo de distribucin:
( ) Normal

( ) Unimodal +

27

( ) Unimodal -

Unidad II
Fundamentos de la Teora de la Probabilidad
Las probabilidades son muy tiles, ya que pueden servir para desarrollar
estrategias. Por ejemplo, algunos automovilistas parecen mostrar una mayor
tendencia a aumentar la velocidad si creen que existe un riesgo pequeo de ser
multados; los inversionistas estarn ms interesados en invertirse dinero si las
posibilidades de ganar son buenas.
El punto central en todos estos casos es la capacidad de cuantificar cuan probable
es determinado evento. En concreto decimos que las probabilidades se utilizan para
expresar cuan probable es un determinado evento.
Concepto clsico y como frecuencia relativa.
La probabilidad clsica: el enfoque clsico o a priori de la probabilidad se basa en
la consideracin de que los resultados de un experimento son igualmente posibles.
Empleando el punto de vista clsico, la probabilidad de que suceda un evento se
calcula dividiendo el nmero de resultados favorables, entre el nmero de
resultados posibles.

Experimentos Aleatorios
Todos estamos familiarizados con la importancia de los experimentos en la ciencia
y en la ingeniera. Un principio fundamental es que si efectuamos tales experimentos
repetidamente bajo condiciones aproximadamente idnticas obtenemos resultados
que son esencialmente los mismos.
Sin embargo, hay experimentos en los cuales los resultados no son esencialmente
los mismos a pesar de que las condiciones sean aproximadamente idnticas.
Tales experimentos se denominan experimentos aleatorios. Los siguientes son
algunos ejemplos.
Ejemplo 1: si tenemos una mquina que produce tornillos, el resultado del
experimento es que algunos pueden estar defectuosos. As cuando se produce un
tornillo ser un miembro del conjunto {defectuoso, no defectuoso}.
Ejemplo 2: si lanzamos un dado el resultado del experimento es uno de los nmeros
en el conjunto {1, 2, 3, 4, 5, 6}.

28

Modelos de asignacin de probabilidades, clsico, de


frecuencia relativa, subjetiva.
Modelo De Frecuencia Relativa (A Posteriori)
Se basa en datos que se han observado empricamente, registra la frecuencia con
que ha ocurrido algn evento en el pasado y estima la probabilidad de que el evento
ocurra nuevamente con base a datos histricos.
Frecuencia Relativa =

Ejemplo.- El ao anterior hubo 50 nacimientos en un hospital local, de los cuales 32


de los recin nacidos eran nias. El modelo de frecuencia relativa revela que la
probabilidad de que el siguiente nacimiento sea una nia es:
Frecuencia Relativa =

Modelo Subjetivo
Se utiliza cuando los datos no se encuentran disponibles por lo tanto no es posible
calcular la probabilidad a partir del desempeo anterior. Por tanto se calcula la
probabilidad a partir del mejor criterio. El modelo es utilizado cuando se desea
asignar probabilidad a un evento que nunca ha ocurrido.
Ejemplo.- La probabilidad de que una mujer sea elegida como presidenta de los
Estados Unidos. Se debe analizar las opiniones y creencias para obtener una
estimacin subjetiva de probabilidad.
Modelo Clsico (A Priori)
La probabilidad de xito basada en el conocimiento previo del proceso implicado.

Ejemplo:
Probabilidad de obtener una cara en el lanzamiento de una moneda.

29

Tarea
guila o Sol
Realizar una prueba que consista en lanzar una moneda 50 veces y tomar
datos de lo realizado.
t 1 2 3
A
S

50

Al finalizar, graficar los datos obtenidos. Calcular la probabilidad que existe al tirar
una moneda y obtener soles o guilas. Hacer conclusiones.

Tarea
Probabilidad de sacar frijoles
Hacer 4 equipos de 10 integrantes aproximadamente. Cada equipo colocar
en una cajita ocho frijoles negros y dos frijoles blancos. Dos de los equipos
calcularn la probabilidad de obtener frijoles negros, de igual forma los otros
dos calcularn la probabilidad de obtener frijoles blancos.

30

Bases de la probabilidad
Modelos de probabilidad
1) A priori
2) A posteriori
3) Subjetivo
Donde:

A = evento que nos interesa.


n(A) = nmero de eventos que sucede (provoca que suceda A).
n = son todos los posibles resultados, tamao del espacio muestral.

Espacio Muestral:
Son todos los resultados posibles
de un experimento.
|| tamao del espacio muestral n.

La probabilidad
nunca es negativa y
siempre es menor a 1

Evento:
Es el resultado de un experimento
aleatorio.

Ejemplo
Modelo A priori.- En un conjunto S.
2

S = {2,3,4,5,6,7,8,9}
||= 8

EVENTOS: (A) y (B)


{
A=
}
|| = 4
A= {2,4,6,8}

7
8

B = { 7}
|| = 2
B = {8,9}
Probabilidad de sacar un nmero par,
es decir, que suceda A.

P(A) =

Probabilidad de sacar un nmero


mayor a 7, es decir, que suceda B.

P(B) =

31

Axiomas y Teoremas Bsicos de Probabilidad

Axiomas de probabilidad
Los axiomas de la formulacin moderna de la teora de la probabilidad constituyen
una base para deducir a partir de ellas un amplio nmero de resultados. La letra P
se utiliza para designar la probabilidad de un evento, siendo P(A) la probabilidad de
ocurrencia de un evento A en un experimento.
Axioma 1
Si A es un evento de S, entonces la probabilidad del evento A es:
0 P(A) 1
Como no podemos obtener menos de cero xitos ni ms de n xitos en n
experimentos, la probabilidad de cualquier evento A, se representa mediante un
valor que puede variar de 0 a 1.
Axioma 2
Si dos eventos son mutuamente excluyentes, la probabilidad de obtener A o B es
igual a la probabilidad de obtener A ms la probabilidad de obtener B.
Si dos eventos son mutuamente excluyentes, la probabilidad de obtener A o B es
igual a la probabilidad de obtener A ms la probabilidad de obtener B.
P (AB) = P(A) + P (B)
Excluirse mutuamente quiere decir que A y B no pueden ocurrir simultneamente
en el mismo experimento. As, la probabilidad de obtener guila o sol en la misma
tirada de una moneda ser:
P (AB) = P (A) + P (B) P (AB) = 1/2 + 1/2 = 1.
En general podemos decir que la suma de las probabilidades de todos los posibles
eventos mutuamente excluyentes es igual a 1:
P (A1) + P (A2) + P (A3) +... + P(An) = 1
Axioma 3
Si A es un evento cualquiera de un experimento aleatorio y A es el complemento
de A, entonces:
P (A) = 1 - P (A)
Es decir, la probabilidad de que el evento A no ocurra, es igual a 1 menos la
probabilidad de que ocurra.

32

Tarea
Un volado
Calcular la probabilidad de obtener por lo menos
dos soles al lanzar 10 veces una moneda.
Calcular la probabilidad A priori se relaciona con
contar el nmero de formas que favorecen n(A) de
todos los posibles resultados.

() =

()

Teoremas de la suma de Probabilidades


Suponiendo que P (A) y P (B) representan las
probabilidades para los dos eventos A y B, entonces
P (AB) significa la probabilidad de que ocurran A o
B. Si representamos los eventos A y B en un
Diagrama de Venn con AB=
Entonces A y B son conjuntos disjuntos o
mutuamente excluyentes, o sea que no pueden
ocurrir en forma simultnea

En cambio, si ambos eventos


muestrales en comn A B

tienen

33

puntos

Regla de la suma
Si una primera tarea se puede realizar de n1 tareas y una segunda de n2 tareas y
las tareas mutuamente se excluyen, entonces realizar solo una de las se puede de
n1 + n2 maneras.

Regla de la multiplicacin
En la regla del producto, si una primera tarea se puede realizar de n1 maneras
seguidas de una segunda que se puede realizar de n2 maneras entonces realizar la
tarea 1 seguida de la tarea 2 se puede realizar de n1 x n2 maneras.

Ejemplo:

de la suma

del producto

Comer cantar

hacer ejercicio y escuchar msica

Eventos simples y compuestos


Evento simple: es un experimento divisible en un solo paso.
Evento compuesto: es un experimento divisible en dos o ms pasos.

Ejercicio Simple

Ejercicio Compuesto

Una caja con una esfera


numerada de {1 al 9}, sacar un
nmero menor a 3.

Hacer 3 tortas (1 de pollo y 2 de


jamon), Elegir 1 y que esta sea
de jamon . (2/3).

En un bolsillo poner fichas de


colores: 4 rojas, 3 negras, 2
blancas. Probabilidad de sacar
una blanca. (2/9).

34

De una caja con esferas de


colores, 3 rojas, 4 azules, 2
amarillas, sacar 2 esferas: una
roja y una azul.

En una habitacin oscura se


encuentran 3 nias, y 5 nios.
Sacar de esa habitacin 2 nios
y 3 nias.

Lanzar 10 monedas al aire y


obtener 3 soles o Tirar 2 veces
un dado y que su suma sea par.

Tarea
Esferas de Colores
Pasar del lenguaje hablado al clculo.
de probabilidad los siguientes eventos.

a) Con reposicin
b) Sin reposicin

A = {Sacar dos esferas una amarrilla y una azul}


B = {Sacar una amarilla y una azul o una azul y una amarilla}
Todas las Tareas y
Ejercicios se entregarn
en hojas blancas escritos
a mano.

Las combinaciones
son lo mismo que las
permutaciones con
repeticiones.

Ejemplo
Modelo A priori
A= {Sacar una blanca}

() =

5
10

B= {Sacar 2 Esferas, 1 blanca y 1 roja}


(blanca y una roja una roja y una blanca)
a) Con reposicin
b) Sin reposicin

a) () = () () + () () =
b) () = () () + () () =

35

10 10
5

10 9

10 10

10 9

Ejemplo
Calcular la probabilidad de sacar Blanca y Amarilla, y, Amarilla y Blanca.
Si es en ese orden (Establecer orden) Blanca, Amarilla, Amarilla, Blanca.
Con Reposicin:
a) () () (). () =

10 10 10 10

100
10000

1
100

Sin Reposicin:
b)

2 1 4

10 9 8 7

40
5040

1
126

P (2 Blancas y 2 Amarillas en cualquier orden) =


4!
P (2B y 2A) = P (AABB) + P (ABAB)++ =
=6
2! 2!

Anlisis combinatorio y Diagrama de rbol

Diagrama de rbol
Los diagramas de rbol son ordenaciones empleadas para enumerar todas las
posibilidades lgicas de una secuencia de eventos, donde cada evento puede
ocurrir en un nmero finito. Proporcionan un mtodo sistemtico de enumeracin
objetiva de los resultados.

36

Anlisis combinatorio
Los diagramas de rbol muestran objetivamente el nmero de resultados posibles
en que se puede disponer de la ordenacin de un conjunto de elementos, pero esta
enumeracin es limitada, pues a medida que aumenta el nmero de objetos dicha
ordenacin se complica, por lo que hay que utilizar otro procedimiento ms sencillo
para determinar el nmero total de resultados.
Con este fin, nos apoyaremos en los conceptos permutaciones y combinaciones,
los cuales tienen como base el principio fundamental del conteo.
Una permutacin de un conjunto de elementos, es un ordenamiento especfico de
todos o algunos elementos del conjunto, facilita el recuento de las ordenaciones
diferentes que pueden hacerse con los elementos del conjunto.
Permutaciones de n elementos
Por el principio fundamental del conteo podemos enunciar que el nmero de
permutaciones de n objetos distintos tomados de n en n, es: nPn = n!
Permutaciones de n elementos en diferentes grupos de r elementos.
Podemos calcular el nmero de permutaciones nPr, de n elementos, tomados en
grupos o subconjuntos de r elementos.

Permutaciones donde no todos los elementos son diferentes.


Si los elementos de un conjunto no son todos diferentes entre s, es decir, algunos
de los elementos son idnticos, la frmula de las permutaciones presenta un nuevo
aspecto. El nmero de permutaciones que se pueden formar en el caso de n
elementos, cuando hay n1elementos idnticos, n2 elementos de otro tipo idnticos,
etctera, es:

Combinaciones
Sabemos que en una permutacin el orden de los elementos es importante, pero
cuando el orden de colocacin carece de importancia, a la disposicin de dichos
elementos se le denomina combinacin. Por lo tanto, una combinacin es un
subconjunto o una disposicin de todos los elementos de un conjunto, sin tener en
cuenta el orden de ellos. El nmero de combinaciones o subconjuntos no
ordenados, cada uno formado por r elementos, que pueden obtenerse de un
conjunto de n elemento es:

37

Probabilidad Condicional e Independencia de Eventos


Probabilidad condicional

La probabilidad condicional se simboliza P (B/A), que se lee probabilidad de B, dado


A, o la probabilidad de que ocurra B, condicionado a que haya ocurrido A. Se dice
que dos o ms eventos son independientes entre s cuando la probabilidad de que
ocurra uno no es influida por la ocurrencia de otro.
Si A y B representan dos eventos y si la ocurrencia de A no afecta a la ocurrencia
de B, y la ocurrencia de B no afecta a la ocurrencia de A, entonces se dice que A y
B son Independientes. En este caso, la probabilidad de que ocurran A y B es igual
al producto de sus respectivas probabilidades, y se expresa as:
P (AB) = P(A) P (B)
Independencia de eventos

Dos eventos A y B son independientes si la probabilidad de A dado B es igual a la


probabilidad de A, y tambin la probabilidad de B dado A es igual a la probabilidad
de B, es decir, si la ocurrencia o no ocurrencia de un evento no modifica en nada la
probabilidad de ocurrencia de otro. Esto es, A y B son independientes si:
P ( AB ) = P ( A ) y tambin P ( BA ) = P ( B )
Teorema:
Dos eventos A y B son eventos independientes s y slo s P(A B) = P(A) P (B)

Teora de Conteo
Permutaciones con o sin repeticiones.
Calcular la probabilidad de sacar tres letras de
la caja mostrada, teniendo en cuenta dos casos:
con reposicin y sin reposicin.

38

a) Sin repeticin
A , E, I de un conjunto de tamao n.
N de permutaciones de tamao r de un conjunto de tamao n.
!
(, ) =
()!
(3,3) =

3!
= 3! = 3 2 1 = 6
(3 3)!

b) Con repeticin
!
x=
1 ! 2 !
P (9,3) =

987654321
654321

(9,3) = 9 8 7 =

9!
6!

987654321
654321

9!
(93)!

(n , r)

N de combinaciones de tamao r de un conjunto de tamao n.


!
() = ()!
Combinaciones.
!

Probabilidad condicional
S

( ) = () ()

B
() =

39

( )
()

Ejemplo:
() =

()
()

S
2
9
5
9

( ) = () () ( )

b) P(x=2) =

3!
2!
3!
2!

2
3
6

a) P(x=2) =

7
5

6
12
6
12

6
12
5
11

6
12
6
10

En las Permutaciones
el orden
En las combinaciones
el orden.

SI IMPORTA.

NO IMPORTA.

Teorema de Bayes
El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir
de probabilidades previas, se llama regla Bayesiana. Las probabilidades apriori o
previas se conocen antes de obtener informacin alguna del experimento en
cuestin. Las probabilidades a-posteriori se determinan despus de conocer los
resultados del experimento.
El teorema de Bayes consiste en un mtodo para encontrar la probabilidad de una
causa especfica cuando se observa un efecto particular.

40

Esto es, si el evento B ha ocurrido, Cul es la probabilidad de que fue generado


por el evento A1 (que es una causa posible) o por el A2(otra causa posible)?
Si suponemos que los eventos A1, A2, A3,....., An, forman una particin de un
espacio muestral S; esto es, que los eventos A1 son mutuamente excluyentes y su
unin es S.
Ahora, sea B otro evento, entonces:

La expresin anterior puede interpretarse de la manera siguiente: Si un evento


puede ocurrir en ms de una forma, entonces la probabilidad de que ocurra en una
forma particular ser igual a la razn de la probabilidad de que se presente la forma
respecto a la probabilidad de que ocurra.

Ecuacin:
( ) =

() ()
() () + () ()

41

Tarea
1) En una caja que contiene 12 esferas del 1 12.
Calcular la probabilidad de atraer dos nmeros
pares y un nmero impar, al atraer 2 esferas.
a) Con reposicin
b) Sin reposicin

2) En un cuestionario las 5 primeras preguntas tienen dos respuestas


opcionales y las ltimas 5 tienen 3 respuestas opcionales. Calcular la
probabilidad de sacar 6 de calificacin si se est adivinando.

3) Tres cajas contienen 6 fichas numeradas del 1-6 cada una. Se extrae una
ficha de cada una. Calcular la probabilidad de que la suma de los nmeros
extrados sea mayor a 3.

42

PRACTICAS
1.- Experimentos simples
1.1 Seleccione dos sistemas aleatorios
1.2 Defina un experimento simple para cada uno de los sistemas aleatorios
1.3 Repita el experimento mnimo 200 veces
1.4 Hacer una grfica de la frecuencia relativa para cada proceso
1.5 Calcular la probabilidad del experimento en forma a priori (antes), comprtela
con los resultados del experimento y presente sus conclusiones.

2.- Experimentos Compuestos


2.1 Defina un experimento compuesto para cada uno de los sistemas aleatorios
seleccionados en la prctica #1.
2.2 Efectu el experimento un nmero de veces que usted considere necesario y
suficiente para calcular la probabilidad de manera a posterior.
2.3 Calcular la probabilidad del experimento de forma a priori, comprelo con los
resultados del experimento y presente sus conclusiones.

Ejemplo:
Dados

se tiran dos veces y que su suma sea par.

Frijoles

sacar un puo de tres frijoles y que los tres sean negros.

43

Unidad III
Modelos Probabilsticos Para Variables Discretas
Variable Aleatoria Discreta
Se llama variable aleatoria a toda funcin que asocia a cada elemento del espacio
muestral E un nmero real. Se utilizan letras maysculas X, Y,... para designar
variables aleatorias, y las respectivas minsculas (x, y, ...) para designar valores
concretos de las mismas. Se representa con letras maysculas X = ().
X representa el nmero de blancas.
X => Variable independiente
Y => Variable dependiente
Evento:
Sacar 2 Esferas.

Variable aleatoria discreta


Una variable aleatoria discreta es aquella que slo puede tomar valores enteros.
Ejemplo: El nmero de hijos de una familia, la puntuacin obtenida al lanzar un
dado.
Variable aleatoria continua
Una variable aleatoria continua es aquella que puede tomar todos los valores
posibles dentro de un cierto intervalo de la recta real. Ejemplo: La altura de los
alumnos de una clase, las horas de duracin de una pila.

NN

Variable discreta: Tiene


aquello que se cuenta.

Variable continua: Tiene relacin con lo que


se mide.

NB

BN
2

BB

Dominio

Rango

44

relacin

con

Ejemplos:
Especificar en cada uno de los puntos, si pertenece a una variaba discreta
variable continua.

Intensidad luminosa durante el da

Direccin del viento

Nmero de soles

La velocidad del viento

La humedad de la tierra

Nmero de esferas blancas

La duracin del da

La precipitacin pluvial

El Nmero de accidentes

La humedad del aire

La temperatura diaria

La longitud de un clavo

45

Variable Aleatoria
Discreta

Continua
Funcin de densidad de
probabilidad

Dada con una


tabla o formula

Esta dada con


f(x)

= {0,1,2}
( = ) 14 , 12 , 14

1/y
012

() =

Caractersticas de una variable


aleatoria

( = ) 0 ( = )
1

() > 0

( = ) = 1

() = 1

( ) =

()

( ) = ( = )
=

46

Valor esperado
Sea x una variable aleatoria discreta con valores posible x1, x2, xn, el valor esperado
de x se define:

[] = ( = )
=1

El valor esperado o esperanza de una variable aleatoria tiene su origen en los


juegos de azar, debido a que los jugadores deseaban saber cual era su esperanza
de ganar o perder con un juego determinado.
Como a cada resultado particular del juego le corresponde una probabilidad
determinada, esto equivale a una funcin de probabilidad de una variable aleatoria
y el conjunto de todos los resultados posibles del juego estar representado por la
distribucin de probabilidad de la variable aleatoria. El valor esperado o esperanza
es muy importante, ya que es uno de los parmetros que describen una variable
aleatoria.
Sea X una variable aleatoria discreta con funcin de probabilidades f(x). Entonces,
el valor esperado de la variable aleatoria X, el cual se representa por E(X), est
definido por:

() = ( )
Lo anterior significa, que para calcular E(X) se multiplica cada valor que puede tomar
la variable aleatoria por la probabilidad que le corresponde y despus se suman
esos productos. El valor esperado representa el valor promedio que se espera
suceda, al repetir el experimento en forma independiente una gran cantidad de
veces.
El valor esperado se interpreta fsicamente como el centro de masa o centro de
gravedad de la distribucin de probabilidad, por lo que es igual a la media o
promedio aritmtico, los cuales se representan con la letra . De acuerdo a lo
anterior podemos escribir que:

() = = ( )

47

Propiedades del valor esperado


a) =

[ ] = ( ) = ( ) =
+

[ ] = ( ) = ( )
b) [ ] = [ ]

[ ] = ( ) = ( )
[ ] = []

c) [ + ] = [ ] + []

Varianza
Existen dos aspectos que caracterizan de forma simple el comportamiento de la
distribucin de probabilidad, porque proporcionan una descripcin completa de la
forma en que se comporta: la medida de tendencia central y la de dispersin.
La primera est representada por la media o valor esperado, ya vista en el punto
anterior, y la segunda por la variancia o por la desviacin estndar, que evalan la
dispersin de la distribucin de probabilidad o grado en que se separan del
promedio los valores de la variable aleatoria X.
Por ejemplo, en un espacio muestral equiprobable vemos que los valores 5, 10 y 15
tienen una media de 10 y que los valores 9.9, 10 y 10.1 la media tambin es 10. Sin
embargo, advertimos que los dos conjuntos de valores difieren notablemente en la
dispersin de los valores respecto a su media y que tal dispersin es de gran
importancia.
Por lo tanto, para tener un conocimiento claro y completo del comportamiento de los
valores que puede tomar la variable aleatoria, es indispensable conocer tanto la
media como la variancia o la desviacin estndar de la distribucin de probabilidad.
Las desviaciones (X - ) toman valores: (x1 - ), (x2 - ), (x3 - ), ,(xi - ), con
probabilidades respectivas: f(x1), f(x2), f(x3), . . . , f(xi). Sin embargo, al tomar el valor
esperado de estas desviaciones nos encontramos con que:
( ) = ( )( ) = ( ) ( ) = ( ) = = 0

48

Esto se debe a que las desviaciones positivas se compensan con las desviaciones
negativas. Para determinar una medida de dispersin, necesitamos considerar
nicamente la magnitud de las desviaciones sin sus signos.
Una manera de eliminar el signo de las desviaciones, es considerar el cuadrado de
las mismas, es decir, (xi - )2.
Si obtenemos el valor esperado de las desviaciones elevadas al cuadrado,
obtenemos una medida de la dispersin de la distribucin de probabilidad, la cual
es conocida como Variancia y se simboliza por 2 Var (X) V(X). La varianza de
una variable aleatoria X se define como:
2 = V(X) = Var (X) = E (X - )2 = E(xi - )2 f(xi)
A partir de sta ecuacin y mediante un pequeo desarrollo matemtico, se obtiene
la siguiente expresin:

Al usar la variancia como medida de dispersin o variabilidad se presenta una


dificultad. Las unidades con que se miden los valores que toma la variable aleatoria
X son lineales, por ejemplo kilogramos, metros, litros, etc., por lo que = E(X)
tambin ser lineal, pero la variancia 2 est en unidades cuadrticas, como
kilogramos elevados al cuadrado, metros elevados al cuadrado, litros elevados al
cuadrado, etc.
En vista de lo anterior, si queremos expresar la medida de dispersin en las mismas
unidades en que se miden los valores de la variable aleatoria X, debemos tomar la
raz cuadrada positiva de la variancia. A esta cantidad se le conoce con el nombre
de desviacin estndar y se representa con . La desviacin estndar de una
variable aleatoria X se define y simboliza como:

= () =

2
2
2
2
2 =
1 ( ) = ( )

Ejemplo: Seleccionamos al azar un nmero real en el intervalo [2, 6] y definimos


una variable aleatoria como X=nmero seleccionado. Calcula la probabilidad de
que el nmero seleccionado sea menor de 5 y el nmero esperado.
En este caso X U(2,6) Para calcular la probabilidad lo que hacemos es:

49

Esto se podra haber hecho ms rpido con la funcin de distribucin de la siguiente


forma.

Para calcular la esperanza, aplicamos la formula y nos queda:

Propiedades de la varianza V[x]


a) [ + ] = []
2

[ + ] = [ + [ + ]] = [ + [] []]

[ + ] = [ + [] ]2 = [ []] = []

b) [] = 2 []
2

[] = [ []] = [( [])]2 = [ 2 ( [])2 ]


2

[] = 2 [ []] = 2 []

c) [ + ] = [] + []

50

Distribucin de
probabilidad

Funciones de densidad de probabilidad FDP

Distribuciones Tericas

Discretas

Continuas

1. Poisson
2. Bernoulli
3. Geometra
4. Hipergeometric
a

A. Gauss
B. Student
C. Exponencial

1.- Calcula la probabilidad de que suceda r eventos en un intervalo continuo de


espacio o tiempo.
2.- Calcula la probabilidad de que en n pruebas ocurran r xitos
3.- Calcula la probabilidad de obtener el primer xito al intento n.
4.- Calcula la probabilidad de que en un conjunto de N con (k) de tipo D. Al extraer
n se obtenga exactamente (r) de D.
A) Calcula la probabilidad de que una medicin caiga en un intervalo A, B.

51

Distribuciones y Teoras Discretas


Aunque en adelante hablemos de distribucin "tal", nos estaremos refiriendo al
modelo tal. Los modelos discretos, son modelos de probabilidad de variable
aleatoria discreta. Los ms importantes son los modelos de BERNOUILLI
(especialmente "la distribucin binomial") y la "distribucin de Poisson".

Distribucin Binomial o de Bernouilli.


El campo de variacin de la variable es: {0,1}. y la funcin de cuanta es:
P(X=0) = q = 1-p P(X=1)= p. Si una variable aleatoria X sigue o tiene una distribucin
dicotmica de parmetro p se expresa como X~D(p). Modela situaciones en las que:

Slo puede dar dos resultados posibles: A y A. La probabilidad del resultado A


es P(A) = p y la del resultado A es P(A)= q=1-p. En estas circunstancias la
variable aleatoria X significa "n de resultados A que se obtienen. La media de
la distribucin ser: m = x P(x) = 0.q + 1.p = p. La varianza de la distribucin:
s2 = a2- m2. Es fcil comprobar que todos los momentos ordinarios de orden
mayor o igual a 1 son iguales a p.

Condiciones de un proceso de Bernoulli


1) En cada prueba hay dos posibles resultados, xito o fracaso.
2) El resultado en cada prueba es independiente.
3) La probabilidad de xito es constante e=P y se calcula a priori o a posteriori.
La media

= [ ] =

n = Nmero de pruebas
P = Probabilidad de xito

Probabilidad de
un solo caso

( = ) = () ()
xito

Sirve para calcular r xitos


en n pruebas.

Fracaso

52

Tarea
Seis de dieciocho proyectos de viviendas violan el cdigo de construccin. Calcular
la probabilidad de que un constructor de vivienda que selecciona a cuatro de ellas
descubra que:
A. Ninguna lo viola.
B. Una lo viola.
C. Dos lo violan.
D. Al menos 3 lo violan.

Distribucin de Poisson
Formalmente: dada una variable aleatoria X con campo de variacin X {0, 1, 2,...,
} es decir X N siendo l un parmetro positivo diremos que X sigue una distribucin
de Poisson de parmetro l , X ~ P(l ). y cuya funcin de cuanta sea:


( ) =
!
Situaciones que modela:

Se observa la ocurrencia de hechos de cierto tipo durante un perodo de tiempo


o a lo largo de un espacio, considerados unitarios. El tiempo (o el espacio)
pueden considerarse homogneos, respecto al tipo de hechos estudiados, al
menos durante el perodo experimental; es decir, que no hay razones para
suponer que en ciertos momentos los hechos sean ms probables que otros.

En un instante (infinitesimal) slo puede producirse como mucho un hecho (se


podr producir o uno o ninguno). La probabilidad de que se produzca un hecho
en un intervalo infinitesimal es prcticamente proporcional a la amplitud del
intervalo infinitesimal.

Si en estas circunstancias la variable aleatoria X = n de hechos que se producen


en un intervalo unitario sigue una distribucin de Poisson, que cmo veremos tendr
por parmetro l el nmero medio de hechos que pueden producirse en el intervalo
unitario.

53

La varianza ser: s2 = a2- m2 = l + l2 - l2 = I y la moda de una distribucin de Poisson


puede determinarse como el valor de la variable (el nmero natural) que verifica
que: l - 1 Mo l. Habitualmente la moda ser la "parte entera de la l (de la media)",
pero habr dos modas (l - 1 y l) cuando l sea un nmero entero.

Poison
En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin
de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia
media, la probabilidad de que ocurra un determinado nmero de eventos durante
cierto perodo de tiempo. Concretamente, se especializa en la probabilidad de
ocurrencia de sucesos con probabilidades muy pequeas, o sucesos "raros".
La funcin de probabilidad de la distribucin de Poisson es:

= ( = ) =
=

P = Promedio de evento por unidad.


n = Nmero de unidades.

Donde:

es el nmero de ocurrencias del evento o fenmeno (la funcin nos da la


probabilidad de que el evento suceda precisamente k veces).

es un parmetro positivo que representa el nmero de veces que se espera


que ocurra el fenmeno durante un intervalo dado. Por ejemplo, si el suceso
estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados
en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos,
usaremos un modelo de distribucin de Poisson con = 104 = 40.

e es la base de los logaritmos naturales (e = 2,71828...)


Tanto el valor esperado como la varianza de una variable aleatoria con distribucin
de Poisson son iguales a . Los momentos de orden superior son polinomios de
Touchard en cuyos coeficientes tienen una interpretacin combinatoria.

54

De hecho, cuando el valor esperado de la distribucin de Poisson es 1, entonces


segn la frmula de Dobinski, el n-simo momento iguala al nmero de particiones
de tamao n.
La moda de una variable aleatoria de distribucin de Poisson con un no entero es
igual a , el mayor de los enteros menores que (los smbolos representan la
funcin parte entera). Cuando es un entero positivo, las modas son y 1.

Ejemplo 1
Valor Esperado
= =
( = 0) = 5
( = 1) = 5
( = 2) = 5
( = 3) = 5
( = 4) = 5
( = 5) =

1
10 = 5
2

50

56

( = 6) = 5

0!
51

( = 7) = 5

1!
52

6!
57
7!

( = 8) = 5

2!
53

( = 9) = 5

3!
54

58
8!
59
9!

( = 10) = 5

4!

55

0!

55

5 10
10!

Ejemplo 2:
Valor Esperado
==
( = 0) =

5
2

( = 1) =

5
2

5 0
2
0!

5 1
2
1!

5
3

5
3

5 0
3
0!

5 0
3
0!

5 5

2 3

5
3

( = 2) =

Terminar el
ejemplo #2
Tarea para la sig. clase

56

5 0
2
0!

5
3

5 1
3
1!

La Distribucin Binomial;
Una distribucin de probabilidad de verdad
Teorema del binomio

( + ) = ( ) 0 + ( ) 1 1 + ( ) 2 2 + + (
) 1 + ( ) 0
0
1
2
1

Demostrar:

(P+q)n =
(P+(1-P)n =
1n = 1

La Distribucin de Poisson;
Una distribucin de probabilidad de verdad
=0

! =


=0 !

= 0 = 1

P(x=r)

La Distribucin de Geomtrica;
Una distribucin de probabilidad de verdad

( = ) =
(n-1)

( = ) = ( + + + ) = (1 + + + + )
=1

1
1
= = 1
1

q<1

57

Hipergeometrica

( = ) =

(
)(
)

(
)

58

Nmero de formas
distintas

Nmero de
caso

(
)

Probabilidad de un
caso cualquiera

( = ) =

()(
)

Unidad IV
Modelos Probabilsticos Para Variables Continuas
En las variables continuas, hay que observar que la probabilidad de que la variable
tome un valor particular se considera igual a cero. Se supone que no es posible
conocer el valor exacto de una variable continua, ya que medir su valor consiste en
clasificarlo dentro de un intervalo.
Las variables aleatorias continuas se describen por medio de una funcin real de
variable real, a la que se denomina funcin de densidad, que surge como la
generalizacin de las curvas de frecuencias asociadas a los histogramas, cuando la
amplitud de los intervalos se considera innatamente pequea.

Variable Aleatoria Continua


Definicin: Si el rango x R , de una variable aleatoria X es un intervalo sobre la recta
de los nmeros reales se llama variable aleatoria continua.
Esto significa que una variable aleatoria continua puede tomar valores enteros o
decimales.
Un ejemplo de esta variable es el caudal diario registrado en una estacin de aforo,
representado en la figura 1.

Ejemplo
Es una variable aleatoria continua, pues su rango (los valores que puede tomar) son
todos los puntos de un intervalo.

59

La funcin de distribucin o funcin de distribucin acumulada de la variable aleatoria


X, denotada por F(x) , se define como:

Caractersticas de la variable aleatoria contina


El valor medio o media de una distribucin , tambin conocido como valor esperado
E(X ) est definido por:

La Varianza de la distribucin, esta definida por:

La Desviacin Tpica de la distribucin se define como la raz cuadrada de la varianza


y se denota por , su valor se obtiene con la ecuacin anterior:

[ ] =

( )

Sea la funcin f(z).

Considere una variable aleatoria continua x.

()

-1

()

+1

Media = 0
E[z] = 0
Desviacin estndar = 1

60

[ ] = 2

[ ] = 1
F(z)

Funcin Terica.
Z = Variable aleatoria

F(x)

Funcin Real.

Z = Un valor que puede tomar


esa variable. Ejemplo: Z=3

= +
Funcin de relacin para desplazarse
=+

68%

Depender de la media la posicin


de la grfica.

68%

Para E[z] = 0
-1
[] = [

+1

1
1
1
] = [ ] = {[] []} = { } = 0

61

Para V[z] = 1
[

1
1
1
] = [ ] = [[] []] = 2 [ 2 0] = 1

[ ] = [ [ ]]2

Caractersticas de un VAC
Sea x una VAC con valores con valores posibles en x, si existe una funcin f(x),
llamada funcin de densidad de probabilidad FDP; que define la probabilidad de x y
satisface las necesidades a-c.
a)

( ) 0

b)

( ) = 1

c)

( ) = ( )

[ ] =
Modelos probabilsticos para variables continuas
Las variables aleatorias constituyen el fundamento de la Estadstica Inferencial. Los
modelos matemticos que determinan el comportamiento poblacional de ciertos
fenmenos aleatorios, son construidos en base a las variables aleatorias.
En ocasiones, algunas variables aleatorias siguen distribuciones de probabilidad
muy concretas, como por ejemplo el estudio a un colectivo numeroso de individuos
que se modelizan por la distribucin Normal.

62

Estudiaremos algunas de las distribuciones o modelos de probabilidad ms


importantes y que despus nos resultarn muy tiles para el tema de la Estimacin.
Como hemos visto, las variables pueden ser discretas o continuas; por ello, tambin
las distribuciones podrn ir asociadas a variables aleatorias discretas o continas.

Distribuciones tericas continuas


Uno de los objetivos de la estadstica es el conocimiento cuantitativo de una
determinada parcela de la realidad. Para ello, es necesario construir un modelo de
esta realidad particular objeto de estudio, partiendo de la premisa de que lo real es
siempre ms complejo y multiforme que cualquier modelo que se pueda construir.
De todas formas, la formulacin de modelos aceptados por las instituciones
responsables y por los usuarios, permite obviar la existencia del error o distancia
entre la realidad y el modelo.

Distribucin Normal estndar


En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o
distribucin gaussiana, a una de las distribuciones de probabilidad de variable
continua que con ms frecuencia aparece en fenmenos reales. La grfica de su
funcin de densidad tiene una forma acampanada y es simtrica respecto de un
determinado parmetro. Esta curva se conoce como campana de Gauss.
Hay varios modos de definir formalmente una distribucin de probabilidad. La forma
ms visual es mediante su funcin de densidad. De forma equivalente, tambin
pueden darse para su definicin la funcin de distribucin, los momentos, la funcin
caracterstica y la funcin generatriz de momentos, entre otros.

Funcin de densidad
Se dice que una variable aleatoria continua X sigue una distribucin normal de
parmetros y y se denota X~N(, ). Ai su funcin de densidad est dada por:

63

La distribucin normal es, sin duda, la distribucin de probabilidad ms importante


del Clculo de probabilidades y de la Estadstica. Fue descubierta por De Moivre
(1773), como aproximacin de la distribucin binomial.
De todas formas, la importancia de la distribucin normal queda totalmente
consolidada por ser la distribucin lmite de numerosas variables aleatorias,
discretas y continuas, como se demuestra a travs de los teoremas centrales del
lmite. Las consecuencias de estos teoremas implican la casi universal presencia de
la distribucin normal en todos los campos de las ciencias empricas: biologa,
medicina, psicologa, fsica, economa, etc.
En particular, muchas medidas de datos continuos en medicina y en biologa (talla,
presin arterial, etc.) se aproximan a la distribucin normal. Junto a lo anterior, no
es menos importante el inters que supone la simplicidad de sus caractersticas y
de que de ella derivan, entre otras, tres distribuciones (Ji-cuadrado, t y F) que se
mencionarn ms adelante, de importancia clave en el campo de la contrastacin
de hiptesis estadsticas.
La distribucin normal queda totalmente definida mediante dos parmetros: la
media (Mu) y la desviacin estndar (Sigma).
Campo de variacin:
- < x <
Parmetros:
Mu: media de la distribucin, - < Mu <
Sigma: desviacin estndar de la distribucin, Sigma > 0

Distribucin Exponencial
Sea X una variable aleatoria continua. Se dice que X tiene una distribucin
exponencial con parmetro real , si su funcin de densidad est dado por la
ecuacin.

En la ecuacin el parmetro real es una constante positiva. Adems=2.718.


La funcin de distribucin de la variable aleatoria X con Distribucin exponencial es:

64

La distribucin exponencial es un caso particular de distribucin gammacon k= 1.


Adems la suma de variables aleatorias que siguen una misma distribucin
exponencial es una variable aleatoria expresable en trminos de la distribucin
gamma.

Distribucin T Student
Es una distribucin de probabilidad que surge del problema de estimar la media de
una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo.
sta es la base de la popular prueba t de Student para la determinacin de las
diferencias entre dos medias mustrales y para la construccin del intervalo de
confianza para la diferencia entre las medias de dos poblaciones.
La distribucin t es ms ancha y ms plana en el centro que la distribucin normal
estndar como resultado de ello se tiene una mayor variabilidad en las medias de
muestra calculadas a partir de muestras ms pequeas. Sin embargo a medida que
aumenta el tamao de la muestra la distribucin t se aproxima a la distribucin
normal estndar.
Condiciones:

Se utiliza en muestras de 30 o menos elementos.


La desviacin estndar de la poblacin no se conoce

Diferencias:

La distribucin t Student es menor en la media y mas alta en los extremos


que una distribucin normal.
Tiene proporcionalmente mayor parte de su rea en los extremos que la
distribucin normal.

Distribucin chi cuadrada


En estadstica, la distribucin de Pearson, llamada tambin ji cuadrado o chi
cuadrado () es una distribucin de probabilidad continua con un parmetro k que
representa los grados de libertad de la variable aleatoria.

65

Donde Zi son variables aleatorias normales independientes de media cero y


varianza uno. El que la variable aleatoria X tenga esta distribucin se representa
habitualmente as:

Funcin de distribucin acumulada


Su funcin de distribucin es:

Donde: gamma(k,z) es la funcin gamma incompleta.


El valor esperado y la varianza de una variable aleatoria X con distribucin son,
respectivamente, k y 2k

Aplicaciones
La distribucin tiene muchas aplicaciones en inferencia estadstica. La ms
conocida es la de la denominada prueba utilizada como prueba de independencia
y como prueba de bondad de ajuste y en la estimacin de varianzas.
Pero tambin est involucrada en el problema de estimar la media de una poblacin
normalmente distribuida y en el problema de estimar la pendiente de una recta de
regresin lineal, a travs de su papel en la distribucin t de Student.
Aparece tambin en todos los problemas de anlisis de varianza por su relacin con
la distribucin F de Snedecor, que es la distribucin del cociente de dos variables
aleatorias independientes con distribucin .

66

Unidad V
Inferencia Estadstica
Distribuciones mustrales
Como bien se sabe uno de los propsitos de la estadstica inferenciales estimar las
caractersticas poblacionales desconocidas, examinando la informacin obtenida
de una muestra, de una poblacin. El punto de inters es la muestra, la cual debe
ser representativa de la poblacin objeto de estudio.
Para ello debemos tener en cuenta que se deben seguir ciertos procedimientos de
seleccin para asegurar de que las muestras reflejen observaciones a la poblacin
de la que proceden, y a que solo se pueden hacer observaciones probabilsticas
sobre una poblacin cuando se usan muestras representativas de la misma.
Para poder comprender esto debemos de tener dos conceptos muy en cuenta. Una
poblacin est formada por la totalidad de las observaciones en las cuales se tiene
cierto observa. Una muestra es un subconjunto de observaciones seleccionadas de
una poblacin. Tales distribuciones sern muy importantes en el estudio de la
estadstica inferencial, porque las inferencias sobre las poblaciones se harn
usando estadsticas mustrales.
Como sabemos, cuando una medida tal como la media, la desviacin estndar, la
proporcin, etc. Describe cierto aspecto de una poblacin, esta medida toma el
nombre de parmetro de la poblacin considerada. De igual manera, cuando una
medida describe cierto aspecto de una muestra, se le da el nombre estadstico de
la muestra.
Es decir la teora del muestreo es el estudio de las relaciones entre una poblacin y
las muestras que se extraen de ella. Cuando la poblacin es finita y de un tamao
manejable en tiempo y costo, los valores poblacionales se calculan directamente,
sin necesidad del muestreo. Tambin es necesario mencionar que esta depende de
la distribucin muestral que se requiera usar; por ejemplo esta se subdivide en dos
la cual es la muestral de medias y la de proporciones.
Con respecto a la muestral de medias es bien conocida como la distribucin de
probabilidad de todos los valores de la media muestral. Y el valor esperado viene
siendo cuando se tienen las medias de varias muestras sacadas de una poblacin
y la media de todos esos valores se conocer como el valor esperado de la media
muestral

67

Ahora bien podemos decir que una distribucin de muestreo o muestral es una
distribucin de probabilidad aleatoria y su valor depende de los elementos que
conforman la muestra.
En lo que respecta a la distribucin muestral puedo decir que es la probabilidad de
todas las muestras de un determinado tamao de muestra de una poblacin,
adems, esto es muy importante para el estudio de la estadstica inferencial
porque las inferencias sobre las poblaciones se harn usando estadsticos
muestrales.
Conocer esta distribucin muestral y sus propiedades permitir juzgar la
confiabilidad de un estadstico muestral como un instrumento para hacer inferencias
sobre un parmetro poblacional desconocido.
Cuando se utilizan valores
mustrales (parmetros), o estadsticos para estimar valores poblacionales, pueden
ocurrir dos tipos generales de errores:
El error muestral se refiere a la variacin natural existente entre muestras tomadas
de la misma poblacin. An si se ha tenido gran cuidado para asegurar que dos
muestras del mismo tamao sean representativas de una cierta poblacin, no
esperaramos que las dos sean idnticas en todos sus detalles. El error muestral es
un concepto importante que ayudar a entender mejor la naturaleza de la
estadstica inferencial.
Los errores que surgen al tomar las muestras y que no pueden clasificarse como
errores mustrales y se denominan errores no mustrales. El sesgo de las muestras
es un tipo de error no muestral. El sesgo muestral se refiere a una tendencia
sistemtica inherente a un mtodo de muestreo que da estimaciones de un
parmetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo
positivo) que el parmetro real.
Ejemplo: la longitud del dedo ndice de personas dela misma edad y sexo. El sesgo
muestral puede suprimirse, o minimizarse, usando la aleatorizacin.

Distribuciones mustrales de medias


En el estudio de la estadstica analizamos varias medidas de tendencia central. Sin
duda, la media es la medicin de la tendencia central que ms se utiliza. Con
frecuencia, la media muestral se utiliza para calcular la media poblacional. La
distribucin muestral de la media es la distribucin de todas las medias posibles que
surgen si en realidad se seleccionaran todas las muestras posibles de cierto
tamao.

68

En lo que respecta con el Teorema del Lmite Central tambin nos indica que
cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao pero
provenientes de una poblacin normal, la distribucin muestral de medias tiene un
comportamiento aproximadamente normal, por lo que se puede utilizar la frmula
de la distribucin normal con

S, es equivalente al error estndar de la media, entonces la frmula para calcular la


probabilidad del comportamiento del estadstico, en este caso la media de la
muestra, quedara de la siguiente manera:

Algunos estadsticos importantes Sea (X1, X2,, Xn) una muestra aleatoria de la
v.a. X. Definiremos algunos estadsticos importantes.

Es estadstico X toma el valor


cuando,
X1= x1, X2=x2,, Xn= xn
En la prctica el trmino media muestral se aplica tanto al estadstico X como a su
valor calculado x.

69

Distribucin muestral de varianzas


Se pude decir como definicin que la Varianza mide la distancia existente entre los
valores de la serie y la media. Se calcula como sumatoria de las diferencias al
cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se
ha repetido cada valor. La sumatoria obtenida se divide por el tamao del conjunto.
Y el conjunto de estas muestras es conocido como muestral de medias.
A veces lo que nos interesa es estudiar la variabilidad de las medidas. La
variabilidad se suele medir con la varianza o con la desviacin tpica y el estadstico
empleado es la varianza muestral: Para poder trabajar con ella necesitamos
conocer la funcin de distribucin asociada, para esto estudiaremos la distribucin
chi cuadrado.
Se dice que una variable aleatoria X sigue una distribucin chi cuadrado con k
grados de libertad, cuando su funcin de densidad est dada por la frmula:
Y las propiedades de esta distribucin:

Si X es una variable con distribucin ji cuadrado con k grados de libertad, su


media es k y su varianza 2k.

Una variable ji cuadrado no toma valores negativos. Su grfica es de las de tipo de


curvas sesgadas a la derecha. A medida que aumentan los grados de libertad la
curva se va haciendo ms simtrica y su cola derecha se va extendiendo. Por cada
valor de k hay una distribucin distinta. k es el nico parmetro asociado a la
distribucin.

70

Teora del muestreo


Su funcin bsica es de terminar que parte de una realidad en estudio (poblacin o
un inverso) debe examinarse con la finalidad de hacer inferencias sobre dicha
poblacin. El error que se comete debido al hecho de que se obtienen conclusiones
sobre cierta realidad a partir de la observacin de slo una parte de ella, se
denomina error de muestreo. Obtener una muestra adecuada significa lograr una
versin simplificada de la poblacin, que reproduzca de algn modo sus rasgos
bsicos.
En la prctica profesional, el mdico se enfrenta con frecuencia ante la necesidad
de conocer realidades respecto al proceso salud enfermedad en la persona
humana, una enfermedad, un medicamento, una tcnica quirrgica, niveles de
educacin e informacin; cuando ello se necesita conocer en un grupo poblacional,
sera necesario examinar todos los miembros de ese grupo con el fin de observar el
comportamiento de las variables en estudio.
Sin embargo, muchas veces, el grupo en estudio es tan grande que hace difcil, casi
imposible el examen de todos sus miembros, por lo que se procede comnmente a
examinar un determinado nmero de individuos u objetos, observar el
comportamiento de las variables en estudio en este conjunto limitado para luego
extender los resultados al conjunto total, con cierto grado de confianza.
Es entonces, importante conocer que se puede estudiar un sub conjunto de la
poblacin para luego inferir los resultados al conjunto total de elementos con un
cierto grado de precisin el cual depender de la seleccin de los elementos del sub
conjunto a estudiar y de los mtodos de inferencia para la obtencin de premisas
generales.
Esto es la teora del muestreo, la seleccin adecuada en cantidad y calidad de los
individuos que constituirn el grupo de observacin, para ello es necesario tener
conceptos muy claros respecto a poblacin o universo.

Teora del lmite central


El conocer la distribucin de probabilidad de los estadsticos, permite obtener
conclusin esa partir de una muestra hacia la poblacin en general, proporcionar
una medida del error que se puede cometer en dichas conclusiones y tambin
permite dar una medida de confianza de que ese sea el error y no otro ms grande.
Existe un teorema de mucha importancia prctica, que especifica la regularidad
estadstica de los promedios (medias aritmticas) obtenidos de las mediciones
numricas en las unidades experimentales analizadas en muestras de tamao n.

71

Se podra preguntar en el teorema qu tan grande debe ser el tamao n de la


muestra ? La respuesta es que depende del grado de alejamiento de la distribucin
de muchas medias muestrales.
Si el alejamiento es muy fuerte, distribuciones asimtricas con mayores
probabilidades en los extremos, o con varias modas, un tamao de muestra de 30
o ms ya produce la distribucin normal. Sin embargo, si la distribucin de la
poblacin es normal con muestras de tamao 10 o ms se tiene la normalidad.
Si la distribucin de poblacin no es normal, pero no se aleja mucho de ella, es
simtrica o casi, con la media casi igual a la moda y la mediana, entonces con
muestras de tamao 15 o 20 dependiendo de qu tan cercana es la distribucin de
la poblacin a la distribucin normal.
Es importante recordar que no se puede decir que una variable dada o sus
promedios siguen estrictamente una distribucin normal. Esta distribucin es una
idealizacin que no se da en realidad, lo que importa es que la distribucin real est
cercana a la normal y este supuesto produzca conclusiones correctas.
Frecuentemente en muchas mediciones no pueden ocurrir valores negativos, pesos
reas, concentraciones de sustancias, etc.; sin embargo, la normal asigna
probabilidad mayor que cero a valores negativos. En la medida que dicha posibilidad
sea muy pequea, esa inconsistencia del modelo con la realidad no es grave.
Si la poblacin o el proceso del cual se extrae una muestra tienen distribucin
normal, entonces la distribucin de muestreo para la media tambin ser una
distribucin normal, independientemente del tamao de la muestra. Sin embargo,
qu ocurre si una poblacin no tiene una distribucin normal? Existe una teora de
la estadstica matemtica que aun en estos casos permite aplicar la distribucin
normal a tales distribuciones de muestreo.
La teora del lmite central establece que a medida que el tamao de la muestra
aumenta, la forma de la distribucin de muestreo para la media (y tambin para
otros estadsticos muestrales) se aproxima la de una distribucin normal,
independientemente de la forma dela distribucin de la poblacin de la cual se
extrajo la muestra.
Para fines prcticos puede suponerse que la distribucin de muestreo para la media
es una distribucin aproximadamente normal, aun en casos de poblaciones o
procesos muy apartados de una distribucin normal, siempre que el tamao de la
muestra sea en poblaciones que son ligeramente normales ser suficiente un
tamao de la muestra ms pequeo. Pero un tamao de la muestra de por lo menos
30 ser suficiente an en la situacin poblacional ms adversa.

72

Calculo del tamao adecuado de una muestra


Tipos de muestras
En muchas investigaciones no se pretende en principio (al menos como objetivo
prioritario) extrapolar los resultados. Cuando el inters del investigador tiene como
objetivo analizar una muestra concreta (verificar si una innovacin didctica
funciona en una clase, estudiar las actitudes de nuestros alumnos, etc.), el tamao
de la muestra es el tamao del grupo objeto de estudio.
Cuando se trata de extrapolarlos resultados a la poblacin representada por una
muestra hay que tratar de dos temas: el tipo de muestra y el nmero de sujetos.
Cmo se obtiene la muestra tiene que ver con la representatividad de la muestra
El tamao de la muestra tiene que ver con los mrgenes de error al extrapolar de
la muestra a la poblacin. Cuando se trata de recoger unos datos de una muestra
(por ejemplo en un survey o encuesta sociolgica, de opiniones, etc.) para
extrapolar los resultados a la poblacin, el nmero de sujetos no es el nico dato
que hay que tener en cuenta, y esto hay que tenerlo presente desde el principio.
La muestra, cualquiera que sea su magnitud, debe ser representativa de la
poblacin a la que se van a extrapolar los resultados. Debemos recordar que los
lmites o caractersticas de la poblacin los determina y define el que investiga (los
alumnos de una facultad o de universidad, o de todo el pas, etc.).
En cualquier caso hay que explicar cmo se hizo este muestreo y describir bien la
muestra para poder valorar esta representatividad. Las muestras (y los mtodos
para obtenerlas) podemos dividirlas en dos grandes categoras segn sean o no
sean muestras probabilsticas o aleatorias (ambos trminos, probabilsticas o
aleatorias, expresan lo mismo.
Cuando nos preguntamos cuntos sujetos necesitamos hay que aadir,
necesitamos Para qu? Porque puede haber varias finalidades. Lo que con ms
frecuencia se encuentra en los textos es posiblemente las normas y frmulas para
determinar el tamao de la muestra cuando se quieren extrapolar los resultados a
la poblacin (encuestas, sondeos pre-electorales, etc.); ste es el primer punto que
vamos a tratar.
Pero en la investigacin y experimentacin en psicologa, educacin o sociologa
hay con frecuencia otras finalidades: Cuntos sujetos necesitamos para construir y
analizar un instrumento de medicin (un test, una escala de actitudes), o para llevar
a cabo un anlisis factorial o un anlisis de varianza en un diseo experimental

73

En los textos de investigacin experimental vemos con frecuencia ejemplos de


investigaciones con muy pocos sujetos, quizs sobre todo cuando se utilizan
diseos experimentales en sentido propio y el anlisis de varianza es el mtodo de
anlisis Qu podemos decir sobre el tamao de la muestra en estos casos?
Vamos a dividir esta exposicin en varios apartados de extensin muy desigual:

Nmero de sujetos necesario:


a) Para extrapolar los resultados a una poblacin mayor (el caso tpico de los
sondeos de opinin);
b) Para construir un instrumento de medicin (test o escala)
c) Para llevar a cabo un estudio experimental (contrate de medias, anlisis de
varianza)
d) Para hacer un anlisis correlacionar.

Variables de las que depende el tamao de la muestra


Suponiendo que la muestra es la adecuada, el tamao necesario de la muestra para
poder extrapolar los resultados a la poblacin depende bsicamente de tres
variables. El por qu estas variables inciden en el tamao de la muestra es fcil
comprenderlo de manera intuitiva, al margen de la traduccin de estas variables a
valores estadsticos.
1 El nivel de confianza o riesgo que aceptamos de equivocarnos al
presentar nuestros
Resultados: lo que deseamos es que en otras muestras semejantes los resultados
sean los mismos o muy parecidos. Tambin podemos denominarlo grado o nivel de
seguridad. El nivel de confianza habitual es de .05 (= .05). El nivel de confianza
va a entrar en la frmula para determinar el nmero de sujetos con un valor de zeta,
que en la distribucin normal est asociado a una determinada probabilidad de
ocurrencia.
2 La varianza(o diversidad de opiniones) estimada en la poblacin.
Esta diversidad en la poblacin es la diversidad estimada; si la conociramos
(cuntos van a decir que s y cuntos van a decir que no) en primer lugar no
necesitaramos hacer la encuesta.
Si sabemos de antemano que todos piensan lo mismo (aunque no sabemos qu
piensan y por eso lo preguntamos), nos bastar preguntar a un solo sujeto, pero si

74

las opiniones pueden ser muy distintas nos harn falta ms sujetos. Por ejemplo,
si aterrizamos en un pas desconocido donde todos hablan el mismo idioma y no
sabemos cul esbasta con preguntrselo a una sola persona de ese pas.
Si en una agrupacin de sujetos que viven juntos, todos se levantan a la misma hora
(un cuartel, un convento), y queremos saber a qu hora se levantan por la maana,
basta con preguntrselo a una sola persona. A mayor diversidad esperada, o al
menos posible, en las opiniones o posibles respuestas en la poblacin har falta un
mayor nmero de sujetos en la muestra.
3 El margen de error que estamos dispuestos a aceptar.
Si por ejemplo el 20% de la muestra est de acuerdo con una proposicin (o dice
que va votar a un determinado candidato o que prefiere un determinado producto)
eso no significa que el 20% exacto de la poblacin vaya a responder lo mismo,
puede ser el 22% o el 18% necesitaremos muestras mayores si queremos que el
margen de error o de oscilacin de muestra a muestra de los resultados sea muy
pequeo (el resultado exacto lo tendramos si respondiera el 100% y la muestra
coincidiera con la poblacin).
Esto puede ser ms o menos importante segn la situacin; el margen de error en
sondeos pre-electorales es, por ejemplo, muy importante y este margen de error
suele ponerse en torno a un 3%.

75

CREDITOS

Universidad Autnoma de Chiapas


Facultad de Ingeniera
Licenciatura en Ingeniera civil

Manual de Clases para


Probabilidad y Estadstica
Autor Intelectual:
Dr. Rubn Herrera Galicia
1ra Edicin:
Yery Cristell Prez Olmedo

Tuxtla Gutirrez, Chiapas.


Mayo 2014
76

Das könnte Ihnen auch gefallen