Sie sind auf Seite 1von 107

PROBABILIDAD Y ESTADSTICA

UNIDAD I. TEORA DE LA PROBABILIDAD


1.1Conjuntos, sus operaciones, leyes y su representacin
Definicin de conjunto
Por Extensin y por Comprensin
Un conjunto queda perfectamente definido si se conocen con exactitud los
elementos que lo integran o que pertenecen a l; es decir, si se nombran todos
sus elementos o bien si se usa un enunciado o propiedad que lo identifique.
Independientemente de la forma en que se lo represente, siempre se usa una
letra mayscula que lo define. Esta letra mayscula representa a un conjunto
especfico de elementos.
Existen dos maneras de definir un conjunto dado:
a) Por extensin o enumeracin: se define nombrando a cada elemento del
conjunto.
Por comprensin: se define mediante un enunciado o atributo que representa al
conjunto (se busca una frase que represente a la totalidad de elementos sin
nombrar a ninguno en particular).
Por comprensin Por extensin
A = {Nmeros dgitos} A = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
B = {Nmeros pares] B = {2, 4, 6, 8, 10, 12, 14, ...}
C = {Mltiplos de 5} C = {5, 10, 15, 20, 25, 30, 35...}
Diagrama de Venn y entre llaves.
Es habitual representar los conjuntos en forma grfica mediante los Diagramas de
Venn.
En estos diagramas el conjunto se representa mediante una superficie
limitada por una lnea. En su interior se colocan los elementos del
conjunto. Cada porcin del plano limitada se nombra con una letra
mayscula.

El conjunto A est formado por los elementos 1, 2, 3.
El conjunto B est formado por los elementos a, b, c, d.
Existe, adems, otra forma de representarlos que es entre llaves.
En estos ejemplos se escribe:
A = {1, 2, 3}
B = {a, b, c, d}

Otro ejemplo:
Por diagrama Entre llaves
S = {a, e, i, o, u}
Se escribe una coma para separar los
elementos.
Conjunto Disjunto, Conjunto Subconjunto
1) Conjuntos disjuntos: Son aquellos conjuntos que no tienen elementos en
comn.
Por ejemplo:
El conjunto A tiene como elementos a los nmeros 1, 2 y 3. El conjunto B tiene
como elementos a las letras a, b, c y d. No hay elementos comunes entre los
conjuntos A y B. En otras palabras, ningn elemento del conjunto A pertenece al
conjunto B; a su vez, ningn elemento de B pertenece al conjunto A.
En consecuencia, los conjuntos A y B son disjuntos.
Tomando otro ejemplo:
Si E = { pizarrn, tiza, borrador} (Conjunto E formado por pizarrn, tiza, borrador)
F = { tiza, profesor, regla} (Conjunto F formado por tiza, profesor, regla)
G = { nio, cuaderno, sala, lpiz } (Conjunto G formado por nio, cuaderno, sala,
lpiz)
E y G son conjuntos disjuntos porque: pizarrn, tiza, borrador no pertenecen al
conjunto G.
E y F no son disjuntos ya que tiza pertenece a E y tambin a F.
F y G son conjuntos disjuntos porque: tiza, profesor, regla no pertenecen a G, y
nio, cuaderno, sala, lpiz no pertenecen a F.
2) Conjunto Subconjunto: Un conjunto es subconjunto de otro si todos los
elementos de un conjunto tambin pertenecen al otro.
Si se tienen los siguientes conjuntos:
P = { a, e, i, o, u } y R = { a, i }
R es subconjunto de P porque todos los elementos de R estn en P.
En general, para expresar que un conjunto es subconjunto de otro conjunto se
pone entre ellos el smbolo . En este ejemplo se escribe:
R P
Se lee R es subconjunto de P
no es subconjunto de otro cuando al menos un elemento del primero no pertenece
al segundo conjunto. El smbolo que representa la frase no es subconjunto de es
.
Si se tienen los siguientes conjuntos:
C = { 3, 5, 7, 9 } y H = { 3, 5, 8 }
H no es subconjunto de C porque el elemento 8 no pertenece al conjunto C. Se
escribe:
H C
Se lee H no es subconjunto de C
Tambin los subconjuntos pueden representarse mediante Diagramas de
Venn.
Ejemplo:
S C
Propiedades de la relacin subconjunto
1.- Todo conjunto es subconjunto de s mismo.
Si T = { x, z, y, z }, se tiene que T T
2.- El conjunto vaco es subconjunto de cualquier conjunto (el conjunto vaco es
aquel que no tiene elementos; se representa por: { } o bien por
Si se tiene el conjunto B se puede establecer que T
Relaciones entre conjuntos
Sean los conjuntos
A = { 5, 7 }
B = { 3, 5, 7, 9 }
Los elementos 5 y 7 forman parte del conjunto A.
En otras palabras, los elementos 5 y 7 pertenecen ( ) al conjunto A.
5 A y 7 A
Los elementos 3, 5, 7, 9 forman parte del conjunto B, es decir, pertenecen al
conjunto B
3 B 5 B 7 B 9 B
Se puede observar, adems, en el diagrama, que los elementos del conjunto A
estn incluidos dentro del conjunto B; por lo tanto, dichos elementos tambin
pertenecen al conjunto B.
En otras palabras, A es subconjunto de B.
A B
Operaciones entre conjuntos
Interseccin de conjuntos ( ) La interseccin entre dos o ms conjuntos es
otro conjunto formado por los elementos comunes a ellos; es decir, a los
elementos comunes o repetidos de ambos conjuntos A y B.
La interseccin se simboliza con el signo y se coloca entre las letras que
representan a cada conjunto.

Conjunto A = {3, 8, 24}
Conjunto B = {13, 7, 8, 12}
Los elementos que se repiten entre A y B son: 3 y 8. Estos elementos se anotan
en la parte de color amarillo pues representa el lugar comn entre ambos
conjuntos.
Otro ejemplo:
B = { a, b, c, d, e, f }
C = { a, d, f, g, h }
B C = { a, d, f }
En el diagrama de Venn la parte ennegrecida representa la interseccin de B y C.
Unin de conjuntos: La unin de dos o ms conjuntos es otro conjunto
formado por los elementos que pertenecen a uno u otro conjunto o a
ambos. La unin se representa por el smbolo Si un elemento est
repetido, se coloca una sola vez.

Cuando no hay elementos comunes o repetidos (esquema 1) se anotan todos los
elementos en un solo conjunto (una sola figura cerrada):
A B = {2, 3, 4, 5, 6, 7}.

Si hay elementos repetidos, stos se anotan en la zona comn a ambos
conjuntos (esquema 2), donde se juntan ambas figuras cerradas:
W Z = {9, 6, 8, 5, 7}.
La cardinalidad de un conjunto se representa con el smbolo # y corresponde al
nmero de elementos que tiene el conjunto.
Ejemplos:
W = { $, %, &, /, } El conjunto W est integrado por 5 elementos, por lo
tanto, su cardinalidad es 5 ( # = 5 )
Q
=
El conjunto Q est formado por
3 elementos
# Q = 3
K = El conjunto K tiene un elemento
# K= 1
Conjuntos equivalentes
Son aquellos que tienen igual cardinalidad, es decir, igual nmero de elementos.
T =
{ , ,
}
# T = 3
P = { a, b, c } # P = 3
Los conjuntos T y P son equivalentes porque tienen la misma cardinalidad.
Conjuntos iguales
Son todos aquellos conjuntos que tienen elementos iguales. Los elementos de un
conjunto tambin pertenecen al mismo conjunto.
Ejemplo:
D F D = F
Los conjuntos D y F son iguales porque tienen el mismo elemento. A veces
pueden estar desordenados los elementos cuando son ms de uno, en tal caso,
debe recordarse que en un conjunto no importa el orden en que estn los
elementos.
Conjunto universo
En el Diagrama de Venn de la izquierda se puede observar que el conjunto U
contiene a los conjuntos M y N. U es el conjunto universo porque es un conjunto
que contiene a todos los conjuntos.
Otro ejemplo:
Sea Y = { enero, febrero } ; = { marzo, junio, agosto }
El conjunto universo ser: U = { meses del ao }
1.2Probabilidad de eventos aleatorios
Probabilidad de eventos
Para calcular la probabilidad de eventos es necesario que stos se comporten de
una maner ms o menos estable. Precisamente, se echa mano de la regularidad
estadstica, que es la propiedad de los fenmenos aleatorios, y que consiste en
que al aumentar el nmero de repeticiones de un experimento en condiciones
prcticamente constantes, la frecuencia relativa de ocurrencia para cada evento
tiende a un valor fijo.
Sin embargo, al momento de definir la probabilidad de un evento podemos tomar
en cuenta los siguientes criterios:
1. La probabilidad subjetiva de un evento se la asigna la persona que hace
el estudio, y depende del conocimiento que esta persona tenga sobre el
tema. Precisamente por su carcter de subjetividad no se considera con
validez cientfica, aunque en la vida diaria es de las ms comnes que se
utilizan al no apoyarse ms que en el sentido comn y los conocimientos
previos, y no en resultados estadsticos.
2. La probabilidad frecuencial de un evento es el valor fijo al que tienden
las frecuencias relativas de ocurrencia del evento de acuerdo a la
regularidad estadstica. Esta definicin sera la ms real, pero proporciona
probabilidades aproximadas, es decir, proporciona estimaciones y no
valores reales. Adems, los resultados son a posteriori, pues se necesita
realizar el experimento para poder obtenerlo. (Para ver un ejemplo haz click
aqu.)
3. La probabilidad clsica de un evento E, que denotaremos por P(E), se
define como el nmero de eventos elementales que componen al evento E,
entre el nmero de eventos elementales que componen el espacio
muestral:
Es la definicin ms utilizada porque supone de antemano, y se necesita
como requisito indispensable, que todos los eventos elementales tienen la
misma probabilidad de ocurrir.
Axiomas de la probabilidad
Recordemos primero que las frecuencias relativas de una distribucin tenan las
siguientes propiedades:
1. Las frecuencias relativas son mayores o iguales que cero.
2. La frecuencia relativa del espacio muestral es igual a la unidad.
3. Si dos eventos son mutuamente excluyentes, es decir que no ocurren
simultneamente, entonces la frecuencia relativa de su unin es la suma de
las frecuencias relativas de cada uno.
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definicin
ya expuesta, es la frecuencia relativa cuando se aumenta el tamao de la muestra,
se tienen lo siguiente.
Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E,
entonces se satisfacen los axiomas de la probabilidad:
1. 0 -P(E) -1.
2. P(S) = 1.
3. Si E1, E2, ... , En son eventos mutuamente excluyentes, entonces
Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad
de eventos.
Posibilidades y probabilidades
Se habla muy comnmente en sitios de apuestas, como en las autdromos o
hipdromos, de que "las apuestas a tal o cual participante es de x a y", es decir,
que las posibilidades de que gane es de x a y. Esta manera de expresarse se
refiere al uso de razones.
En trminos generales, la posibilidad de que ocurra un evento se determina
mediante la razn de la probabilidad de que ocurra a la probabilidad de que no
ocurra.
Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las
posibilidades de que ocurra son x a y, es decir
Tales que x y y son enteros positivos.
Por ejemplo: Si se tiran dos monedas normales (no trucadas), la probabilidad de
que las dos monedas caigan cara es de . Esto quiere decir si alguien apuesta a
que las dos monedas no caen simultneamente en cara, la posibilidad de ganar la
apuesta es de
es decir, 3 a 1.
Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento,
entonces se acostumbra mencionar las posibilidades en contra del evento.
Por ejemplo: Si se tira un dado no trucado, sabemos que la probabilidad de
obtener un cuatro es
1
/6, es decir que la posibilidad de obtener un cuatro es de 1 a
6; pero se acostumbra decir que las posibilidades en contra, esto es, de no
obtener un cuatro es de 6 a 1.
Inversamente, en el caso de tener las posibilidades de un evento, entonces es fcil
obtener su probabilidad, pues si la posibilidad de un evento es de x a y, entonces
la probabilidad p de que ocurra tal evento es
Por ejemplo: En la Copa Mundial de Futbol Francia 1998 se deca que el equipo mexicano tena
una posibilidad de 1 a 75 de llegar a ser el campen del torneo.
Si se desea encontrar la probabilidad de que el equipo mexicano llegase a ser
campen, entonces se tiene que
es la probabilidad de que ocurriese el evento.
Esto tiene la ventaja de que permite, en combinacin con el tercer axioma de la
probabilidad, medir la confiabilidad que tienen las opiniones de las personas sobre
las posibilidades que le asignan a algunos eventos. Esto quiere decir que el
clculo de las probabilidades de dos eventos mutuamente excluyentes a partir de
las posibilidades otorgadas de manera subjetiva resulta como un criterio de
consistencia.
Por ejemplo: Un criminlogo piensa que las posibilidades de que en la prxima
semana la cantidad de delitos en una ciudad aumente con respecto a la anterior
es de 5 a 2, de que sea la misma cantidad de delitos es de 1 a 3 y las
posibilidades de que aumente la cantidad o sea la misma es de 7 a 4.
Si se desea saber si son consistentes las probabilidades correspondientes habra
que hacer los clculos.
Las probabilidades de aumente la cantidad de delitos, sea igual la cantidad de
delitos, y de que aumente o sea igual la cantidad de delitos es, respectivamente,
de
y dado que (como son eventos mutuamente excluyentes) no es
lo mismo que
7
/11, entonces los criterios del criminlogo pueden ser cuestionados.
Propiedades de la probabilidad de eventos no elementales
Cuando se tienen eventos elementales no existe mucho problema en el sentido
del clculo de las probabilidades, pues basta con una contabilizacin o el uso
directo del clculo combinatorio. Pero en el caso de eventos no elementales, que
son los compuestos por ms de un evento elemental, el proceder de manera
anloga resulta muy complejo y las operaciones pueden sobrepasar la capacidad
de clculo existente. Sin embargo, utilizando los axiomas de la probabilidad y las
siguientes propiedades, se podrn expresar las probabilidades de estos eventos
en trminos de los eventos elementales que lo componen, siempre y cuando se
conozcan las probabilidades de stos.
Veamos la probabilidad de una unin de eventos, la cual la podremos calcular
de la siguiente manera:
Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es
igual a la suma de las probabilidades de ocurrencia de A y de B, menos la
probabilidad de que ocurran A y B simultneamente. Es decir,
P(AB) = P(A) + P(B) - P(AB)
Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene:
Propiedad 2. Si dos eventos, A y B, son mutuamente excluyentes entonces la
probabilidad de que ocurra A o B es igual a la suma de las probabilidades de
ocurrencia de A y de B. Es decir
P(AB) = P(A) + P(B)
Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad
del complemento de un evento E, que denotaremos como ~E:
Propiedad 3. Si E es un evento y ~E su complemento, entonces
P(~E) = 1 - P(E)
Retomando los conceptos de eventos dependientes o condicionales, se va a
definir la probabilidad condicional como sigue:
Propiedad 4. La probabilidad de que ocurra un evento A dado que ocurri el
evento B (el evento A depende del evento B), denotado P(A|B), es:
Hay que notar que esta propiedad no es conmutativa, situacin que s ocurre con
la probabilidad de unin o la interseccin de eventos, por lo que no hay que
confundir P(A|B) y P(B|A).
Finalmente, el criterio para la independencia de eventos queda como sigue:
Propiedad 5. Dos eventos A y B son independientes si y slo si
P(A|B) = P(A) y P(B|A) = P(B)
o, que es lo mismo:
P(AB) = P(A) P(B)
1.3Espacio muestral y eventos
Modelos:
Modelo determinista: designamos as al modelo que estipula que las condiciones
en las que se verifica un experimento determinan el resultado del mismo. El modelo
seala que las condiciones en las cuales se verifican ciertos fenmenos determinan
el valor de ciertas variables observables: la magnitud de la velocidad, el rea
recurrida durante un cierto tiempo, etc.
Modelo no determinista (o probabilstico o estocstico): en este modelo las
condiciones experimentales solo determinan el comportamiento probabilstico (la
distribucin probabilstica) de los resultados observables. Usamos consideraciones
especficas para especificar una distribucin de probabilidades.
Caractersticas de un experimento aleatorio:
Es posible repetir cada experimento en forma indefinida sin cambiar
esencialmente las condiciones.
Aunque en general no podemos especificar cual ser el resultado particular,
podemos describir el conjunto de todos los resultados posibles del experimento.
Cuando el experimento se repite un gran nmero de veces, aparece un patrn
definido o regularidad. Esta regularidad hace posible la construccin de un modelo
preciso con el cual podemos analizar el experimento.
Espacio muestral:
Para cada experimento E definimos el espacio muestral como el conjunto de todos
los resultados posibles de E. Usualmente se designa este conjunto como S.
El espacio muestral, de acuerdo con el nmero de resultados posibles, puede ser:
finito, infinito numerable, infinito no numerable.
Eventos:
Un evento A (respecto a un espacio muestral particular S asociado a un
experimento E) es simplemente un conjuno de resultados posibles. En terminologa
de conjuntos, un evento es un subconjunto del espacio muestral S. Esto implica
que S tambien es un evento asi como lo es el conjunto vacio. Cualquier resultado
individual tambien puede considerarse como un evento.
Se dice que dos eventos A y B, son mutuamente excluyentes si no pueden ocurrir
juntos. Expresamos esto escribiendo IMAGEN; es decir, la interseccin de A y B es
el conjunto vaco.
Frecuencia relativa:
Supongamos que repetimos n veces el experimento E, y sean A y B dos eventos
asociados con E. Sean nA y nB el nmero de veces que el evento A y el B
(respectivamente) ocurrieron en las n repeticiones. Entonces, definimos fA = nA / n
como la frecuencia relativa del evento A en las n repeticiones de E.
La frecuencia relativa fA tiene las siguientes propiedades:
0 fA 1
fA = 1 si y slo si A ocurre cada vez en las n repeticiones.
fA = 0 si y slo si A nunca ocurre en las n repeticiones.
Si A y B son dos eventos mutuamente excluyentes, y si f(A U B) es la frecuencia
relativa asociada al evento A U B, entonces f(A U B) = fA + fB.
fA, basada en la n repeticiones del experimento y considerada para una funcin
de n, "converge" en cierto sentido probabilstico a P(A) cuando n-->+oo. (Esto NO
es lo mismo que el concepto corriente de convergencia que se encuentra en otra
parte en matematicas. En realidad, sta no es una conclusin matemtica, sino
simplemente un hecho emprico.) Lo importante de esta propiedad es que si un
experimento se realiza un gran nmero de veces, la frecuencia relativa con que
ocurre un evento A tiende a variar cada vez menos a medida que el nmero de
repeticiones aumenta. A esta caracterstica se la conoce como regularidad
estadstica.
Nociones bsicas de probabilidad:
Sea E un experimento y S un espacio muestral asociado con E. Con cada evento A
asociamos un nmero real, designado con P(A) y llamado probabilidad de A, el
cual satisface las siguientes propiedades:
0 P(A) 1
P(S) = 1
i A y B son dos eventos mutuamente excluyentes, P(A U B) = P(A) + P(B)
Si X es el conjunto vacio, entonces P(X) = 0
Si A
C
es el evento complementario de A, entonces P(A) = 1 - P(A
C
)
Si A y B son dos eventos cualesquiera, entonces P(A U B) = P(A) + P(B) - P(A
IMAGEN C)
Si A B, entonces P(A) P(B)
1.4 Definicin clsica de la probabilidad
El concepto de Probabilidad ha evolucionado en el transcurso del tiempo. La
probabilidad naci en el juego y es jugando como mejor se aprende la
probabilidad. A los aljebristas del siglo XVI, Pacioli, Cardano, Tartaglia, se
deben las primeras consideraciones matemticas profundas a propsito
de los juegos de azar. Los fundamentos del clculo de probabilidades
surgen alrededor del ao 1650, cuando sugerido por los juegos de dados,
de cartas, del lanzamiento de una moneda, se plante el debate de
determinar la probabilidad de ganar la partida. Fermat y Pascal,
esquematizado el tema propuesto (ver primer problema), dieron en
1654 la primera definicin de probabilidad. Se aceptaba como intuitivo el
concepto de equiprobabilidad, se admita que la probabilidad de conseguir
un acontecimiento fuese igual al cociente entre el nmero de casos
favorables y el de casos posibles. El clculo de probabilidades tuvo un
notable desarrollo sobre la base de la anterior definicin de probabilidad.
Destacan en 1713 el teorema de Bernoulli y la distribucin binomial, y en
1738 el primer caso particular estudiado por De Moivre, del teorema
central del lmite. En 1809 Gauss inici el estudio de la teora de errores y
en 1810 Laplace, que haba considerado anteriormente el tema, complet
el desarrollo de esta teora.
A mediados del siglo XIX, un fraile agustino austraco, Gregor Mendel, inici el
estudio de la herencia, la gentica, con sus interesantes experimentos
sobre el cruce de plantas de diferentes caractersticas. Su obra, La
matemtica de la Herencia, fue una de las primeras aplicaciones
importantes de la teora de probabilidad a las ciencias naturales.
1.5 Definicin en base a la frecuencia relativa
Probabilidad de eventos
Para calcular la probabilidad de eventos es necesario que stos se comporten de
una maner ms o menos estable. Precisamente, se echa mano de la regularidad
estadstica, que es la propiedad de los fenmenos aleatorios, y que consiste en
que al aumentar el nmero de repeticiones de un experimento en condiciones
prcticamente constantes, la frecuencia relativa de ocurrencia para cada evento
tiende a un valor fijo.
Sin embargo, al momento de definir la probabilidad de un evento podemos tomar
en cuenta los siguientes criterios:
1. La probabilidad subjetiva de un evento se la asigna la persona que hace
el estudio, y depende del conocimiento que esta persona tenga sobre el
tema. Precisamente por su carcter de subjetividad no se considera con
validez cientfica, aunque en la vida diaria es de las ms comnes que se
utilizan al no apoyarse ms que en el sentido comn y los conocimientos
previos, y no en resultados estadsticos.
2. La probabilidad frecuencial de un evento es el valor fijo al que tienden
las frecuencias relativas de ocurrencia del evento de acuerdo a la
regularidad estadstica. Esta definicin sera la ms real, pero proporciona
probabilidades aproximadas, es decir, proporciona estimaciones y no
valores reales. Adems, los resultados son a posteriori, pues se necesita
realizar el experimento para poder obtenerlo. (Para ver un ejemplo haz click
aqu.)
3. La probabilidad clsica de un evento E, que denotaremos por P(E), se
define como el nmero de eventos elementales que componen al evento E,
entre el nmero de eventos elementales que componen el espacio
muestral:
Es la definicin ms utilizada porque supone de antemano, y se necesita
como requisito indispensable, que todos los eventos elementales tienen la
misma probabilidad de ocurrir.
1.6 Definicin axiomatica de la probabilidad
Axiomas de la probabilidad
Recordemos primero que las frecuencias relativas de una distribucin tenan las
siguientes propiedades:
1. Las frecuencias relativas son mayores o iguales que cero.
2. La frecuencia relativa del espacio muestral es igual a la unidad.
3. Si dos eventos son mutuamente excluyentes, es decir que no ocurren
simultneamente, entonces la frecuencia relativa de su unin es la suma de
las frecuencias relativas de cada uno.
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definicin
ya expuesta, es la frecuencia relativa cuando se aumenta el tamao de la muestra,
se tienen lo siguiente.
Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E,
entonces se satisfacen los axiomas de la probabilidad:
1. 0 -P(E) -1.
2. P(S) = 1.
3. Si E1, E2, ... , En son eventos mutuamente excluyentes, entonces
Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad
de eventos.
Para hacer una definicin rigurosa de la probabilidad, necesitamos precisar ciertas
leyes o axiomas que deba cumplir una funcin de probabilidad. Intuitivamente
estos axiomas deberan implicar, entre otras, las siguientes cuestiones, que nos
parecen lgicas en trminos de lo que se puede esperar de una funcin de
probabilidad:
La probabilidad slo puede tomar valores comprendidos entre 0 y 1(no
puede haber sucesos cuya probabilidad de ocurrir sea del ni del ;
La probabilidad del suceso seguro es 1, es decir, el ;
La probabilidad del suceso imposible debe ser 0.
La probabilidad de la interseccin de dos sucesos debe ser menor o igual
que la probabilidad de cada uno de los sucesos por separado, es decir,
La probabilidad de la unin de sucesos debe ser mayor que la de cada uno
de los sucesos por separado:
Ms an, si los sucesos son disjuntos (incompatibles) debe ocurrir que
La probabilidad del suceso contrario de A, debe valer .
Esto en realidad puede deducirse del siguiente razonamiento:
En las ltimas lneas hemos esbozado ciertas propiedades que debera cumplir
una funcin que queramos llamar probabilidad. Hemos de tener en cuenta
entonces que siguiendo esos puntos:
1.
La funcin de probabilidad debe calcularse sobre subconjuntos de E. No es
estrictamente necesario que sean todos, pero si es necesario que si se
puede calcular sobre un conjunto, lo pueda ser tambin sobre su
complementario, y que si se puede calcular sobre dos conjuntos A y B, que
tambin se pueda calcular sobre su unin y su interseccin. Para ello
introduciremos el concepto de -lgebra de sucesos, que ser una clase
de subconjuntos de Esobre los que podamos aplicar las reglas de la
probabilidad.
2.
Entre las leyes que debe cumplir una funcin de probabilidad y que hemos
escrito antes, hemos observado que algunas son redundantes, ya que se
pueden deducir de las dems. Con la definicin axiomtica de la
probabilidad pretendemos dar el menor conjunto posible de estas reglas,
para que las dems se deduzcan como una simple consecuencia de ellas.
Precisemos entonces los conceptos de -lgebra de sucesos y de probabilidad.
1.7 Diagramas de rbol
Tablas de contingencia y diagramas de rbol.
En los problemas de probabilidad y en especial en los de probabilidad
condicionada, resulta interesante y prctico organizar la informacin en una tabla
de contingencia o en un diagrama de rbol.
Las tablas de contingencia y los diagramas de rbol estn ntimamente
relacionados, dado uno de ellos podemos construir el otro. Unas veces, los datos
del problema permiten construir fcilmente uno de ellos y a partir de l podemos
construir el otro, que nos ayudar en la resolucin del problema.
Conversin de una tabla en diagrama de rbol
Las tablas de contingencia estn referidas a dos caractersticas que
presentan cada una dos o ms sucesos.
En el caso de los sucesos A, , B y , expresados en frecuencias
absolutas, relativas o probabilidades la tabla, adopta la forma adjunta.
Dicha tabla adopta la forma del diagrama de rbol del dibujo. En ste, a
cada uno de los sucesos A y se les ha asociado los sucesos B y .
A TOTAL
B P( A B )
P( B )
P( B )
P( A ) P( ) P( )
TOTAL P( A )
P( )
1
Sobre las ramas del diagrama de rbol se han anotado las probabilidades
condicionadas correspondientes, deducidas de las relaciones anlogas a:
Conversin de un diagrama en tabla de contingencia
De manera recproca, dado el diagrama de rbol podemos construir la tabla
de contingencia equivalente si ms que utilizar la expresin
P( B A ) = P( B/A ) P( A ),
para calcular las probabilidades de las intersecciones de sucesos que
forman la tabla.
1.8 permutaciones y combinaciones
Anlisis combinatorio
En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una
situacin dada se convierte en algo difcil de lograr o, simplemente, tedioso. El
anlisis combinatorio, o clculo combinatorio, permite enumerar tales casos o
sucesos y as obtener la probabilidad de eventos ms complejos.
En el caso de que existan ms de un suceso a observar, habra que contar el
nmero de veces que pueden ocurrir todos los sucesos que se desean observar,
para ello se utiliza el principio fundamental de conteo:
Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2
formas, entonces el nmero de formas en que ambos sucesos pueden
presentarse en ese orden es de n1n2.
En otras palabras, basta multiplicar el nmero de formas en que se pueden
presentar cada uno de los sucesos a observar.
Este principio nos remite automticamente al factorial de un nmero natural, que
se puede pensar como una funcin con dominio los nmeros naturales junto con el
cero y codominio los nmeros naturales. El factorial de un nmero n, denotado n!,
se define como:
Ahora, n es muy grande el proceso de clculo se vuelve tedioso y muy cargado,
incluso para una computadora, por lo que se utiliza la aproximacin de Stirling a
n!:
donde e_2.71828..., que es la base de los logaritmos neperianos.
En Excel existe la funcin FACT( n ) que calcula el factorial de un nmero entero no
negativo n.

En el anlisis combinatorio se definen las permutaciones, con o sin repeticin, y
las combinaciones.
Permutaciones (u ordenaciones) con repeticin
Las permutaciones son tambin conocidas como ordenaciones, y de hecho
toman este nombre porque son ordenaciones de r objetos de n dados. En este
curso las representaremos como ORn
r
nORr.
Por ejemplo: Sea A={a,b,c,d}, cuntas "palabras" de dos letras se pueden
obtener?
Se pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras
es 4. En este caso r=2 y n=4.
Las "palabras" formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db,
dc, dd. En total son 16.
En general, si se toman r objetos de n, la cantidad de permutaciones u
ordenaciones con repeticin obtenidas son:
ORn
r
= nORr = n
r
Permutaciones (u ordenaciones) sin repeticin
En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos de n
dados atendiendo a la situacin de cada objeto en la ordenacin. Su
representacin ser Pn
r
nPr.
Por ejemplo: Sea el mismo conjunto A={a,b,c,d}, cuntas ordenaciones sin
repeticin se pueden obtener?
Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.
En general, si se toman r objetos de un total de n, la cantidad de permutaciones
Pn
r
= nPr =
El Excel cuenta con la funcin PERMUTACIONES( n ,r) que realiza el clculo.
Combinaciones
Es una seleccin de r objetos de n dados sin atender a la ordenacin de los
mismos. Es decir, es la obtencin de subcojuntos, de r elementos cada uno, a
partir de un conjunto inicial de n elementos. La denotaremos con Cn
r
, nCr .
Por ejemplo: Si tomamos el mismo conjunto A={a,b,c,d}, cuntos subconjuntos
de 2 elementos cada uno se pueden obtener?
Hacindolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los
subconjuntos.
En general, si de n objetos dados se hacen combinaciones de r objetos cada una,
el nmero de combinaciones obtenidas son:
Cn
r
= nCr =
o, que es lo mismo,
Cn
r
= nCr =
En Excel la funcin COMBINAT( n ,r) calcula las combinaciones de n objetos
tomando r de ellos.
1.9 Probabilidad condicional e independencia
Posibilidades y probabilidades
Se habla muy comnmente en sitios de apuestas, como en las autdromos o
hipdromos, de que "las apuestas a tal o cual participante es de x a y", es decir,
que las posibilidades de que gane es de x a y. Esta manera de expresarse se
refiere al uso de razones.
En trminos generales, la posibilidad de que ocurra un evento se determina
mediante la razn de la probabilidad de que ocurra a la probabilidad de que no
ocurra.
Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las
posibilidades de que ocurra son x a y, es decir
Tales que x y y son enteros positivos.
Por ejemplo: Si se tiran dos monedas normales (no trucadas), la probabilidad de
que las dos monedas caigan cara es de . Esto quiere decir si alguien apuesta a
que las dos monedas no caen simultneamente en cara, la posibilidad de ganar la
apuesta es de
es decir, 3 a 1.
Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento,
entonces se acostumbra mencionar las posibilidades en contra del evento.
Por ejemplo: Si se tira un dado no trucado, sabemos que la probabilidad de
obtener un cuatro es
1
/6, es decir que la posibilidad de obtener un cuatro es de 1 a
6; pero se acostumbra decir que las posibilidades en contra, esto es, de no
obtener un cuatro es de 6 a 1.
Inversamente, en el caso de tener las posibilidades de un evento, entonces es fcil
obtener su probabilidad, pues si la posibilidad de un evento es de x a y, entonces
la probabilidad p de que ocurra tal evento es
Por ejemplo: En la Copa Mundial de Futbol Francia 1998 se deca que el equipo
mexicano tena una posibilidad de 1 a 75 de llegar a ser el campen del torneo.
Si se desea encontrar la probabilidad de que el equipo mexicano llegase a ser
campen, entonces se tiene que
es la probabilidad de que ocurriese el evento.
Esto tiene la ventaja de que permite, en combinacin con el tercer axioma de la
probabilidad, medir la confiabilidad que tienen las opiniones de las personas sobre
las posibilidades que le asignan a algunos eventos. Esto quiere decir que el
clculo de las probabilidades de dos eventos mutuamente excluyentes a partir de
las posibilidades otorgadas de manera subjetiva resulta como un criterio de
consistencia.
Por ejemplo: Un criminlogo piensa que las posibilidades de que en la prxima
semana la cantidad de delitos en una ciudad aumente con respecto a la anterior
es de 5 a 2, de que sea la misma cantidad de delitos es de 1 a 3 y las
posibilidades de que aumente la cantidad o sea la misma es de 7 a 4.
Si se desea saber si son consistentes las probabilidades correspondientes habra
que hacer los clculos.
Las probabilidades de aumente la cantidad de delitos, sea igual la cantidad de
delitos, y de que aumente o sea igual la cantidad de delitos es, respectivamente,
de
y dado que (como son eventos mutuamente excluyentes) no es
lo mismo que
7
/11, entonces los criterios del criminlogo pueden ser cuestionados.
Propiedades de la probabilidad de eventos no elementales
Cuando se tienen eventos elementales no existe mucho problema en el sentido
del clculo de las probabilidades, pues basta con una contabilizacin o el uso
directo del clculo combinatorio. Pero en el caso de eventos no elementales, que
son los compuestos por ms de un evento elemental, el proceder de manera
anloga resulta muy complejo y las operaciones pueden sobrepasar la capacidad
de clculo existente. Sin embargo, utilizando los axiomas de la probabilidad y las
siguientes propiedades, se podrn expresar las probabilidades de estos eventos
en trminos de los eventos elementales que lo componen, siempre y cuando se
conozcan las probabilidades de stos.
Veamos la probabilidad de una unin de eventos, la cual la podremos calcular
de la siguiente manera:
Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es
igual a la suma de las probabilidades de ocurrencia de A y de B, menos la
probabilidad de que ocurran A y B simultneamente. Es decir,
P(AB) = P(A) + P(B) - P(AB)
Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene:
Propiedad 2. Si dos eventos, A y B, son mutuamente excluyentes entonces la
probabilidad de que ocurra A o B es igual a la suma de las probabilidades de
ocurrencia de A y de B. Es decir
P(AB) = P(A) + P(B)
Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad
del complemento de un evento E, que denotaremos como ~E:
Propiedad 3. Si E es un evento y ~E su complemento, entonces
P(~E) = 1 - P(E)
Retomando los conceptos de eventos dependientes o condicionales, se va a
definir la probabilidad condicional como sigue:
Propiedad 4. La probabilidad de que ocurra un evento A dado que ocurri el
evento B (el evento A depende del evento B), denotado P(A|B), es:
Hay que notar que esta propiedad no es conmutativa, situacin que s ocurre con
la probabilidad de unin o la interseccin de eventos, por lo que no hay que
confundir P(A|B) y P(B|A).
Finalmente, el criterio para la independencia de eventos queda como sigue:
Propiedad 5. Dos eventos A y B son independientes si y slo si
P(A|B) = P(A) y P(B|A) = P(B)
o, que es lo mismo:
P(AB) = P(A) P(B)
1.10 Teorema de bayes
Teorema de Bayes
Si los sucesos Ai son una particin y B un suceso tal que p(B) 0 _
Demostracin
Aplicaciones
Diagnstico mdico (en general clasificaciones no biunvocas): El diagnstico
consiste en establecer la enfermedad de un paciente, a partir de una serie de
sntomas. Pero los sntomas y las enfermedades no estn ligados de un modo
biunvoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E2 :cncer de pulmn; E3: bronquitis obstructiva; etc.
y Si a los sntomas y sndromes asociados con las mismas.
S1: tos; S2: estado febril; S3: hemotisis; etc.
La informacin accesible en los libros de patologa, o en un archivo de historias
clnicas es del tipo.
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc.
y lo mismo para las dems enfermedades.
En trminos de probabilidad condicionada, esta informacin es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc.
para diagnosticar la tuberculosis se ha de evaluar, para los sntomas que presenta
el paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las
enfermedades forman una particin (son mutuamente excluyentes y se consideran
todas las enfermedades compatibles con el sntoma) y se conocen sus
prevalencias.
Ntese que un mismo conjunto de sntomas podra dar lugar a un diagnstico
diferente en poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnsticas: Supngase una prueba diagnstica, por ejemplo nivel de
glucosa en sangre, en ayunas, para diagnosticar la diabetes. Se considera que la
prueba es positiva si se encuentra un nivel por encima de un cierto valor, digamos
120 mg/l.
Para evaluar la prueba, (habr que hacerlo para distintos valores de corte) se
somete a la misma a una serie de individuos diabticos diagnosticados por otro
procedimiento (el patrn de oro o "gold standar") y a una serie de individuos no
diabticos. Los resultados se pueden representar en una tabla de doble entrada


Patrn de oro



NE E
Prueba
- a b r
+ c d s

t u
Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se denomina
coeficiente falso-positivo (CFP) al cociente c/t, y es una estimacin de la
probabilidad condicionada p(+|NE), se denomina coeficiente falso-negativo (CFN)
al cociente b/u, y es una estimacin de la probabilidad condicionada p(-|E). Estos
dos coeficientes cuantifican los dos errores que la prueba puede cometer y
caracterizan a la misma. Simtricamente, los coeficientes que cuantifican los
aciertos son la sensibilidad, p(+|E), y la especificidad p(-|NE).
Cuando la prueba se usa con fines diagnsticos (o de "screening") interesa
calcular p(E|+) y/o p(NE|-).
Como E y NE son una particin, usando el Teorema de Bayes
y
Ntese que ambas dependen de la prevalencia de la enfermedad: una prueba
diagnstica que funciona muy bien en la clnica Mayo, puede ser intil en el
Hospital Ramn y Cajal.
Ejemplo 9:
una prueba diagnstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si
la prevalencia de la diabetes en la poblacin donde se usa es del 7% cul es la
probabilidad de que sea diabtico un individuo en el que la prueba d positiva? y
de que no lo sea uno en el que d negativo?
p(+|NE) = 0,04 p(-|NE) = 0,96 _
p(-|E) = 0,05 p(+|E) = 0,95 _
p(E) = 0,07 p(NE) = 0,93 _
y
Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y
p(NE), sern la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y
p(NE|-) si dio negativa.
Teorema de Bayes.
En el ao 1763, dos aos despus de la muerte de Thomas Bayes (1702-1761),
se public una memoria en la que aparece, por vez primera, la determinacin de la
probabilidad de las causas a partir de los efectos que han podido ser observados.
El clculo de dichas probabilidades recibe el nombre de teorema de Bayes.
Sea A1, A2, ...,An un sistema completo de sucesos, tales que la probabilidad de
cada uno de ellos es distinta de cero, y sea B un suceso cualquier del que se
conocen las probabilidades condicionales P(B/Ai). entonces la probabilidad P(Ai/B)
viene dada por la expresin:
En los problemas relacionados con la probabilidad, y en particular con la
probabilidad condicionada, as como con la probabilidad total y el teorema de
Bayes, es aconsejable que, con la informacin del problema, construyas una tabla
de contingencia o un diagrama de rbol.
El teorema de Bayes parte de una situacin en la que es posible conocer las
probabilidades de que ocurran una serie de sucesos Ai.
A esta se aade un suceso B cuya ocurrencia proporciona cierta informacin,
porque las probabilidades de ocurrencia de B son distintas segn el suceso Ai que
haya ocurrido.
Conociendo que ha ocurrido el suceso B, la frmula del teorema de Bayes nos
indica como modifica esta informacin las probabilidades de los sucesos Ai.
Ejemplo: Si seleccionamos una persona al azar, la probabilidad de que sea
diabtica es 0,03. Obviamente la probabilidad de que no lo sea es 0,97.
Si no disponemos de informacin adicional nada ms podemos decir, pero
supongamos que al realizar un anlisis de sangre los niveles de glucosa son
superiores a 1.000 mg/l, lo que ocurre en el 95% de los diabticos y slo en un 2%
de las personas sanas.
Cul ser ahora la probabilidad de que esa persona sea diabtica?
La respuesta que nos d el teorema de bayes es que esa informacin adicional
hace que la probabilidad sea ahora 0,595.
Vemos as que la informacin proporcionada por el anlisis de sangre hace pasar,
la probabilidad inicial de padecer diabetes de 0,03, a 0,595.
Evidentemente si la prueba del anlisis de sangre hubiese sido negativa, esta
informacin modificara las probabilidades en sentido contrario. En este caso la
probabilidad de padecer diabetes se reducira a 0,0016.
Es una consecuencia del teorema de las probabilidades totales.
Sea el conjunto total formado por una particin (coleccin de sucesos con
interseccin vaca dos a dos).
Ahora el inters se centrar en la obtencin de la probabilidad de cualquier suceso
de la particin condicionada a un suceso A cualquiera.
El resultado ser :
que es conocido como teorema o regla de Bayes.
Unidad II. Variables aleatorias y distribuciones
2.1 variable aleatoria y funciones de distribucin
FUNCION DE DISTRIBUCION
Definicin: Dado un espacio de probabilidad oe , y una variable
aleatoria X definida sobre l, la funcin de distribucin de X, que ser
denotada por FX, est definida por
para cada nmero real a.
Ejemplo: Sean las funciones X, Y, Z definidas sobre el campo de
probabilidad asociado al experimento aleatorio que se considere:
1) Sea X el nmero de mujeres en una comisin conformada por tres
personas, seleccionadas al azar de un grupo de 5 personas, entre las
cuales hay dos mujeres.
2) Sea Y el nmero de caras obtenidas al tirar dos veces sucesivas una
moneda.
3) Sea Z el nmero de una ficha que se seleccione al azar de un grupo de
tres fichas numeradas 0,1, 2.
Sean las variables X, Y, Z de acuerdo a la definicin de funcin de
distribucin, que
a) Si a < 0 no hay eventos elementales que por X se apliquen sobre
nmeros negativos con lo cual es
b) Si 0 a < 1, entonces tenemos en [ X a ] todas las comisiones de tres
personas entre las cuales haya cero mujeres, con probabilidad 1/10, sto es
FX (a) = 1/10 para 0 a < 1
c) Si 1 a < 2, entonces tenemos que considerar todas las comisiones con
una o ninguna mujer, las cuales se dan con probabilidad 7/10, es decir
FX (a) = 7/10 para 1 a < 2
d) Siendo a un nmero real cualquiera puede, finalmente, satisfacer la
desigualdad a 2 y entonces debemos considerar comisiones conformadas
por cualquier nmero de mujeres en el experimento en cuestin,
obtenindose
FX (a) = 1 para a 2
Resumiendo los resultados obtenidos, tenemos que la funcin de
distribucin de X est dada por
En forma similar tendremos para las variables aleatorias Y, Z
Las funciones de distribucin de nuestras variables aleatorias X, Y, Z, las
determinan completamente pues describen su comportamiento, con
relacin a sus valores, en trminos de probabilidad y, en este ejemplo
comprobamos que a pesar de tener el mismo recorrido, el comportamiento
de estas variables es diferente. Sin embargo, puede ocurrir que dos o ms
variables aleatorias diferentes tengan no slo el mismo recorrido, sino
tambin la misma funcin de distribucin.
2.2 Valor esperado y momentos
Valor esperado o esperanza matemtica
Sea X una v.a. discreta. Se denomina esperanza matemtica de X o valor
esperado, y se denota bien o bien , a la cantidad que se expresa como:
donde es el conjunto numerable de ndices de los valores que puede tomar la
variable (por ejemplo para un nmero finito de valores de la v.a. o
bien para una cantidad infinita numerable de los mismos.
Si X es una v.a. continua, se define su esperanza a partir de la funcin de
densidad como sigue:
Observacin
Recordamos que si
y por tanto tiene sentido calcular su esperanza matemtica:
Por las analogas existente entre la definicin de media aritmtica y esperanza
matemtica, las propiedades de linealidad de la primera se trasladan a la segunda,
como es inmediato comprobar:

2.3 Distribuciones discretas
Propiedades de la Funcin de Distribucin
La funcin de distribucin de una variable aleatoria adems de estar bien
definida, pues est definida en trminos de la funcin probabilidad la cual
es una funcin definida axiomticamente, tiene las propiedades que se dan
a travs de los siguientes teoremas.
Teorema: La funcin de distribucin es no decreciente.
Teorema: Para toda funcin de distribucin FX se cumple
Teorema: Toda funcin de distribucin es continua por la derecha.
Teorema: Toda funcin de distribucin es continua por la derecha.
Ejemplo: Para la funcin h (x) definida por
se tiene
a) h (x) toma valores sobre una recta con pendiente o toma valores sobre
el eje x, o sobre una recta paralela al eje x, por lo que podemos afirmar que
es una funcin no decreciente.
b) y dado que para se tiene
c) lo que implica
d) En cada punto, interior a un intervalo de definicin, h(x) toma valores
sobre una recta, es decir es una funcin lineal y, por lo tanto, es contnua.
En los puntos "crticos" se tiene, considerando un nmero k > 0 que
de lo que podemos afirmar que h (x) no slo es continua por la derecha,
sino que es continua en cada punto real.
Como h (x) satisface las condiciones de una funcin de distribucin, ella es
una funcin de distribucin y podra ser asignada como tal a cualquier
variable aleatoria X cuyo recorrido sea el intervalo .
Como consecuencia de su definicin y de sus propiedades, para la funcin
de distribucin FX se satisfacen adems las propiedades establecidas en el
siguiente teorema.
Teorema: Dada una variable aleatoria X con funcin de distribucin FX,
entonces
a) para todo par de nmeros reales a < b.
b) Para todo nmero real a es
donde
Ejemplo: Si consideramos la variable aleatoria X del 3.8, para la cual es
vemos que FX es continua en todo punto real que no pertenezca al
conjunto {0, 1, 2}, por lo que ser
para todo a real tal que
Adems es
puesto que si > 0 entonces FX (- ) = 0. Por otro lado, si > 0 entonces es
1 - < 1, 2 - < 2, con lo cual se obtiene
Si lo que nos interesa es que la variable aleatoria X tome valores en un
cierto intervalo, entonces se tiene, por ejemplo
2.4 Variables aleatorias y distribuciones continuas
Distribucin de Probabilidad de una Variable Aleatoria
Consideremos las variables aleatorias X y Y definidas de la manera
siguiente
X = Nmero de puntos obtenidos al tirar un dado correcto.
Y = Distancia al origen de un punto elegido al azar sobre el segmento [0,1].
cuyas funciones de distribucin estn dadas por :
Observamos que mientras el recorrido de X est constituido por un conjunto
finito, el recorrido de Y es un conjunto infinito no numerable y, que la
funcin de distribucin de X tiene saltos, lo que no ocurre para la funcin de
distribucin de Y. Luego, podemos afirmar que la naturaleza de estas dos
variable aleatorias es diferente.
Estas dos variables aleatorias constituyen ejemplos de dos de las
categoras de variables aleatorias, las cuales se determinan, como
veremos, tomando en cuenta su recorrido y/o su funcin de distribucin. De
acuerdo a sto, las variables aleatorias se clasifican en Discretas,
Absolutamente Continuas y Mixtas. Consideraremos en primer lugar las
discretas.
2.5 Variables Aleatorias Discretas
Definicin: Una variable aleatoria X se dice discreta si su recorrido es un
conjunto contable (finito o infinito numerable) de nmeros reales.
Esta definicin implica que los posibles valores de X, su recorrido RX,
pueden ser listados como x1, x2,...., xn, ..... donde sin prdida de
generalidad, podemos suponer una ordenacin como x1, < x2 < .... < xn <
xn+1 < .... Adems, considerando los eventos de la forma [X = xn] se tiene
que se cumple
y
donde la unin se extiende para todos los valores de n. En consecuencia se
cumple
y para cualquier nmero real a
Por otro lado, por las propiedades de la funcin de distribucin se tiene en
este caso
En conclusin, se tiene que si X es una variable aleatoria discreta con
funcin de distribucin FX, existe otra funcin px a la cual se le denomina
Funcin de Cuanta o Funcin de Densidad Discreta de X, definida por
para lo cual se cumplen las siguientes condiciones
1) R
2)
3)
Las dos primeras condiciones deben ser satisfechas por cualquier funcin
real valorada, cuyo dominio sea un conjunto contable de nmeros reales
para ser una funcin de cuanta, mientras que la satisfaccin de las tres
condiciones determina la funcin de cuanta de una variable aleatoria X
especfica.
El conjunto de pares de la forma (xn, px (xn)) recibe el nombre de
Distribucin de Probabilidad de la Variable Aleatoria Discreta X, y
contiene toda la informacin necesaria para estudiar a esta variable
aleatoria.
Ejemplo: Un fabricante de motores sabe que en un lote de 10 motores, hay
2 motores defectuosos. Cada motor le cuesta 7,500 nuevos soles y lo
puede vender en 10,000 nuevos soles. Al ofrecer el lote a una tienda le
dicen que lo sometern a una prueba que consistir en seleccionar, al azar,
dos motores y probar su funcionamiento. Si no se obtienen motores
defectuosos le compran el lote. En caso contrario, se lo rechazan.
Si X es la ganancia neta que deja el lote al fabricante, se tendr que
X = 10 (10,000 - 7,500) = 25,000 si se vende el lote, y
X = 10 (0 - 7,500) = - 75,000 si le rechazan el lote
luego X es variable aleatoria discreta con
y con dominio
donde d y significa motor defectuoso y motor no defectuoso,
respectivamente.
La funcin de cuanta de X est dada por
puesto que no vende si se encuentra por lo menos un motor defectuoso,
que es el evento contrario de no encontrar defectuosos.
Con los resultados obtenidos, la distribucin de probabilidad de X se
presenta en la siguiente tabla.
X - 75,000 25,000
PX
La definicin de una variable aleatoria absolutamente continua, las
propiedades de la funcin de distribucin de algunas propiedades del
anlisis, llevan a los siguientes resultados:
1) fx es no negativa.
Condicin necesaria para que FX sea una funcin no decreciente.
2)
Resultado que deriva del hecho de que sea y de la definicin
de la integral impropia.
3) FX (x) es continua en todo X real y si fx es continua en x0, entonces FX es
derivable en x0 y se cumple
Resultado justificado por el Teorema Fundamental del Clculo Integral, que
dice "si una funcin real valorada h es integrable en el sentido de Riemann
sobre el intervalo [a, b], entonces la funcin
para todo x [a, b] es continua sobre [a, b] y si h es continua en x0
entonces H(x) es derivable en x0 y se cumple
4) P[x = a] = 0 para cualquier nmero real a.
Como sabemos, en general, se cumple
y, como la continuidad de FX implica la igualdad de FX (a) y el lmite
considerado en esta expresin, se tiene entonces que una variable aleatoria
absolutamente continua toma cada uno de los valores reales, an los de su
recorrido, con probabilidad cero. Teniendo en cuenta el axioma de
aditividad de la funcin probabilidad, se sigue que la probabilidad asignada
a un conjunto contable de puntos en RX es nula.
5) Si a y b son dos nmeros reales tales que a < b, entonces
independientemente de si se incluye o no a la igualdad en los extremos.
Este resultado se sigue de la consideracin de la propiedad de FX que
establece
y del resultado 4 anterior.
Geomtricamente este resultado se interpreta de la siguiente manera: La
probabilidad de que una variable aleatoria absolutamente continua tome
valores en el intervalo de extremos a, b, abierto o cerrado, es el rea bajo la
curva de fX comprendida entre las rectas x= a y x = b.
Observaciones
1) La funcin fX no es en s una probabilidad, pero s es la densidad de
probabilidad en cada punto y para un intervalo infinitesimal de amplitud dx
se tiene
2) Los resultados 1 y 2 constituyen condicin necesaria y suficiente para
que una funcin real valorada cualquiera sea una funcin de densidad de
probabilidad.
3) Una variable aleatoria X es, entonces, absolutamente continua si su
funcin de distribucin es continua y derivable con primera derivada
continua en todo punto del eje real, salvo un conjunto a lo ms infinito
numerable de puntos. Esta primera derivada es la funcin de densidad de
probabilidad de X.
4) De la observacin anterior se sigue que la funcin de densidad de
probabilidad fX puede ser discontinua en algunos puntos y, eventualmente,
podra hacerse infinita en algn punto. Dado la validez del resultado 2, se
tiene que:
- Si RX es un intervalo de longitud infinita, fX tiende a cero cuando x crece y
definidamente sobre RX.
- Si fX (x0) es infinita, la integral
tiende a cero cuando a y b tienden independientemente a cero.
Ejemplo: Dada la variable aleatoria X cuya funcin de distribucin est dada
por
se quiere saber si X tiene una distribucin absolutamente continua.
En primer lugar debemos estudiar la continuidad de FX, para lo cual bastar
con estudiar los puntos donde FX cambia su expresin funcional, pues en
los intervalos comprendidos entre dos de estos puntos la funcin es lineal y,
por ende, continua en cada punto.
As tenemos que
de donde podemos afirmar que FX tiene un punto de discontinuidad en a = -
2 y sto es suficiente para afirmar que X no es una variable aleatoria
absolutamente continua.
2.6 Distribuciones especiales de probabilidad para una variable
aleatoria continua: Distribucin uniforme, exponencial, normal y
normal estandar
Variables Aleatorias Mixtas
Definicin: Una variable aleatoria X es mixta si su funcin de distribucin
es de la forma
donde F1 es la funcin de distribucin de una variable aleatoria discreta y F2
es la funcin de distribucin de una variable aleatoria absolutamente
continua y es un nmero comprendido entre 0 y 1.
Si R1 es el recorrido para la variable aleatoria con F1 y R2 es el recorrido
para la variable aleatoria correspondiente a F2, entonces se tiene RX = R1
R2, y como la probabilidad de cada uno de los puntos de R2 es nula, se
tiene:
Como ilustraremos a continuacin, en el ejemplo tenemos un caso de
variable mixta.
Ejemplo: Para la variable aleatoria X cuya funcin de distribucin es
se cumple
para todo nmero real a, si se define
Como ya sabemos, la funcin de distribucin de una variable aleatoria
cualquiera, contiene toda la informacin con respecto a la variable aleatoria
y, por lo tanto, las variables aleatorias mixtas sern estudiadas en trminos
de su funcin de distribucin. Sin embargo, es muy til expresar a sta,
como una combinacin lineal convexa de una funcin de distribucin
discreta y una funcin de distribucin absolutamente continua.
Unidad 3 Estadstica descriptiva y Teora de muestreo
3.1Distribuciones de frecuencia, de frecuencia relativa y frecuencia
acumulada
Distribucin de Frecuencias
Cuando la informacin que se tiene es un gran volumen, resulta muy conveniente
ordenar y agrupar los datos para manejarlos de acuerdo a la distribucin de
frecuencias la cual consiste en agrupar los datos en clases o categoras que
estarn definidas por un lmite mnimo y uno mximo de variacin, mostrando en
cada clase el nmero de elementos que contiene o sea la frecuencia.
Otra forma comn para estudiar la disposicin espacial de los individuos de una
poblacin consiste en comparar la distribucin de frecuencias observadas en un
muestreo basado en cuadrculas, con las frecuencias esperadas dada una
distribucin terica (e.g. la de Poisson). Las frecuencias estn referidas al nmero
de oportunidades en las cuales se obtiene un nmero determinado de individuos
en una cuadrcula. Si en un estudio observamos los siguientes resultados:
4 5 4 6 7 1 5 2 2 4 4 3
donde cada nmero representa el nmero de individuos contados en una
cuadrcula, tendremos que la frecuencia con la cual se obtiene 1 individuo es 1/12
(siendo n = 12 el total de cuadrculas), la frecuencia de 2 individuos es 2/12, la de 3
= 1/12, la de 4 = 4/12, la de 5 = 2/12, la de 6 = 1/12, la de 7 = 1/12, mientras que la
de 8 individuos en adelante es 0/12. Una frecuencia es as una proporcin con la
cual ocurre un determinado evento. El conjunto de estas proporciones permite
grficamente formar una distribucin de frecuencias. La distribucin de las
frecuencias obtenidas anteriormente se observa en la siguiente figura:
Para analizar si los individuos de la poblacin bajo estudio se distribuyen de
acuerdo a un determinado patrn hipottico, se estima un valor conocido como la
bondad del ajuste de la distribucin observada a la distribucin terica. La bondad
de un ajuste est referida a cun prximas se encuentran las dos distribuciones a
ser comparadas, entendiendo como proximidad las diferencias numricas
existentes en cada uno de los eventos posibles (eje X de la figura anterior). Cuanto
mayor sea la suma de estas diferencias, menor ser la bondad del ajuste. El
estadstico de prueba ms corrientemente empleado para estimar la bondad de un
ajuste es:
El cual se distribuye segn una _
2
(chi- cuadrada), con (n - nmero de parmetros
obtenidos de los datos) grados de libertad, con n = nmero de eventos (clases de
frecuencia). Si este estadstico es mayor que el valor tabulado un nivel de
significancia , se rechaza la hiptesis nula de que la distribucin observada es
igual a la distribucin terica.
Cmo se utiliza este procedimiento para estimar la disposicin espacial de un
conjunto de individuos? Partiendo del hecho de que tenemos un conjunto de
cuentas de ocurrencias en n cuadrculas, el trabajo consiste en hallar las
distribuciones tericas que mejor parezcan corresponder a nuestros datos. Luego,
se estudia la bondad del ajuste de los valores predichos por tales distribuciones a
los observados, y la que mejor se ajuste (aquella que resulte en un mnimo de
diferencias no significativas) es la que mejor representa la disposicin espacial de la
poblacin (Fig. 3).
Figura 3: Representacin grfica de la distribucin de frecuencias del ejemplo
al ser comparada con una distribucin de Poisson para verificar la bondad del
ajuste.
El resultado de aplicar este procedimiento es la obtencin de un modelo que explica
la disposicin espacial de los individuos de la poblacin. El mejor modelo, como
hemos insistido, es aquel que representa la ubicacin exacta de cada individuo
sobre el espacio (deja de ser un modelo para convertirse en un mapa). Sin
embargo, la obtencin del mismo tiene inconvenientes metodolgicos importantes
en la mayora de los casos. De esta manera, la bondad de ajuste consiste en
explorar un universo de infinitas posibles distribuciones estadsticas para encontrar
la que mejor se adapta a los resultados.
Cmo llevar a cabo esta bsqueda? En la aplicacin tradicional de las tcnicas
para el estudio de la disposicin espacial, la bsqueda no es demasiado intensiva, y
comprende generalmente slo dos distribuciones tericas: la Poisson y la binomial
negativa. La primera, como hemos visto, representa un conjunto de frecuencias de
eventos que ocurren al azar, mientras que la segunda es representativa de un
patrn de disposicin espacial agregado. Las disposiciones uniformes son tan
frecuentes en la literatura como en la naturaleza, habiendo recibido muy poca
atencin. De esta manera, un procedimiento conveniente al ajustar distribuciones a
datos consiste en: (1) probar si las observaciones se desvan significativamente de
un patrn aleatorio, mediante cualquiera de las tcnicas vistas hasta el momento, y
(2) en caso negativo, ajustar la distribucin de frecuencias observadas a una
distribucin binomial negativa. Veamos, paso a paso:
1. Ajuste de datos a una distribucin de Poisson:
Consideremos los siguientes datos, tomados de Krebs (1989):
0;0;0;0;0;0;1;1;1;1;1;1;1;1;2;2;2;2;2;2;2;2;2;3;3;3;3;3;3;4;4;4;4;4;4;5;5;7;7;7;8;9;9;9;9
En el conjunto, n = 50, y la media muestral = 3,46. La siguiente tabla muestra las
frecuencias observadas para cada evento. La divisin de cada frecuencia entre n
resulta en las frecuencias relativas de cada uno de los eventos, sobre el total.
Nmero de
individuos en
una
cuadrcula, x
Nmero de
cuadrculas
con x
individuos
0 6
1 8
2 9
3 6
4 6
5 2
6 5
7 3
8 1
9 4
Aplicando la ecuacin de Poisson (ver pgina anterior), podemos calcular las
frecuencias esperadas:
P0 = proporcin de cuadrculas con 0 individuos (equivalente a la probabilidad de
que una cuadrcula tenga 0 individuos) = e
-3,46
(3,46
0
/0!)=0,0314
P1 = proporcin de cuadrculas con 1 individuo = e
-3,46
(3,46
1
/1!)=0,1087
P2 = e
-3,46
(3,46
2
/2!)=0,1881
P3 = e
-3,46
(3,46
3
/3!)=0,2170
P4 = e
-3,46
(3,46
4
/4!)=0,1877
P5 = 0,1299
P6 = 0,0749
P7 = 0,0370
P8 = 0,0160
P9 = 0,0062
Para obtener las frecuencias esperadas segn la distribucin de Poisson, slo hace
falta multiplicar cada proporcin por el nmero total de cuadrculas muestreadas,
n=50. La siguiente tabla muestra los clculos de frecuencias observadas,
esperadas y del estadstico _
2
para cada x.
x Frec. Obs. Frec. Esp.
(Frec. Obs. - Frec. Esp.)
2
Frec. Esp.
0 6 1,57 12,50
1 8 5,44 1,20
2 9 9,41 0,019
3 6 10,85 2,18
4 6 9,39 1,22
5 2 6,50 3,12
6 5 3,75 0,42
7 3 1,85 0,72
8 1 0,80 0,050
9 4 0,31 43,92
>9 0 0,155 0,155
= 65,51
En este punto, cabe hacer mencin de dos consideraciones adicionales. En primer
lugar, puede notarse que fue aadida una clase de frecuencia adicional, para el
caso en el que el nmero de cuentas en cuadrculas es mayor que 9. Esto se debe
a que las frecuencias esperadas deben sumar 1, en forma de proporciones, o 50, el
nmero total de cuadrculas. La frecuencia esperada en este caso fue calculada
restando las frecuencias restantes a la unidad, resultando en 0,0031. La otra
consideracin es que suele recomendarse para la prueba chi-cuadrada que el
nmero de cuentas en una clase no sea inferior a 3 (o a 5, segn el autor). Aunque
en este espacio se han incluido las frecuencias tal y como fueron obtenidas para
fines ilustrativos, es preferible en la prctica que las clases de frecuencia sean
agrupadas con el fin de que se cumpla esta regla. Se han desarrollado pruebas
ms potentes que la chi- cuadrada para resolver este problema, las cuales pueden
ser consultadas por el lector en la literatura disponible.
El nmero de grados de libertad para esta prueba es =11-2=9, ya que slo se
obtuvieron de los datos la media y el nmero de cuadrculas. El valor crtico de _
para estos grados de libertad y =0,05 es 16,92, y por lo tanto se rechaza la
hiptesis nula de que la poblacin se dispone espacialmente segn una Poisson.
Dado que la varianza de los datos es 7,356 y la media 3,46, el cociente entre estas
dos variables (2,13) indica que la poblacin presenta algn grado de agregacin.
Por lo tanto pasamos a evaluar el ajuste de los datos a una distribucin binomial
negativa.
2. Ajuste de datos a una distribucin binomial negativa:
La binomial negativa (Fig. 4) es la distribucin estadstica de uso ms generalizado
para el modelaje de poblaciones agregadas, llegndose incluso en ocasiones a
tratar a ambas distribuciones (espacial y estadstica) como sinnimos. Al igual que
la de Poisson, la binomial negativa es una distribucin de frecuencias discretas,
siendo su forma matemtica:
donde Px la probabilidad de observar una cuadrcula con x individuos, la media '
de la distribucin, k el exponente de la binomial negativa y la funcin Gamma. '
Figura 4: Representacin grfica de la distribucin de frecuencias de una
binomial negativa con =10 y k=2,5 (n=100). '
La binomial negativa est determinada por dos parmetros, k y p, relacionados a la
media por cuanto =kp. El parmetro k suele ser visto como una medida de '
agregacin, considerndose que mientras menor su valor, mayor la agregacin. De
esta manera, el enfoque tradicional plantea que ajustar una distribucin binomial a
un patrn de disposicin espacial consiste en encontrar un valor de k que, dada una
media muestral, permita modelar cualquier patrn de agregacin como una de las
infinitas formas de la binomial negativa.
Para facilitar los clculos de frecuencias esperadas segn la binomial negativa, se
tiene la siguiente serie de frmulas:
Para la estimacin de k, se emplean ciertas reglas que el lector puede consultar en
la bibliografa recomendada. Los procedimientos varan segn el nmero de
cuadrculas con ningn individuo y la media muestral, y en muchos casos estn
basados en procedimientos iterativos por ensayo y error, partiendo de un k
aproximado, obtenido a partir de la varianza de la distribucin:
2
= +( ' '
2
/k):
Para el ejemplo que venimos desarrollando, esta primera aproximacin de k es
3,07, la cual se transforma en 2,65 tras la aplicacin de uno de los procedimientos
de ensayo y error disponibles. La utilizacin de este valor de k en las frmulas para
el clculo de las frecuencias esperadas origina los resultados presentados en la
tabla a continuacin:
x Frec. Obs. Frec. Esp.
(Frec. Obs. - Frec. Esp.)
2
Frec. Esp.
0 6 5,47 0,051
1 8 8,20 0,0049
2 9 8,47 0,033
3 6 7,44 0,28
4 6 5,95 0,00042
5 2 4,48 1,37
6 5 3,23 0,97
7 3 2,26 0,24
8 1 1,54 0,19
9 4 1,04 8,42
>9 0 1,91 1,91
= 13,43
Los grados de libertad para la prueba chi-cuadrada son, al igual que en el caso
anterior igual al nmero de clases de frecuencia utilizadas menos el nmero de
parmetros estimados a partir de los datos. En este caso se estimaron tres
parmetros, correspondientes a la media, el nmero de muestras y k. Por lo tanto,
buscamos el valor crtico para la distribucin con 8 grados de libertad, para un valor
de =0,05, el cual es 15,51. Concluimos que el patrn de disposicin espacial se
distribuye segn una binomial negativa. Empleando la relacin convencional entre
distribuciones, concluimos que el patrn de disposicin es agregado.
3.2Medidas de tendencia central: media, mediana, moda, promedio
(ponderado, mvil) media geomtrica, armnica, cuantiles (cuartiles,
deciles y percentiles)
Los fenmenos biolgicos no suelen ser constantes, por lo que ser necesario que
junto a una medida que indique el valor alrededor del cual se agrupan los datos,
se asocie una medida que haga referencia a la variabilidad que refleje dicha
fluctuacin.
En este sentido pueden examinarse varias caractersticas, siendo las ms
comunes:
La tendencia central de los datos;
La dispersin o variacin con respecto a este centro;
Los datos que ocupan ciertas posiciones.
La simetra de los datos.
La forma en la que los datos se agrupan.

Figura: Medidas representativas de un conjunto de datos
estadsticos
A lo largo de este captulo, y siguiendo este orden, iremos estudiando los
estadsticos que nos van a orientar sobre cada uno de estos niveles de
informacin: valores alrededor de los cuales se agrupa la muestra, la mayor o
menor fluctuacin alrededor de esos valores, nos interesaremos en ciertos valores
que marcan posiciones caractersticas de una distribucin de frecuencias as como
su simetra y su forma.
1.4.1 MEDIA, MEDIA PONDERADA
La media aritmtica de una variable estadstica es la suma de todos sus posibles
valores, ponderada por las frecuencias de los mismos. Es decir, si la tabla de
valores de una variable X es
X
ni fi
x1 n1 f1
... ... ...
xk nk fk
la media es el valor que podemos escribir de las siguientes formas equivalentes:
Si los datos no estn ordenados en una tabla, entonces
La media tiene las siguientes caractersticas:
Es el centro de gravedad de la distribucin y es nica para cada
distribucin.
Cuando aparecen valores extremos y poco significativos (demasiado
grandes o demasiado pequeos), la media puede dejar de ser representativa.
No tiene sentido en el caso de una variable cualitativa ni cuando existen
datos agrupados con algn intervalo no acotado.
Para variables agrupadas, los xi sern las marcas declase de cada
intervalo.
Adems, la media cumple las siguientes propiedades:
Si se suma una constante a todos los valores, la media aumenta en dicha
constante.
Si se multiplican todos los valores de la variable por una constante, la
media queda multiplicada por dicha constante.
Observacin
Hemos supuesto implcitamente en la definicin de media que tratbamos con una
variable X discreta. Si la variable es continua tendremos que cambiar los valores
de xi por las marcas de clase correspondientes. En general, la media aritmtica
obtenida a partir de las marcas de clase ci, diferir de la media obtenida con los
valores reales, xi. Es decir, habr una perdida de precisin que ser tanto mayor
cuanto mayor sea la diferencia entre los valores reales y las marcas de clase, o
sea, cuanto mayores sean las longitudes ai, de los intervalos.
Proposicin
La suma de las diferencias de la variable con respecto a la media es nula, es
decir,
Demostracin
Basta desarrollar la sumatoria para obtener
Este resultado nos indica que el error cometido al aproximar un valor cualquiera de
la variable, por ejemplo x1, mediante el valor central , es compensado por los
dems errores:
Si los errores se consideran con signo positivo, en este caso no pueden
compensarse. Esto ocurre si tomamos como medida de error alguna de las
siguientes:
que son cantidades estrictamente positivas si algn .
Ejemplo
Obtener las desviaciones con respecto a la media en la siguiente distribucin y
comprobar que su suma es cero.
li-1 - li ni
0 - 10 1
10 - 20 2
20 - 30 4
30 - 40 3
Solucin:
li-1 - li ni xi xi ni
0 - 10 1 5 5 -19 -19
10 - 20 2 15 30 -9 -18
20 - 30 4 25 100 +1 +4
30 - 40 3 35 105 +11 +33
n=10
La media aritmtica es:
Como se puede comprobar sumando los elementos de la ltima columna,
Medias generalizadas
En funcin del tipo de problema varias generalizaciones de la media pueden ser
consideradas. He aqu algunas de ellas aplicadas a unas observaciones x1, ..., xn:
La media geomtrica
, es la media de los logaritmos de los valores de la variable:
Luego
Si los datos estn agrupados en una tabla, entonces se tiene:
La media armnica
, se define como el recproco de la media aritmtica de los recprocos, es
decir,
Por tanto,
La media cuadrtica
, es la raz cuadrada de la media aritmtica de los cuadrados:
MEDIANA
Consideramos una variable discreta X cuyas observaciones en una tabla
estadstica han sido ordenadas de menor a mayor. Llamaremos mediana, Medal
primer valor de la variable que deja por debajo de s al de las observaciones.
Por tanto, si n es el nmero de observaciones, la mediana corresponder a la
observacin [n/2]+1, donde representamos por la parte entera de un nmero.

En el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la
frmula de la mediana se complica un poco ms (pero no demasiado): Sea (li-1,li] el
intervalo donde hemos encontrado que por debajo estn el de las
observaciones. Entonces se obtiene la mediana a partir de las frecuencias
absolutas acumuladas, mediante interpolacin lineal (teorema de Thales).
Observacin
La relacin Corresponde a definir para cada posible observacin, , su
frecuencia relativa acumulada, F(x), por interpolacin lineal entre los valores F(lj-1)
= Fj-1 y F(lj) = Fj de forma que
Figura: Clculo geomtrico de la mediana
De este modo, Med es el punto donde . Esto equivale a decir que la
mediana divide al histograma en dos partes de reas iguales a .
Observacin
Entre las propiedades de la mediana, vamos a destacar las siguientes:
Como medida descriptiva, tiene la ventaja de no estar afectada por las
observaciones extremas, ya que no depende de los valores que toma la
variable, sino del orden de las mismas. Por ello es adecuado su uso en
distribuciones asimtricas.
Es de clculo rpido y de interpretacin sencilla.
A diferencia de la media, la mediana de una variable discreta es siempre un
valor de la variable que estudiamos (ej. La mediana de una variable nmero de
hijos toma siempre valores enteros).
Si una poblacin est formada por 2 subpoblaciones de medianas Med1 y
Med2, slo se puede afirmar que la mediana, Med, de la poblacin est
comprendida entre Med1 y Med2
El mayor defecto de la mediana es que tiene unas propiedades
matemticas complicadas, lo que hace que sea muy difcil de utilizar en
inferencia estadstica.
Es funcin de los intervalos escogidos.
Puede ser calculada aunque el intervalo inferior o el superior no tenga
lmites.
La suma de las diferencias de los valores absolutos de n puntuaciones
respecto a su mediana es menor o igual que cualquier otro valor. Este es el
equivalente al teorema de Knig (proposicin 2.1) con respecto a la media,
pero donde se considera como medida de dispersin a:
Ejemplo
Sea X una variable discreta que ha presentado sobre una muestra las
modalidades
Si cambiamos la ltima observacin por otra anormalmente grande, esto no afecta
a la mediana, pero si a la media:
En este caso la media no es un posible valor de la variable (discreta), y se ha visto
muy afectada por la observacin extrema. Este no ha sido el caso para la
mediana.
Ejemplo
Obtener la media aritmtica y la mediana en la distribucin adjunta. Determinar
grficamente cul de los dos promedios es ms significativo.
li-1 - li ni
0 - 10 60
10 - 20 80
20 - 30 30
30 - 100 20
100 - 500 10
Solucin:
li-1 - li ni ai xi xi ni Ni
0 - 10 60 10 5 300 60 60
10 - 20 80 10 15 1.200 140 80
20 - 30 30 10 25 750 170 30
30 - 100 20 70 65 1.300 190 2,9
100 - 500 10 400 300 3.000 200 0,25
n=200
La media aritmtica es:
La primera frecuencia absoluta acumulada que supera el valor n/2=100 es Ni=140.
Por ello el intervalo mediano es [10;20). As:
Para ver la representatividad de ambos promedios, realizamos el histograma de la
figura 2.3, y observamos que dada la forma de la distribucin, la mediana es ms
representativa que la media.

Figura: Para esta distribucin de frecuencias es ms
representativo usar como estadstico de tendencia central la
mediana que la media.
MODA
La moda se suele definir como el valor ms frecuente. En el caso de una variable
no agrupada, es el valor de la variable que ms se repite. En el caso de una
variable agrupada por intervalos de igual amplitud se busca el intervalo de mayor
frecuencia (intervalo o clase modal) y se aproxima la moda por el valor obtenido al
aplicar la frmula
donde:
Li-1 es el lmite inferior del intervalo modal.
ni es la frecuencia absoluta del intervalo modal.
ni-1 es la frecuencia absoluta del intervalo anterior al intervalo modal.
ni+1 es la frecuencia absoluta del intervalo posterior al intervalo modal.
ci es la amplitud del intervalo.
La moda cumple que
Puede ser que exista ms de una moda. En dicho caso, se dice que la
distribucin es bimodal, trimodal, ..., segn el nmero de valores que presentan
la mayor frecuencia absoluta.
La moda es menos representativa que la media, a excepcin de las
distribuciones con datos cualitativos.
Si los intervalos no tienen la misma amplitud, se busca el intervalo de
mayor densidad de frecuencia (que es el cociente entre la frecuencia absoluta
y la amplitud del intervalo: ) y se calcula con la frmula anterior.
Llamaremos moda a cualquier mximo relativo de la distribucin de frecuencias,
es decir, cualquier valor de la variable que posea una frecuencia mayor que su
anterior y su posterior.

Figura: Clculo geomtrico de la moda
En el caso de variables continuas es ms correcto hablar de intervalos modales.
Una vez que este intervalo, (li-1, li], se ha obtenido, se utiliza la siguiente frmula
para calcular la moda, que est motivada en la figura 2.4:
Observacin
De la moda destacamos las siguientes propiedades:
Es muy fcil de calcular.
Puede no ser nica.
Es funcin de los intervalos elegidos a travs de su amplitud, nmero y
lmites de los mismos.
Aunque el primero o el ltimo de los intervalos no posean extremos inferior
o superior respectivamente, la moda puede ser calculada.
3.3 Medidas de dispersin: Rango o amplitud de variacin, desviacin
media, varianza y desviacin estandar, momentos y courtosis.
Imagina que tenemos 3 conjuntos de personas y nos dicen que en todos los
casos, la media del peso es 55. Significa esto que los tres conjuntos de datos
son iguales o similares? Conseguimos los datos originales y nos encontramos con
que las observaciones son las siguientes:
Grupo 1: 55 55 55 55 55 55 55
Grupo 2: 47 51 54 55 56 59 63
Grupo 3: 39 47 53 55 57 63 71
vemos que, aunque la media es la misma, los conjuntos de datos son muy
diferentes. Fjate si hacemos el diagrama de tallo y hojas lo que obtenemos
5
5
5
5
5
5
5
3 4 5 6 7


9
6
5
4
7 1 3
3 4 5 6 7




7
5
9 7 1 3 1
3 4 5 6 7
Entonces cmo podemos detectar esas diferencias entre los conjuntos de datos?
Parece que las medidas de centralizacin no nos proporcionan informacin
suficiente en muchas situaciones, as que debemos encontrar alguna otra cantidad
que nos diga cmo de lejos estn los datos entre ellos y de la media, es decir, nos
surje la necesidad de medir la dispersin de los datos. Lo primero que vemos es
que en el primer caso todos los datos son iguales, en el segundo hay ms
diferencia entre el mayor y el menor, y en el tercero ms an que en el segundo.
Exactamente tenemos que
55-55=0
63-47=16
71-39=32
A esta cantidad la llamamos rango de los datos. Sin embargo, aunque es muy fcil
de calcular, no se usa demasiado, porque si hay un slo valor muy grande o muy
pequeo, el rango vara mucho, as que no siempre es una medida til. Cmo
podramos encontrar un nmero que nos d una aproximacin de la distancia de
los datos a la media? Pues podemos calcular todas las diferencias (en valor
absoluto) entre las observaciones y la media y luego calcular la media de esas
diferencias. A esta cantidad la llamamos desviacin media. Calculemos la
desviacin media del grupo 2 de datos, tenemos
Sin embargo, habitualmente se usa otra medida de la variabilidad, que responde a
la media de los cuadrados de las desviaciones de los datos respecto a la media,
as conseguimos que las desviaciones mayores influyan ms que las pequeas.
Pero vamos a ver la definicin rigurosa de todos estos conceptos.
RANGO
Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia
entre el valor ms elevado y el valor ms bajo.
VARIANZA
Varianza: Mide la distancia existente entre los valores de la serie y la media. Se
calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamao de la muestra.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms
concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.
COEFICIENTE DE ASIMETRA DE PEARSON
Diremos que una distribucin es simtrica cuando su mediana, su moda y su
media aritmtica coincidan. Claramente las distribuciones de los ejemplos de los
niveles de colinesterasa y del n de hijos no son por tanto, simtricas.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias
(absolutas o relativas) descienden ms lentamente por la derecha que por la
izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha
diremos que la distribucin es asimtrica a la izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias. Aqu
estudiaremos dos de ellas.
a. Coeficiente de Asimetra de Pearson
Se define como:
siendo cero cuando la distribucin es simtrica, positivo cuando existe
asimetra a la derecha y negativo cuando existe asimetra a la izquierda.
En el ejemplo del nmero de hijos Ap es igual a
indicando una ligera asimetra a la izquierda en la distribucin de
frecuencias correspondiente.
De la misma manera, para el ejemplo de los niveles de colinesterasa
tambin se observa una ligera asimetra a la izquierda, al ser
De la definicin se observa que este coeficiente solo se podr utilizar
cuando la distribucin sea unimodal. La otra medida de asimetra que
veremos no presenta este inconveniente
3.4 Muestreo aleatorio: simple, sistemtico, estratificado, por
conglomerados
Introduccin al muestreo.
a. Concepto e importancia
Es la actividad por la cual se toman ciertas muestras de una poblacin de
elementos de los cuales vamos a tomar ciertos criterios de decisin, el muestreo
es importante porque a travs de l podemos hacer anlisis de situaciones de una
empresa o de algn campo de la sociedad.
b. Terminologa bsica para el muestreo
Los nuevos trminos, los cuales son frecuentemente usados en inferencia
estadstica son:
Estadstico:
Un estadstico es una medida usada para describir alguna caracterstica de una
muestra , tal como una media aritmtica, una mediana o una desviacin estndar
de una muestra.
Parmetro:
Una parmetro es una medida usada para describir alguna caracterstica de una
poblacin, tal como una media aritmtica, una mediana o una desviacin estndar
de una poblacin.
Cuando los dos nuevos trminos de arriba son usados, por ejemplo, el proceso de
estimacin en inferencia estadstica puede ser descrito como le proceso de
estimar un parmetro a partir del estadstico correspondiente, tal como usar una
media muestral ( un estadstico para estimar la media de la poblacin (un
parmetro).
Los smbolos usados para representar los estadsticos y los parmetros, en ste y
los siguientes captulos, son resumidos en la tabla siguiente:
Tabla 1
Smbolos para estadsticos y parmetros correspondientes
Medida Smbolo para el estadstico Smbolo para el parmetro
(muestra) (Poblacin)
Media X
Desviacin estndar s
Nmero de elementos n N
Proporcin p P
Distribucin en el muestreo:
Cuando el tamao de la muestra (n) es ms pequeo que el tamao de la
poblacin (N), dos o ms muestras pueden ser extradas de la misma poblacin.
Un cierto estadstico puede ser calculado para cada una de las muestras posibles
extradas de la poblacin. Una distribucin del estadstico obtenida de las
muestras es llamada la distribucin en el muestreo del estadstico.
Por ejemplo, si la muestra es de tamao 2 y la poblacin de tamao 3 (elementos
A, B, C), es posible extraer 3 muestras ( AB, BC Y AC) de la poblacin. Podemos
calcular la media para cada muestra. Por lo tanto, tenemos 3 medias mustrales
para las 3 muestras. Las 3 medias mustrales forman una distribucin. La
distribucin de las medias es llamada la distribucin de las medias mustrales, o la
distribucin en el muestreo de la media. De la misma manera, la distribucin de las
proporciones (o porcentajes) obtenida de todas las muestras posibles del mismo
tamao, extradas de una poblacin, es llamada la distribucin en el muestreo de
la proporcin.
Error Estndar:
La desviacin estndar de una distribucin, en el muestreo de un estadstico, es
frecuentemente llamada el error estndar del estadstico. Por ejemplo, la
desviacin estndar de las medias de todas la muestras posibles del mismo
tamao, extradas de una poblacin, es llamada el error estndar de la media. De
la misma manera, la desviacin estndar de las proporciones de todas las
muestras posibles del mismo tamao, extradas de una poblacin, es llamada el
error estndar de la proporcin. La diferencia entre los trminos "desviacin
estndar" y "error de estndar" es que la primera se refiere a los valores
originales, mientras que la ltima est relacionada con valores calculados. Un
estadstico es un valor calculado, obtenido con los elementos incluidos en una
muestra.
Error muestral o error de muestreo
La diferencia entre el resultado obtenido de una muestra (un estadstico) y el
resultado el cual deberamos haber obtenido de la poblacin (el parmetro
correspondiente) se llama el error muestral o error de muestreo. Un error de
muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la
poblacin, sino que se toma una muestra para estimar las caractersticas de la
poblacin. El error muestral es medido por el error estadstico, en trminos de
probabilidad, bajo la curva normal. El resultado de la media indica la precisin de
la estimacin de la poblacin basada en el estudio de la muestra. Mientras ms
pequeo el error muestras, mayor es la precisin de la estimacin. Deber
hacerse notar que los errores cometidos en una encuesta por muestreo, tales
como respuestas inconsistentes, incompletas o no determinadas, no son
considerados como errores mustrales. Los errores no mustrales pueden
tambin ocurrir en una encuesta completa de la poblacin.
Mtodos de seleccin de muestras.
Una muestra debe ser representativa si va a ser usada para estimar las
caractersticas de la poblacin. Los mtodos para seleccionar una muestra
representativa son numerosos, dependiendo del tiempo, dinero y habilidad
disponibles para tomar una muestra y la naturaleza de los elementos individuales
de la poblacin. Por lo tanto, se requiere una gran volumen para incluir todos los
tipos de mtodos de muestreo.
Los mtodos de seleccin de muestras pueden ser clasificados de acuerdo a:
1. El nmero de muestras tomadas de una poblacin dada para un estudio y
1. La manera usada en seleccionar los elementos incluidos en la muestra. Los
mtodos de muestreo basados en los dos tipos de clasificaciones son
expuestos en seguida.
Mtodos de muestreo clasificados de acuerdo con el nmero de muestras
tomadas de una poblacin.
Bajo esta clasificacin, hay tres tipos comunes de mtodos de muestreo. Estos
son, muestreo simple, doble y mltiple.
Muestreo simple
Este tipo de muestreo toma solamente una muestra de una poblacin dada para el
propsito de inferencia estadstica. Puesto que solamente una muestra es tomada,
el tamao de muestra debe ser los suficientemente grande para extraer una
conclusin. Una muestra grande muchas veces cuesta demasiado dinero y
tiempo.
Muestreo doble
Bajo este tipo de muestreo, cuando el resultado dele estudio de la primera
muestra no es decisivo, una segunda muestra es extrada de la misma poblacin.
Las dos muestras son combinadas para analizar los resultados. Este mtodo
permite a una persona principiar con una muestra relativamente pequea para
ahorrar costos y tiempo. Si la primera muestra arroja una resultado definitivo, la
segunda muestra puede no necesitarse.
Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la
primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una
calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja
una calidad intermedia, ser requerir la segunda muestra. Un plan tpico de
muestreo doble puede ser obtenido de la Military Standard Sampling Procedures
and Tables for Inspection by Attributes, publicada por el Departamento de Defensa
y tambin usado por muchas industrias privadas. Al probar la calidad de un lote
consistente de 3,000 unidades manufacturadas, cuando el nmero de defectos
encontrados en la primera muestra de 80 unidades es de 5 o menos, el lote es
considerado bueno y es aceptado; si el nmero de defectos es 9 o ms, el lote es
considerado pobre y es rechazado; si el nmero est entre 5 y 9, no puede
llegarse a una decisin y una segunda muestra de 80 unidades es extrada del
lote. Si el nmero de defectos en las dos muestras combinadas (incluyendo 80 +
80 = 160 unidades) es 12 o menos, el lote es aceptado si el nmero combinado es
13 o ms, el lote es rechazado.
Muestreo mltiple
El procedimiento bajo este mtodo es similar al expuesto en el muestreo doble,
excepto que el nmero de muestras sucesivas requerido para llegar a una
decisin es ms de dos muestras.
Mtodos de muestreo clasificados de acuerdo con las maneras usadas en
seleccionar los elementos de una muestra.
Los elementos de una muestra pueden ser seleccionados de dos maneras
diferentes:
a. Basados en el juicio de una persona.
b. Seleccin aleatoria (al azar)
Muestreo de juicio
Una muestra es llamada muestra de juicio cuando sus elementos son
seleccionados mediante juicio personal. La persona que selecciona los elementos
de la muestra, usualmente es un experto en la medida dada. Una muestra de
juicio es llamada una muestra probabilstica, puesto que este mtodo est basado
en los puntos de vista subjetivos de una persona y la teora de la probabilidad no
puede ser empleada para medir el error de muestreo, Las principales ventajas de
una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es
bajo.
Muestreo Aleatorio
Una muestra se dice que es extrada al azar cuando la manera de seleccin es tal,
que cada elemento de la poblacin tiene igual oportunidad de ser seleccionado.
Una muestra aleatoria es tambin llamada una muestra probabilstica son
generalmente preferidas por los estadsticos porque la seleccin de las muestras
es objetiva y el error muestral puede ser medido en trminos de probabilidad bajo
la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo
aleatorio simple, muestreo sistemtico, muestreo estratificado y muestreo de
conglomerados.
A. Muestreo aleatorio simple
Una muestra aleatoria simple es seleccionada de tal manera que cada muestra
posible del mismo tamao tiene igual probabilidad de ser seleccionada de la
poblacin. Para obtener una muestra aleatoria simple, cada elemento en la
poblacin tenga la misma probabilidad de ser seleccionado, el plan de muestreo
puede no conducir a una muestra aleatoria simple. Por conveniencia, este mtodo
pude ser reemplazado por una tabla de nmeros aleatorios. Cuando una poblacin
es infinita, es obvio que la tarea de numerar cada elemento de la poblacin es
infinita, es obvio que la tarea de numerar cada elemento de la poblacin es
imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio simple son
necesarias. Los tipos ms comunes de muestreo aleatorio modificado son
sistemtico, estratificado y de conglomerados.
B. Muestreo sistemtico.
Una muestra sistemtica es obtenida cuando los elementos son seleccionados en
una manera ordenada. La manera de la seleccin depende del nmero de
elementos incluidos en la poblacin y el tamao de la muestra. El nmero de
elementos en la poblacin es, primero, dividido por el nmero deseado en la
muestra. El cociente indicar si cada dcimo, cada onceavo, o cada centsimo
elemento en la poblacin va a ser seleccionado.
El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una
muestra sistemtica puede dar la misma precisin de estimacin acerca de la
poblacin, que una muestra aleatoria simple cuando los elementos en la poblacin
estn ordenados al azar.
C. Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la poblacin en
grupos, llamados estratos, que son ms homogneos que la poblacin como un
todo. Los elementos de la muestra son entonces seleccionados al azar o por un
mtodo sistemtico de cada estrato. Las estimaciones de la poblacin, basadas en
la muestra estratificada, usualmente tienen mayor precisin (o menor error
muestral) que si la poblacin entera muestreada mediante muestreo aleatorio
simple. El nmero de elementos seleccionado de cada estrato puede ser
proporcional o desproporcional al tamao del estrato en relacin con la poblacin.
D. Muestreo de conglomerados.
Para obtener una muestra de conglomerados, primero dividir la poblacin en
grupos que son convenientes para el muestreo. En seguida, seleccionar una
porcin de los grupos al azar o por un mtodo sistemtico. Finalmente, tomar
todos los elementos o parte de ellos al azar o por un mtodo sistemtico de los
grupos seleccionados para obtener una muestra. Bajo este mtodo, aunque no
todos los grupos son muestreados, cada grupo tiene una igual probabilidad de ser
seleccionado. Por lo tanto la muestra es aleatoria.
Una muestra de conglomerados, usualmente produce un mayor error muestral
(por lo tanto, da menor precisin de las estimaciones acerca de la poblacin) que
una muestra aleatoria simple del mismo tamao. Los elementos individuales
dentro de cada "conglomerado" tienden usualmente a ser iguales. Por ejemplo la
gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir
en otra rea. No todas las reas son muestreadas en un muestreo de reas. La
variacin entre los elementos obtenidos de las reas seleccionadas es, por lo
tanto, frecuentemente mayor que la obtenida si la poblacin entera es muestreada
mediante muestreo aleatorio simple. Esta debilidad puede reducida cuando se
incrementa el tamao de la muestra de rea.
El incremento del tamao de la muestra puede fcilmente ser hecho en muestra
muestra de rea. Los entrevistadores no tienen que caminar demasiado lejos en
una pequea rea para entrevistar ms familias. Por lo tanto, una muestra grande
de rea puede ser obtenida dentro de un corto perodo de tiempo y a bajo costo.
Por otra parte, una muestra de conglomerados puede producir la misma precisin
en la estimacin que una muestra aleatoria simple, si la variacin de los elementos
individuales dentro de cada conglomerado es tan grande como la de la poblacin.
3.5 Muestreo no aleatorio: dirigido, por cuotas, deliberado
Muestreos no aleatorios
El muestreo no aleatorio, llamado opintico puro, consiste en la eleccin de una muestra segn el
juicio del equipo investigador. Naturalmente, la calidad del muestreo no puede valorarse ni a priori ni
objetivamente, pues depende de los criterios utilizados para escoger a los componentes de la muestra.
A veces, razones de economa y rapidez lo hacen aconsejable. En ocasiones se completa el muestreo
con el denominado sistema de cuotas, que consiste en realizar cierto nmero de encuestas entre
cada uno de los distintos grupos en que se divide el universo. As, se puede exigir que haya X
entrevistas a familias que tengan dos hijos, Y entrevistas a familias que vivan los padres con ellos...
Esas especificaciones se determinan teniendo en cuenta las caractersticas conocidas del universo.
Dentro de este apartado, tenemos el muestreo denominado semialeatorio, consistente en la obtencin
al azar de ciertos grupos del colectivo para dejar, a criterio del entrevistador, la eleccin del elemento
que se va a elegir.
Un muestreo, bastante utilizado en las entrevistas y que segn algunos autores puede resultar
prcticamente aleatorio, es el denominado muestreo por rutas, en el que partiendo de unos puntos
determinados (calle, nmero...), los agentes van siguiendo su itinerario y efectan las entrevistas de
acuerdo con un ritmo (por ejemplo, cada 10 edificios) y unas normas (para la eleccin de viviendas).
Una variante de muestreo no aleatorio, que suele utilizarse frecuentemente en determinados casos, son
las reuniones de grupo o grupos de discusin. Su importancia en determinados estudios es tal que
hemos considerado oportuno incluirlo como tema independiente al final del captulo.
Tamao de la muestra
La muestra es el nmero de elementos, elegidos o no al azar, que hay que tomar de un universo para
que los resultados puedan extrapolarse al mismo, y con la condicin de que sean representativos de la
poblacin. El tamao de la muestra depende de tres aspectos:
Del error permitido.
Del nivel de confianza con el que se desea el error.
Del carcter finito o infinito de la poblacin.
Las frmulas generales que permiten determinar el tamao de la muestra son las siguientes:
Para poblaciones infinitas (ms de 100.000 habitantes):
Para poblaciones finitas (menos de 100.000 habitantes):
Leyenda:
n = Nmero de elementos de la muestra.
N = Nmero de elementos del universo.
P/Q = Probabilidades con las que se presenta el fenmeno.
Z
2
= Valor crtico correspondiente al nivel de confianza elegido; siempre se opera con valor
sigma 2, luego Z = 2.
E = Margen de error permitido (a determinar por el director del estudio).
Cuando el valor de P y de Q no se conozca, o cuando la encuesta se realice sobre diferentes aspectos
en los que estos valores pueden ser diferentes, es conveniente tomar el caso ms favorable, es decir,
aquel que necesite el mximo tamao de la muestra, lo cual ocurre para P = Q = 50, luego, P = 50 y
Q = 50. En mi larga trayectoria profesional siempre he visto los valores P x Q como 50 x 50.
Para facilitar el clculo del tamao de la muestra pueden utilizarse unas tablas especiales,
incorporadas en el anexo I y II, cuyo uso viene dado por el fcil mtodo del eje de coordenadas.
En ambos casos si hubisemos ido a las tablas de los anexos I y II hubisemos obtenido el mismo
resultado.
Unidad IV Inferencia estadstica.
4.1 Estimacin puntual y por intervalos de confianza
ESTIMACION
El objetivo principal de la estadstica inferencial es la estimacin, esto es que
mediante el estudio de una muestra de una poblacin se quiere generalizar las
conclusiones al total de la misma. Como vimos en la seccin anterior, los
estadsticos varan mucho dentro de sus distribuciones mustrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de otros
sus valores.
Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo. Una
estimacin puntual es un nico valor estadstico y se usa para estimar un
parmetro. El estadstico usado se denomina estimador.
Una estimacin por intervalo es un rango, generalmente de ancho finito, que se
espera que contenga el parmetro.
Estimacin Puntual
La inferencia estadstica est casi siempre concentrada en obtener algn tipo de
conclusin acerca de uno o ms parmetros (caractersticas poblacionales). Para
hacerlo, se requiere que un investigador obtenga datos muestrales de cada una de
las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en
los valores calculados de varias cantidades muestrales . Po ejemplo,
representamos con (parmetro) el verdadero promedio de resistencia a la
ruptura de conexiones de alambres utilizados para unir obleas de
semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para
determinar la resistencia a la ruptura de cada una, y la media muestral de la
resistencia a la ruptura se poda emplear para sacar una conclusin acerca del
valor de . De forma similar, si es la varianza de la distribucin de resistencia
a la ruptura, el valor de la varianza muestral s
2
se podra utilizar pra inferir algo
acerca de .
Cuando se analizan conceptos generales y mtodos de inferencia es conveniente
tener un smbolo genrico para el parmetro de inters. Se utilizar la letra griega
para este propsito. El objetivo de la estimacin puntual es seleccionar slo un
nmero, basados en datos de la muestra, que represente el valor ms razonable
de .
Una muestra aleatoria de 3 bateras para calculadora podra presentar duraciones
observadas en horas de x1=5.0, x2=6.4 y x3=5.9. El valor calculado de la duracin
media muestral es = 5.77, y es razonable considerar 5.77 como el valor ms
adecuado de .
Una estimacin puntual de un parmetro es un slo nmero que se puede
considerar como el valor ms razonable de . La estimacin puntual se obtiene al
seleccionar una estadstica apropiada y calcular su valor a partir de datos de la
muestra dada. La estadstica seleccionada se llama estimador puntual de .

El smbolo (theta sombrero) suele utilizarse para representar el estimador de y
la estimacin puntual resultante de una muestra dada. Entonces se lee como
"el estimador puntual de es la media muestral ". El enunciado "la estimacin
puntual de es 5.77" se puede escribir en forma abreviada .
Ejemplo:
En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo
costo, para varios procesos de fundicin. En consecuencia, es importante contar
con mtodos prcticos para determinar varias propiedades mecnicas de esas
aleaciones. Examine la siguiente muestra de mediciones del mdulo de elasticidad
obtenidos de un proceso de fundicin a presin:
44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1
Suponga que esas observaciones son el resultado de una muestra aleatoria. Se
desea estimar la varianza poblacional . Un estimador natural es la varianza
muestral:
En el mejor de los casos, se encontrar un estimador para el cual siempre.
Sin embargo, es una funcin de las Xi muestrales, por lo que en s misma una
variable aleatoria.
Entonces el estimador preciso sera uno que produzca slo pequeas diferencias
de estimacin, de modo que los valores estimados se acerquen al valor verdadero.
Propiedades de un Buen Estimador
Insesgado.- Se dice que un estimador puntual es un estimador insesgado
de si , para todo valor posible de . En otras palabras, un
estimador insesgado es aquel para el cual la media de la distribucin
muestral
e

suficienteme
nte amplia, sta ser representativa. Adems, es necesario atender al
mtodo mediante el cual se elige fsicamente la muestra:
Muestreo aleatorio o probabilstico.
Muestreo no aleatorio u opintico.
4.2 Prueba de hiptesis y planteamiento de las hiptesis
Las secciones anteriores han mostrado cmo puede estimarse un parmetro a
partir de los datos contenidos en una muestra. Puede encontrarse ya sea un slo
nmero (estimador puntual) o un intervalo de valores posibles (intervalo de
confianza). Sin embargo, muchos problemas de ingeniera, ciencia, y
administracin, requieren que se tome una decisin entre aceptar o rechazar una
proposicin sobre algn parmetro. Esta proposicin recibe el nombre de
hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica,
puesto que muchos tipos de problemas de toma de decisiones, pruebas o
experimentos en el mundo de la ingeniera, pueden formularse como problemas
de prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros
de una o ms poblaciones.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor
slido utilizado en los sistemas de salida de emergencia para la tripulacin de
aeronaves. El inters se centra sobre la rapidez de combustin promedio. De
manera especfica, el inters recae en decir si la rapidez de combustin promedio
es o no 50 cm/s. Esto puede expresarse de manera formal como
Ho; = 50 cm/s
H1; 50 cm/s
La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la
proposicin H1; 50 cm/s, recibe el nombre de hiptesis alternativa. Puesto
que la hiptesis alternativa especifica valores de que pueden ser mayores o
menores que 50 cm/s, tambin se conoce como hiptesis alternativa bilateral.
En algunas situaciones, lo que se desea es formular una hiptesis alternativa
unilateral, como en
Ho; = 50 cm/s Ho; = 50 cm/s

H1; < 50 cm/s H1; > 50 cm/s


Es importante recordar que las hiptesis siempre son proposiciones sobre la
poblacin o distribucin bajo estudio, no proposiciones sobre la muestra. Por lo
general, el valor del parmetro de la poblacin especificado en la hiptesis nula se
determina en una de tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del
proceso, entonces el objetivo de la prueba de hiptesis usualmente es
determinar si ha cambiado el valor del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el
proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es
verificar la teora o modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales
como las especificaciones de diseo o ingeniera, o de obligaciones
contractuales. En esta situacin, el objetivo usual de la prueba de hiptesis
es probar el cumplimiento de las especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular
recibe el nombre de prueba de hiptesis. Los procedimientos de prueba de
hiptesis dependen del empleo de la informacin contenida en la muestra aleatoria
de la poblacin de inters. Si esta informacin es consistente con la hiptesis, se
concluye que sta es verdadera; sin embargo si esta informacin es inconsistente
con la hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la
verdad o falsedad de una hiptesis en particular nunca puede conocerse con
certidumbre, a menos que pueda examinarse a toda la poblacin. Usualmente
esto es imposible en muchas situaciones prcticas. Por tanto, es necesario
desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la
probabilidad de llegar a una conclusin equivocada.
La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms
caractersticas de poblaciones que al inicio se supone cierta (es decir, la "creencia
a priori").
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a
Ho, y sta es la hiptesis del investigador.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la
evidencia muestral sugiere que Ho es falsa. Si la muestra no contradice
decididamente a Ho, se contina creyendo en la validez de la hiptesis nula.
Entonces, las dos conclusiones posibles de un anlisis por prueba de hiptesis
son rechazar Ho o no rechazar Ho.
Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el problema de la rapidez de
combustin del agente propulsor presentado con anterioridad. La hiptesis nula es
que la rapidez promedio de combustin es 50 cm/s, mientras que la hiptesis
alternativa es que sta no es igual a 50 cm/s. Esto es, se desea probar:
Ho; = 50 cm/s
H1; 50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y
que se observa cual es la rapidez de combustin promedio muestral. La media
muestral es un estimador de la media verdadera de la poblacin. Un valor de la
media muestral que este prximo al valor hipottico = 50 cm/s es una
evidencia de que el verdadero valor de la media es realmente 50 cm/s; esto es,
tal evidencia apoya la hiptesis nula Ho. Por otra parte, una media muestral muy
diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa
H1. Por tanto, en este caso, la media muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si
48.5 51.5, entonces no se rechaza la hiptesis nula Ho; = 50 cm/s, y que si
<48.5 >51.5, entonces se acepta la hiptesis alternativa H1; 50 cm/s.
Los valores de que son menores que 48.5 o mayores que 51.5 constituyen la
regin crtica de la prueba, mientras que todos los valores que estn en el
intervalo 48.5 51.5 forman la regin de aceptacin. Las fronteras entre las
regiones crtica y de aceptacin reciben el nombre de valores crticos. La
costumbre es establecer conclusiones con respecto a la hiptesis nula Ho. Por
tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la regin
crtica, de lo contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de dos conclusiones
errneas. Por ejemplo, es posible que el valor verdadero de la rapidez promedio
de combustin del agente propulsor sea igual a 50 cm/s. Sin embargo, para todos
los especmenes bajo prueba, bien puede observarse un valor del estadstico de
prueba que cae en la regin crtica. En este caso, la hiptesis nula Ho ser
rechazada en favor de la alternativa H1cuando, de hecho, Ho en realidad es
verdadera. Este tipo de conclusin equivocada se conoce como error tipo I.
El error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es
verdadera. Tambin es conocido como nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia
sera del 5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el
nivel de significancia sera del 10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente
de 50 cm/s, aunque la media muestral caiga dentro de la regin de aceptacin.
En este caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el
nombre de error tipo II.
El error tipo II error se define como la aceptacin de la hiptesis nula cuando
sta es falsa.
Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones
diferentes que determinan si la decisin final es correcta o errnea.
Decisin Ho es verdadera Ho es falsa
Aceptar Ho No hay error
Error tipo II
Rechazar Ho Error tipo I No hay error
1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la
probabilidad de uno por lo general tiene como resultado un aumento en la
probabilidad del otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un
error tipo I, siempre se puede reducir al ajustar el o los valores crticos.
3. Un aumento en el tamao muestral n reducir y de forma simultnea.
4. Si la hiptesis nula es falsa, es un mximo cuando el valor real del
parmetro se aproxima al hipottico. Entre ms grande sea la distancia
entre el valor real y el valor hipottico, ser menor
4.5 Pruebas unilaterales y bilaterales

4.6 Prueba de hiptesis para una distribucin muestral de diferencias de
medias
PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS
INDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTE TRATANDO
1. Interpretar correctamente hacia que distribucin muestral se ajustan los
datos del enunciado.
2. Interpretar correctamente los datos del enunciado diferenciando los
parmetros de los estadsticos. As mismo se debe determinar en este
punto informacin implcita como el tipo de muestreo y si la poblacin es
finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el planteamiento
grfico del problema. El ensayo de hiptesis est en funcin de
parmetros ya que se quiere evaluar el universo de donde proviene la
muestra. En este punto se determina el tipo de ensayo (unilateral o
bilateral).
4. Establecer la regla de decisin. Esta se puede establecer en funcin del
valor crtico, el cual se obtiene dependiendo del valor de (Error tipo I o
nivel de significancia) o en funcin del estadstico lmite de la distribucin
muestral. Cada una de las hiptesis deber ser argumentada correctamente
para tomar la decisin, la cual estar en funcin de la hiptesis nula o Ho.
5. Calcular el estadstico real, y situarlo para tomar la decisin.
6. Justificar la toma de decisin y concluir.
7.
4.9 Muestreo pequeo: Distribucin de ji-cuadrada. Cuadros de
contingencia, limitaciones de la prueba de ji-cuadrada
Distribucin muestral de Proporciones
Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que queremos investigar la proporcin de artculos defectuosos o la
proporcin de alumnos reprobados en la muestra. La distribucin muestral de
proporciones es la adecuada para dar respuesta a estas situaciones. Esta
distribucin se genera de igual manera que la distribucin muestral de medias, a
excepcin de que al extraer las muestras de la poblacin se calcula el estadstico
proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters
y "n" el tamao de la muestra) en lugar del estadsitico media.
Una poblacin binomial est estrechamente relacionada con la distribucin
muestral de proporciones; una poblacin binomial es una coleccin de xitos y
fracasos, mientras que una distribucin muestral de proporciones contiene las
posibilidades o proporciones de todos los nmeros posibles de xitos en un
experimento binomial, y como consecuencia de esta relacin, las afirmaciones
probabilsticas referentes a la proporcin muestral pueden evaluarse usando la
aproximacin normal a la binomial, siempre que np 5 y
n(1-p) 5. Cualquier evento se puede convertir en una proporcin si se divide el
nmero obtenido entre el nmero de intentos.
Generacin de la Distribucin Muestral de Proporciones
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artculos
defectuosos. Se van a seleccionar 5 artculos al azar de ese lote sin reemplazo.
Genere la distribucin muestral de proporciones para el nmero de piezas
defectuosas.
Como se puede observar en este ejercicio la Proporcin de artculos defectuosos
de esta poblacin es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas
de este lote estn defectuosas.
El nmero posible de muestras de tamao 5 a extraer de una poblacin de 12
elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:
Artculos
Buenos
Artculos
Malos
Proporcin
de artculos
defectuoso
Nmero de
maneras en las
que se puede
obtener la
muestra
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 792
Para calcular la media de la distribucin muestral de proporciones se tendra que
hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla
entre el nmero total de muestras.
Como podemos observar la media de la distribucin muestral de proporciones es
igual a la Proporcin de la poblacin.
p
= P
Tambin se puede calcular la desviacin estndar de la distribucin muestral de
proporciones:
La varianza de la distribucin binomial es
2
= npq, por lo que la varianza de la
distribucin muestral de proporciones es
2
p =(Pq)/n. Si se sustituten los valores
en esta frmula tenemos que , este valor no coincide con el de 0.1681, ya que nos
falta agregar el factor de correccin para una poblacin finita y un muestreo sin
reemplazo:
La frmula que se utilizar para el clculo de probabilidad en una distribucin
muestral de proporciones est basada en la aproximacin de la distribucin normal
a la binomial . Esta frmula nos servir para calcular la probabilidad del
comportamiento de la proporcin en la muestra.
Ejemplo:
Se ha determinado que 60% de los estudiantes de una universidad grande fuman
cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la
probabilidad de que la proporcin de la muestra de la gente que fuma cigarrillos
sea menor que 0.55.
Solucin:
Este ejercicio se puede solucionar por dos mtodos. El primero puede ser con la
aproximacin de la distribucin normal a la binomial y el segundo utilizando la
frmula de la distribucin muestral de proporciones.
Aproximacin de la distribucin normal a la binomial:
Datos:
n=800 estudiantes
p=0.60
x= (.55)(800) = 440 estudiantes
p(x 440) = ?
Media= np= (800)(0.60)= 480
p(x 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de
que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

Distribucin Muestral de Proporciones
Datos:
n=800 estudiantes
P=0.60
p= 0.55
p(p 0.55) = ?
Unidad V Anlisis de regresin y correlacin.
5.1 Regresin lineal simple, curvilnea y mltiple
Regresin lineal simple
En un problema de regresin, los carcteres no son
considerados de la misma forma. Uno de ellos es el carcter
''a explicar'', los otros son ''explicativos''. Vamos primero a
considerar el caso de dos carcteres, (explicativo) e (a
explicar). ''Explicar'' significa aqu expresar una dependencia
funcional de como funcin de , de manera tal de prever el
valor de conociendo el de . Si para todo individuo ,
, y si se observa un valor del carcter en un
nuevo individuo, daremos como prediccin del
carcter en este nuevo individuo. La situacin ideal donde
no se encuentra nunca en la prctica. Ms bien se
buscar, en una familia fija de funciones, aquella para la que
los se encuentran ms cerca de los . La cercana se
mide en general por el error cuadrtico medio:
(3.2)
Hablamos entonces de regresin en el sentido de los
mnimos cuadrados. Las diferencias entre los valores
observados y los valores que predice el modelo , se
llaman los residuos. Si el modelo se ajusta de manera tal
que la serie de los residuos sea centrada (de media nula),
entonces el error cuadrtico es la varianza de los
residuos. La regresin lineal consiste en buscar entre las
funciones afines. La solucin se expresa de manera simple a
partir de las carctersticas de e .
Proposicin 3.5 Sean e dos muestras observadas
sobre una misma poblacin de tamao . Denotemos por
la funcin de en definida por:
Si (el carcter no es constante), la funcin
admite un mnimo en:
y
El valor de este mnimo es:
Definicin 3.6 Llamamos recta de regresin lineal de
sobre a la recta de ecuacin .
Demostracin: Si fijamos , es un polinomio de
grado en . El alcanza su mnimo para un tal que
la derivada se anule. Calculando:
Obtenemos por tanto . Substituimos este valor
en :
Esta funcin es un polinomio de grado en , que alcanza
su mnimo en el punto donde se anula su derivada.
Obtenemos:
sea:
Pongamos:
y
Tenemos entonces para todo par :
El valor del mnimo es:




Como se esperaba, el error cuadrtico minimal es menor
cuando la correlacin es ms fuerte.
Es importante observar la diferencia de los roles que
desempean e . Geomtricamente, la recta de regresin
lineal de con respecto a minimiza la suma de las
distancias verticales de los puntos a la recta. La recta
de regresin lineal de con respecto a minimiza las
distancias horizontales. Las dos rectas se cortan en el centro
de gravedad, , de la nube de puntos. La separacin
entre las dos rectas es mayor cuando la correlacin es ms
dbil.
La prediccin es la primera aplicacin de la regresin lineal.
A continuacin tenemos las estaturas en centmetros
(muestra ) y el peso en kilogramos ( ) de nios de
aos.
Nio 1 2 3 4 5 6 7 8 9 10
Estatura 121 123 108 118 111 109 114 103 110 115
Peso 25 22 19 24 19 18 20 15 20 21
Las carctersticas numricas toman los siguientes valores:
Grfico 14: Estatura y peso de nios de 6 aos: recta
de regresin.
Hacer una regresin lineal quiere decir que se piensa que el
peso debe crecer, en general, proporcionalmente a la
estatura. La recta de regresin lineal constituye un modelo
de prediccin. Por ejemplo diremos que el peso promedio de
un nio de 6 aos que mide 120 centmetros ser de
kg. Evidentemente esta prediccin no es
infalible. Ella slo da un orden de magnitud. El valor
observado ser probablemente distinto y el error previsible
ser del orden de kg.
Como segunda aplicacin se puede extender el ajuste por
cuantiles a familias de leyes invariantes por
transformaciones afines, como las leyes normales . Sea
una muestra continua de tamao para la cual queremos
verificar si ella podra haber salido de una ley normal
, con parmetros y desconocidos. Para
, denotemos como siempre por los
estadgrafos de orden. Si la hiptesis de normalidad es
pertinente, entonces debe estar cerca del cuantil
de la ley . Recordemos que si una
variable aleatoria sigue la ley , entonces
sigue la ley . Esto es lo mismo que
decir que para todo :
Denotemos por los valores de la funcin
cuantil de la ley en los puntos . Si la hiptesis de
normalidad se verifica, los puntos de coordenadas
deberan estar cercanos de la recta de ecuacin .
Una regresin lineal de las con respecto a las nos da a
la vez una estimacin de los valores de y , y una
indicacin sobre la calidad del ajuste (figura 15). Antes de
que existieran los programas de clculo, se venda papel
''gausso-aritmtico'', graduado en las abscisas segn los
cuantiles de la ley . Bastaba poner en las ordenadas
los valores de las para trazar a mano la recta de
regresin lineal, que lleva el nombre de ''recta de Henry'', por
el nombre del coronel que invent este mtodo en el siglo
XIX para estudiar el alcance de los caones.
Grfico 15: Estaturas de nios de 6 aos. Cuantiles
de la ley normal y estadgrafos de orden.
Superposicin de la recta de Henry.
El problema de la regresin es determinar en una familia de
funciones dada, cual es la funcin que minimiza el error
cuadrtico (3.2). Pero es frecuente que no haya una solucin
explcita. Para ciertas familias de funciones, se transforma el
problema de manera tal de llevarlo a una regresin lineal.
Presentamos aqu algunos casos frecuentes.
Familia Funciones Transformacin Forma afn
exponencial
potencia
inversa
logstica
Como ejemplo de aplicacin, vamos a tomar el problema del
ajuste por los cuantiles para la familia de leyes de Weibull,
las cuales se emplean frecuentemente para modelar tiempos
de sobrevida en medicina o tiempos de funcionamiento en
fiabilidad. La funcin cuantil de la ley de Weibull es:
Sea una muestra que queremos ajustar por una ley de
Weibull de parmetros y desconocidos. Para
, el estadgrafo de orden debe estar cerca del cuantil
.
o sea:
Pongamos y . Los
puntos deberan estar cerca de la recta de ecuacin
. Una regresin lineal nos dar no
solamente los valores para y , sino tambin una
indicacin sobre la calidad del ajuste. Antes de los
programas de clculo, exista tambin un ''papel Weibull'',
graduado de manera tal que se poda automatizar este caso
particular de regresin no lineal.
5.2 Correlacin
Otra forma de anlisis bivariado es la correlacin y regresin de variables numricas y discretas. El
concepto de correlacin y regresin se basa en el grado de relacin que poseen dos variables
numricas entre si.
El coeficiente de correlacin permite predecir si entre dos variables existe o no una relacin o
dependencia matemtica.
Supongamos que queremos estudiar la correlacin existente entre peso y altura de un grupo de
personas tomadas al azar. Sometemos los datos recogidos de peso y altura al anlisis de
correlacin y encontramos el coeficiente de correlacin entre ambas, que se representa con la letra
r. El r = 0.78. Esto significa que a mayor altura correspondera mayor peso.
Los coeficientes de correlacin r siempre oscilan entre valores de 1 y 1. El valor cero 0 significa
que no existe correlacin entre ambas variables. Un valor positivo indica que a incrementos en la
variable A se producen incrementos proporcionales en B y un valor negativo indica lo contrario.
Podemos graficar la correlacin entre las dos variables a travs de una grfica de dos ejes
(abscisas y ordenadas) cartesianos.
En el siguiente grfico observamos la correlacin entre potencia de motor de un automvil y
consumo en Litros por cada 100 Km. El r = 0.87 (correlacin positiva). (SPSS). Evidentemente a
mayor potencia se observa mayor consumo de combustible. El valor de significacin para ese r es
de una p < 0.01. Esto quiere decir que la correlacin entre potencia y consumo no es aleatoria.
En el siguiente grfico encontramos la relacin existente entre peso del automvil en kg. y
aceleracin 0 a 100 Km. / hora en segundos. El r = - 0.56 con una p < 0.05. Esto significa que
existe una correlacin negativa significativa, entre peso del auto y respuesta de la aceleracin.
Automviles ms pesados presentan una respuesta ms tarda y viceversa. (SPSS)
Para interpretar el coeficiente de correlacin, Colton a dado los siguientes lineamientos generales:
Valor de r de 0 a 0.25 implica que no existe correlacin entre ambas variables.
Valor de r de 0.25 a 0.50 implica una correlacin baja a moderada.
Valor de r de 0.50 a 0.75 implica correlacin moderada a buena.
Valor de r de 0.75 o mayor, implica una muy buena a excelente correlacin.
Estos rangos de valores se pueden extrapolar a correlaciones negativas tambin.
Se debe tener cuidado al analizar la correlacin entre dos variables, de que ambas varen juntas
permanentemente. Esto parece redundante, pero es importante. Por ejemplo, si correlacionamos
edad y altura. La altura ir aumentando con la edad hasta un determinado punto en donde ya no
aumentar ms.
5.3 Regresin y correlacin para datos agrupados
Recta de regresin
Supongamos que en una variable bidimensional queremos precisar la relacin que
existe entre las dos variables que la forman. En concreto queremos expresar
mediante una relacin cmo depende una de ellas (variable dependiente) de la
otra (variable independiente). Normalmente se elige como y la variable
dependiente y como x la independiente.
Si esa relacin se expresa mediente una funcin lineal del tipo y = ax + b, su
grfica correspondera a una recta.
En el caso que nos ocupa nos interesa la recta que mejor "se ajuste" a los puntos
de la nube de puntos de la variable. Dicha recta se denomina: recta de regresin.
Por un mtodo que se denomina de "mnimos cuadrados" y cuya concreccin no
corresponde a este nivel de estudio, se deduce que la recta de regresin debe
pasar por el punto correspondiente a las medias de ambas variables y que debe
tener por pendiente la covarianza dividida por la varianza de la variable x.
Con ello la expresin de la recta de regresin ser:
Esta es la llamada "Recta de regresin de y sobre x". Si se deseara estudiar la
dependencia de x respecto a y slo habra que cambiar en la expresin de la recta
x por y, obtenindose la recta regresin de x sobre y.
En la imagen siguiente se muestra la recta de regresin de y (peso) sobre x (talla)
del ejemplo 1 de este tema. En este caso se supone que represente cmo
depende el peso de una persona de su talla.
Si recordamos que entre la talla y el peso decamos que exista una dependencia
directa, la recta de regresin lo confirma ya que su pendiente es positiva: a medida
que aumenta la talla aumenta el peso. Por tanto:
Dependencia directa - Pendiente de la recta positiva - Funcin creciente.
Pero qu utilidad tiene la recta de regresin?
En la tabla de valores de la variable talla - peso, solamente nos dan los valores de
un determinado nmero de personas (10 en este caso): las personas de las que
se conocen dichos valores. Mediante la recta de regresin podramos obtener de
manera aproximada el peso de una persona de la que conociramos la talla, en
una poblacin semejante a aquella de la que se ha obtenido la muestra.
Si observamos la grfica anterior, podramos suponer por ejemplo que una
persona de 185 cm pesara algo ms de 80 kg.
De manera ms precisa, si conocemos la expresin de la recta de regresin, se
pueden calcular valores para la variable y, conocidos los de x, como si se tratara
de una funcin.
Ejemplo 4.- La recta de regresin de la variable y (talla) sobre x (peso) ser la
recta:
- que pasa por el punto (172,6 ; 66,3)
- tiene de pendiente: 55,32 / 50,71 = 1,0909
Recta: y - 66,3 = 1,0909 ( x - 172,6) que operando y simplificando queda:
y = 1,0909x - 121,9
El valor del peso que suponamos aproximado para una talla de 185 cm sera:
Peso= 1.0909 185 - 121,9 = 79.9
Este valor obtenido es algo menor al esperado. Eso quiere decir que las
predicciones hechas con la recta de regresin no son exactas. En el apartado
siguiente precisaremos la "fiabilidad" de las mismas.
Por tanto la recta de regresin se puede utilizar para realizar
predicciones para la variable y a partir de valores conocidos de la
variable x.
Ejercicio 4.- Observar la tabla de valores siguiente y la escena donde dichos
valores estn representados. En la escena a los pares de valores le llamamos
(a,a1) ; (b,b1); etc.
x 2 4 6 8 10 12
y 8 7 7 6 6 4
- Calcular la recta de regresin de y sobre x.
Se debe obtener los valores siguientes:
Media de x: 7 ; Media de y: 6,33 ; covarianza: -3,99 ; varianza de x: 11,66 y con
ello:
recta de regresin: y = -0,342 x + 8,72
- Cmo es la pendiente ? qu tipo de dependencia existe entre las variables?
- Dar algunos valores a x y obtener los correspondientes a y segn la recta de
regresin. Comprobar en la escena si los valores obtenidos son correctos.
- Cambiar los valores iniciales de la tabla en la escena viendo cmo vara la recta
de regresin y calcularla en los casos que se desee (por ejemplo un caso en que
la pendiente de la recta sea positiva).

Coeficiente de correlacin
Una vez observado que en una variable bidimensional existe una cierta
dependencia entre las dos caractersticas o variables que la forman (nube de
puntos y covarianza), podemos precisar el grado de dicha dependencia.
- Si los puntos de la nube estuvieran todos sobre la recta de regresin se dira que
existe una dependencia funcional. De su estudio se encargan las funciones.
- Si los puntos no estn todos sobre la recta de regresin se dice que entre las
variables hay una cierta correlacin lineal. Este es el caso que nos ocupa. Para
cuantificar el grado de dicha correlacin se usa el:
Coeficiente de correlacin de Pearson. Si le llamamos r, su valor es:
Puede observarse que el signo del coeficiente de correlacin es el mismo que
el de la covarianza y puede deducirse que el valor del mismo esta
comprendico entre -1 y 1.
En la escena siguiente se puede observar la escena del ejercicio 4, donde se ha
aadido el valor del coeficiente de correlacin.

Se pueden deducir las siguientes conclusiones relativas al coeficiente de
correlacin (r):
- Su signo es el mismo de la covarianza, luego si r es positivo la
dependencia es directa y si es negativo inversa.
- Si r se acerca a -1 o a +1, la dependencia es fuerte y por tanto las
predicciones que se realicen a partir de la recta de regresin sern bastante
fiables.
- Si r se acerca a 0 la dependencia es dbil y por tanto las predicciones
que se realicen a partir de la recta de regresin sern poco fiables.

Ejercicio 5.- Calcular el coeficiente de correlacin para la variable talla - peso y
deducir del valor del mismo el tipo de dependencia y la fiabilidad de las
predicciones. (Sol: r = 0,90)
5.4 Correlacin por rangos
Correlacin por rangos
Hay varios modos de determinar la magnitud de un coeficiente de correlacin. El
ms sencillo es el coeficiente de correlacin por rangos, cuyo smbolo es p, (la
letra griega rho).
El primer paso para obtener p es ordenar a los sujetos por sus rendimientos en
cada uno de los tests analizados. Luego se comparan los rangos y de esta
comparacin se deriva el valor de p.
Si hubiese correlacin positiva perfecta, no habr diferencia entre los dos
conjuntos de rangos.
En cambio si la correlacin fuese algo menos que perfecta, las diferencias entre
los rangos no sera 0, en modo alguno. Cuanto mayores sean las disparidades de
los rangos, menor ser la relacin positiva entre los dos conjuntos de
puntuaciones. Por lo tanto, la medida de las diferencias del rango proporciona,
evidentemente un modo de medir el coeficiente de correlacin. Cuanto mayor sea
la medida, menor ser la correlacin positiva.
Siendo + 100 la correlacin positiva mayor posible, para obtener el coeficiente de
correlacin restaremos de cien la media de las diferencias entre los rangos.
Cunto ms elevada sea la media de las diferencias entre los rangos, menor ser
el coeficiente de correlacin.
Frmula: la cuanta de la correlacin es I menos la media de las diferencias entre
los rangos, o
P = I - sumatoria D2
___________
N
Frmula derivada por lgica, que es de estructura muy semejante a la obtenida
matemticamente.
Por diversas razones matemticas, la verdadera frmula es:
P = I -6sumatoriad2
________________
N(N2 - I)
El mismo razonamiento sirve para la correlacin negativa por rangos.
5.5 Coeficiente de correlacin para datos nominales
Correlacin de producto-momento
El coeficiente de correlacin ms frecuentemente usado es el coeficiente de
correlacin producto-momento.
La frmula es: r =sumatoria xy
__________
Noxoy
X e y son las desviaciones de las puntuaciones individuales de las medias del
grupo, ox es la desviacin standard de las puntuaciones en el test x y oy la
desviacin standard de las puntuaciones en el test y.
Por regla general, se prefiere el coeficiente de correlacin por rangos cuando el
nmero de casos es pequeo (15 20) y cuando hay poca ligazn entre los
rangos. En otros casos, el coeficiente de correlacin de p-m resulta ms
conveniente.
Un error lgico que frecuentemente se comete en la interpretacin del coeficiente
de correlacin es el argumento de causa y efecto. Se admite a menudo que si dos
variables estn muy correlacionadas, una es la causa de la otra. No obstante, la
correlacin elevada entre dos fenmenos indica simplemente que ambos son
causados por un tercer factor y no que un fenmeno cause o influencie el otro. En
estadstica se usa, a menudo el coeficiente de correlacin en problemas de los
que se sabe que no hay relacin causal entre los dos conjuntos de medida que se
correlacionan.
Errores de medida
El error se debe a un instrumento de medida inexacto, a un mtodo imperfecto de
aplicar el instrumento, a nuestra manera inadecuada de leerlo o registrarlo o a
cualquier otro factor.
En la ciencia, por depender en gran parte del raciocinio de las mediciones, se
tiene mucho cuidado con los errores de medida y se ha aprendido mucho acerca
de su naturaleza, origen y control. En los casos que se ha sido incapaz de
eliminarlos, se han desarrollado tcnicas que permiten estimar el grado de error.
Sabiendo la magnitud del error se puede enunciar el grado de confianza en las
conclusiones basadas en las medidas. El estudio de los errores de medida es uno
de los bsicos de la estadstica.
Fiabilidad
No existe un instrumento de medida absolutamente perfecto. Hasta el instrumento
de medida ms simple, la regla, no est libre de error. Algunos instrumentos de
medida nos dan errores mayores que otros.
La fiabilidad de un aparato de medida(incluido su mtodo de aplicacin) puede
definirse como el grado en que medidas repetidas de la misma cantidad, con el
mismo instrumento de medida, dan las mismas lecturas.
La fiabilidad medida por correlacin: el coeficiente de correlacin nos da un ndice
numrico que expresa el grado de fiabilidad de una prueba. Cuando se usa con
este fin, el coeficiente de correlacin recibe el nombre de coeficiente de fiabilidad.
Veracidad de las formas comparables: La mayora de las pruebas psicolgicas
constan de gran nmero de elementos, problemas y preguntas. La correlacin de
las dos formas comparables nos dara la fiabilidad de una y otra forma.
El mtodo de las formas comparables evita el problema de la memoria y quizs el
de fastidio, pero deja intacto el del tiempo. Las dos formas se aplican en tiempos
diferentes, y durante el intervalo pueden suceder muchas cosas que dificultan la
interpretacin de la correlacin entre las dos formas comparables.
Fiabilidad compartida: la base del mtodo de fiabilidad bipartida es idntica a la del
de formas comparables. Este mtodo suele llamarse del coeficiente de pares-
impares y cuenta con dos ventajas: primera, las dos subpruebas(pares y nones)
se hacen a la vez, en las mismas condiciones de motivacin, idnticas condiciones
de examen y con el mismo grado de atencin. Segunda, por haber divido la
prueba de pares-impares, hemos garantizado la comparabilidad de formas, no
slo en cuanto al contenido, sino tambin en cuanto al contenido, sino tambin en
cuanto al modo de administracin.
Estos y otros mtodos pueden proporcionarnos una valiosa informacin sobre la
utilidad de una prueba como instrumento de medida. Sin embargo, saber que una
prueba es fiable no basta para permitirnos apreciar su valor como instrumento de
medicin Puede ser muy fiable y por el contrario, constituir un mal instrumento de
medida, por carecer de validez.
Validez
Los trminos de fiabilidad y validez se usan indistintamente en el lenguaje
vulgar. No obstante, en la teora de la medicin, tienen un significado distinto. El
estadstico preocupado por el problema de la fiabilidad e un instrumento con lo
que mide. Cuando le interesa la cuestin de la validez, pregunta si el instrumento
mide lo que l quiere medir. Un instrumento puede hacer medidas acordes(puede
tener fiabilidad), pero acaso no mide lo que se quiere medir(acaso tiene poca
validez). Pero a la mayora de los tests que tratan de medir fenmenos ms
complejos no se les adscribe la validez con tanta facilidad. En primer lugar, la
validez, lo mismo que la fiabilidad, no es asunto de todo nada. Una prueba tiene
grados de validez. El grado de validez de las preguntas de clase slo estara
influido por la comprensin por parte del alumno de los principios psicolgicos. En
este caso diramos que las preguntas tienen validez perfecta como medida de la
comprensin de principios psicolgicos; pero, ms probablemente, la puntuacin
en las preguntas es la resultante de la comprensin psicolgica, ms la aptitud
memorista. La prueba tiene alguna validez para la comprensin psicolgica y
alguna otra para la capacidad memorista, pero no es una prueba pura de
ninguna de las dos. Como en la fiabilidad, necesitamos algn medio para expresar
el grado de validez de un instrumento de medida de un instrumento de medida y,
de nuevo como en aquella, el coeficiente de correlacin nos facilita ese medio.
La validez medida por correlacin: Es evidente que una prueba es vlida en el
grado en que sus medidas se correlacionan con lo que mide. Cuando se usa de
este modo el coeficiente de correlacin se llama coeficiente de validez.
El principio general para determinar la validez de una prueba es bastante simple,
correlacionamos sus puntuaciones con su criterio. La dificultad consiste en que,
frecuentemente, no podemos hallar un criterio con el que compararlas. Por
ejemplo se quiere medir la validez de una prueba de inteligencia. Se pude obtener
las puntuaciones del test con mucha facilidad, pero qu servir de criterio de
inteligencia Las calificaciones escolares? El dinero ganado en la vida real?
La originalidad y creatividad? La primaca en cuestiones sociales? Personas
diferentes sugeriran distintos criterios y algunos de ellos plantearan, por s
mismos, problemas e medida.
Se han hecho muchos intentos de resolver el problema del criterio. Entre las
tcnicas ms corrientes est el llamado mtodo del grupo conocido.
Grupos conocidos y validez: No hay puntuaciones-criterio de originalidad y
creatividad fcilmente disponibles.
Una prueba puede tener gran fiabilidad y poca validez, en el sentido que no mida
lo que intentbamos que midiese. En cambio, una prueba de mucha validez no
puede tener poca fiabilidad. Las pruebas poco fiables no pueden compararse
consecuentemente con n conjunto de puntuaciones-criterio, porque sus medidas
son, en gran parte, errneas y por consiguiente deben tener poca validez.
http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html
http://prof.usb.ve/ejmarque/cursos/ea2181/core/desp05.html
http://ftp.medprev.uma.es/libro/node61.htm
http://coqui.lce.org/mdejesus/CLAS4/index.htm
http://www.profesorenlinea.cl/quinto/matematica/ConjuntosRelaciones.htm

Das könnte Ihnen auch gefallen