Beruflich Dokumente
Kultur Dokumente
2
. Uso de tablas
Realiza clculos
bsicos sobre
probabilidades de
eventos
Calcula adecuadamente
probabilidades de eventos,
utilizando reglas,
propiedades o tablas de las
distribuciones de
probabilidad
Nociones de estadstica
Inferencial. Prueba de
hiptesis. Prueba de
hiptesis para la media
y proporcin
poblacional.
Realiza pruebas de
hiptesis sobre
medias y proporciones
poblacionales para
muestras grandes y
muestras pequeas.
Efecta prueba de hiptesis
sobre medias y
proporciones poblacionales
aplicando adecuadamente
los procedimientos
pertinentes
Prueba de hiptesis
para comparacin de
medias y proporciones
poblacionales.
Realiza pruebas de
hiptesis sobre
comparacin de
medias y proporciones
poblacionales.
Efecta prueba de hiptesis
sobre comparacin de
medias y proporciones
poblacionales aplicando
adecuadamente los
procedimientos pertinentes
Prueba de hiptesis
sobre relacin entre
variables cualitativas:
Chi-Cuadrado
Realiza pruebas de
hiptesis sobre
relacin entre
variables cualitativas.
Efecta prueba de
independencia para
determinar la relacin entre
dos variables cualitativas
aplicando adecuadamente
los procedimientos
pertinentes
EXAMEN FINAL.
6. COEFICIENTE DE CORRELACIN LINEAL
En una distribucin bidimensional puede ocurrir que las dos variables guarden algn tipo de relacin
entre s. Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy posible
que exista relacin entre ambas variables: mientras ms alto sea el alumno, mayor ser su peso.
El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las
variables. Este coeficiente se aplica cuando la relacin que puede existir entre las variables es lineal
26
No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc. En
estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las variables,
por lo que convendra utilizar otro tipo de coeficiente ms apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es representar los
pares de valores en un grfico y observar la forma que describen.
El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:
Es decir:
Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de
valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el
resultado obtenido de todos los pares de valores y este resultado se divide por el tamao de la
muestra.
Denominador se calcula el producto de las varianzas de "x" y de "y", y a este producto se le
calcula la raz cuadrada.
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra).
La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la
otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de
correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere decir
obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que este
resultado podra haberse debido al puro azar.
Ejemplo: vamos a calcular el coeficiente de correlacin de la siguiente serie de datos de altura y peso
de los alumnos de una clase:
Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso
X y x y x y
27
Alumno 1 1,25 32 Alumno 11 1,25 33 Alumno 21 1,25 33
Alumno 2 1,28 33 Alumno 12 1,28 35 Alumno 22 1,28 34
Alumno 3 1,27 34 Alumno 13 1,27 34 Alumno 23 1,27 34
Alumno 4 1,21 30 Alumno 14 1,21 30 Alumno 24 1,21 31
Alumno 5 1,22 32 Alumno 15 1,22 33 Alumno 25 1,22 32
Alumno 6 1,29 35 Alumno 16 1,29 34 Alumno 26 1,29 34
Alumno 7 1,30 34 Alumno 17 1,30 35 Alumno 27 1,30 34
Alumno 8 1,24 32 Alumno 18 1,24 32 Alumno 28 1,24 31
Alumno 9 1,27 32 Alumno 19 1,27 33 Alumno 29 1,27 35
Alumno 10 1,29 35 Alumno 20 1,29 33 Alumno 30 1,29 34
Aplicamos la frmula:
Luego,
Por lo tanto, la correlacin existente entre estas dos variables es elevada (0,7) y de signo postivo.
7. REGRESIN LINEAL
Representamos en un grfico los pares de valores de una distribucin bidimensional: la variable "x" en
el eje horizontal o eje de abscisa, y la variable "y" en el eje vertical, o eje de ordenada. Vemos que la
nube de puntos sigue una tendencia lineal:
28
(1/30) * (0,826)
r = ----------------------------------------------------------
(((1/30)*(0,02568)) * ((1/30)*(51,366)))^(1/2)
r = 0,719
El coeficiente de correlacin lineal nos permite determinar si, efectivamente, existe relacin entre
las dos variables. Una vez que se concluye que s existe relacin, la regresin nos permite definir la
recta que mejor se ajusta a esta nube de puntos.
Una recta viene definida por la siguiente frmula:
y = a + bx
Donde "y" sera la variable dependiente, es decir, aquella que viene definida a partir de la otra variable
"x" (variable independiente). Para definir la recta hay que determinar los valores de los parmetros "a"
y "b":
El parmetro "a" es el valor que toma la variable dependiente "y", cuando la variable
independiente "x" vale 0, y es el punto donde la recta cruza el eje vertical.
El parmetro "b" determina la pendiente de la recta, su grado de inclinacin.
La regresin lineal nos permite calcular el valor de estos dos parmetros, definiendo la recta que
mejor se ajusta a esta nube de puntos.
El parmetro "b" viene determinado por la siguiente frmula:
Es la covarianza de las dos variables, dividida por la varianza de la variable "x".
El parmetro "a" viene determinado por:
a = ym - (b * xm)
Es la media de la variable "y", menos la media de la variable "x" multiplicada por el parmetro "b" que
hemos calculado.
Ejemplo: vamos a calcular la recta de regresin de la siguiente serie de datos de altura y peso de los
alumnos de una clase. Vamos a considerar que la altura es la variable independiente "x" y que el peso
es la variable dependiente "y" (podamos hacerlo tambin al contrario):
Alumno Estatura Peso Alumno Estatura Peso Alumno Estatura Peso
x Y x y x y
Alumno 1 1,25 32 Alumno 11 1,25 33 Alumno 21 1,25 33
29
Alumno 2 1,28 33 Alumno 12 1,28 35 Alumno 22 1,28 34
Alumno 3 1,27 34 Alumno 13 1,27 34 Alumno 23 1,27 34
Alumno 4 1,21 30 Alumno 14 1,21 30 Alumno 24 1,21 31
Alumno 5 1,22 32 Alumno 15 1,22 33 Alumno 25 1,22 32
Alumno 6 1,29 35 Alumno 16 1,29 34 Alumno 26 1,29 34
Alumno 7 1,30 34 Alumno 17 1,30 35 Alumno 27 1,30 34
Alumno 8 1,24 32 Alumno 18 1,24 32 Alumno 28 1,24 31
Alumno 9 1,27 32 Alumno 19 1,27 33 Alumno 29 1,27 35
Alumno 10 1,29 35 Alumno 20 1,29 33 Alumno 30 1,29 34
El parmetro "b" viene determinado por:
b =
(1/30) * 1,034
----------------------------------------- = 40,265
(1/30) * 0,00856
Y el parmetro "a" por:
a = 33,1 - (40,265 * 1,262) = -17,714
Por lo tanto, la recta que mejor se ajusta a esta serie de datos es:
y = -17,714 + (40,265 * x)
Esta recta define un valor de la variable dependiente (peso), para cada valor de la variable
independiente (estatura):
Estatura Peso
x x
1,20 30,6
1,21 31,0
1,22 31,4
1,23 31,8
1,24 32,2
1,25 32,6
1,26 33,0
1,27 33,4
1,28 33,8
1,29 34,2
1,30 34,6
8. PROBABILIDAD
La probabilidad mide la frecuencia con la que aparece un resultado determinado cuando se realiza
un experimento.
Ejemplo: tiramos un dado al aire y queremos saber cul es la probabilidad de que salga un 2,
o que salga un nmero par, o que salga un nmero menor que 4.
30
El experimento tiene que ser aleatorio, es decir, que pueden presentarse diversos resultados,
dentro de un conjunto posible de soluciones, y esto aun realizando el experimento en las mismas
condiciones. Por lo tanto, a priori no se conoce cul de los resultados se va a presentar:
Ejemplos: lanzamos una moneda al aire: el resultado puede ser cara o cruz, pero no
sabemos de antemano cul de ellos va a salir.
En la Lotera de Navidad, el "Gordo" (en Espaa se llama "Gordo" al primer premio) puede ser
cualquier nmero entre el 1 y el 100.000, pero no sabemos a priori cual va a ser (si lo
supiramos no estaramos aqu escribiendo esta leccin).
Hay experimentos que no son aleatorios y por lo tanto no se les puede aplicar las reglas de la
probabilidad.
Ejemplo: en lugar de tirar la moneda al aire, directamente seleccionamos la cara. Aqu no podemos
hablar de probabilidades, sino que ha sido un resultado determinado por uno mismo. Antes de
calcular las probabilidades de un experimento aleatorio hay que definir una serie de conceptos:
Suceso elemental: hace referencia a cada una de las posibles soluciones que se pueden presentar.
Ejemplo: al lanzar una moneda al aire, los sucesos elementales son la cara y la cruz. Al
lanzar un dado, los sucesos elementales son el 1, el 2, .., hasta el 6.
Suceso compuesto: es un subconjunto de sucesos elementales.
Ejemplo: lanzamos un dado y queremos que salga un nmero par. El suceso "numero par" es
un suceso compuesto, integrado por 3 sucesos elementales: el 2, el 4 y el 6
O, por ejemplo, jugamos a la ruleta y queremos que salga "menor o igual que 18". Este es un
suceso compuesto formado por 18 sucesos elementales (todos los nmeros que van del 1 al
18).
Al conjunto de todos los posibles sucesos elementales lo denominamos espacio muestral. Cada
experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas las
soluciones posibles).
Ejemplo: si tiramos una moneda al are una sola vez, el espacio muestral ser cara o cruz.
Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el espacio
muestral estara formado por (cara-cara), (cara-cruz), (cruz-cara) y (cruz-cruz).
8.1 PROBABILIDAD: RELACIN ENTRE SUCESOS
Entre los sucesos compuestos se pueden establecer distintas relaciones:
31
a) Un suceso puede estar contenido en otro: las posibles soluciones del primer suceso tambin lo
son del segundo, pero este segundo suceso tiene adems otras soluciones suyas propias.
Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6, y b) que
salga un nmero par. Vemos que el suceso a) est contenido en el suceso b).
Siempre que se da el suceso a) se da el suceso b), pero no al contrario. Por ejemplo, si el
resultado fuera el 2, se cumplira el suceso b), pero no el el a).
b) Dos sucesos pueden ser iguales: esto ocurre cuando siempre que se cumple uno de ellos se
cumple obligatoriamente el otro y viceversa.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b)
que salga mltiplo de 2. Vemos que las soluciones coinciden en ambos casos.
c) Unin de dos o ms sucesos: la unin ser otro suceso formado por todos los elementos de los
sucesos que se unen.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par y b)
que el resultado sea mayor que 3. El suceso unin estara formado por los siguientes
resultados: el 2, el 4, el 5 y el 6
d) Interseccin de sucesos: es aquel suceso compuesto por los elementos comunes de dos o ms
sucesos que se intersectan.
Ejemplo: lanzamos un dado al aire, y analizamos dos sucesos: a) que salga nmero par, y b)
que sea mayor que 4. La interseccin de estos dos sucesos tiene un slo elemento, el nmero
6 (es el nico resultado comn a ambos sucesos: es mayor que 4 y es nmero par).
e) Sucesos incompatibles: son aquellos que no se pueden dar al mismo tiempo ya que no tienen
elementos comunes (su intereseccin es el conjunto vacio).
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero menor
que 3, y b) que salga el nmero 6. Es evidente que ambos no se pueden dar al mismo tiempo.
f) Sucesos complementarios: son aquellos que si no se da uno, obligatoriamente se tiene que dar el
otro.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero par, y
b) que salga un nmero impar. Vemos que si no se da el primero se tiene que dar el segundo
(y viceversa).
8.2 Clculo de probabilidades
Como hemos comentado anteriormente, la probabilidad mide la mayor o menor posibilidad de que se
d un determinado resultado (suceso) cuando se realiza un experimento aleatorio.
32
La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%):
El valor cero corresponde al suceso imposible: lanzamos un dado al aire y la probabilidad
de que salga el nmero 7 es cero (al menos, si es un dado certificado por la OMD,
"Organizacin Mundial de Dados").
El valor uno corresponde al suceso seguro: lanzamos un dado al aire y la probabilidad de
que salga cualquier nmero del 1 al 6 es igual a uno (100%).
El resto de sucesos tendr probabilidades entre cero y uno: que ser tanto mayor cuanto
ms probable sea que dicho suceso tenga lugar.
Cmo se mide la probabilidad?
Uno de los mtodos ms utilizados es aplicando la Regla de Laplace: define la probabilidad de un
suceso como el cociente entre casos favorables y casos posibles.
P(A) = Casos favorables / casos posibles
Veamos algunos ejemplos:
a) Probabilidad de que al lanzar un dado salga el nmero 2: el caso favorable es tan slo
uno (que salga el dos), mientras que los casos posibles son seis (puede salir cualquier
nmero del uno al seis). Por lo tanto:
P(A) = 1 / 6 = 0,166 (o lo que es lo mismo, 16,6%)
b) Probabilidad de que al lanzar un dado salga un nmero par: en este caso los casos
favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles
siguen siendo seis. Por lo tanto:
P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%)
c) Probabilidad de que al lanzar un dado salga un nmero menor que 5: en este caso
tenemos cuatro casos favorables (que salga el uno, el dos, el tres o el cuatro), frente a los seis
casos posibles. Por lo tanto:
P(A) = 4 / 6 = 0,666 (o lo que es lo mismo, 66,6%)
d) Probabilidad de que nos toque el "Gordo" de Navidad: tan slo un caso favorable, el
nmero que jugamos (qu triste...), frente a 100.000 casos posibles. Por lo tanto:
P(A) = 1 / 100.000 = 0,00001 (o lo que es lo mismo, 0,001%)
Merece la pena... Por cierto, tiene la misma probabilidad el nmero 45.264, que el nmero
00001, pero cul de los dos compraras?
Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos requisitos:
33
a) El nmero de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos
resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sera
cero.
b) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado,
algunas caras tuvieran mayor probabilidad de salir que otras, no podramos aplicar esta regla.
A la regla de Laplace tambin se le denomina "probabilidad a priori", ya que para aplicarla hay que
conocer antes de realizar el experimento cuales son los posibles resultados y saber que todos tienen
las mismas probabilidades.
Y si el experimento aleatorio no cumple los dos requisitos indicados, qu hacemos?,
ponemos una denuncia?
No, no va a ser necesario denunciar a nadie, ya que en este caso podemos acudir a otro modelo de
clculo de probabilidades que se basa en la experiencia (modelo frecuentista):
Cuando se realiza un experimento aleatorio un nmero muy elevado de veces, las
probabilidades de los diversos posibles sucesos empiezan a converger hacia valores
determinados, que son sus respectivas probabilidades.
Ejemplo: si lanzo una vez una moneda al aire y sale "cara", quiere decir que el suceso "cara"
ha aparecido el 100% de las veces y el suceso "cruz" el 0%.
Si lanzo diez veces la moneda al aire, es posible que el suceso "cara" salga 7 veces y el
suceso "cruz" las 3 restantes. En este caso, la probabilidad del suceso "cara" ya no sera del
100%, sino que se habra reducido al 70%.
Si repito este experimento un nmero elevado de veces, lo normal es que las probabilidades
de los sucesos "cara" y "cruz" se vayan aproximando al 50% cada una.
En este modelo ya no ser necesario que el nmero de soluciones sea finito, ni que todos los sucesos
tengan la misma probabilidad.
Ejemplo: si la moneda que utilizamos en el ejemplo anterior fuera defectuosa (o estuviera
trucada), es posible que al repetir dicho experimento un nmero elevado de veces, la "cara"
saliera con una frecuencia, por ejemplo, del 65% y la "cruz" del 35%. Estos valores seran las
probabilidades de estos dos sucesos segn el modelo frecuentista.
A esta definicin de la probabilidad se le denomina probabilidad a posteriori, ya que tan slo
repitiendo un experimento un nmero elevado de veces podremos saber cual es la probabilidad de
cada suceso.
9 PROBABILIDAD DE SUCESOS
Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos sucesos entre s,
as como de las posibles relaciones que se pueden establecer entre los mismos. Vamos a ver ahora
cmo se refleja esto en el clculo de probabilidades.
34
a) Un suceso puede estar contenido en otro: entonces, la probabilidad del primer suceso ser
menor que la del suceso que lo contiene.
Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6, y b) que salga un
nmero par. Dijimos que el suceso a) est contenido en el suceso b).
P(A) = 1/6 = 0,166
P(B) = 3 / 6 = 0,50
Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor que la
probabilidad del suceso que lo contiene, suceso b).
b) Dos sucesos pueden ser iguales: en este caso, las probabilidades de ambos sucesos son las
mismas.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que
salga mltiplo de 2. Las soluciones coinciden en ambos casos.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
c) Interseccin de sucesos: es aquel suceso compuesto por los elementos comunes de los dos o
ms sucesos que se intersectan. La probabilidad ser igual a la probabilidad de los elemntos
comunes.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que sea
mayor que 3. La interseccin de estos dos sucesos tiene dos elementos: el 4 y el 6.
Su probabilidad ser por tanto:
P(A B) = 2 / 6 = 0,33
d) Unin de dos o ms sucesos: la probabilidad de la unin de dos sucesos es igual a la suma de
las probabilidades individuales de los dos sucesos que se unen, menos la probabilidad del suceso
interseccin
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que el
resultado sea mayor que 3. El suceso unin estara formado por los siguientes resultados: el 2, el 4, el
5 y el 6.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P (A B) = 2 / 6 = 0,33
35
Por lo tanto,
P (A u B) = (0,50 + 0,50) - 0,33 = 0,666
e) Sucesos incompatibles: la probabilidad de la unin de dos sucesos incompatibles ser igual a la
suma de las probabilidades de cada uno de los sucesos (ya que su interseccin es el conjunto vacio y
por lo tanto no hay que restarle nada).
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero menor que 3,
y b) que salga el nmero 6.
La probabilidad del suceso unin de estos dos sucesos ser igual a:
P(A) = 2 / 6 = 0,333
P(B) = 1 / 6 = 0,166
Por lo tanto,
P(A u B) = 0,33 + 0,166 = 0,50
f) Sucesos complementarios: la probabilidad de un suceso complementario a un suceso (A) es igual
a 1 - P(A)
Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un nmero par, luego su
complementario, suceso (B), es que salga un nmero impar.
La probabilidad del suceso (A) es igual a :
P(A) = 3 / 6 = 0,50
Luego, la probabilidad del suceso (B) es igual a:
P(B) = 1 - P(A) = 1 - 0,50 = 0,50
Se puede comprobar aplicando la regla de "casos favorables / casos posibles":
P(B) = 3 / 6 = 0,50
g) Unin de sucesos complementarios: la probabilidad de la unin de dos sucesos
complementarios es igual a 1.
Ejemplo: seguimos con el ejemplo anterior: a) que salga un nmero par, y b) que salga un
nmero impar. La probabilidad del suceso unin de estos dos sucesos ser igual a:
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
Por lo tanto,
36
P(A U B) = 0,50 + 0,50 = 1
10 PRUEBA DE HIPTESIS
Hiptesis: enunciado acerca de una poblacin elaborada con el propsito de ponerse a prueba.
Ejemplos de hiptesis acerca de un parmetro de poblacin son:
la media mensual de ingresos para analistas de sistemas es $3625,
el 20% de los delincuentes juveniles son capturados y sentenciados a prisin.
PRUEBA DE HIPTESIS
Afirmacin acerca de los parmetros de la poblacin.
Etapas Bsicas en Pruebas de Hiptesis.
Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) en parmetro poblacional.
Despus de recolectar una muestra aleatoria, se compara la estadstica muestral, as como la media
(x), con el parmetro hipottico, se compara con una supuesta media poblacional (). Despus se
acepta o se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico slo si el
resultado muestral resulta muy poco probable cuando la hiptesis es cierta.
Etapa 1.- Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H0) es el valor
hipottico del parmetro que se compra con el resultado muestral resulta muy poco probable cuando
la hiptesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%,
entonces se rechaza la hiptesis nula solamente si el resultado muestral es tan diferente del valor
hipottico que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una
probabilidad de 1.05 o menos.
Etapa 3.- Elegir la estadstica de prueba. La estadstica de prueba puede ser la estadstica muestral
(el estimador no segado del parmetro que se prueba) o una versin transformada de esa estadstica
muestral. Por ejemplo, para probar el valor hipottico de una media poblacional, se toma la media de
una muestra aleatoria de esa distribucin normal, entonces es comn que se transforme la media en
un valor z el cual, a su vez, sirve como estadstica de prueba.
Definiciones
Hiptesis nula H0: afirmacin acerca del valor de un parmetro poblacional.
Hiptesis alterna H1: afirmacin que se aceptar si los datos muestrales proporcionan evidencia de
que la hiptesis nula es falsa.
37
Nivel de significancia: probabilidad de rechazar la hiptesis nula cuando es verdadera.
Error Tipo I: rechazar la hiptesis nula cuando en realidad es verdadera.
Error Tipo II: aceptar la hiptesis nula cuando en realidad es falsa.
Estadstico de prueba: valor obtenido a partir de la informacin muestral, se utiliza para determinar si
se rechaza o no la hiptesis.
Valor crtico: el punto que divide la regin de aceptacin y la regin de rechazo de la hiptesis nula.
Valor p en la prueba de hiptesis
Valor p: es la probabilidad de observar un valor muestral tan extremo o ms que el valor observado,
dado que la hiptesis nula es verdadera.
Si el valor p es menor que el nivel de significancia, H0 se rechaza.
Si el valor p es mayor que el nivel de significancia, H0 no se rechaza
LA PRUEBA DE X
2
La prueba de X
2
se utiliza cuando se quieren analizar la correlacin entre dos variables cuyos valores
son nominales y parte, de la comparacin de las frecuencias absolutas del cruce de los valores, con
los valores de las frecuencias esperados de forma terica.
En el siguiente ejemplo se tienen 212 estudiantes de las carreras de psicologa, ingeniera y
arquitectura, se desea encontrar si existe correlacin entre la carrera estudiada y el gnero (masculino
o femenino).
TABLA 1
GENERO CARRERA GENERO CARRERA GENERO CARRERA GENERO CARRERA GENERO CARRERA
Masculino ingeniera Femenino Psicologa femenino Arquitectura Femenino ingeniera femenino psicologa
Femenino arquitectura Masculino Ingeniera masculino ingeniera Femenino psicologa masculino arquitectura
Masculino psicologa Masculino Arquitectura femenino ingeniera Femenino psicologa masculino ingeniera
Femenino ingeniera Masculino Ingeniera femenino psicologa Femenino arquitectura masculino psicologa
Femenino arquitectura Femenino Ingeniera femenino psicologa Masculino ingeniera femenino ingeniera
Femenino psicologa Masculino Ingeniera femenino arquitectura Femenino psicologa femenino arquitectura
Femenino psicologa Femenino Ingeniera masculino arquitectura Femenino arquitectura femenino psicologa
Femenino ingeniera Femenino Ingeniera masculino psicologa Masculino arquitectura femenino arquitectura
Masculino ingeniera Femenino Arquitectura femenino psicologa Femenino psicologa femenino psicologa
Femenino psicologa Masculino Ingeniera femenino ingeniera Femenino ingeniera femenino psicologa
Masculino psicologa Femenino Ingeniera femenino ingeniera Femenino arquitectura masculino ingeniera
Masculino ingeniera Femenino Ingeniera masculino ingeniera Masculino psicologa femenino arquitectura
Masculino psicologa Masculino Psicologa femenino ingeniera Masculino psicologa femenino ingeniera
Femenino psicologa Femenino Arquitectura femenino psicologa Masculino arquitectura masculino arquitectura
Masculino ingeniera Masculino Psicologa femenino ingeniera Masculino ingeniera masculino arquitectura
Masculino arquitectura Masculino Ingeniera masculino arquitectura Femenino arquitectura femenino psicologa
Masculino arquitectura Femenino Ingeniera femenino arquitectura Femenino arquitectura femenino ingeniera
Masculino ingeniera Masculino Arquitectura masculino ingeniera Femenino psicologa masculino ingeniera
Femenino arquitectura Femenino Psicologa masculino psicologa Femenino psicologa femenino psicologa
Femenino arquitectura Masculino Psicologa femenino psicologa Femenino psicologa femenino psicologa
Femenino psicologa Masculino Arquitectura femenino psicologa Masculino arquitectura masculino ingeniera
Femenino psicologa Masculino Arquitectura femenino psicologa Femenino psicologa masculino arquitectura
Femenino psicologa Femenino Arquitectura femenino psicologa Masculino ingeniera masculino arquitectura
Femenino arquitectura Femenino Arquitectura femenino arquitectura Masculino ingeniera masculino arquitectura
Femenino ingeniera Femenino Psicologa femenino ingeniera Masculino arquitectura femenino psicologa
Masculino arquitectura Masculino Ingeniera femenino ingeniera Femenino psicologa masculino ingeniera
Femenino psicologa Femenino Arquitectura femenino ingeniera Femenino ingeniera masculino ingeniera
Femenino arquitectura Masculino Ingeniera femenino psicologa Femenino arquitectura masculino psicologa
Masculino psicologa Femenino Arquitectura masculino arquitectura Masculino arquitectura masculino arquitectura
38
Femenino ingeniera Masculino Psicologa femenino psicologa Masculino arquitectura femenino arquitectura
Masculino ingeniera Masculino Ingeniera femenino arquitectura Masculino psicologa femenino psicologa
Masculino ingeniera Masculino Psicologa femenino arquitectura Femenino arquitectura femenino psicologa
Masculino arquitectura Femenino Ingeniera masculino psicologa Femenino arquitectura femenino arquitectura
Femenino ingeniera Femenino Psicologa masculino psicologa Masculino psicologa masculino psicologa
Masculino arquitectura Femenino Ingeniera masculino arquitectura Femenino ingeniera masculino ingeniera
Masculino ingeniera Masculino Ingeniera masculino ingeniera Femenino arquitectura femenino psicologa
Femenino arquitectura Femenino Ingeniera femenino arquitectura Masculino ingeniera femenino psicologa
Femenino arquitectura Masculino Ingeniera femenino psicologa Masculino ingeniera masculino ingeniera
Masculino psicologa Femenino Ingeniera femenino psicologa Femenino arquitectura masculino psicologa
Masculino arquitectura Masculino Arquitectura masculino ingeniera Masculino ingeniera masculino ingeniera
Masculino psicologa Femenino Psicologa femenino arquitectura Masculino psicologa
Femenino psicologa Femenino Psicologa femenino psicologa Femenino arquitectura
Femenino ingeniera Masculino Arquitectura femenino ingeniera Masculino arquitectura
39
Lo primero que hacemos es un conteo de las variables cruzadas como se muestra en la siguiente
tabla.
TABLA 2
Frecuencia observada
Psicologa Ingeniera arquitectura
Masculino 24 39 30
Femenino 49 32 38
Despus se procede a contar los valores de cada variable sumando los renglones sumando las
columnas, por ejemplo el total de:
masculino es 24 + 39 + 30 = 93
femenino es 49 + 32 + 38 = 119
psicologa es 24 + 49 = 73
ingeniera es 39 + 32 = 71
arquitectura es 30 + 38 = 68
Y la suma total es 212
TABLA 3
psicologa Ingeniera arquitectura
Masculino 24 39 30 93
Femenino 49 32 38 119
73 71 68 212
Se calcula la tabla de las frecuencias esperadas multiplicando de la TABLA 3 la suma del rengln por
la suma de la columna dividida entre la suma total, colocando el resultado en la TABLA 4.
As para:
masculino - psicologa 73 x 93 / 212 = 32.0235849
masculino ingeniera 71 x 93 / 212 =31.1462264
masculino arquitectura 68 x 93 / 212 =29.8301887
femenino - psicologa 73 x 119 / 212 = 40.9764151
femenino ingeniera 71 x 119 / 212 =39.8537736
femenino arquitectura 68 x 119 / 212 =38.1698113
TABLA 4
frecuencia esperada
psicologa Ingeniera arquitectura
Masculino 32.0235849 31.1462264 29.8301887
Femenino 40.9764151 39.8537736 38.1698113
Si comparamos los valores de las frecuencias esperadas con la de las frecuencias observadas
tenemos que la frecuencia observada en masculino psicologa = 24 es menor que su frecuencia
esperada = 32.0235849 esto puede implicar un correlacin negativa, es decir el valor masculino de la
variable gnero puede presentar valores inferiores a los esperados del valor psicologa de la variable
carrera. Una forma ms simple de decirlo es que los estudiantes de genero masculino tienden a
presentarse menos en la carrera de psicologa en menor grado que los de genero femenino, el que
exista una correlacin negativa o positiva no implica trminos excluyentes o determinantes pues en
este ejemplo aunque la correlacin parece ser negativa ( tal y como lo calcularemos mas adelante)
ello no implica que estudiantes del genero masculino se excluyan de la carrera de psicologa,
40
simplemente significa que los valores observados son menores a los que esperaramos
estadsticamente si no hubiera correlacin.
Para medir la correlacin procedemos a calcular el valor de la X
2
.
El valor de la X
2
es igual a:
Esto es la suma de los cuadrados de la diferencia entre la frecuencia esperada menos la frecuencia
observada entre la frecuencia esperada.
Esto lo veremos con mayor claridad en la siguiente tabla
As para:
(GENERO-CARRERA) (fe - fo)
2
/ fe
masculino - psicologa ( 32.0235849 24 )
2
/ 32.0235849 = 2.01032817
masculino ingeniera ( 31.1462264 39 )
2
/ 31.1462264 = 1.9803927
masculino arquitectura ( 29.8301887 30 )
2
/ 29.8301887 = 0.0009666
femenino - psicologa ( 40.9764151 49 )
2
/ 40.9764151 = 1.5710968
femenino ingeniera ( 39.8537736 32 )
2
/ 39.8537736 = 1.54770186
femenino arquitectura ( 38.1698113 38 )
2
/ 38.1698113 = 0.00075546
TABLA 5
X
2
psicologa Ingeniera arquitectura
Masculino 2.01032817 1.9803927 0.00096667
Femenino 1.5710968 1.54770186 0.00075546
X
2
= 7.11124166
El valor de la X
2
es la suma de todos los trminos
2.01032817
+ 1.9803927
+ 0.00096667
+ 1.5710968
+ 1.54770186
+ 0.00075546
7.11124166
As:
X
2
= 7.11124166
Ahora calculamos los grados de libertad (g.l.) mediante la siguiente frmula.
g.l. =(r 1)(c 1)
g.l. = grados de libertad
r = nmero de renglones
41
( )
observada frecuencia
esperada frecuencia
1
2
2
=
=
=
=
fo
fe
fe
fo fe
n
i
c = nmero de columnas
Para el ejemplo que estamos manejando tenemos:
r = 2 (Los renglones para los dos valores masculino y femenino)
c = 3 (Las columnas para los tres valores de psicologa, ingeniera y arquitectura)
As:
g.l. = (r 1)(c 1)
g.l. = (2 1)(3 1)
g.l. = (1)(2)
g.l. = 2
Para el ejemplo tenemos que:
X
2
= 7.11124166 y g.l. = 2
Teniendo el valor de la X
2
y los grados de libertad procedemos a calcular " (alfa)
Siendo alfa:
Donde es la funcin GAMMA
La funcin anterior no se puede integrar de manera explcita por lo que para resolverla es necesario
usar mtodos numricos de integracin.
Mediante las hojas de clculo de Microsoft Excel es posible calcular el valor de " escribiendo para
este ejemplo:
=DISTR.CHI(7.11124166, 2)
Ya que: X
2
= 7.11124166 y g.l. = 2
Haciendo esto, obtenemos:
"= 0.0285636361919662
El significado de (alfa) y su interpretacin "
El mtodo de anlisis de correlacin no paramtrica para tablas de contingencia de la X
2
parte del
supuesto inicial de que no existe correlacin entre las variables y que los resultados de la muestra son
producto exclusivamente del azar.
A este supuesto inicial se le conoce como la hiptesis nula y se le designa con H0.
Dada esta suposicin el valor de "es la probabilidad de que se obtenga una muestra como la que se
obtuvo sin que exista una correlacin de las variables, si el valor de " es muy pequeo, entonces
tenemos dos opciones:
1.-) Se obtuvo una muestra muy extraa y con escasas probabilidades de ocurrir.
2.-)La hiptesis nula de que no existe correlacin entre las variables es falsa siendo que los valores
observados ocurrieron no por azar sino porque estn correlacionadas, A esta opcin se le conoce
como la hiptesis alternativa y se le denomina Ha.
Si el valor de " es muy pequeo, se opta por la segunda opcin pues es una explicacin mas
plausible que las variables estn correlacionadas a que haya ocurrido un hecho rarsimo.
42
2
2
1
2
.
2
2
2
2
2
. .
2
1
dx e
x
l g
x
l g
"
"
0.0285636361919662
"
"*"""
"