Beruflich Dokumente
Kultur Dokumente
Esta dentro de lo normal y probable, es decir la diferencia que observamos en los datos
es debida al azar.
La Ho establece que no hay diferencia o lo que es lo mismo hay igualdad.
Aceptamos la Ho
La diferencia que observamos es debida a algo mas
Rechazamos la hipótesis nula.
Clasificación
Dos variables
Prueba de independencia
Se usa para analizar la frecuencia de dos variables con categorías múltiple para determinar
si las dos variables son independientes o no.
La prueba de chi cuadrado de independencia es particularmente útil para analizar datos
de variables cualitativos nominales.
Los datos de las variables cualitativas o categorías representan atributos o categorías y se
organizan en tablas llamadas tablas de contingencia o tablas de clasificación cruzada.
Dónde:
i j: es el número de sujetos que tienen las características A i y B j a la vez.
R i: (i = 1,…, r) es la suma de la i-ésima fila de la tabla. Es decir, es el total de sujetos
que poseen la característica A i.
C j :(j = 1,…,c) es la suma de la j-ésima columna de la tabla. Es decir, es el total de sujetos
que poseen la característica B j.
n: representa el total de observaciones tomadas.
Formula
Donde
Oij: es la frecuencia observada de la celda que está en la fila i, columna j,
La frecuencia esperada es aquella que debe ocurrir para que la hipótesis nula sea acpetada
La prueba estadística se distribuye como un Ji-Cuadrado con (r-1)*(c-1) grados de
libertad.
La hipótesis nula se rechaza si
O equivale si el ´´p-value´´ es menor que a (prefijado).
EJEMPLO:
Se toma muestras aleatoria de 2200 familias y se les clasifica en una tabla de doble entrada según
su nivel de ingresos (alto, medio o bajo) y el tipo de colegio a la que envían a sus hijos. La
siguiente tabla muestra los resultados obtenidos
¿A un nivel de significancia del 1% hay una razón para creer que el ingreso y el tipo de colegio
no son variables independientes?
Primero: ingresar los datos ya tabulados de la siguiente manera
Solución:
La hipótesis a plantearse son las siguientes:
Ho: no hay relación entre el ingreso y el tipo de colegio
H1: si hay relación entre el ingreso y el tipo de colegio
HOMOGENIDAD:
Se extraen muestras independientes de varias poblaciones y se prueban ver si son homogéneas
con respecto a algún criterio de clasificación
Un conjunto totales marginales son fijos mientras que los otros marginales son aleatorios.
EJEMPLO:
Con el fin de probar la efectividad e una vacuna contra cierta enfermedad, se realizó un
experimento observando a 200 personas, 110 de ellas vacunadas y las otras 90 sin vacunar.
Presenta los datos evidencia suficiente como para indicar que la proporción de personas
vacunadas que contrajeron la enfermedad no es la misma que la proporción de personas que no
se vacunaron y que contrajeron la enfermedad.
Los resultados obtenidos se muestras en el siguiente cuadro
Planteamiento de hipótesis
Ho: P1 = P2
H1: P1 diferente de P2
Donde
P1: proporción de vacunados que contraen la enfermedad
P2: proporción de no vacunados que contraen la enfermedad.
Resultados:
Decisión:
Como p-valor= 0.286 es mayor que 0.05 (alfa)
Podemos indicar que no existe suficiente evidencia para aceptar que hay diferencias entre las
proporciones P1 y P2.
PRUEBA DE BONDAD DE AJUSTE
Están diseñados para problemas en los que se conoce la población o problemas de probabilidad,
y la hipótesis involucra los parámetros de la distribución.
Se utiliza para la comparación de la distribución de una muestra con alguna teórica que se supone
a la población de la cual se extrajo
Ho: la variable tiene comportamiento normal
H1: la variable no tiene comportamiento normal
A menudo se encuentra otra clase de hipótesis: no se sabe cuál es la distribución de la población
y se desea probar la hipótesis de una distribución en particular será un modelo satisfactorio de la
población.
Por ejemplo:
Probar la hipótesis de que la población tiene comportamiento normal, poisson, exponencial etc.
1. Formulación de la hipótesis:
Ho: los datos de la muestra se ajustan a la distribución teórica escogida
H1: los datos de la muestra no se ajustan a la distribución teórica escogida
2. Fijar el nivel de significación:
3. La estadística de prueba donde
Ei: npi
Oi: observado
p: número de parámetros estimados a partir de la muestra
K: número de categorías o clases
pi: probabilidad
Bibliografía
aramirez. (19 de Febrero de 2010). Chi Cuadrado. Obtenido de Slide Share:
https://es.slideshare.net/tinaramirez/chi-cuadrado-3228701