Sie sind auf Seite 1von 20

UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN

ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

AO DEL BUEN SERVICIO AL CIUDADANO


FACULTAD DE CIENCIAS DE LA EDUCACIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

Docente:
Clodoaldo, RAMOS PANDO

Alumno:
Franz Hubert, CRISTOBAL TRINIDAD

Curos:
Estadstica

Semestre:
VII

Cerro de Pasco 2017

Tecnologa Informtica y Telecomunicaciones 1


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

Tecnologa Informtica y Telecomunicaciones 2


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

DEDIACTORIA

El siguiente trabajo se lo dedico a


Dios, que me ha dado la fortaleza
para poder realizar este trabajo, a
mis padres, por su apoyo
incondicional y al docente del curso
por ser gua en mi formacin
profesional.

Tecnologa Informtica y Telecomunicaciones 3


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA
NDICE

NDICE

INTRODUCCION ........................................................................................................................................ 5
TEORIA ........................................................................................................................................................ 6
PLANTEAMIENTO DE HIPOTESIS EN MAS DE DOS POBLACIONES (Chi-Cuadrada) ......... 6
CASO ESTADISTICO ................................................................................................................................ 6
APLICACIONES.......................................................................................................................................... 8

PRUEBAS DE 2........................................................................................................................................ 8
PROPIEDADES DE LAS DISTRIBUCIONES CHI CUADRADAS .................................................... 10
SUPUESTOS Y RESTRICCIONES ....................................................................................................... 10
GRAFICOS ................................................................................................................................................ 12
FORMULA.................................................................................................................................................. 14
TABLA DE CONTINGENCIA CHI CUADRADA................................................................................... 15
Pasos para realizar la tabla de contingencias.......................................................................................... 15
BIBLIOGRAFA: ........................................................................................................................................ 20

Tecnologa Informtica y Telecomunicaciones 4


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

INTRODUCCION

En estadstica, la distribucin (de Pearson) es una distribucin de probabilidad continua


con un parmetro k que representa los grados de libertad de la variable aleatoria:

Donde Zi son variables de distribucin normal, de media cero y varianza uno. El que la

variable aleatoria X tenga esta distribucin se representa habitualmente as: .

Tecnologa Informtica y Telecomunicaciones 5


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

TEORIA

Distribucin de Chi- cuadrado ()


Distribucin de datos discretos, que es funcin de la densidad poblacional y cuyos
valores varan desde cero hasta infinito positivo.
A diferencia de la distribucin Normal o la de t (Test de Student o de t), la funcin se
aproxima asintticamente al eje horizontal slo en la cola derecha de la curva y NO en
ambas colas.
Para evaluar el ajuste entre frecuencias observadas y esperadas existenestadsticos
que prueban en qu medida difieren las mismas y si esadiferencia es significativa o no.
Hay dos mtodos que son los ms utilizados:
Mtodo de Ji- cuadrado o Chi- cuadrado ()
Mtodo G o prueba del logaritmo de la razn de Verosimilitudes
Mtodo de Ji- cuadrado o Chi- cuadrado ()
Donde fo= frecuencia observada
fe= frecuencia esperada X= (fo- fe) /fe
La razn por la que la que esta prueba se ha denominado Chi cuadrado ypor la que
muchos han llamado as tambin al estadstico obtenido X,es que la distribucin de
muestreo de esta sumatoria se aproxima a lade una distribucin de X con = 1 grados
de libertad.
La prueba es siempre a una cola ya que las desviaciones estnelevadas al cuadrado y
conducen siempre a valores positivos

PLANTEAMIENTO DE HIPOTESIS EN MAS DE DOS POBLACIONES (Chi-Cuadrada)

CASO ESTADISTICO
Dnde:
X2 = valor estadstico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.

Tecnologa Informtica y Telecomunicaciones 6


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

En estadstica y estadstica aplicada se denomina prueba (pronunciado como ji


cuadrado y a veces como chi cuadrado) a cualquier prueba en la que
el estadstico utilizado sigue una distribucin si la hiptesis nula es cierta. Algunos
ejemplos de pruebas son:
La prueba de Pearson, la cual tiene numerosas aplicaciones:
La prueba de frecuencias.
La prueba de independencia.
La prueba de bondad de ajuste.
La prueba de Pearson con correccin por continuidad o correccin de Yates.
La prueba de Bartlett de homogeneidad de varianzas.
La prueba de Pearson se considera una prueba no paramtrica que mide la
discrepancia entre una distribucin observada y otra terica (bondad de ajuste), indicando
en qu medida las diferencias existentes entre ambas, de haberlas, se deben al azar en
el contraste de hiptesis. Tambin se utiliza para probar la independencia de dos
variables entre s, mediante la presentacin de los datos en tablas de contingencia.
La frmula que da el estadstico es la siguiente:

Cuanto mayor sea el valor de , menos verosmil es que la hiptesis sea correcta.
De la misma forma, cuanto ms se aproxima a cero el valor de chi-cuadrado, ms
ajustadas estn ambas distribuciones.
Los grados de libertad gl vienen dados por:

Donde r es el nmero de filas y k el de columnas.


Criterio de decisin:

No se rechaza cuando . En caso contrario s se rechaza.


Donde t representa el valor proporcionado por las tablas, segn el nivel
de significacin estadstica elegido.

Tecnologa Informtica y Telecomunicaciones 7


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

APLICACIONES

La distribucin tiene muchas aplicaciones en inferencia estadstica, por ejemplo en la


denominada prueba utilizada como prueba de independencia y como prueba de
bondad de ajuste y en la estimacin de varianzas. Tambin est involucrada en el
problema de estimar la media de una poblacin normalmente distribuida y en el problema
de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la
distribucin t de Student, y participa en todos los problemas de anlisis de varianza, por
su papel en la distribucin F de Snedecor, que es la distribucin del cociente de dos
variables aleatorias independientes con distribucin .

PRUEBAS DE 2

BONDAD DE AJUSTE
o Se utiliza para la comparacin de la distribucin de una muestra con alguna
distribucin terica que se supone describe a la poblacin de la cual se
extrajo.
INDEPENDENCIA
o La Ho indica que 2 variables o criterios de clasificacin son independientes
cuando se aplican a un conjunto de individuos (unidades de observacin)
o Totales Marginales Aleatorios
HOMOGENEIDAD
o Se extraen Muestras Independientes de varias poblaciones y se prueban
para ver si son homogneas con respecto a algn criterio de clasificacin.
o Un conjunto de Totales Marginales Son Fijos mientras que los otros
marginales son Aleatorios.
Bondad de Ajuste (para una multinominal)

Esta es una prueba para comparar las probabilidades de (i) de una distribucin
multinominal (lo esperado), con las obtenidas en una muestra (lo observado) para
determinar si son iguales o no.

Tecnologa Informtica y Telecomunicaciones 8


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

Distribucin Multinominal

La Distribucin Multinominal es una extensin de la distribucin Binominal. En vez de


haber solo dos posibles resultados (xitos y fracasos) tenemos k posibles resultados.
Al igual que en la Binominal:

1. Los experimentos son Independientes


2. Hay un nmero fijo de experimentos

La probabilidad de que ocurra cada uno de los resultados en un experimento 1,.. 2


k es constante.

La prueba de Chi Cuadrada es un mtodo til para comparar resultados experimentales


con aquellos que se esperan tericamente en virtud de una hiptesis.

La distribucin Chi cuadrada nos permite probar, si dos o ms proporciones de poblacin


pueden ser consideradas iguales.
Si clasificamos a una poblacin en diferentes categoras con respecto a dos atributos
(edad, y desempeo en el trabajo), podemos utilizar una prueba Chi cuadrada, para
comprobar si los dos atributos son independientes entre s. la distribucin Ji cuadrada, se
denota por la letra griega X(Ji), elevada al cuadrado: X2.
A medida que aumentan los grados de libertad la curva se va haciendo ms simtrica y su
cola derecha se va extendiendo.
Caractersticas de la distribucin
Todos los valores de x2son positivos.
Es una curva sesgada hacia la derecha.
La media de la distribucin son sus grados de libertad

Tecnologa Informtica y Telecomunicaciones 9


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

PROPIEDADES DE LAS DISTRIBUCIONES CHI CUADRADAS

l.-Los valores de x2 son mayores o iguales que O


2.-La forma de una distribucin x2 depende del g I =n-l. En consecuencia hay un nmero
infinito de distribuciones x2.
3.-EI rea bajo una curva Chi cuadrada y sobre el eje horizontal es 1.
4.-Las distribuciones x2 no son simtricas, tienen colas estrechas que se extienden a la
derecha; estn sesgadas a la derecha.

5.- cuando n>2 la media de una distribucin x2 es n-l y la varianza es 2(n-l). 6.-EI valor
modal de una distribucin x2 se da en el valor (n-3).

SUPUESTOS Y RESTRICCIONES

SUPUESTOS PARA LA PRUEBA DE 2

o Experimento multinominal. Lo que se satisface tomando una muestra aleatoria de la


poblacin de inters.
o El tamao de muestra es lo suficientemente grande para que el nmero esperado en
las categoras sea 5, para asegurar que 2 se aproxime a la distribucin real
(multinomial).
o Se puede recurrir a colapsar categoras contiguas (celdas) con valores esperados
menores de 5.

La prueba estadstica es:

Donde pio representa la proporcin deseada en la i-sima categora, Obsi la frecuencia


observada en la categora i y n es el tamao de la muestra.
La prueba estadstica se distribuye como una Ji-Cuadrado con k-1 grados de libertad
donde, k es el nmero de categoras.
Si el valor de la prueba estadstica (2 calculado) es mayor que el valor crtico (2 de la
tabla) se rechaza la hiptesis nula

Tecnologa Informtica y Telecomunicaciones 10


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

Ei: frecuencia Esperada de la i-sima clase


Oi: frecuencia Observada de la i-sima clase
N: nmero de clases
k: nmero de parmetros estimados a partir de la muestra

La chi cuadrada permite al investigador comprobar una hiptesis acerca de una relacin
entre dos medidas nominales. La lgica x2 es la siguiente: el nmero total de
observaciones en cada columna en cada columna y el nmero total de observaciones en
cada rengln (positivo o negativo) son considerados o fijados y se conoce como
frecuencia marginal.

Existen abusos de esta prueba estadstica como su empleo en grupos independientes


cuyas variables son numricas, para lo cual debera usarse la t y no convertir los valores
ordinales o nominales. Un ejemplo frecuente es usar puntos de corte arbitrariamente
como la edad de 45 o 60 aos cuando los datos numricos con la estadstica
correspondiente nos brindan ms informacin.

Desventajas del mtodo:


1) Deben agruparse aquellas clases con una frecuencia esperada menor o igual a 5
(fe5), hasta que su suma alcance un valor mayor o igual a 5 (fe5).
Por esta restriccin, el agrupamiento produce una reduccin en el nmero de clases y es
frecuente entonces que el nmero de grados de libertad no sea suficiente para evaluar
estadsticamente el ajuste.
Por ello, Cochran (1954; Snedecor & Cochran, 1967) ha considerado que tal restriccin
debilita la sensibilidad del test y ha sugerido que los valores esperados no deben ser
menores a 1 (fe1) y no a 5.
El nmero de grados de libertad es entonces:
=n de clase luego de la agrupacin a-1

Teniendo a la interpretacin mencionada ms abajo.


2) El nmero de grados de libertad es = n-a-1, donde a es el nmero de parmetros
estimados para ajustar el modelo elegido; de manera que el nmero mnimo de clases
que se pueden comparar es:

Tecnologa Informtica y Telecomunicaciones 11


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

3, para el modelo de Poisson. El parmetro de este modelo es


(Lambda) y como los grados de libertad de cualquier distribucin no pueden
ser menores a la unidad ( 1):

= n-a-1

Siendo a==1 parmetro


= n-2
Por tanto n debe ser 3

GRAFICOS

GRAFICA DISTRIBUCION JI CUADRADA PARA V= 2, 5, Y 10 GRADOS DE LIBERTAD

Distribucin Chi cuadrada para v=2,5 y 10.


La estadstica de Ji cuadrada se calcula de la manera siguiente:

Esta frmula establece que Chi cuadrada, o x2, es la suma que obtendremos si:
1.- Restamos Fe de Fo para cada una de las celdas de la tabla.
2.-Elevamos al cuadrado cada una de las diferencias.

Tecnologa Informtica y Telecomunicaciones 12


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

3.- Dividimos cada diferencia al cuadrado entre Fe.


4.-Sumamos los resultados.

La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el
valor (n-3) = (gl-2).

La funcin de densidad de la distribucin X2 est dada por:

para x>0

la cual da valores crticos (gl) para veinte valores especiales de . Para denotar el

valor crtico de una distribucin X2 con gl grados de libertad se usa el smbolo (gl);
este valor crtico determina a su derecha un rea de bajo la curva X2 y sobre el eje
horizontal. Por ejemplo para encontrar X20.05(6) en la tabla se localiza 6 gl en el lado

izquierdo y a o largo del lado superior de la misma tabla.

Tecnologa Informtica y Telecomunicaciones 13


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

La Distribucin Chi cuadrada

La Distribucin de probabilidad

FORMULA
La frmula es:

Tecnologa Informtica y Telecomunicaciones 14


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

Dnde:
X2 = valor estadstico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.

Pasos:
1. Arreglar las observaciones en una tabla de contingencias.
2. Determinar el valor terico de las frecuencias para cada casilla.
3. Calcular las diferencias entre los valores observados con respecto a los tericos de
cada casilla.
4. Elevar al cuadrado las diferencias y dividirlas entre el valor terico de la casilla
correspondiente.
5. Obtener la sumatoria de los valores anteriores, que es el estadstico X2.
6. Calcular los grados de libertad (gl): gl = (K columnas -1) [H hileras -1].
7. El valor de X2 se compara con los valores crticos de ji cuadrada de la tabla de
valores crticos de X2 y de acuerdo con los grados de libertad, y se determina la
probabilidad.
8. Decidir si se acepta o rechaza la hiptesis X2c X2t se rechaza Ho.

TABLA DE CONTINGENCIA CHI CUADRADA

La tabla Chi cuadrada (X2) se utiliza principalmente:


Para probar si una serie de datos observada, concuerda con el modelo (serie
esperada) de la informacin.
Para probar las diferencias entre las proporciones de varios grupos (tabla de
contingencia).
Para todos los casos,
Ho: No hay diferencia o no hay dependencia entre variables
H1: Hay diferencia o si hay dependencia entre variables

Pasos para realizar la tabla de contingencias

Tecnologa Informtica y Telecomunicaciones 15


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

1. Plantear las hiptesis:


H1: al menos dos proporciones son diferentes.
2. Construir una tabla que contenga los valores observados.
3. Sumar los totales de los renglones y columnas de los valores observados.
4. Debajo de cada valor observado poner el valor esperado utilizando la frmula:
5. Calcular el valor del estadstico de prueba usando la frmula:
Dnde:
Oij = Valor observado de la celda i,j.
Eij = Valor esperado de la celda i,j
6. Determinar los grados de libertad mediante:
donde
r = nmero de renglones
c = nmero de columnas
7. Calcular el valor crtico en la tabla
8. Criterio de decisin: si el valor crtico < valor del estadstico de prueba rechazamos
Ho

Ejemplo: Al final de un semestre, las calificaciones de matemticas fueron tabuladas en la


siguiente tabla de contingencia de para estudiar la relacin entre la asistencia a clase y la
calificacin obtenida.
Ausencias Aprobado No aprobado
0-3 135 110
4-6 36 4
7 - 45 9 6
Con, indican los datos que son distintas las proporciones de estudiantes que pasaron en
las tres categoras de ausencias?
H0 : p1 = p2 = p3
H1: al menos dos proporciones son diferentes.
Los valores Oij = 135, 110... Corresponden a los valores observados, los valores
esperados se colocan en las celdas con parntesis, para calcular los utilizamos la
frmula:
Calculamos el valor del estadstico de prueba usando la frmula:

Tecnologa Informtica y Telecomunicaciones 16


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

La tabla siguiente nos ayuda a organizar los clculos para el estadstico.

Tabla. Clculos para el estadstico Chi cuadrada

Para determinar el valor crtico del estadstico de prueba procedemos de la siguiente


manera:
Determinar los grados de libertad usando la frmula: , gl = (3-1)(2-1) = 2
El valor crtico del estadstico ji-cuadrada para y g.l. = 2 se denota, En la
tabla ji- cuadrada encontramos que vale 5.991, el valor del estadstico de prueba es
=17.44.

Conclusin: Como este estadstico est localizado en la regin de rechazo (a la derecha


del valor crtico) , rechazamos Ho por lo cual aceptamos la hiptesis alternativa H 1: al
menos dos proporciones son diferentes. La tasa de aprobacin si depende de las
asistencias.

Tecnologa Informtica y Telecomunicaciones 17


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

Tecnologa Informtica y Telecomunicaciones 18


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

Tecnologa Informtica y Telecomunicaciones 19


UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIN
ESCUELA DE FORMACIN PROFESIONAL DE EDUCACIN SECUNDARIA

BIBLIOGRAFA:
Estadstica e Investigacin CON APLICACIONES DE SPSS
http://www.semergencantabria.org/calc/apcalc.htm
http://www.aray1.com/docupdf/ji2.pdf
Http://members.fortunecity.co/bucker4/estadstica/pruebaji2mi.htm

Tecnologa Informtica y Telecomunicaciones 20

Das könnte Ihnen auch gefallen