Sie sind auf Seite 1von 21

Induccin de novatos

DATOS CATEGRICOS
II Trmino acadmico 2015-2016

Facultad de Ingeniera en Mecnica y


Ciencias de la Produccin
FIMCP
Enero, 2015
Agenda
Datos categricos y probabilidades multinomiales.
Induccin de novatos
Estimacin de probabilidades de categoras en una tabla
unidireccional.
II Trmino acadmico 2015-2016
Prueba de probabilidades de categoras en una tabla
unidireccional.
Inferencias respecto a las probabilidades de categoras en una
tabla bidireccional (de contingencia)
Tablas de contingencia con totales marginales fijos.
Datos categricos y probabilidades
multinomiales.
Los datos categricos aparecen cuando una variable se mide en una escala que
slo clasifica a la variable de inters en un nmero limitado de grupos. Por
Induccin de novatos
ejemplo, una encuesta donde se recoge informacin sobre variables como sexo,
estado civil y afiliacin poltica.

II Trmino acadmico 2015-2016


Adems de distinguir una variable como categrica (cualitativa) o continua
(cuantitativa), las variables tambin se pueden clasificar como independientes o
dependientes.
El trmino independiente se refiere a una variable que se puede manipular
experimentalmente (e.g. el tipo de tratamiento que se le asigna a cada persona),
pero tambin se aplica a menudo a una variable que se utiliza para predecir otra
variable (e.g. nivel socio-econmico).
Datos categricos y probabilidades
multinomiales.
Recuerde que la proporcin p es la probabilidad de xito en un experimento
binomial. En este capitulo, lo que interesa es hacer inferencias acerca de las
Induccin de novatos
probabilidades (o proporciones) desconocidas de un experimento multinomial
con k posibles resultados. Es decir, queremos hacer inferencias acerca de
1 , 2 , , , donde es la probabilidad de el i-simo resultado y 1 + 2 + +
II Trmino acadmico 2015-2016
= 1
Ejemplo 1: considere una computadora personal fabricada en una de cinco lneas
de produccin, A, B, C, D, o E. En una muestra de n= 103 Pc defectuosas, 15 de
fabricaron en la lnea A, 27 en la lnea B, 31 en la lnea C, 19 en la lnea D, y 11 en
la lnea E. Para este experimento hay 15 resultados o categoras, en las que se
puede clasificar cada una de las computadoras defectuosas; las categoras
corresponden a cada una de las lneas de produccin.
La pregunta prctica que debe contestarse en el estudio es si las proporciones de PC
defectuosas difieren entre las cinco lneas de produccin. Los datos proporcionan
pruebas que contradigan la hiptesis nula 0 : 1 = 2 = = 5 , donde es la
proporcin de Pc defectuosas fabricadas en la i-sima lnea de produccin?
EstimacinInduccin de novatos
de probabilidades de categoras en
II Trmino acadmico
una tabla 2015-2016
unidireccional
Tabla Unidireccional
Tabla unidireccional de conteos de categora
Categora
Induccin de novatos
1
1
2
2
3
3 k

II Trmino acadmico 2015-2016
Consideremos un experimento multinomial con k resultados que representen a categoras de una
sola variable cualitativa. Los datos ( o sea, conteos por categora) de un experimento as se
pareceran a la tabla mostrada, donde 1 , 2 , , representan los conteos por categora y
= 1 + 2 + +
Un experimento multinomial siempre puede reducirse a un experimento binomial aislando una

categora, y combinando todas las dems. Se sabe que = es un buen estimador del parmetro

binomial , se sigue que:

=

es un buen estimador de , la probabilidad asociada a la categora i de un experimento
multinomial
Intervalo de confianza con muestra grande de (1-)100%

tiene las mismas propiedades de ; a saber, que cuando n es grande, tiene (por el teorema del lmite central) una
distribucin aproximadamente normal con

Induccin de novatos
= y V =
(1 )

II Trmino acadmico 2015-2016


Intervalo de confianza con muestra grande de (1-)100% para

(1 )
2
Intervalo de confianza con muestra grande de (1-)100% para ( )

1 + 1 + 2
( )
2
Ejemplo
Refirase al ejemplo 1, y determine un intervalo de confianza de 95% para
la proporcin 1 de todas las computadoras personales defectuosas que se
Induccin de novatos
puede atribuir a la lnea de produccin A. Cabe sealas que 1 no es la
proporcin de PC producidas por la lnea de produccin A que tienen
II Trmino acadmico 2015-2016
defectos; ms bien, es la proporcin de todas las PC defectuosas que son
producidas por la lnea de produccin A.

Refirase al ejemplo 1, y establezca un intervalo de confianza de 95% para


(1 -2 ), la diferencia entre las proporciones de PC defectuosas atribuibles
a las lneas de produccin A y B, respectivamente.
Induccin de novatos
Prueba de probabilidades de categoras en una tabla
II Trmino acadmico
unidireccional 2015-2016
Prueba de hiptesis relativa a probabilidades
multinomiales
0 : 1 = 1,0 , 2 = 2,0 , , = ,0
1 :

Induccin de novatos
Estadstica de prueba 2 =
=1
1 ( ) 2
( )
= 2
=1
,0

II Trmino acadmico 2015-2016


Donde = ,0 el nmero esperado de resultados de tipo i suponiendo que Ho es verdadera. El
tamao de la muestra es n.

Regin de rechazo: 2 > 2 donde 2 tiene (k-1) grados libertad

Supuesto: 5 para toda


Ejemplo
Los dulces M&M vienen seis colores: marrn, amarillo, rojo, anaranjado, verde y
beige. Segn el fabricante (Mars, Inc), la proporcin de colores en cada lote de
Induccin de novatos
produccin grande es de 30% marrn, 20% amarillo, 20% rojo, 10% anaranjado, 10%
verde y 10% beige. A fin de probar esta aseveracin, un profesor del Carleton College

II Trmino acadmico 2015-2016


(Minnesota) hizo que sus estudiantes contaran los colores de los M&M contenidos en
bolsas de tamao divertido de los dulces (Teaching Statistics, primavera de 1993). En
la tabla se muestran los resultados para 370 M&M. Realice una prueba para
determinar si los verdaderos porcentajes de los colores producidos difieren de los
porcentajes indicados por el fabricante. Utilice = 0,05

Color Marrn Amarillo Rojo Anaranjado Verde Beige Total


# de M&M 84 79 75 79 36 47 370
Induccin de novatos
Prueba de probabilidades de categoras en una tabla
II Trmino acadmico
bidireccional 2015-2016
(de contingencia)
Tabla de contingencia general rXc
Tabla de contigencia general rxc

Induccin de novatos Columna


Totales de
fila

II Trmino acadmico 2015-2016
1 2 c

1 11 12 1 1.
2 21 22 2 2.
Fila

r 1 2 .

Totales de
columna .1 .2 .
Forma general de un anlisis de tabla de contingencia:
Prueba de independencia
0 :
0 :

Induccin de novatos
2
( )
Estadstica de prueba 2 = =1 =1 ( )

Donde =

II Trmino acadmico 2015-2016 =


=

Regin de rechazo: 2 > 2 donde 2 tiene (r-1) (c-1) grados libertad

Supuesto:
1. Los n conteos observados son una muestra aleatoria de la poblacin de inters. As,
podemos considerar que se trata de un experimento multinomial con r x c posibles
resultados.
2. Para que la aproximacin 2 sea vlida, es necesario que los conteos esperados
estimados sean por lo menos cinco en todas las celdas.
Forma general de un anlisis de tabla de contingencia:
Prueba de independencia
Es importante recordar que el estadstico sobre el cual basamos nuestra decisin tiene
una distribucin que slo se aproxima por la distribucin chi cuadrada. Los valores 2
calculados dependen de las frecuencias de las celdas y, en consecuencia, son discretos.
Induccin de novatos
La distribucin chi cuadrada continua parece aproximarse muy bien a la distribucin de
muestreo 2 , siempre y cuando el nmero de grados de libertad sea mayor que 1. En
una tabla de contingencia de 2x2, donde slo tenemos 1 grado de libertad, se aplica una
II Trmino acadmico 2015-2016
correccin llamada correccin de Yates para continuidad.
La frmula corregida entonces se convierte en
2
( ) 0,5
2 =
( )
=1 =1
Si las frecuencias de las celdas esperadas son grandes, los resultados corregidos y sin
correccin son casi iguales. Cuando las freciencias esperadas estn entre 5 y 10, se debe
aplicar la correccin de Yates. Para frecuencias esperadas menores que 5 se debera
utilizar la prueba exacta de Fisher-Irwin. Un anlisis de est prueba lo puede encontrar
en Basic Concepts of Probability and Statistics de Hodges and Lehmann (2005). Sin
embargo, esta prueba se puede evitar seleccionando un muestra grande.
Ejemplo
Un criterio que se utiliza para evaluar a los empleados que trabajan en la seccin de ensamble de
una fbrica grande es el nmero de piezas defectuosas por cada 1000 componentes producidos. El
departamento de control de calidad desea averiguar si hay una relacin entre los aos de
Induccin de novatos
experiencia y la tasa de defectos. Puesto que el trabajo es ms bien repetitivo, despus del
periodo de capacitacin inicial cualquier mejora debida al aprendizaje podra contrarrestarse por
una disminucin en la motivacin del trabajador. Se calcul la tasa de defectos para cada
II Trmino acadmico 2015-2016
trabajador en una evaluacin anual. Los resultados para 100 trabajadores se presentan en la tabla.
Hay pruebas de que exista una relacin entre la tasa de defectos y los aos de experiencia?
Utilice = 0,05

Aos de experiencia (despus del


perodo de capacitacin)
1 2-5 6-10
Alta 6 9 9
Tasa de Defectos Media 9 19 23
Baja 7 8 10
Tablas de contingencia con totales
marginales fijos
Prueba de independencia fijando los totales de las filas*
0 : ; ,

Induccin de novatos
: ; ,
.
2
( )

II Trmino acadmico 2015-2016


Estadstica de prueba

2 =
=1

=1 ( )

Donde =

=
=
Regin de rechazo: 2 > 2 donde 2 tiene (r-1) (c-1) grados libertad

Supuesto:

1. Se selecciona una muestra aleatoria de cada poblacin para la que estn fijos los totales de fila.
2. Las muestras se escogen de forma independencia
3. Es necesario que el valor esperado estimado de cada celda sea de por lo menos cinco para poder
usar la aproximacin 2
*Observe que si se desea un procedimiento para realizar un anlisis 2 con totales de columna fijos basta con intercambiar las palabras columna
y fila .
Ejemplo
Una compaa de electricidad debe elegir entre dos tecnologas para generar electricidad para sus clientes
en el futuro: carbn o energa nuclear. A fin de conocer las actitudes de los ciudadanos locales, la
compaa de electricidad realiz un sondeo de la opinin pblica. Se consideraron cuatro sectores: medios

Induccin de novatos
noticiosos, el sindicato de mineros del carbn, ecologistas y conservacionistas, y grupos locales. Se
muestrearon aleatoriamente 50 personas de cada unos de estos sectores y se les pidi expresar su
opinin. Los resultados de la encuesta se muestran en la tabla.

II Trmino acadmico 2015-2016 Medios


Sindicato
de mineros
Ecologistas y
conservacionistas
Grupos
locales
noticiosos del carbn TOTALES
Apoyan opcin de carbn 21 42 11 25 99
Apoyan opcin nuclear 18 2 16 13 49
Neutrales 11 6 23 12 52
TOTALES 50 50 50 50 200

a. La opinin pblica en lo tocante a la eleccin de una tecnologa futura para generar electricidad difiere
entre los cuatro grupos? Pruebe con = 0,10
b. Parece haber ms apoyo global para la opcin de carbn que para la opcin de energa nuclear? Pruebe
con con = 0,10
c. Establezca un intervalo de confianza de 90% para el porcentaje de ecologistas y conservacionistas que
apoyan la opcin nuclear.
Prueba de Homogeneidad
Utilizando una tabla de contingencia, en lugar de hacer una prueba de
independencia, se prueba la hiptesis de que las proporciones de
Induccin de novatos
poblacin dentro de cada rengln son iguales.

II Trmino acadmico 2015-2016


Al suponer homogeneidad de nuevo se calcula las frecuencias esperadas
de las celdas multiplicando los totales de rengln y de columna
correspondientes y despus dividiendo entre el gran total. Luego se
continua el anlisis utilizando el mismo estadstico de prueba chi cuadrada
como antes.
Ejemplo
De acuerdo con un estudio de la Universidad Johns Hopkins, publicado en
American Journal of Public Health, las viudas viven ms que los viudos.
Induccin de novatos
Considere los siguientes datos reunidos de supervivencia de 100 viudas y 100
despus de la muerte del cnyuge:
II Trmino acadmico 2015-2016
Aos vividos
Menos de 5
Viuda
25
Viudo
39
de 5 a 10 42 40
Ms de 10 33 21
Bibliografa
Walpole, R. E., Myers, R. H., Myers, S. L., Ye, K. (2012)
Probabilidad y estadstica para ingeniera y ciencias.
Induccin de novatos
(L. E. Pineda, R. Hernndez & L. M. Medina, Trans.)
IIMxico
Trmino acadmico 2015-2016
Mendenhall, W., Sincich, T. (1997)Probabilidad y
estadstica para ingeniera y ciencias. (Escalona, M.,
& Rico, M., Trans.) Mxico

Das könnte Ihnen auch gefallen