Sie sind auf Seite 1von 327
BIOESTADISTICA: PRINCIPIOS Y PROCEDIMIENTOS segunda edicién (primera en espafiol) Robert G. D, Steel Profesor de Estadistica North Carolina State University dames H. Torrie Profesor Emérito de Agronomia University of Wisconsin Traduccién Ricardo Martinez B. Profesor Asociado Universidad Nacional de Colombia Revision desis Maria Castafio Profesor de Matematicas McGRAW-HILL MEXICO » BUENOS AIRES » CARACAS * GUATEMALA LISBOA ¢ MADRID ¢ NUEVA YORK * PANAMA » SAN JUAN SANTAFE DE BOGOTA * SANTIAGO « SAO PAULO AUCKLAND * HAMBURGO * LGNDRES ¢ MILAN « MONTREAL NUEVA DELHI ¢ PARIS * SAN FRANCISCO * SINGAPUR ST. LOUIS * SIDNEY « TOKIO « TORONTO BIOESTADISTICA Princlpios y Procedimientos Prohibida la reproduccién total o parcial de asta obra, por cualquier medio, sin autorizacién escrita del editor. DERECHOS RESERVADOS © 1988, respecto a la primera edicién en espafios par MoGRAW-HILL/INTERAMERICANA DE MEXICO, S.A. DE CV. Attacomulco 499-501, Fracc. Industrial San Andrés Atoto 636500 Naucalpan de Judrez, Edo. de México Miembro de la Cartiara Nacional de Ia Industria Editorial, Reg. Nim. 1890 ISBN 968-451-495-6 Traducido de la segunda edicién en inglés de PRINCIPLES AND PROCEOURES OF STATISTICS A Blometrial Approach Copyright © MCMLXXX, by McGraw-Hill, Inc., U. S. A. ISBN 0-07-060926-8 8901234567 F.1.-86 9087543216 impreso en México Printed in Mexico Esta obra se terminé de imprimir en Agosto de 1996 en Impresora y Maquiladora de Libros MIG, S.A. de C.V. Venados Num. 530 Col. Los Olivos Delagacién Tiéhuac 13210 Maxico, D:F. So tiraron 800 ejemplares A ‘a memoria de James H. Torrie, quien no pudo participar en la redaccién de esta segunda edicién. Los dos afios anteriores a su muerte, el 30 de mayo de 1976, fueron para él de precaria salud. Era entonces Profesor Emérito de Agronomia de la Universidad de Wisconsin en Madison. Jim tuvo una larga y productiva carrera, fue un profesor amistoso y paciente y una persona tranquila, nada presuntuoso. Capitulo 1 Li CONTENIDO ‘Prefacio Simbolos escogidos Introduccion Definicion de la estadistica Breve historia de la estadistica La estadistica y el método cientifico El estudio de Ja estadistica Observaciones Introduccién Variables Distribuciones Poblaciones y muestras Muestras aleatorias: Recoleccién de datos Presentacion, resumen y caracterizacién de la informacion Medidas de tendencia central Medidas de dispersion Desviacién estandar de las medias Coeficiente de variabilidad o de variacién Ejemplo Modelo lineal aditivo Ejemplo El uso de codificacién en et calculo de estadigrafos La tabla de frecuencia Ejemplo Vanes vill CONTENIDO 217 2.18 219 Capftulo 3 3.1 3.2 3.3 3.4 3.5 3.6 Capitulo 5 $1 3.2 5.3 5.4 5.5 5.6 57 58 5.9 3.10 Cielo de 1a media y la desviacién estindar con una tabla de frecuencia | Presentacién grafica de la tabla de frecuencia Digitos significativos Probabilidad Introduccién Algunos elementos de probabilidad La distribucién binomial Funciones de probabilidad para variables continuas La distribucién normal Probabilidades de una distribucién normal. Uso de una tabla de probabilidades La distribucion normal con media u y varianza o? Distribucién de medias Distribucion x Distribucién ¢ de Student Estimaci6n e inferencia Prediccién de resultados de muestras Muestreo de una pobiacién normal Introduccién Una poblacién con distribucién normal Muestras aleatorias de una distribucién normal Distribucion de medias muestrales Distribucién de varianzas y muestrales y desviaciones estandar Insesgamiento de s? Desviacién estandar de la media o error estandar La distribucién ¢ de Student E] enunciado de confianza Muestreo de diferencias Resumen sobre muestreo Comparaciones entre dos medias muestrales Introduccién Pruebas de significancia Pmeba de hipétesis de que una redia poblacional es un valor dado Pruebas de dos o mas medias , Comparacion de dos medias muestrales, muestras independientes y varianzas iguales Modelo lineal aditivo Comparacion de medias muestrales; observaciones pareadas de importancia El modelo jineal aditivo para comparaciones pareadas Muestras independientes y varianzas desiguales La media y la varianza de una funcion lineal 34 35 35 93 97 98 10L 102 103 Capitulo 6 Capitulo 7 71 22 73 74 1S 7.6 Capitulo 8 8.1 8.2 8.3 a4 a5 8.6 CONTENIDO ix. Prusba de hipdtesis de igualdad de varianzas Poder, tamafio de la muestra y determinacidn de diferencias Muestras biet4picas de Stein Principios de disefio experimental Introducci6n 4Qué es un experimento? Objetivos de un experimento Unidad experimental y tratamiento Error experimental Repeticiones y sus funciones Factores gue afectan el nfimero de repeticiones Precision relativa de disefios con pocos tratamientos Control del error Eteccidén de los tratamientos Refinamiento de la técnica Aleatorizacién Inferencia estadistica Analisis de la varianza I: Clasificacién de una via Tntroduccién E] disefio completamente aleatorio Datos con un soto criterio de clasificacion: El andlisis de la varianza para cualquier niimero de grupos con igual namero de repeticiones Datos con un solo criterio de clasificacién: El andlisis de la varianza para cualquier nfimero de grupos con numero desigual de repeticiones El modelo lineal aditivo ~* Anilisis de la varianza con submuestras: Numero igual de submuestras Modelo lineal para submuestreo Anilisis de la varianza con submuestras: Desigual mamero de submuestras Componentes de la varianza en experimentos planeados con submuestras Supuestos en que se fundamenta el anilisis de la varianza Comparaciones miltiples Introducci6én La diferencia minima significante Comparaciones Prueba de efectos sugeridos por los datos Prucha de Scheffé Procedimiento w de Tukey 108 109 116 118 132 £32 132 134 140 144 148 154 156 159 162 166 166 171 175 177 i” x CONTENIDO Capitulo 10 10.1 10.2 10.3 10.4 10.5 10.6 10.7 10,8 10.9 10.10 10.11 10,12 10,13 Capitulo 11 1 11.2 113 Prueba de Student-Newman-Keuls 0 S-N-K Nueva prueba de amplitud miltiple de Duncan Comparacién de todas las medias con un contro! Prueba de ¢ de razon k bayesiana de Waller-Duncan Pruebas de medias con nimero desiguai de repeticiones Anélisis de la varianza II: clasificaciones nviltiples. Introduccién El disefio de bloque completo al azar Andlisis de la varianza para cualquier namero de tratamientos; disefio de bloque completo al azar La naturaleza del término de error Particion del error experimental Datos faltantes Estimacion de la ganancia en eficiencia El disefio de bloques completas al azar: mAs de una observacién por tratamiento por bloque Modelos lineales y e] analisis de la varianza Agrupamiento doble: cuadrados latinos Anilisis de la varianza del cuadrado latino Parcelas faltantes en el cuadrado latino Estimacién de la ganancia en eficiencia EI modelo lineal para el cuadrado latino El tamafio de un experimento Transformaciones Regresién lineal Introduccion La regresion lineal de Y con respecto aX El modelo y Ja ecuacion de regresién lineal Fuentes de variacion en la linea de regresién lineal Valores de regresién y valores ajustados Desviaciones estandar, intervalos de confianza y pruebas de hipOtesis Control de la variacién por observaciones concomitantes Diferencia entre dos regresiones independientes Una prediccién y su vatianza Prediccién de X, modelo I Distribuciones bivariantes, modelo I Regresién a través del origen Anilisis de regresion ponderada Correlacién lineal Introduccibn La correlaci6n y el coeficiente de correlacién Correlaci6n y regresién 180 181 182 184 185 188 188 188 190 195 198 202 207 208 211 213 215 219 223 224 226 231 234 231 236 240 242 244 248 250 253 256 256 258 261 263 263 263 268 Capitulo 12 12.1 12,2 12.3 12.4 Capitulo 13 Capitulo 14 14,1 14.2 14.3 14.4 14.5 14.6 14.7 14.8 14.9 Capitulo 15 15.5 15.2 15.3 15.4 15.5 15.6 ae CONTENIDO x Distribuciones muestrales, intervalos de confianza y pruebas de hipotesis 269 Homogeneidad de los coeficientes de correlaci6n 271 Correlacién intraclases 273 Notacién matricial 276 Introduccion 276 Matrices 277 Operaciones con matrices 278 Inversas, dependencia lineal, y rango 283 Regresi6n lineal en notacién matricial 288 Introduccién 288 El modelo y la estimacian de minimos cuadrados 288 El andlisis de ja varianza 292 Desviaciones estandar, intervalos de confianza y pruebas de hipétesis 294 Estimaci6n y prediccion 296 Variables indicadoras o binarias 298 Regresién y correlacién multiple y parcial 303 Introduccion 303 La ecuacién lineal y su interpretacion en mas de dos dimensiones 304 Regresién lineal parcial, total y miltiple 306 La ecuacién muestral de regresién lineal mUltiple 308 Regresién lineal multiple; dos variables independientes 309 Correlacion parcial y multiple 316 Regresién lineal miltiple; resultados impresos para & variables independientes 320 Miscelanea 324 Coeficientes de regresién parcial estandar 325 Andlisis de la varianza II: ¢xperimentos factoriales 328 Introduccién 328 Experimentos factoriales 328 El experimento factorial 2 x 2: un ejemplo 4334 Factorial 3 x 3x 2 6 3? x 2: un ejemplo 340 Modelos lineales para experimentos factoriales 346 Clasificaciones de n vias y experimentos factoriales; superficies de respuesta 382 Grados de libertad individuales; tratamientos igualmente espaciados ap Un solo grado de lbertad para no aditividad xil CONTENIDO Capitulo 16 16.1 16.2 16.3 16.4 16.5 16.6 16.7 16.8 Capitulo 17 17.1 17.2 17.3 17.4 17.5 17.6 17.7 17.8 17.9 17.10 17AL 17.12 17.13 Capitulo 18 18.1 18.2 18.3 18.4 18.5 Capitulo 19 19.1 19.2 19.3 19.4 19.5 Capitulo 20 20.1 20.2 Anilisis de la varianza IV: disefio y andlisis de parcelas divididas Introduccién Disefios de parcelas divididas Un ejemplo de parcelas divididas Datos faltantes en diseftos de parcelas divididas Disefio de bloques divididos Modelos de parcelas y de bloques divididos Parcelas divididas en espacio y tiempo Series de experimentos semejantes Anzlisis de la covarianza Introduccién Usos del andlisis de la covarianza El modelo y los supuestos para la covarianza Prueba de medias de tratamientos ajustadas La covarianza en el disefio de bloques completes at azar Ajuste de las medias de tratamiento Aumento de precision debido a la covarianza Particion de la covarianza Homogeneidad de coeficientes de regresion La varianza cuando se particiona fa suma de cuadrados de tratamiento Estimacion de observaciones faltantes mediante la covarianza Covarianza con dos variables independientes Calculos de alta velocidad y salidas de computador Anilisis de la varianza V: namero desigual de subclases Introduccion Observaciones miiltipies dentro de subclases Anilisis de un namero proporcionado de subclases Anilisis de un nimero no proporcionado de subclases ‘Otras técnicas analiticas Ajuste de curvas Introduccién Regresi6n no lineal Curvas logaritmicas 0 exponenciales El polinamio de segundo grado Polinomios ortogonales Algunos usos del Ji-cuadrado Introduccion Intervalos de confianza para o? 368 368 374 379 381 384 384 386 392 392 392 396 398 401 406 409 412 413 417 418 424 428 428 428 429 432 440 442 442 444 450. 451 458 458 458 20.3 20.4 20.5 Capitulo 21 21.1 21.2 21.3 21.4 21.5 21.6 21.7 Capitulo 22 222 22.2 223. 22.4 22.5 22.6 22.7 22.8 22.9 22.10 22.1 22.12 Capitulo 23 23.1 23.2 23.3 23.4 23.5 23.6 23 Capitulo 24 24.1 24.2 24.3 24.4 24.5 24.6 CONTENIDO xill Homogeneidad de la varianzea Bondad de ajuste para distribuciones continuas Combinaciones de probabilidades de pruebas de significancia Datos enumerativos I: clasificaciones de una via Introduccion El criterio de prueba x7 Tablas de dos celdas, limites de confianza para una proporcién 0 porcentaje Tablas de dos celdas, pruebas de hipdtesis Pruebas de hipétesis para un conjunto limitado de alternativas Tamafio de la muestra Tablas de una via con 7 celdas Datos enumerativos II: tablas de contingencia Introduccién El modelo de muestreo aleatorio El modelo de muestreo aleatorio estratificado Tabla cuédruple 0 de2 x 2 “Prueba exacta’’de Fisher Muestras no independientes en tablas 2 x 2 Homogeneidad de muestras de dos celdas Aditividad de Mas sobre la aditividad de x” RegresiOn lineal, tablas r x 2 Tamafio de la muestra en tablas 2 x 2 Clasificacién de m vias Algunas distribuciones discretas TIntroduccién La distribucién hipergeométrica La distribucién binomial Ajuste de una distribucién binomial Transformacién para la distribucién binomial La distribucién de Poisson Otras pruebas con distribuciones de Poisson Estadistica no paramétrica Introduccién Pmeba x? de bondad de ajuste Prueba de K olmogorov-Smirnov con una muestra La prueba de signos Prueba de rangos signados de Wilcoxon Prueba de Kolmogotov-Smirnov de dos muestras 460 461 464 466 466 466 467 471 474 478 480 482 482 482 486 489 491 493 495 497 498 501 $03 504 508 508 510 510 514 515 517 520 520 521 522 524 526 527 xlv CONTENIDO 24.7 24.8 24.9 24.10 24.11 24,12 24,13 24.14 24.15 24.16 Capitulo 25 25.1 25.2 25.3 25.4 25.5 25.6 25.7 Prueba de Wilcoxon-Mann-Whitney con dos muestras Prueba de la mediana Prueba de Kruskal-Wallis con k muestras Prueba de la mediana para k muestras Pmeba de Friedman para la clasificacion de dos vias Una prueba de ta mediana para la clasificacin de dos vias Desigualdad de Chebyshev Coeficiente de correlacién de rangos de Spearman Prueba de asociacién dei cuadrante de Olmstead-Tukey Prueba de aleatorizacién para regresion Muestreo de poblaciones finitas Intreduccién Organizacién del estudio Muestreo probabilistico Muestreo aleatorio simple Muestreo estratificado Asignacién éptima Muestreo multietapico o por conglomerados Apéndice Tablas Indice 541 541 542 543 544 547 550 553 559 559 613 PREFACIO Esta segunda edicién de Bioestad{stica (Principles and Procedures of Statistics: A Biome- trical Approach) reconoce el hecho de que la estadistica es necesaria, y ya es usada por un creciente numero de disciplinas. Los principios estadisticos son independientes de la ma- teria en Ja cual se aplican, y los procedimientos aplicados en Ja agricultura y las ciencias biolégicas pueden Ilevarse a otras dreas como la industria, el gobierno, la ingenierfa, la me« dicina, y dar alli tan buenos resultados como en aquellas; podria decirse, a cualquier area donde se adelante la investigacién. Las universidades y colegios superiores aceptan gene- talmente este hecho y exigen uno 0 varios cursos de estadistica como requisito para otor- gar titulos superjores, El rapido crecimiento de la ensefianza de estadistica en los cursos de pregrado también estd asociado con los requisitos exigidos en este nivel. Este extraordi- nario crecimiento en el uso de la estadistica es paralelo en cierta medida con un rapido de sarrollo de los procedimientos estadisticos, algunos de ios cuales se cubren en este libro. Otros escapan a su nivel docente. Tendencias como la expansion en el uso de la estadistica y el crecimiento de los métodos explican por qué después de una vida vigorosa y de éxito en estos 20 afios, la edicién original Bioestadistica (Principles and Procedures of Statistics: A Biometrical Approach} ha debido ceder el paso a esta nueva edicién actualizada, reor- ganizada y ampliada. Los supuestos basicos de ambas ediciones siguen siendo iguales: un enfoque esencial- mente no matematico porque los desarrollos algebraicos parecen crear temores en algunos estudiantes; presentacién y andlisis tempranos del disefio experimental de modo que los estudiantes y los profesionales en centros de investigacién puedan aplicar ios métodos es- tadisticos aunque todavia se hallen en el proceso de aprenderlos, e incorporacién de sufi- cientes técnicas que satisfagan las necesidades de la mayor{a de investigadores. Esta edicién tiene unas 200 paginas mds que la primera. Obviamente se cubre més ma- terial. Entre otras cosas, tiene en cuenta los comentarios y las sugerencias que durante estos afios se han hecho a la primera edicién. Una de ellas y muy frecuente se referia al nivel de la lengua, argumentando que era muy dificil debido a su concisién. El autor ha uy xvi PREFACIO revisado el libro palabra por palabra y parrafo por parrafo en un esfuerzo por ampliar las explicaciones y, por consiguiente, simplificar el contenido. Se han incluido muchas técnicas nuevas, algunas de las cuales se estudian brevemente y otras, con mayor detenimiento. Entre los multiples y nuevos procedimientos de compa- racion se incluyen la dms protegida de Fisher, la prueba de Scheffé y la prueba ¢ para la razon k bayesiana de Waller-Duncan, las titiles variables de indicadores se tratan breve, pero apropiadamente; el procedimiento de Satterthwaite para calcular pruebas cuasi razones F se explica cuidadosamente en una parte y se demuestra en otras, Jos polinomios ortogo- nales se usan para producir ecuaciones de superficies de respuesta en experimentos facte- riales, y el capitulo 24, sobre estadistica no paramétrica, incluye ahora las pruebas de una y dos muestras para la bondad de ajuste de Kolmogorov-Smirnov. No se ha descuidado la modernizacién de las técnicas estandar. Los disefios de parce- las divididas en el tiempo se consideran como ejemplos de disefio de bloques divididos. El capitulo 14, sobre regresién miiltipie, se presenta en notacién matricial, el enfoque mo- derno que necesita de la interpretacién de resultados impresos que resultan de la tecnolo- gia de la computacién, La notacién matricial se ha presentado en los dos capitulos anteriores: el capitulo 12, sobre definiciones y procedimientos de operacién, pretende estimular al psuario de los paquetes de cdlculos estadisticos a que adquiera un mayor dominio de los resultados impresos del computador, que los acompajian; el capitulo 13, sobre regresién lineal en presentacién de matricial, presenta en un desarrollo paralelo el enfoque usual, tal como se desarroilé en el capitulo anterior. Este capitulo ayuda al lector a hacer la transicién a la notacién matricial; y el andlisis de datos numérico de subclases desproporcionadas se relaciona con la regresién multiple y con los resultados impresos del computador, Hay una mejora en la organizacién del material respecte de Ja primera edicién. Por ejemplo, el andlisis de la distribuci6n binomial aparece ya desde el capitulo 2, en donde es muy itil para la presentaciOn de Ja distribucion normal; ta discusién de una funcidn lineal, su media y su varianza se han adelantado, de suerte que pueda relacionarse con la comparacion de dos medias, sea de muestras dependientes o independientes; los temas sobre contrastes y comparaciones multiples se han reunido en un nuevo capitulo 8, en donde las tasas de error se han definido cuidadosamente y se presentan gusas y adverten- cias sobre la confusién que puede generar un exceso de pruebas; el capitulo 9 se beneficia de una discusién mejorada del método para determinar el tamafio de un experimento; y el capitulo 24 ofrece una presentacién mas ordenada de la estadistica no paramétrica. Se ha prestado atencién a presentaciones alternativas, por ejemplo, un tratamiento mas adecuado del uso de los componentes de 1a varianza en el planeamiento de experi- imentos con atencién a los costes involucrados; un manejo mas apropiado de correlaciones entre clases; un mejor enfoque —olvidado en la primera edicién— de has tablas de contin- gencia, usando modelos. Por ultimo, en atencién a muchas solicitudes y sugerencias, la seleccion de ejercicios se ha aumentado considerablemente para incluir datos tomados de una gama més amplia dentro de las ciencias biolégicas. Ademés, se han incluido datos obtenidas de las ciencias sociales, Para un conjunto de datos de pre-prueba y post-prueba, los andlisis propuestos incluyen tratamientos de dos conjuntos de datos, como problema de regresién y como disefio de bloques divididos. PREPACIO xvil Los autores quedan muy reconocidos con el profesor Sir Ronald A. Fisher, Cambrid- ge, con cl doctor Frank Yates, Rothamsted, y con Oliver and Boyd, Ltd., Edimburgo por haber autorizado la reproduccién de la tabla II de su libro Statistical Tables for Blo. logical, Agricultural and Medical Research. Los autores también expresan sus agradecimientos a Fred Gruenberger y al Numerical Analysis Laboratory de la Universidad de Wisconsin por su preparacion de la tabla A.l; EL S. Pearson y H. 0. Hartley, editores de Biometrika Tabies for Statisticians, Voll.y & Biometrika por su permiso para reproducir las tablas A.2, A.6, A.8 y A.l5;a CM. Thompson y a Biometrika por su permiso paca reproducir la tabla A.5;a D. B. Duncan y al editor de Biometrika por su permiso para reproducir Ja tabla A.7; a C. W. Dunnett y al editor del Journal of the American Statistical Association por su permiso para reprodu> cir la tabla A.9; a C. I. Bliss por su permiso para reproducir la tabla A. 10 y a F. N. David y Biometrika por su permiso para reproducir la tabla A.11; a L. M. Milne-Thomson y L. J. Comrie, autores de Standard Four-figure Mathematical Tables y a MacMiltan Co. LM., Londres, por su permiso para reproducir la tabla A.12; a G, W, Snedecor, autor de Statistical Methods, 4a. ed. y a la Fowa State College Press por su permiso para reproducir la tabla A.13; a D. Mainland, L, Herrera y M. 1 Sutcliffe por su permiso para reproducir la tabla A.14; a F, Mosteller y J. W, Tukey, editor del Journal of the American Statistical Association, y a Codex Book Company Inc., por su permiso para reproducir la tabla A.16; a Prasert Na Nagara, por su permiso para reproducir la tabla A.17; a Frank Wilcoxon y & la American Cyanamid Company por su permiso para reproducir la tabla A.18; a Colin White y al editor de Biomezrics por su permiso para reproducir la tabla A.19; a P. §, Olmstead, J. W. Tukey, Bell Telephone Laboratories y al editor de Annals of Mathemati- cat Statistics por su permiso para reproducir la tabla A.20; 2 D. B. Duncan por su permise para reproducir la tabla A.21;a L. H. Miller y al editor de Journal of the American Statis- fical Association por su permiso para reproducir la tabla A.22;a Z. W. Birnbaum, R.A. Hall y al editor de Annals of Mathematical Statistics por su permiso para reproducir la tabla A.23; En particular, deseo agradecer a Wyman Nyquist por su valiosa critica de la primera edicién y del manuscrito de la revision. Ademas, tengo deuda de gratitud con muchos de mis colegas por sus sugerencias acerca de varios temas, con otros por sus generosos permisos para usar datos, y con aque- las personas que me ayudaron en la preparacién del manuscrito. Me hubiera extraviado sin las destrezas de Dorothy Green, quien mecanografid, corté y pegé el manuscrito final, Por Ultimo deseo agradecer a mi esposa, Jennie, por su lectura cuidadosa de las pruebas y ayuda editorial, Robert G, D. Steel SIMBOLOS ESCOGIDOS ML_IA A Iv Vo Letras priegas H oo 1, B, ete. ” RD Be no es igual a; por ejemplo, 3 # 4 mayor que; por ejemplo, 5 > 2 mayor que c igual a menor que; por ejemplo, 3 < 7 menor que o igual a valor absoluto; por ejemplo | —7| = 7 suma de indica un conjunto de cantidades faltantes; por ejemplo 1, 2,...,10 n(a—1)...1 llamado x factorial; por ejemplo, 3! = 3(2) 1 = 6 se usa para indicar el promedio aritmético de una media sombrero; se usa para indicar una estimacién, no tanto un valor verdadero; por lo general aparece sobre letras griegas. con pocas excepciones se refieren a parametros de una poblacién media pablacional varianza poblacional y desviaciOn estandar componentes de las medias poblacionales; se usan cominmente junto con modelos lineales error experimental verdadero error verdadero en la muestra; diferencia real coeficiente de regresiOn de la poblacién, efecto de bloque coeficiente de correlacién de la poblacién xx SIMBOLOS ESCOGIDOS N, S? estas letras latinas se usan como simbolos que indican poblaciones + a Ps finitas, en especial en el cap. 25. Las anteriores letras griegas se usan también con subindices para mayor claridad. Por ejemplo: fy media poblacional de las ¥ Byxz regresion de Y sobre X con Z fijo ty contribucién de la media poblacional que recibe ei 7-ésimo tratamiento Algunas excepciones en el uso de letras griegas para indicar parametros son: a probabilidad de un error de Tipo I 1l- coeficiente de confianza B probabilidad de un error de Tipo H 1-8 poder de una prueba estadistica ie eriterio comin de prueba Letras latinas se usan como simbolos generales, incluyendo los de estadistica muestral variable observaciones individuales totales de observaciones diferencia entre observaciones pareadas, Yj; — ¥2; total de tamafio de la muestra mumero de observaciones en é, j-ésima celda medias muestrales, total o parte de una muestra = D Mot a B a3 x a media de las medias muestrales yarianzas muestrales, estimaciones no sesgadas de a?, 0%, y oh 5S, Sy, Sp desviaciones estandar de !a muestra. SExy Shaicy varianzas muestrales ajustadas por regresi6n CL, CI limites de confianza, o intervalos Best 22 5°, SPs 1, puntos extremos de los limites de confianza b coeficiente de regresién de la muestra. by peak coeficiente de regresién parcial de la muestra uv coeficiente de regresion estandar r total de la muestra o coeficiente de correlacién simple Piagek coeficiente de correlacin parcial de la muestra en X; y X2 Rigi coeficiente de correlacién miltiple entre X y otras variables as FC,C,TC sc CM En. By Eyy, Exy, Exx HS dims RE cv Leva Q=d0% cof upm est Pl-p Ay SIMBOLOS ESCOGIDOS xxi grados de libertad factor de correccidn, valor de correccién, término de correcclén ¥(¥ — Py ,suma de cuadradas cuadrado medio cuadrados de tas medias del error en un disefio de parcelas divididas sumas del error de los productos en la covarianza (se usan otras letras para indicar otras fuentes de variacion) significante, por ejemplo, 2.3* altamente significante, por ejemplo, 14.37** no significante diferencia minima significante eficiencia relativa coeficiente de variabilidad (s/ ¥}100 una funcién lineal de observaciones, c; es constante comparacién en la cual ¢; es constante, ¥; es a menudo un tratamiento total y ) ¢; = 0 correccién por poblacién finita unidad primaria de muesireo estratificado, se usa como subindice probabilidad probabilidades en una distribucién binomial hip6tesis nula hipotesis alternativa, usualmente conjunto de alternativas infinito CAPITULO 1.1 Definicién de la estadistica La estadistica moderna proporciona conocimientos a los investigadores, Es un tema nuevo y estimulante, producto del siglo XX. Para el cientifico, particularmente para el cientffico en Biologia, la estadistica comenz6 aproximadamente en 1925 cuando aparecié el libro de Fisher, Statistical Methods for Research Workers, La estadistica es un tema de rapido crecimiento con mucho material original que todavia no se encuentra en textos; crece a medida que los estadisticos encuentran respues tas a mds y mds problemas propuestas por los investigadores. Algunos de los primeros in- vestigadores que contribuyeron al desarrollo inicial de la estadistica todavia laboran actl- vamente, y los nuevos encuentran diversas oportunidades para sus talentos investigativos, En la aplicacién de la estadistica, tos principios son generales aun cuando las técnicas puedan diferir, y a necesidad de formacién estadist ica crece a medida que se incrementa la aplicacién a las ciencias bioldgicas y sociales, 1a ingenierfa y 1a industria. Este tema nuevo y vigoroso afecta a todas los aspectos de la vida moderna. Por ejem- plo, el planeamiento estadistico y la evaluacién de la investigacién contribuyen a los avan- ces tecnoldgicos en él cultive y procesamiento de alimentos; ef control estadistico de calidad de los productos manufacturados hace confiables los equipos automatores y eléc- tricos. La estadfstica ayuda a los encuestadores a recolectar datos para determinar las pro- ferencias de esparcimiento del publico; proporciona informacién para los estudios de impacto ambiental y ayuda en la evaluacidn de las exigencias gubernamentales para que la industria farmacéutica demuestre que un producto es benéfico y no sélo inofensivo. Cada yez son mis los grupos de investigacién en los cuales se encuentra un estadistico. La extensién de la estadistica hace dificil su definicién. Su desarrollo obedecié a la necesidad de tratar problemas en les cuales, para observaciones individuales, las leyes de causa y efecto no aparecen claramente ul observador y donde es necesario un enfoque objetivo. En tales problemas siempre existe un cierto grado de incertidumbre en toda infe- rencia asada en un muimero limitado de observaciones. Por lo tanto, para nuestro props. 2 BIGESTADISTICA: PRINCIPIOS ¥ PROCEDIMIENTOS sito, una definicién razonable y satisfactoria seria: La estadistica es la ciencia, pura y aplicada, que crea, desarrolla y aplica técnicas de modo que pueda evaiuarse la incerti- dumbre de inferencias inductivas, Para la mayoria de los cientificos, 1a estadistica es légica o sentido comin con un fuerte ingrediente de procedimientos aritméticos, La l6gica proporciona el métode me- diante el cual se deben recolectar los datos y determinar cudnto deben abarcar; la aritmé- tica, junto con ciertas tablas numeéricas, produce el material sobre el cual se basa fa infe- Tencia y se mide la incertidumbre. La parte aritmeética es a menudo rutinaria, y el estudiante necesita de formaciGn matematica especial. No vamos a ocuparnos dizectamente con las matematicas, ya que es dificil encontrar un campo de esta materia que no haya dado al estadistico alguna teoria util. 1.2. Breve historia de la estadistica La historia de la estad istica aclara en gran medida la naturaleza de la misma en el siglo XX. La perspectiva historica también es importante para ver las necesidades y las presiones que la crearon. E{ ténmino estad {stica no es nuevo. La estadistica debié comenzar como una aritmé- tica estatal para asistir al gobernante que necesitaba conocer la riqueza y el numero de sus sbditos con el objeto de recaudar impucstos o presupuestar la guerra. Es de presumir que todas las culturas que intencionalmente registraron su historia también registraron sus estadisticas, Sabemos que César Augusto decreté que todos los stibditos tenYan que tribu- tar y porlo tanto exigié a todas las personas que se presentaran al estadistico mds cercano, que entonces era el recaudador de impuestos. Debido a lo anterior, Jesiis nacié en Belén, no en Nazareth. Guillermo el Conquistador ordené un censo de las tierras de Inglaterra para fines de tributacidn y de servicio militar. Este se llamé “Domesday Book”. Tales es- tadisticas son historia. . Varios siglos después del “Domesday Book”, encontramos una aplicacién de la pro- babilidad empirica al seguro de embarque, del cual parece haber dispuesto da navegacion flamenca del siglo XIV, Esto pudo haber sido poco mds que pura especulacidn o juego de azar, pero lego a ser la forma muy respetable de la estadistica Hamada seguros. El juego, en forma de juegos al azar, origins ta teoria de las probabilidades, desarro- Ilada por Pascal y Fermat, a mediados del siglo XVII, debido a su interés en las experien- cias de juego del Caballero de Meré. Para el estadistico y el cientifico experimental, tal teoria tiene mucho uso practico en la informatica, La curva normal o la curva normal de errores ha sido muy importante en el desarro- ilo de la estadistica. La ecuacién de esta curva fue originalmente publicada en 1733 por de Moivre, quien no supo cémo aplicar sus resultados a observaciones experimentales y su escrito permanecié desconocido hasta que Karl Pearson lo encontré en una biblioteca en 1924, Sin embargo, al mismo resultado [egaron luego dos astrénomos matemiticos, Laplace, 1749-1827, y Gauss, 1777-1855, independientemente el uno del otro, Un razonamiento esencialmente estadistico fue aplicado en el siglo XIX por Charles Lyell a un problema geoldgico. En el periodo comprendido entre 1830 y 1833 aparecie- ron tres voltimenes de Principles of Geology de Lyell, quien establecié el orden de las rocas terciarias y les asignéd nombres, Con M, Deshayes, un conquilidlogo francés, identifi- cé y enumeré especies fosiles que se presentaban en unc 0 mas estratos, y también logra- INTRODUCCION = 3 ron dar las proporciones de fas que avin vivian en ciertas partes de los mares, Basados an. estas propurciones asignaron los nombres de: Pleistoceno (novisime), Plioceno (mda reciente), Mioceno (menos reciente) y Hoceno (reciente). El razonamiento de Lyell fue esencialmente estadistico. Una vez establecidos y aceptadas los nombres, el método fue casi inmediatamente olvidado. No habia gedlogos evolucionistas que se preguntaran sl se trataba de etapas discretas, como Jo implican los nombres, o bien si era un proceso cone tinuo y se podia utilizar para hacer predicciones. Otros descubrimientos cientificos del siglo XX también se hicieron sobre una base estad istica sin que se advirtiera apenas la naturaleza estad istica de la técnica, y desafortu- hadamente el método cayé pronto en el olvido. Esta afirmacién es valida para las cienclas bioldgicas y las fisicas. Charles Darwin, 1809-1882, bidlogo, recibié en el Beagle el segundo volumen del libro de Lyell. Posteriormente Darwin formuld sus teorfas y bien pudo haber influido en 4 la lectura de ese libro. La obra de Darwin fue, en gran parte, la naturaleza biométrica 0 estadistica, y ciertamente renové el entusiasmo por ta Biologia. Mendel, con sus estudios sobre hibridos vegetales publicados en 1866, también tuva un problema biométrico 0 estad Istico. En el siglo XIX, la necesidad de una base mds sélida para la estadistica se hizo mant> fiesta. Karl Pearson, 1857-1936, inicialmente f{sico matemdtico aplicé sus matemdticas a la evolucién, como resultado del entusiasmo que generé Darwin en la Biologia, Pearson dedicé casi medio siglo a la investigacién estadistica rigurosa. Ademds, fundé la revista Biometrika y una escuela de estadistica; con etlo tomé impulso el estudio de fa estad istica, Si bien Pearson se ocupaba de muestras grandes, la teorfa correspondiente resultaba inadecuada para los experimentadores que trabajan con muestras necesariamente peque- Nas, Entre estos estaba W.S. Gosset, 1876-1937, quien estudiaba con Karl Pearson y era técnico de la firma de cerveceros Guinness. Parece que la matemtica de Gosset era insufi- ciente para encontrar distribuciones exactas de la desviacion estandar de la muestra, la telacién entre la media de la muestra y la desviacién estandar de la muestra, del coeficien- te de correlacién, estadigrafo al que dedicd especial interés. Por lo tanto, recurrié a sacar cartas calculando y compilando distribuciones de frecuencia empirica. Sus escritos sobre los resultados aparecieron en Biometrika en 1908 bajo cl nombre de Student, seudénimo de Gosset mientras trabajaba con Guinness. Hoy, la tf de Student es instrumento funda- mental para estadisticos y experimentadores, y “estudentizar” es expresién corriente en estadistica. Ahora que el uso de la disiribucién ¢ de Student esta tan generalizado, es inte- resante anotar que el astrénomo alemdn, Helmert, ya la habia obtenid¢o matemdticamente en 1875, R, A, Fisher, 1890-1962, recibié influencias de Karl Pearson y de Student, e hizo lumerosas ¢ importantes contribuciones a la estadistica. El y sus estudiantes dieron consi- derable impulso al uso de los procedimientos estadisticos en muchos campos, particular- mente en agricultura, biologia y genética. J. Neyman, 1894, y E. S. Pearson, 1895, presentaron una teorfa sobre la verificacién o prueba de hipdtesis estadisticas en 1936 y 1938. La teoria fomenté en forma considera- ble ta investigacién y muchos de los resultados son de uso practico. En esta breve historia, mencionaremos sélo otro estadistico. Abraham Wald, 1902- 1950. Sus dos libros, Sequential Analysis y Statistical Decision Functions, se ocupan de 4 BIOFSTADISTICA: PRINCIPIOS Y PROCEDIMIENTOS grandes conquistas estadisticas no tratadas en este texto, no obstante, una aplicaci6n, la solucién minima de un problema de genética, se ilustra en el capitulo 21. En este siglo entonces se han desarrollado la mayoria de los métodos que actual- mente se utilizan. La estadistica de este texto es parte de esos métodos, 1.3 La estadistica y el método cientifico Se dice que los cientificos usan el metodo cientifico. Seria dificil definir la expresién método cientifico, dado que los cientificos usan cuantos métodos o medios puedan con- cebir. Sin embargo, la mayoria de estos métodos tienen puntos esenciales en comun. Sin intentar promover una controversia, consideramos que éstos son: 1. Una revisién de hechos, teorias y propuestas, 2. Formulacién de una hipétesis logica sujeta a prueba mediante métodos experimen- tales. 3. Evaluacién objetiva de las hipdtesis con base en los resultados experimentales. Mucho podria escribirse respecto a estos puntos esenciales: ;Como se llega a una hipstesis? ;Cémo se disefia un experimento? ,Cémo se evaliia objetivamente una hipo- tesis? 4 La ciencia es un estudio que se ocupa de la observacion y clasificacién de las hechos. Los cientificos deben, entonces, ser capaces de observar un suceso o conjunto de eventos como resultado de un plan o disefio, Esto es el experiment, la sustancia del método cien- tifico. El disefio experimental es un campo de la estadistica, La evaluacién objetiva de una hipétesis presenta problemas, puesto que no es posible observar todos loseventos concebibles, y como las leyes exactasde causa fecto generalmen- te se desconocen, existira variacién entre los que son observados. El cientifico debe enton- ces razonar partiendo de casos particulares a casos mas generales, Este proceso es de infe- rencia incierta, Es un proceso que nos capacita para desaprobar hipdtesis incorrectas, pero ho nos permite aprobar hipdtesis correctas. Lo nico que podemos dar como demostracion es una comprobacién fuera de duda razonable. Los procedimientos estad{sticos son méto- dos que nos conducen a esta suerte de pruebas. Una parte de la informaci6n posible, necesariamente canduce sélo a inferencia in- cierta, El azar entra en juego en Ja obtencién de informacién y es la causa de la incerti- dumbre. Al aplicar las leyes del azar, el estadistico de hoy puede realizar una medicién objetiva y precisa de la incertidumbre de las inferencias. Ciertamente, esto se hace para la totalidad de las inferencias y no para cada inferencia individual. O sea que se sigue un pro- cedimiento que asegure que 9 de 10 inferencias serdn correctas, 0 99 de 100, 0 algo por el estilo. :Por qué no estar siempre en lo correcto a muy cerca a lo correcto? E! inconve- niente es el costo. El costo puede subir debido al incremento del tamajio de la muestra, a consecuencia de una decisién incorrecta, o a la vaguedad de la inferencia necesaria para incluir la respuesta correcta. EI método cientifico no es una sucesién dispersa de secuencias de hipétesis experi- mento-inferencia que se ajusten perfectamente en compartimientos. Mas bien, si un cientifi- co no logra demostrar la falsedad de una hipdtesis, quizd la teor{a abarque hechos fuera del alcance de Ja inferencia del experimento o acaso modificandola, pueda abarcar tales hechos, El ciclo se repite entonces. Por otra parte todos Ins supuestos que entran en la hipdtcsis. INTRODUCCION = § pueden no ser necesarios; entonces se formula una nucva hipdtesis con nuevos supuestoa y se repite el ciclo. En resumen, Ja estadistica es un instrumento uplicable en el método cient ffico, para el cual fue desarrollada. Su aplicacién particular estd en los muchos aspectos del disefio de un experimento, desde el plan inicial para la recoleccién de los datos, y en el andlisis de los resultados a partir de los datos resumidos, hasta la evatuacién de la incertidumbre de toda la inferencia extraida de ellos. 1.4 El estudio de la estadistica No se intenta convertir en estadisticos profesionales a aquellos que lean y estudien este libro, Nuestro propésito es promover una forma de pensar clara y disciplinada, especial: mente cuando se trata de recolectar ¢ interpretar informacion numérica, y presentar un considerable ntimero de técnicas estadisticas de aplicabilidad y utitidad generales en Je investigacion. Se requiere hacer célculos en estadistica, pero es cosa de aritmética, no de matemiatica ni estadistica, La estadistica implica, para Ja mayoria de los estudiantes, una forma nueva de pen- sar en términos de incertidumbre o de improbabilidades. Acd como en otros casos, log estudiantes difieren en habilidad, y cuando se enfrentan a Ja estadistica por primera vez, para algunos puede parecer una tortura mental que pucde ser emocionalmente perturba: dora. Creemos haber hecho todo el esfuerzo compatible con nuestros objetives para mini- mizar los problemas del aprendizaje de la estad{stica. Muchas estudiantes encoutrarén que se aprende mejor la estadistica mediante la aplicacién directa a sus propios problemas; pocos encontraran, en el transcurso de uno o dos periodos, ia utilidad del material presentado. Por consiguiente, muchos estudiantes necesitardn considerable reflexion y discusién para obtener el m4ximo provecho de un curso basado en este texto. Se dan preguntas y ejercicios para estimular la reflexién y ofrecer alguna opertunidad de aplicar las técnicas y familiarizarse con elas. Finalmente, es necesario tener en cuenta que la estadistica se ha propuesto como instrumento de investigacién. La investigacién puede ser en genética, mercadeo, nutri- cién, agronom{a, etc. Es el campo de investigacién, no el instrumento, el que debe pros porcionar los “por qué” del problema de investigacién, A veces, este hecho se pasa por alto y los usuatios olvidan que tienen que pensar, que la estadistica no puede pensar por ellos, La estad{stica, sin embargo, ayuda a los investigadores a disefiar experimentos y a evaluar objetivamente los datos numéricos resultantes, Es nuestra intencién proporcionar a los investigadores instrumentos estadisticos utiles para este fin. Referencias 1.1. Box, Joan Fisher: &, A. isher, The life of @ scientist, Wiley, Nueva York, 1978. 1.2. Committee of Presidents of Statistical Societies: Careers in statistics, current edition, American Statistical Association, Washington, D.C. 1.3, Cisenhart, Churchill: Mniversarics in 1965 of interest to statisticians,’ Ammer. Statist. 19: 21-29 (1965) 14. Lisenhart, Churchill, y Allan Birnbaum: “Anniversaries in 1966-67 of interest to statisticians', Amer, Statist. 21:22-29 (1967). 15, Visher,R. A. “Biometry,” Biom., 4: 217-219 (1948). 1.6. 1,7, 19. 1,10. Adi. Ate. Ll4, Es 1.16. 1.17, 1.18, 1,19, 1,20, 12, 1.22. 1,23, 1,24. 1.25. 1,26, 1.27. BIOESTADISTICA: PRINCIPIOS Y PROCEDIM TOS Fisher, R. A.: “The expansion of statistics,” J. Roy. Sratist. Soc., Ser. A., 116:1-6 (1953). Fisher, R. A.: “The expansion of statistics,” Amer, Sci,, 42:275-282 y 293 (1954), . Freeman, Linton C.,y Douglas M. Mote: “Teaching introductory statistics in the liberal arts cu- triculum, Anter, Statist., 10:20-21 (1956). Hotelling, Harold: he teaching of statistics,” Aan, Math. Sratist., 11: 1-14 (1940). Hotelting, Harold; “The impact of R. A. Fisher on statistics,” 4. Amer. Statist, Ass., 4635-46 (1951). Hotelling, Harold: “Abraham Wald," Amer. Starise., $:18-19 (1951). Iotcliing, Harold: “The statistical method and the philosophy of science,” Amer, Sratist., 12: 9-14 (1958). McMullen, Launce: Foreword, en E. §. Pearson y John Wishart (eds.), “Student's” collected papers, Biometrika Oftice, University College, London, 1947. Mahalanobis, P. C.: “Professor Ronald Ayilmer lisher,” Sankfya, 4:265-272 (1938). Mainland, Donald: “Statistics in clinical research; some general principles,” Aan, N, ¥, Acad, Sci. §2:922-930 (1950). Mather, Kenneth: 'R, A, Fisher's Statistical Methods for Research Workers, an appreciation,” J. Amer. Statist. Ass. 46:51-54 (1951). Menger, Karl: “The formative years of Abraham Wald and his work in geometry,” Ann. Math. Statist. 23:13-20 (1952). Pearson, E. S,: “Karl Pearson, an appreciation of some aspects of his life and work, part L 1857-1906,” Biometrika, 28:193-257 (1936). Pearson, FE. S.: “Karl Pearson, an appreciation of some aspects of his life and werk, part II: 1906-1936," Biometrika, 29:161-248 (1938). Reid, R. D,: “Statistics in clinical research,” Ann. MY, Acad, Sei., $2:931-934 (1950), Tintner, G.: “Abraham Wald's contributions to econometrics,” Avin, Math, Statist., 23:21-28 (1952), Walker, Helen M.: “Bicentenary of the normal curve,” J. Amer, Statist. Ass., 29:72-75 (1934). Walker, Hclen M.: “Statistical literacy in the social sciences,” Amer. Sratist., $:6-12 (1951), Walker, Helen M.: “The contributions of Karl Pearson,” J. Amer, Statist. Ass., 53:11-27 (1958). Wolfowitz, J.; “Abraham Wald, 1902-1930," Ann, Math. Statist, 23:1-13 (1952). Yates, .: “The influence of Statistical Methods for Research Workers on the development of the science of statistics," J, Amer Statist. Ass., 46:19-34 (1951). Youden, W. J.: The Fisherian revolution in methods of experimentation,” J, Amer Statist. Ass., 46:47-50 (1951). CAPITULO DOS OBSERVACIONES 2.4 Introduccion Las observaciones constituyen la materia prima con la cual trabajan los investigadores, Para que se pueda aplicar la estadistica a esas observaciones éstas deben estar en forma nu- mérica, En el mejoramiento de cultivos, los mimeros bien pueden ser rendimientos por parcela; en la investigacién médica, pueden ser tiempos de recuperacién bajo varios trata- mientos; en 1a industria, pueden ser cantidad de defectos en varios lotes de un articulo producido en una Iinea de montaje. Tales miimeros constituyen datos y su caracteristica comin es la variabilidad o variacion. Este capitulo se refiere a la recoleccidn, presentacion, resumen y caracterizacién de la informacién, Se discutirin los conceptos de poblaciones, muestras, modelo lineal ¢ inferencia estadistica. 2.2 Variables Proposiciones tales como ‘Maria es rubia”, o “El pesa mds de 20 libras” son comunes ¢ informativas. Se refieren a caracteristicas que no son constantes, sino que varian de una persona a otra y que sirven para distinguir o describir. Las caracteristicas que presentan variabilidad o variacién se denominan variables, variables aleatorias 0 variables de azar. Como gran parte de nuestro estudio debe ser general, empleamos algunos simbolos. En vez de escribir variable a cada oportunidad, sean ¥ la variable Y e Y, (l¢ase ¥ sub-i) la observacion éésima. Aqui no tenemos en mente ninguna observacion en particular. Cuan- do tengamos que referirnos a una observacin especifica, remplazaremos ¢ por un nume- ro. Por ejemplo, si en una familia tres nifios pesan 52, 29 y 28 libras, y Y denota peso, Y, = 52 libras, ¥, = 29 librasy ¥, = 28 libras. En términos mas generales y abstractos, denotamos un conjunto de observaciones mediante ¥,, Y,,..., ¥- Aqui ¥, se refiere al Ultimo término, el subindice nos dice él nimero total, y los tres puntos entre Y, e F, s¢ 1

Das könnte Ihnen auch gefallen