Guía Básica Estadística Clinica

C URSO
J u n io , 20 0 8
DE
Vo lum en 2 , Número 6
ESTADÍSTICA
Sociedad Española Sociedad Española de Bioquímica Clínica y Patología Molecular (SEQC),
Calle Padilla 268, despacho 68, 08025-Barcelona, http://www.seqc.es
Guía de estudio. 7. Estadística aplicada (2) comentarán a continuación de forma

Interpretación de los datos del laboratorio independiente.
clínico 1
Nombres propios: Walter A. Shewhart (1891- Conocimientos previos
1967) 6 • Estadística descriptiva: diagramas.
El Test de Tukey Duckworth para comparar las
• Distribuciones, distribución nomal
medianas de dos poblaciones 7
• Estadística Inferencial: comparación de
Problemas 9
medias y varianzas; ANOVA
• Estadística Inferencial: pruebas de
Introducción a : Regresión en (2):
normalidad
Gráficos 15
Próximo número (2008: vol 2, número 7–8) 19 • Regresión
• Muestreo
Guía de estudio. 7. Contenidos

1. Valores de referencia
Estadística aplicada (2) 2. Valor semiológico, rendimiento de una prueba
de laboratorio
Interpretación de los datos • sensibilidad,
• especificidad
del laboratorio clínico • eficiencia
3. Interpretación de un resultado
La fase postanalítica es aquella parte del proceso • teorema de Bayes
general del laboratorio donde se demuestra la • valores predictivos
utilidad real de la actividad realizada. Las • cociente de verosimilitud
observaciones de laboratorio están sometidas a • análisis ROC
variabilidad no sólo de origen analítico o • curva ROC empírica
metodológico, sino biológico (intra- e • área bajo la curva ROC
interindividual) y patológico (que precisamente • área parcial bajo la curva ROC
es el que se desea poner de manifiesto). • métodos paramétricos y no paramétricos
El contenido estadístico es relativamente de cálculo
especializado aunque por lo general poco • alternativas a la curva ROC
complejo: la estadística descriptiva 4. Análisis de la decisión médica
ha sido siempre una pieza emblemática y la Objetivos

estadística inferencia se limita a sencillos
problemas de evaluación de medidas de Al terminar esta parte del curso, los participantes
centralización y dispersión. deben ser capaces de
Se destacan cuatro aspectos concretos: • Describir un experimento “clásico de
Los valores de referencia producción de valores de referencia” en
El valor semiológico de las pruebas de un laboratorio clínico
laboratorio • Describir un experimento “alternativo” de
la interpretación de un resultado del laboratorio producción de valores de referencia, es
la decisión clínica decir: multicéntrico o a través de la
importanción de intervalos de referencia
obtenidos en otros laboratorios
la validación y la comparación de métodos • Describir y aplicar pruebas de normalidad
analíticos tienen en el laboratorio clínico una previas a la adopción de métodos no
larga tradición y extensa literatura, por lo que se paramétricos.
Curso de estadística Vol. 2, núm. 6, Pág. 2
• Describir y aplicar los métodos Bibliografía acerca de los valores de

paramétricos para caracterizar y referencia
eventualmente comparar con otro
intervalo de referencia: medidas Libros y capítulos de libros
descriptivas de centralización (media), Grasbeck R, Alstrom T, eds. Reference values in
dispersión (varianza) y forma (sesgo y laboratory medicine. Chichester: John Wiley;
curtosis), número de individuos a utilizar 1981.
en las comparaciones.
• Describir y aplicar métodos no Harris EK, Boyd JC. Statistical bases of reference
paramétricos para caracterizar y values in laboratory medicine. New York: Marcel
eventualmente comparar con otro Dekker, 1995.
intervalo de referencia: mediana, Siest G, Henny J, Schiele F, Young DS.
fractiles –cuantiles, etc.-, intervalos Interpretation of clinical laboratory tests. Foster
interfractílicos, etc. city: Biomedical Publications, 1985.
• Describir y aplicar procedimientos de
inferencia estadística paramétrica Siest G, Henny J, Schiele F. Références en biologie
aplicable: intervalos de confianza de los clinique. Paris: Elsevier, 1990.
límites de referencia paramétricos, Solberg HE. Establishment and use of reference
comparación de medias y dispersiones, values. En: Burtis CA, Ashwood ER, Bruns DE, eds.
etc. Tietz, Textbook of clinical chemistry and
• Describir y aplicar procedimientos de molecular diagnostics, 4ª ed. St. Louis: Saunders,
inferencia estadística no paramétrica 2006: 425-48.
aplicable: intervalos de confianza de los
límites de referencia no paramétricos, Recomendaciones de la IFCC
comparación de medias y dispersiones, Solberg HE. Approved recommendation (1986) on
etc. the theory of reference values. Part 1. The
• Conocer y aplicar la forma concept of reference values. Clin Chim Acta.
estadísticamente correcta de describir 1987;167:111-8.
las prestaciones diagnósticas (en el
sentido más amplio del término) de una PetitClerc C, Solberg HE. Approved recommen-
prueba analítica: tasa de verdaderos dation (1987) on the theory of reference values.
positivos (sensibilidad), tasa de falsos Part 2. Selection of individuals for the production
positivos (1-especificidad), eficiencia of reference values. J Clin Chem Clin Biochem.
diagnóstica, odds ratio, razón de 1987;25:639-44.
verosimilitud, etc. Solberg HE, PetitClerc C. Approved recommen-
• Interpretar estadísticamente un dation (1988) on the theory of reference values.
resultado de una prueba de laboratorio Part 3. Preparation of individuals and collection of
clínico en un determinado contexto specimens for the production of reference values.
clínico: valor predictivo positivo y Clin Chim Acta. 1988;177:S1-S12.
negativo, cuando se observen resultados
dicotómicos. Solberg HE, Stamm D. Approved recommendation
• Conocer la forma de dicotomizar on the theory of reference values. Part 4. Control
resultados continuos: análisis ROC. of analytical variation in the production, transfer,
• Conocer y aplicar la generalización and application of reference values. Eur J Clin
mediante la razón de verosimilitud a Chem Clin Biochem. 1991;29:531-5.
observaciones continuas y Solberg HE. Approved recommendations (1987) on
multivariantes. the theory of reference values. Part 5. Statistical
• Conocer y aplicar la forma integral de treatment of collected reference values.
evaluación del rendimiento de una Determination of reference limits. J Clin Chem
prueba de laboratorio mediante el Clin Biochem. 1987;25:645-56.
análisis ROC: área completa y parcial
bajo la curva ROC. Dybkaer R, Solberg HE. Approved recommen-
dations (1987) on the theory of reference values.
• Diseñar un experimento para evaluar las
Part 6. Presentation of observed values related to
prestaciones de un procedimiento
reference values. J Clin Chem Clin Biochem.
analítico, y compararlas con las de otro
1987;25:657-62.
considerado como de referencia.
Recomendaciones de la SEQC
Queraltó JM, Antoja F, Cortés M, et al. Concepto
de valores de referencia en química clínica.
Documento A (1982). Química Clínica 1983;2:39- l'intervalle de référence. Document H. Ann Biol
41. Clin 1983;41:63-79.
Queraltó JM, Antoja F, Cortés M, et al. Bases Albert A, Guéguen R, Sachs C. Présentation des
estadísticas de la teoría de valores de valeurs observées par rapport aux valeurs de
referencia. Documento B. Fase 3. Versión 5 référence. Document I. Ann Biol Clin 1983;41:225-
(1982). Química Clínica 1983;2:95-105. 31.
Queraltó JM, Antoja F, Cortés M, Doménech MV, Siest G, Henny J, Guize L, Sachs C. Utilisation des
Fuentes X, Llagostera MJ, et al. Variaciones valeurs de référence. Ann Biol Clin 1982;40:697-
analíticas y extra–analíticas en la producción de 708.
los valores de referencia. Documento C. Fase 3.
Publicaciones “históricas”
Versión 4 (1983). Química Clínica 1984;3:43-50.
Cotlove E, Harris EK, Williams GZ. Biological and
Queraltó JM, Antoja F, Cortés M, et al.
analytic components of variation in long-term
Producción y utilización de valores de
studies of serum constituent in normal subjects.
referencia. Documento D. Fase 3. Versión 2.
III. Physiological and medical implications. Clin
Química Clínica 1987;6:49-58.
Chem 1970;16:1028-32.
Queraltó JM, Antoja F, Cortés M, et al.
Dybkaer R, Gräsbeck R. Theory of reference
Transferibilidad de los valores de referencia.
values. Scand J Clin Lab Invest 1973;32:1-7.
Documento E. Fase 3. Versión 3. Química Clínica
1990;9:102-23. Gräsbeck R, Saris NE. Establishment and use of
normal values. Scand J Clin Lab Invest
Queraltó JM, Antoja F, Cortés M, et al. Valores
1969;110:62-3.
de referencia intraindividuales. Documento F.
Fase 3. Versión 3. Química Clínica 1991;10:56-8. Harris EK. Distinguishing physiologic variation from
analytic variation. J Chronic Dis 1970;23:469-80.
Recomendaciones de la SFBC
Harris EK, Kanofsky P, Shakarji G, Cotlove E.
Siest G, Vernet-Nyssen M. Le concept des valeurs
Biological and analytical components of variation
de référence en biologie clinique. Document A,
in long-term studies of serum constituents in
2e version. Ann Biol Clin 1981;39:381-4.
normal subjects. II. Estimating biological com-
Guéguen R, Albert A. Langage et principes ponents of variation. Clin Chem 1970;16:1022-7.
statistiques pour les valeurs de référence.
Harris EK. Effects of intra and inter-individual
Document B, 2e version. Ann Biol Clin
variation on the appropriate use of normal ranges.
1985;43:297-305.
Clin Chem 1974;20:1535-42.
Bretaudière JP, Albert A. Influence des facteurs
Harris EK. Some theory of reference values. I.
analytiques sur les valeurs de référence. 2e
Stratified (categorized) normal ranges and a
version. Ann Biol Clin 1985;43:306-9.
method for following and individual's clinical
Siest G, Vernet-Nyssen M. Variations biologiques laboratory values. Clin Chem 1975;21:1457-64.
des examens de laboratoire. Document D. Ann
Harris EK. Some theory of reference values. II.
Biol Clin 1979;37:229-39.
Comparison of some statistical models of intra-
Drosdowsky M, Sachs C. Facteurs à prendre en individual variation in blood constituents. Clin
considération pour le prélèvement sanguin en Chem 1976;22:1343-50.
vue de l'établissement des valeurs de référence.
Williams GZ, Young DS, Stein MR, Cotlove E.
Document E. Ann Biol Clin 1980;38:251-60.
Biological and metrological components of
Siest G, Henny J. Production des valeurs de variation in long-term studies of serum
référence. Document G. Ann Biol Clin constituents in normal subjects. I. Objectives,
1981;39:235-44. Anexos al documento G: Critères subjects selection laboratory procedure and
de partition et d'exclusion. Sachs C. Objectifs. estimation of analytic deviation. Clin Chem
Ann Biol Clin 1984;42:243-5. Drosdowsky M, 1970;16:1016-21.
Ramon-Bauza F. Âge, sexe puberté, ménopause.
Williams RJ. Biochemical individuality. New York :
Ann Biol Clin 1984;42:246-8. Sachs C, Buret J.
J. Wiley and Sons,1956;47.
Poids corporel et surcharge pondérale. Ann Biol
Clin 1984;42:249-56. Aellig A, Sachs C. Facteurs Young DS, Harris EK, Cotlove E. Biological and
d'environnement : alcool, tabac et mode de vie. analytic components of variation in long-term
Ann Biol Clin 1984;42:256-65. studies or serum constituents in normal subjects.
IV. Results of a study designed to eliminate long-
Albert A, Guéguen R, Sachs C. Traitement des
term analytic deviations. Clin Chem 1971;17:403-
valeurs de référence et détermination de
10.
Variaciones metodológicas Partición en subpoblaciones

Bock BJ, Dolan CT, Miller GC, Fitter WF, Hartsell Harris EK, Boyd JC. On dividing reference data into
BD, Crowson AN, et al. The data warehouse as a subgroups to produce separate reference ranges.
foundation for population-based reference Clin Chem 1990;36:265-270
intervals. Am J Clin Pathol. 2003;120:662-70.
Harris EK, Wong ET, Shaw ST. Statistical criteria
Ferré-Masferrer M, Fuentes-Arderiu X, Puchal- for separate reference intervals: race and gender
Ane R. Indirect reference limits estimated from groups in creatine kinase. Clin Chem. 1991;37:
patients' results by three mathematical 1580-2.
procedures. Clin Chim Acta. 1999; 279:97-105.
Lahti A. Partitioning biochemical reference data
Grossi E, Colombo R, Cavuto S, Franzini C. The into subgroups: comparison of existing methods.
REALAB project: a new method for the Clin Chem Lab Med. 2004;42:725-33.
formulation of reference intervals based on
Lahti A, Petersen PH, Boyd JC, Rustad P, Laake P,
current data. Clin Chem. 2005;51:1232-40.
Solberg HE. Partitioning of nongaussian-distributed
Kouri T, Kairisto V, Virtanen A, Uusipaikka E, biochemical reference data into subgroups. Clin
Rajamaki A, Finneman H, et al. Reference Chem. 2004 May; 50:891-900.
intervals developed from data for hospitalized
Lahti A. Are the common reference intervals truly
patients: computerized method based on
common? Case studies on stratifying biochemical
combination of laboratory and diagnostic data.
reference data by countries using two partitioning
Clin Chem. 1994;40:2209-15.
methods. Scand J Clin Lab Invest. 2004;64:407-30.
Ejemplo de aplicaciones
Valores de referencia intraindividuales
Levey AS, Bosch JP, Breyer Lewis J, Greene T,
Fraser CG. Biological variation: from principles to
Rogers N, Roth D. A More Accurate Method to
practice. Washington DC: AACC Press, 2001.
estimate Glomerular Filtration Rate from Serum
Creatinine: A New Prediction Equation. Ann Petersen PH, Fraser CG, Sandberg S, Goldschmidt
Intern Med. 1999;130:461-70. H. The index of individuality is often a
misinterpreted quantity characteristic. Clin Chem
Myron Johnson A, Hyltoft Petersen P, Whicher
Lab Med 1999;37:655-61.
JT, Carlström A, MacLennan S, on behalf of the
International Federation of Clinical Chemistry Queraltó JM. Intraindividual reference values. Clin
and Laboratory Medicine, committee on Plasma Chem Lab Med 2004; 42:765-77.
Proteins reference intervals for serum proteins:
Winkel P. The use of the subjects as his own
similarities and differences between adult
referent. In: Grasbeck R, Alstrom T, eds.
Caucasian and Asian Indian males in Yorkshire,
Reference values in laboratory medicine.
UK. Clin Chem Lab Med. 2004;42:792–9.
Chichester: John Wiley; 1981:65-78.
Sinton TJ, Crowley D, Bryant SJ. Reference
Solberg HE. Subject-based reference values. Scand
values for calcium, phosphate, and alkaline
J Clin Lab Invest 1995;55(suppl. 222):7-10.
phosphatase as derived on the basis of
multichannel-analyzer profiles. Clin Chem. 1986; Calculadoras on-line para valor semiológico:
32:76-9.
http://medcalc3000.com/BayesianAnalysis_1.htm
Procedimientos estadísticos
Barnett V, Lewis T. Outliers in Statistical Data. http://medcalc3000.com/FalsePositiveRateSSP.ht
Chichester: John Wiley; 1978:68-73. m
Dixon WJ. Processing data for outliers.
Biometrics. 1953; 9:74-89. Bibliografía Curvas ROC
Hoffman RG. Statistics in the practice of
Libros
medicine. JAMA. 1963; 185:864-73.
Swets JA, Pickett RM. Evaluation of diagnostic
Linnet K. Two-stage transformation systems for
systems: methods from signal detection theory.
normalization of reference distributions
Nueva York: Academic Press; 1982.
evaluated. Clin Chem. 1987;33:381-386.
Pepe MS. The Statistical evaluation of medical
Reed AH, Henry RJ, Mason WB. Influence of
tests for classification and prediction. UK: Oxford
statistical method used on the resulting estimate
University Press, 2004.
of normal range. Clin Chem. 1971;17:275-84.
En Internet Jiang Y, Metz CE, Nishikawa RM. A receiver

operating characteristic partial area index for
highly sensitive diagnostics tests. Radiology
http://www.anaesthetist.com/mnm/stats/roc/F
1996;201:745-50.
index.htm
McClish DK. Analyzing a portion of the ROC curve.
Med Decision Making 1989;9:190-5.
http://www.fisterra.com/mbe/investiga/curvas
_roc/curvas_roc.htm McNeil BJ, Keeler E, Adelstein SJ. Primer on
certain elements of medical decision making. N
http://www.cs.ucl.ac.uk/staff/W.Langdon/roc/
Engl J Med 1975;293:211-5.
Artículos Metz CE. Basic principles of ROC analysis. Sem
Nucl Med, 1978;8:283-98.
Bamber D. The area above the ordinal
dominance graph and the area below the Metz CE, Herman BA, Shen, J. Maximum likelihood
receiver operating graph. J Math Psych estimation of receiver operating characteristic
1975;12:387-415. (ROC) curves from continuously distributed data.
Statist Med 1998;17:1033-53.
Beck JR, Shultz EK. The use of relative operating
characteristic (ROC) curves in test performance Robertson EA, Zweig MH. Use of receiver operating
evaluation. Arch Pathol Lab Med 1986;110:13-20. characteristic curves to evaluate the clinical
performance of analytical systems. Clin Chem
Burgueño MJ, García-Bastos JL, González-
1981;27:1569-74.
Buitrago JM. Las curvas ROC en la evaluación de
las pruebas diagnósticas. Med Clin (Barc) 1995; Swets JA. Form of empirical ROCs in discrimination
104: 661-670. and diagnostic tasks: implications for theory and
measurement of performance. Psych Bull
Gardner IA, Greiner M. Receiver-operating
1986;99:181-98.
characteristic curves and likelihood ratios:
improvements over traditional methods for the Swets JA, Dawes RM, Monahan J. Better decisions
evaluation and application of veterinary clinical through science. Sci Am 2000 (Octubre):82-85.
pathology tests. Vet Clin Path, 2006;35:8-17. http://www.psychologicalscience.org/pdf/pspi/sci
am.pdf
Griner PF, Mayewski RJ, Mushlin AI, Greenland P.
Selection and interpretation of diagnostic tests Swets JA, Dawes RM, Monahan J. Psychological
and procedures. Ann Int Med, 1981;94:555-600. science can improve diagnostic decisions.
Hanley JA, McNeil BJ. The meaning and use of Psychol Sci (suppl.), 2000;1:1-26.
the area under a receiver operating http://www.psychologicalscience.org/journals/ps
characteristic (ROC) curve. Radiology pi/pdf/pspi001.pdf
1982;143:29-36.
Weinstein MC, Fineberg HV. Clinical Decision
Hanley JA, McNeil BJ. A method of comparing Analysis. Philadelphia:WB Saunders Co;1980.
the areas under receiver operating characteristic
Zou KH, Hall WJ, Shapiro DE. Smooth non-
curves derived from the same cases. Radiology
parametric receiver operating characteristic (ROC)
1983;148:839-43.
curves for continuous diagnostic tests. Stat Med
Hanley JA. The robustness of the binormal model 1997;16:2143-56.
used to fit ROC curves. Med Decision Making
Zweig MH, Campbell G. Receiver-operating
1988;8:197-203.
characteristic (ROC) plots: a fundamental
Hanley JA. The use of the "binormal" model for evaluation tool in clinical medicine. Clin Chem
parametric ROC analysis of quantitative 1993;39:561-77.
diagnostics tests. Statist Med 1996;15:1575-85.
Software para análisis ROC
Hilgers RA. Distribution-free confidence bounds
for ROC curves. Meth Inf Med, 1991;30:96-101.
http://www.rad.jhmi.edu/jeng/javarad/roc/JROC
Hsieh F, Turnbull BW. Nonparametric and FITi.html (gratuito)
semiparametric estimation of the receiver
http://www.netti.fi/~maxiw/ (demostración:
operating characteristic curve. Ann Statist
programa gratuito durante 4 semanas)
1996;24:25-40.
Es autor así mismo de concepto de control

Nombres propios: estadístico de la calidad, que tendía por
finalidad limitar variación de causa aleatoria, de
Walter A. Shewhart modo que se pudiera predecir y tratar
económicamente el rendimiento futuro de un
(1891-1967) proceso industrial mediante diseño
experimental. A partir de consideraciones
estrictamente teóricas dedujo que las
observaciones de los procesos físicos raramente
producen distribuciones gaussianas y que la
variabilidad de los objetos producidos en el
proceso industrial no era necesariamente la
misma que se observaba en la naturaleza, de
modo que mientras unos procesos poseían una
variabilidad inherente, natural o controlada,
otros manifestaban de forma aleatoria además
una variabilidad adicional no controlada.
Walter Andrew Shewhart nació en 1891 en el La idea básica consiste en incorporar el concepto
estado de Illinois y murió en el de Nueva Jersey, de variables aleatorias independientes e
en 1967. Maestro y colaborador de W.E. Deming, idénticamente distribuidas. El principio general
es considerado el padre fundador del control subyacente a esta idea es que cuando un proceso
estadístico de la calidad, es decir, de la está en un estado de control determinado está
utilización de métodos estadísticos para juzgar caracterizado por una distribución definida por
cuando se ha alcanzado un nivel de calidad y unos parámetros. El objetivo es detectar, a
controlar que se mantenga en dicho nivel. través de las oportunas señales, si el proceso se
Estudió en las universidades de Illinois y aleja del estado de control de modo que deba
California en Berkeley, donde se doctoró en ser devuelto a dicho estado mediante las
física en 1917. Desarrolló su carrera profesional oportunas acciones correctivas.
como ingeniero primero en el departamento de La señal de alejamiento del objetivo µ
inspección de ingeniería de la Western Electric desarrollada por Shewhart consistía en que se
Co., de 1918 a 1924, y en los laboratorios Bell cruzaban “líneas de actuación” situadas a
Telephone de 1925 a 1956, año en que se retiró.
En los años 1920, la calidad industrial estaba
µ ± k σ , donde σ es la desviación típica y k
limitada a la inspección de productos terminados una constante (para la sugirió el valor 3, que le
y la substitución de artículos defectuosos. La daba una probabilidad de error tipo I de 0,002).
compañía Western fabricaba aparatos telefónicos El método de Shewhart adolecía de dos
que hasta 1983 alquilaba a los usuarios, por lo problemas: no tenía en cuenta la magnitud de la
que el mantenimiento era a expensas de la desviación y para muestras pequeñas era poco
compañía. Como consecuencia, los ingenieros fiable. Hasta los años 1940-1950 no se
estaban trabajando en reducir la variación del solventaron con éxito estas limitaciones1.
proceso de fabricación, disminuyendo la El diagrama de Shewhart fue adoptado
frecuencia de productos defectuosos y oficialmente por la American Society for Testing
aumentando la fiabilidad de los procesos indus- y Materials (ASTM) en 1933.
triales para reducir el coste que le ocasionarían Desde finales de los años 1930 extendió su
las posibles reparaciones o sustituciones. El 16 interés científico a la inferencia estadística y su
de Mayo de 1924 Shewhart presentó a su superior aplicación en la investigación científica con una
un corto memorándum de sólo una página de visión altamente pragmática influido por el
longitud en el que casi un tercio era un sencillo filósofo empirista Clarence Irwing Lewis2 y el
gráfico o diagrama de control de Shewhart. Este mismo Karl Pearson. De esta época data su libro
diagrama junto con el breve texto que lo “Método estadístico desde el punto de vista del
acompañaba, incluía los principios y control de calidad” (1939). Formuló la idea
consideraciones esenciales que hoy se conocen estadística de intervalos de tolerancia y
como “control estadístico de procesos." propugnó la presentación de datos, de acuerdo
El trabajo de Shewhart destacaba la importancia
de reducir la variabilidad que degrada la calidad 1
Dudding BP, Jennet WJ. Quality control charts.
y entender que ésta es consecuencia de un 1942, London: British Standards Institution
proceso de ajuste continuo, de utilización de Dudding BP, Jennet WJ. Quality control chart
medidas correctivas de las no conformidades. technique. 1944 London: General Electric.
Shewhart definió el problema en términos de
2
causa asignable y causa aleatoria, que podrían Autor de Mind and the world-order. Outline of
ser analizados mediante procedimientos gráficos. a theory of knowledge (1929)
con unos criterios como: (a) los datos no tienen

significado si se presentan descontextualizados; El Test de Tukey Duckworth
(b) los datos constan de señal y ruido: ambos
deben ser separados para poder extraer para comparar las medianas
información
En 1938, los físicos William E. Deming (1900- de dos poblaciones
1993) y Raymond T. Birge (1887-1980),
interesados por el papel de la medición del error Durante una sesión de la sección de Aplicaciones
adaptaron una publicación anterior3, a las nuevas Industriales de la Royal Statistical Society
ideas de Shewhart. Este fue el inicio de una larga celebrada en Nottinham, UK, en 1956, un
colaboración con WE Deming quien divulgó las ingeniero llamado W. E. Duckworth4 se quejó a la
ideas de Shewhart (sintetizadas en el ciclo de la comunidad estadística de la forma tan
calidad o ciclo de Shewhart) en sus famosos “esotérica” de enfocar la comparación de
cursos en el Japón de los años 1950. medidas de centralización, que aparentemente
Shewhart fue consultor del departamento de constituye un problema sencillo que la
defensa de los EEUU, de Naciones Unidas, y del contemplación de gráficos apropiados como el
Gobierno de la India. Enseñó en las Universidades diagrama de cajas parece resolver de forma
de Illinois, California, y colaboró con obvia. John Tuckey aceptó el reto y en 1959
Departamento de Relaciones Sociales de la mismo año publicó un test “compacto” y
Universidad de Harvard, profesor honorario en la “rápido” para satisfacer las especificaciones del
Universidad de Rutgers y miembro del comité ingeniero Duckworth (1).
consultivo del departamento de matemáticas de
la Universidad de Princeton. Fue profesor de
control de calidad y estadística aplicada en la
Objetivo
Universidad de Londres. En 1947-1948 visitó la Se trata de un test no paramétrico, sencillo y
India bajo el patrocinio de P. C. Mahalanobis, muy fácil de utilizar e interpretar (por lo que se
recorriendo el país y estimular el interés por el ha denominado ocasionalmente “test de
control de la calidad de los industriales indios bolsillo”) para comparar las medianas de dos
Algunas de sus obras son: poblaciones X e Y de las que se han obtenido
• Basis for economic control of quality, 1929. muestras de diferente tamaño: n X y n Y . No
• When must a thing be left to chance?:
requiere ni cálculos ni tablas especializados.
Criteria for determining when fluctuations in
Para datos censurados existe una versión
observed phenomena indicate the presence
adaptada (2).
of causes of such fluctuations, inspection and
economics, 1929.
• Economic control of quality of manufactured Limitaciones
products, 1931. No es un test muy potente, pero este hecho
• Application of statistical methods to viene compensado por la facilidad de uso ya
manufacturing problems, 1938. comentada.
• Importance of some statistical El número de observaciones ha de estar
characteristics of a standard of quality, comprendido entre 4 y 30: 4 ≤ n X ≤ n Y ≤ 30
1938.
• Statistical method from the viewpoint of
quality control, 1939. Hipótesis
Las hipótesis nula y alternativa son:
 H 0 : Me X = Me Y

 H 1 : Me X ≠ Me Y
Procedimiento
Determinar la observaciones extremas de ambas
muestras.
4
Autor de una publicación acerca de uno de los
varios tests no paramétricos rápidos y potentes,
denominados test de los signos (Duckworth WE,
3
Deming WE, Birge RT. On the statistical theory Wyatt JV. Rapid statistical techniques for
of errors Rev. Mod. Phys. 1934;6,119-61 operations research workers. Oper. Res.
Quarterly, 1958;9:218-33.)
Contar el número de observaciones de la muestra Ordenando las dos muestras tras combinarlas
con el valor más alto (en el ejemplo que sigue es (sólo se muestran los datos extremos):
Y ), superiores a la observación más alta de la Y 45,2
segunda muestra X . Y 46,1
Contar el número de observaciones de la muestra Y 47,7
con el valor más bajo (en el ejemplo que sigue es Y 47,8
X ), inferiores a la observación más pequeña de X 49,2
la otra muestra Y . Y 50,0
... ...
Cálculo del estadístico
X 64,7
El estadístico a calcular, D , es la suma de estos Y 65,1
dos números. X 65,2
4 nY X 65,4
Si sucede que 3+ ≤ n X ≤ 2 nY , o X 66,1
3
viceversa, entonces se resta a D un 1. X 66,6
X 69,4
Decisión: nivel de significación X 69,8
Si el valor de D es superior al valor crítico se
rechaza la hipótesis nula de igualdad de Se observa como el solapamiento afecta a 4 y 6
medianas con la correspondiente probabilidad observaciones. Pero al ser 33, 66 ≥ n Y ≤ 46 , el
α. estadístico D será:
Valores críticos D = 4 + 6 −1 = 9
α Concluyéndose que se puede rechazar la
hipótesis de igualdad de medianas con una
0,05 0,01 0,001
probabilidad comprendida entre 0,05 y 0,01.
D 7 10 13
Bibliografía
Ejemplo 1. Tukey JW. A quick, compact, two-sample test
Supóngase dos poblaciones de las que se extraen to Duckworth’s specifications. Technometrics
las siguientes muestras 1959;1:31-48.
2. Westlake WJ. A one-sided version of the
X Y
Tukey-Duckworth test. Technometrics,
1 69,4 55,3
1941;13(4):901-3.
2 61,1 58,3
3 62,8 58,1
4 55,0 47,8
5 49,2 54,5
6 59,2 45,2
7 59,1 62,5
8 62,7 53,3
9 60,8 52,9
10 64,7 56,2
11 56,6 65,1
12 66,6 47,7
13 57,7 60,7
14 66,1 56,9
15 69,8 59,0
16 65,4 61,6
17 60,4 55,1
18 58,4 54,7
19 65,2 54,4
20 64,3 57,1
21 55,9 58,0
22 46,1
23 50,0
n 21 23
Problemas
1. Se sabe que el diámetro medio de una población celular es de 7,5 µm y que sigue una distribución
aproximadamente normal. Se ha obtenido una muestra aleatoria de 25 elementos celulares de esta
población y las correspondientes medidas se expresan en la siguiente tabla. Se desea saber
(a) ¿Cuál es la estimación de máxima verosimilitud de la desviación típica poblacional?
(b) ¿Cuál es la probabilidad de que el estimador de máxima verosimilitud subestime el verdadero valor
del parámetro?
caso diámetro caso diámetro caso diámetro caso diámetro caso diámetro
1 6,1 6 8,4 11 9,0 16 7,3 21 5,6
2 7,1 7 7,4 12 8,7 17 6,1 22 9,5
3 6,7 8 9,8 13 7,2 18 7,0 23 7,8
4 9,6 9 9,2 14 10,2 19 9,4 24 8,0
5 6,2 10 8,4 15 8,4 20 7,4 25 6,6
Solución
(a) Se conoce que la variable aleatoria X “longitud del diámetro de las células” tiene una distribución
N ∼ ( 7,5, σ 2 ) . En primer lugar se calculará la estimación de la desviación típica σ por el método de
la máxima verosimilitud. Al tratarse de una distribución normal, la función de verosimilitud
L (σ ) = f σ ( x1 , x 2 ,… , x n ) será:
L (σ ) = f σ ( x 1 , x 2 , … , x n )
n
= ∏ fσ ( x )
i =1
i
1  1 n 2
= exp  − ∑(x − 2) 
 2π
2 i
σ 2 ( 2π )
2
i =1 
Tomando logaritmos neperianos y sustituyendo por su valor:
n
n 1
∑( x −x)
2
log L (σ ) = − n log σ − log ( 2 π ) −
2σ 2
i
2 i =1
Una forma de obtener un valor máximo de una función consiste en igualar a cero la primera derivada de la
función y resolviendo esta igualdad:
d
log L (σ ) = 0
dσ
n
4σ ∑ ( x i − x )
2
∂ n
log L (σ ) = − +
i =1
= 0
∂σ σ 4σ 4
1 n
∑ ( xi − x )
2
σˆ =
n i =1
Es decir,
1 25
∑ ( x i − 7,5 )
2
σˆ =
25 i =1
σˆ = 1,34
(b) La probabilidad que el estimador de máxima verosimilitud hallado subestime el verdadero valor del
parámetro se puede formalizar:
1 n 
Pr (σˆ < σ ) = Pr  ∑ ( x i − x ) < σ 2 
2
 n i =1 
 1 25 
= Pr  2 ∑ ( x i − 7,5 ) < 25 
2
 σ i =1 
= Pr ( χ 25
2
< 25 ) = 0, 4624
Ya que, como en el caso de estimación de la varianza de población normal de media conocida,

25
1
∑(x − 7,5 ) , tiene una distribución χ 252 .
2
σ 2
i =1
i
Esta probabilidad puede calcularse extrapolando a partir de la información proporcionada en las tablas de
χ 2 , donde se presentan para cada grado de libertad (en las filas), las abcisas χ grados
2
de libertad , β que dejan
a su derecha un área de probabilidad β (en columnas) de la distribución χ 2
n, β . Es decir
Pr ( χ n2 > χ n2, β ) = β . Por ejemplo en la tabla siguiente Pr ( χ 252 > 40, 646 ) = 0, 025
Distribución χ 252
ß
g. de l. 0,975 0,10 0,05 0,025 0,01 0,005 0,001
1 0,000982 2,706 3,841 5,024 6,635 7,879 10,828
2 0,0506 4,605 5,991 7,378 9,210 10,597 13,816
3 0,216 6,251 7,815 9,348 11,345 12,838 16,266
4 0,484 7,779 9,488 11,143 13,277 14,860 18,467
5 0,831 9,236 11,070 12,833 15,086 16,750 20,515
6 1,237 10,645 12,592 14,449 16,812 18,548 22,458
7 1,690 12,017 14,067 16,013 18,475 20,278 24,322
8 2,180 13,362 15,507 17,535 20,090 21,955 26,124
9 2,700 14,684 16,919 19,023 21,666 23,589 27,877
10 3,247 15,987 18,307 20,483 23,209 25,188 29,588
11 3,816 17,275 19,675 21,920 24,725 26,757 31,264
12 4,404 18,549 21,026 23,337 26,217 28,300 32,909
13 5,009 19,812 22,362 24,736 27,688 29,819 34,528
14 5,629 21,064 23,685 26,119 29,141 31,319 36,123
15 6,262 22,307 24,996 27,488 30,578 32,801 37,697
16 6,908 23,542 26,296 28,845 32,000 34,267 39,252
17 7,564 24,769 27,587 30,191 33,409 35,718 40,790
18 8,231 25,989 28,869 31,526 34,805 37,156 42,312
19 8,907 27,204 30,144 32,852 36,191 38,582 43,820
20 9,591 28,412 31,410 34,170 37,566 39,997 45,315
21 10,283 29,615 32,671 35,479 38,932 41,401 46,797
22 10,982 30,813 33,924 36,781 40,289 42,796 48,268
23 11,689 32,007 35,172 38,076 41,638 44,181 49,728
24 12,401 33,196 36,415 39,364 42,980 45,559 51,179
25 13,120 34,382 37,652 40,646 44,314 46,928 52,620
Un ejemplo de extrapolación a partir de tablas estadística se comenta en el problema 2.

Alternativamente, se puede utilizar calculadores disponibles on-line en Internet, por ejemplo en

http://www.stat.sc.edu/~west/applets/chisqdemo.html
En esta calculadora se entra el número de grados de libertad en y
(a) el valor de χ en la caja

2
para obtener las probabilidades, como es el caso
del presente problema; o
(b) entrar la probabilidad en la caja , que corresponde a la descripción de la tabla hecha

anteriormente.
Al pulsar aparecerá respectivamente la probabilidad o el área (que además queda

representada en la figura).
Comentarios
Cuando se piensa en probabilidad (de observar un evento determinado A ) se suele imaginar n
repeticiones de un “experimento” de modo que la frecuencia relativa con que se observa el evento
expresa su probabilidad. Implícitamente se asume un modelo probabilístico que se representa mediante
una función matemática que consta de uno o más parámetros. Formalmente, la probabilidad de observar
un evento A en el contexto de un modelo probabilístico con p parámetros se puede expresar como
Pr ( A | p ) . A través de las leyes de la probabilidad y los parámetros del modelo se pueden hacer
inferencias y predicciones.
Sin embargo, puede hacerse un planteamiento diferente: si se dispone de un conjunto de n
observaciones, fijo y sin que haya ningún mecanismo probabilístico que lo altere, puede intuirse que el
hecho de haber observado este conjunto determinado de datos y no otro obedece al hecho de que es más
fácil (o verosímil) que se de en la realidad. A partir de estas observaciones se puede, pues, obtener los
parámetros que definen el modelo. El concepto de verosimilitud (likelihood) es simétrico del de
probabilidad. Su expresión formal es L ( p | A ) .
Principio de la máxima verosimilitud

La mejor estimación de los parámetros del modelo será aquella que hace más probable la aparición de los
datos, es decir que maximiza su verosimilitud. El método estadístico para estimar parámetros a partir de
muestras obtenidas aleatoriamente que satisfagan la máxima verosimilitud fue introducido por R. A. Fisher
entre 1911 y 1922.
El procedimiento se inicia escribiendo la función de verosimilitud de los datos. Considérese una familia
Dθ de distribuciones de probabilidad caracterizadas por un parámetro θ (“parametrizadas”) desconocido
y que se asocia a una función ( f ) densidad de probabilidad, si es continua, o masa de probabilidad, si es
θ
discreta. Se extrae una muestra aleatoria { x , x ,… , x } y se calcula la densidad de probabilidad

1 2 n
asociada a los valores observados de θ:

f θ ( x1 , x 2 ,… , x n | θ )
Esta función de θ para los valores fijos {x , x
1 2 ,… , x n } se denomina función de verosimilitud.
Dicho de otra manera, supóngase que la variable aleatoria X se distribuye de acuerdo con la función de
densidad o de masa Pr ( x |θ ) , entonces se define la función de verosimilitud de θ como
f θ ( x 1 , x 2 ,… , x n | θ ) = (θ | x ) = Pr ( x |θ )
Aparentemente se trata de lo mismo, pero la función de densidad o de masa Pr ( x |θ ) y función de
verosimilitud de θ son conceptos totalmente diferentes: en probabilidad, el conjunto muestral
{x , x
1 2 ,… , x n } son un conjunto de valores que varían mientras que el parámetro θ permanece
constante o fijo. En verosimilitud, es el conjunto muestral quien permanece constante y el que puede
variar es el parámetro θ .
Estimador de máxima verosimilitud

La estimación de máxima verosimilitud (EMV) es un procedimiento (y no una regla de optimización5) para
obtener un valor θˆ del argumento o parámetros en cuestión tal que el valor de la expresión f θ alcanza un
valor máximo:
θˆ = arg max f θ ( x ) = arg max (θ | x )
θ θ
El EMV es válido si y solo si θˆ es un valor único de X para el cual f θ ( x ) es máximo. Si existen varios
máximos, entonces coexiste un conjunto de soluciones.
Cuando el tamaño muestral es grande, la EMV, goza de las siguientes propiedades:
(a) Es un estimador insesgado de varianza mínima al aumentar el contingente de la muestra;
(b) Se distribuye normalmente y permite el cálculo de la varianza muestral que pueden ser utilizada para
establecer límites de confianza;
(c) Puede ser utilizada para comparar hipótesis sobre modelos y parámetros.
No obstante, también presentan inconvenientes:
(a) Cuando se dispone de pocos casos (por ejemplo, menos de 10) pueden producir estimaciones sesgadas
y no ser aplicables las propiedades mencionadas anteriormente;
(b) El cálculo puede requerir software especializado para resolver expresiones analíticamente complejas.
Estimador de máxima verosimilitud

Si la función de verosimilitud (θ | x ) es diferenciable, entonces θˆ se obtiene igualando a cero la
6
derivada de esta función de verosimilitud y resolviendo
∂
log ( (θ | x ) ) = 0
∂θ
Si la función densidad de probabilidad tiene una forma conocida, el EMV puede ser resuelto mediante
procedimientos de cálculo analítico y álgebra lineal. Si ello no es posible hay que recurrir a técnicas más
complejas como la iteración de Newton-Raphson, por el método scoring, o el algoritmo EM (expectación
maximización)
5
La estimación de la mínima varianza, la forma alternativa al EMV, es un estimador que satisface este
requisito concreto, pero al contrario del EMV no constituye por sí mismo un procedimiento de estimación.
6
O su logaritmo
En resumen, el principio de la verosimilitud establece que la información acerca del parámetro θ

contenida en una observación x se halla totalmente presente en la correspondiente función de
probabilidad Pr ( x |θ ) . El estimador de máxima verosimilitud aparece como consecuencia de la aplicación
del principio de verosimilitud. El EMV se calcula analíticamente o mediante algoritmos iterativos
alternativos. Entre sus notables propiedades está el ser consistente, asintóticamente eficiente7: cuando
exista un estimador eficiente, lo es el EMV, y es invariante a la reparametrización.
Bibliografía
Casella G, Berger RL. Statistical Inference. 2ª ed. Pacific Grove, CA: Duxbury, 2002.
van der Vaart A. Asymptotic Statistics. Cambridge: Cambridge University Press, 2000.
2. Se sabe que la variabilidad de la concentración de un determinado constituyente biológico está

sometida a factores de variación intrerindividuales independientes del muestreo de la población
(σ ) 2
b y, sobre todo, a factores de variación intraindividuales (σ ) . Se desea estimar el índice de
2
w
σ b2
individualidad definido por . Para ello se estudiaron 31 individuos seleccionados al azar a los que
σ w2
2
se determinó la concentración del constituyente y se calculó la cuasivarianza muestral s b . A 10 de
estos individuos se realizó determinaciones repetidas con periodicidad mensual de modo que estimó
2
la cuasivarianza muestral s w . Suponiendo que las distribuciones de las concentraciones son normales,
s b2 σ b2
se desea saber si el cociente es un estimador razonable de . Se entiende por “razonable” que
s w2 σ w2
no sobreestime su valor en más del triple y no lo infraestime en menos del 50 %.
Solución
La probabilidad buscada es:
 1 σ b2 s b2 σ b2 
Pr  ≤ ≤3 2 
 2 σ w2 s w2 σw
 
Es decir, que si el índice de individualidad realmente fuera 1,5 y se estimara como 0,3 ó 5,8 incumpliría
claramente en ambos casos la condición de “razonable”. Para calcular la probabilidad mencionada es
σ b2
preciso conocer la función de distribución de . Ya que se ha considerado que son distribuciones
σ w2
normales de media desconocida e independientes (en principio es aceptable que las variabilidades intra e
interindividual sean mútuamente independientes) se puede decir que:
s b2
s w2
∼ F n b − 1 , n w − 1 (α )
σ b2
σ w2
donde: n b −1 es el tamaño de la muestra extraída para calcular la variabilidad interindividual, 29, y
n w −1 es el tamaño de la muestra extraída para calcular la variabilidad intraindividual, 9.
Por lo tanto:
7
cuando n → ∞ , como sucede con el estimador de mínima varianza
 1 σ b2 s b2 σ b2  1 
Pr  ≤ ≤ 3 2  = Pr  ≤ F30,9 ≤ 3 
 2 σ w2 s w2 σw   2 

 1
= Pr ( F30,9 ≤ 3) − Pr  F30,9 < 
 2
 1
= 1 − Pr ( F30,9 > 3) − Pr  F30,9 < 
 2
Para resolver esta expresión se deberá disponer de tablas de F como las que se encuentran, por ejemplo
en
http://www.itl.nist.gov/div898/handbook/eda/section3/eda3673.htm
Las tablas no suelen ser muy detalladas y deberá extrapolarse su contenido. Por ejemplo, supóngase que
se dispone de unos valores F procedentes de tablas como los siguientes:
probabilidad
numerador denominador
0,100 0,050 0,025 0,010 0,005
30 9 2.2547 2.8637 3.5604 4.6484 5.6248
9 30 1,8490 2.2107 2.5746 3.0665 3.4505
Habitualmente, para ajustar el espacio sólo se expresan valores de Fm , n para la cola de la derecha, solo
para abscisas grandes: es decir será fácil hallar valores tabulados para F30,9 > 3 pero no para F30,9 < 0, 25 .
Para poder hacerlo se invoca la propiedad de la distribución F
1
Fm , n =
Fn , m
reescribiendo la expresión anterior
 1 σ b2 s b2 σ b2   1
Pr  ≤ ≤ 3  = 1 − Pr ( F30,9 > 3) − Pr  F30,9 < 
 2 σ w sw
2 2
σ w 
2
 2

 1 1
= 1 − Pr ( F30,9 > 3) − Pr  < 
 F9,30 2 
 
= 1 − Pr ( F30,9 > 3) − Pr ( F9,30 > 2 )
En el extracto de la tabla se puede ver como el valor para F30,9 > 3 no está tabulado aunque sí están
( ) ( )
tabuladas las probabilidades Pr F30,9 > 3,5604 = 0, 025 y Pr F30,9 > 2,8637 = 0, 050 . Es decir, entre
0, 05 y 0, 025 . Extrapolando, será
3 − 2,8637
× 0, 025 = 0, 0049
3,5604 − 2,8637
0, 05 − 0, 0049 = 0, 0451
Tampoco está el valor F9,30 > 2 . Para calcular esta probabilidad se opera como en el caso anterior: están
( ) ( )
tabuladas las probabilidades Pr F9,30 > 1,8490 = 0,100 y Pr F9,30 > 2, 2107 = 0, 050 . Para obtenerlo
por extrapolación, se calcula
2 − 1,8490
× 0, 050 = 0, 0206
2, 2107 − 1,8490
0,100 − 0, 0206 = 0, 0794
Utilizando la calculadora on line http://faculty.vassar.edu/lowry/tabs.html#f se obtendrían resultados

similares: 0, 0433 y 0, 0749 .
Finalmente la probabilidad pedida será:

1 − 0, 0451 0, 0794 = 0,8755
Introducción a : Regresión en (2): Gráficos
Ejemplo de utilización (cont.)

Supóngase los datos (simulados) que se han utilizado anteriormente:
n X Y
n GENERO GGT FAL
1 1 50,4 32,0
2 2 63,6 30,5
3 2 66,6 31,3
4 2 64,6 35,5
5 2 52,7 44,2
6 1 61,3 21,9
7 2 49,2 30,6
8 1 68,7 36,2
9 1 52,1 38,7
10 2 58,8 45,9
11 1 63,8 52,1
12 1 58,8 35,2
13 1 60,3 40,1
14 1 53,2 25,6
15 2 54,8 36,9
16 1 66,5 36,2
17 2 53,2 34,1
18 1 56,8 32,9
19 1 57,0 26,1
20 1 69,3 42,0
21 1 56,5 26,5
22 2 63,8 19,4
23 2 54,2 53,0
24 2 74,2 35,6
25 1 53,0 41,1
y que se habrán adquiridos desde un fichero MS Office al “clipboard” del ordenador y subsiguientemenet
habían sido (a) leídos por
(b) vinculado por defecto el archivo “ejemplo”, para no tener que repetir continuamente este nombre
como prefijo de las variables:
(c) obtenido la regresión lineal, creando el objeto “ml.lineal”:

(d) y opcionalmente visualizado los resultados con:
o de forma más completa con
Para realizar una representación gráfica se utilizará la instrucción plot(x~y).
que produce la siguiente gráfica:
Si se desea ampliar los rótulos y puntos, este incremento proporcional se incluirá previamente en las
instrucciones de diagramación par( ):
Si se desea introducir un titular (en negrita):

Para introducir la linea de regresión se añadirá la instrucción:
o, equivalentemente,
Que hará aparecer la recta de regresión:
La instrucción plot (objeto regresión) crea cuatro gráficas que en principio se representan
sucesivamente en cuatro pantallas. Al pedir:
pide confirmar un “cambio de página” para evitar sobrescribir en el gráfico que pudiera estar presnte
en la ventana gráfica:
Pulsando b aparece el diagrama de dispersión de los residuales frente a los valores predichos
Repitiendo b aparecen sucesivamente el diagrama de cuantiles (QQ plot) de los residuales:
los residuales estandarizados frente a los valores predichos:
y el diagrama de distancias de Cook:
Parece lógico, no obstante disponer de los cuatro gráficos simultáneamente. Para ello deverá incluirse
previamente una instrucción gráfica genérica par(mfrow), con un argumento que le indique que se
desean cuatro gráficos en una “matriz” de 2 x 2:
y se obtendrá el gráfico:
Próximo número
Guía de estudio (8 y 9)
(2008: vol 2, número 7–8) Módulo III: Aplicaciones estadísticas (III):
muestreo, diseño de experimentos,
determinación del número de observaciones.
Módulo IV: Estadística avanzada (I): series
temporales: análisis clásico y modelos ARIMA.
Problemas
Inferencia
Nombres propios
Pierre de Fermat
Fecha aproximada de aparición:
segunda quincena de Agosto Tests estadísticos
Test de aleatoriedad
Noticias
Reactivación del Foro del Curso de Estadística de Introducción a : Regresión en (3)
la SEQC

Guía Básica Estadística Clinica

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Guía Básica Estadística Clinica

Hochgeladen von

Copyright:

Verfügbare Formate

C URSO

Guía de estudio. 7. Estadística aplicada (2) comentarán a continuación de forma

Guía de estudio. 7. Contenidos

ha sido siempre una pieza emblemática y la Objetivos

• Describir y aplicar los métodos Bibliografía acerca de los valores de

Variaciones metodológicas Partición en subpoblaciones

En Internet Jiang Y, Metz CE, Nishikawa RM. A receiver

Es autor así mismo de concepto de control

con unos criterios como: (a) los datos no tienen

Ya que, como en el caso de estimación de la varianza de población normal de media conocida,

Un ejemplo de extrapolación a partir de tablas estadística se comenta en el problema 2.

Alternativamente, se puede utilizar calculadores disponibles on-line en Internet, por ejemplo en

En esta calculadora se entra el número de grados de libertad en y

(a) el valor de χ en la caja

(b) entrar la probabilidad en la caja , que corresponde a la descripción de la tabla hecha

Al pulsar aparecerá respectivamente la probabilidad o el área (que además queda

Principio de la máxima verosimilitud

discreta. Se extrae una muestra aleatoria { x , x ,… , x } y se calcula la densidad de probabilidad

asociada a los valores observados de θ:

Estimador de máxima verosimilitud

Estimador de máxima verosimilitud

En resumen, el principio de la verosimilitud establece que la información acerca del parámetro θ

2. Se sabe que la variabilidad de la concentración de un determinado constituyente biológico está

Utilizando la calculadora on line http://faculty.vassar.edu/lowry/tabs.html#f se obtendrían resultados

Finalmente la probabilidad pedida será:

Introducción a : Regresión en (2): Gráficos

Ejemplo de utilización (cont.)

(c) obtenido la regresión lineal, creando el objeto “ml.lineal”:

(d) y opcionalmente visualizado los resultados con:

o de forma más completa con

Para realizar una representación gráfica se utilizará la instrucción plot(x~y).

que produce la siguiente gráfica:

Si se desea introducir un titular (en negrita):

Para introducir la linea de regresión se añadirá la instrucción:

Que hará aparecer la recta de regresión:

Repitiendo b aparecen sucesivamente el diagrama de cuantiles (QQ plot) de los residuales:

los residuales estandarizados frente a los valores predichos:

y el diagrama de distancias de Cook:

Das könnte Ihnen auch gefallen