Sie sind auf Seite 1von 41

TALLER

DE

BIOESTADÍSTICA

Carmen M. Cadarso-Suárez
(eicadar@usc.es)

Unidad de Bioestadística
Departamento de Estadística e IO
Facultad de Medicina
Universidad de Santiago de Compostela
NECESIDAD DE LA ESTADÍSTICA EN LAS CIENCIAS BIOMÉDICAS

A) La variabilidad biológica de los individuos objeto de estudio.

Dos individuos nunca son iguales, lo que implica que la


experimentación biologica sea aleatoria y las conclusiones que se
derivan llevarán implícito un error, “controlado” en términos de
probabilidad.

B) La naturaleza cuantitativa de las Ciencias Biomédicas.

La Estadística permite manejar toda la información obtenida en la


experimentación aleatoria.

C) La investigación biomédica.

requiere de la Estadística en sus etapas de diseño, recopilación de


datos y anáilsis de los resultados.

D) La naturaleza del trabajo clínico

La estadística y la probabilidad ofrecen rigor y objetividad a los


clásicos procesos subjetivos de diagnóstico, pronóstico y tratamiento.

E) Necesidad del método inductivo.

En general, las Ciencias Biomédicas son experimentales y se basan


en el Método Inductivo que proporciona la Estadística. Esto es:

“La extensión a la población de las conclusiones obtenidas en una


muestra particular “.

F) La Estadística en la literatura biomédica:

El volumen de información que recibe el profesional biomédico requiere


del conocimento de la estadística para realizar una lectura crítica de los
resultados científicos ya publicados.
PANORAMA

DE LA ESTADÍSTICA

EN LA LITERATURA MÉDICA
• De los artículos publicados en revistas médicas, aproximadamente UN GRAN
PORCENTAJE de los que incorporan métodos estadísticos, los utilizan
incorrectamente.

• Los errores son habituales y el sistema actual de revisión editorial no es capaz


de evitarlos (Altman, 1998).
ERRORES HABITUALES
(Altman, 1998)

I. DISEÑO

II. ANÁLISIS
III. PRESENTACIÓN

IV. INTERPRETACIÓN
Acuerdo de Vancouver (British Columbia)

El Comité Internacional de Editores de Revistas Médicas (Grupo


Vancouver), se reúne anualmente para lograr consenso sobre la calidad
de las publicaciones en Medicina.

Apartado: Estadística

• Los métodos estadísticos deben ser descritos con suficiente detalle para
permitir que un lector interesado, con acceso a los datos originales,
pueda verificar los resultados que se informan.
• Siempre que sea posible se deberá cuantificar los hallazgos y
presentarlos con indicadores apropiados de error o incertidumbre
(como los intervalos de confianza).
• Evite basarse sólo en pruebas de hipótesis, como el uso de valores de
“p”, que fallan en proporcionar importante información cuantitativa, y
discuta la elegibilidad de los sujetos dando detalles acerca de la
aleatorización.
• Señale el número de observaciones y las pérdidas durante el estudio
(tales como abandonos en un ensayo clínico).
• Las referencias acerca del diseño del estudio y métodos estadísticos
deben ser de publicaciones estándar siempre que sea posible
(señalando las páginas pertinentes), más bien que de los artículos
donde fueron originalmente propuestos.
• Se debe especificar el empleo de cualquier programa computacional de
uso general.
• Evite el uso no técnico de términos estadísticos, tales como “azar” (lo
cual implica un mecanismo aleatorio), “normal”, “significativo”,
“correlaciones” y “muestra”. Defina los términos estadísticos,
abreviaciones y los símbolos.
¿Qué suelen exigir las revistas biomédicas?

• La mayoría, suele seguir las recomendaciones de Vancouver.

• El nivel de exigencia estadístico es variable.

• Sólo una minoría cuenta con bioestadísticos en el Consejo


Editorial.
AUTHOR INFORMATION

…….

D. STATISTICS

• The AJO recommends that authors ensure statistical expertise for a study
that has statistical content.

• Statistical methods must be identified in the manuscript whenever they are used.

• Software programs used for statistical analyses should be identified since


reviewers or readers may wish to verify calculations.

• When P values are used, the actual P value (for example, P = .032) is preferred to
an inequality (for example, P < .05).

• Reporting basic summary statistics, such as the mean and the standard error, as
well as confidence limits, also helps the reader understand the conclusions of the
study.

• Models such as analysis of variance, covariance, multiple regressions, and the


like must be specified.

• A sample size calculation and power analysis should be included when


appropriate.

• Authors should state the levels for alpha and beta errors and the clinically
significant difference that was used to determine the power calculation.

• Numeric equivalents should precede all percentages, as in these examples: "Of


80 patients, 20 (25%) had retinopathy" or "20 (25%) of 80 patients had
retinopathy."
……….
Editorial Board
Editor-in-Chief
Moyses Szklo, MD, DrPH
American Journal of Epidemiology Editorial Office
111 Market Place, Ste 840
Baltimore, MD 21202-6709
USA

Editorial Board
Donna K. Arnett, Phd, MSPH
Tim Byers, MD, MPH
Harvey Checkoway, PhD, MPH
Francesca Dominici, PhD
Janice Dorman, PhD
Manning Feinleib, MD, DRPH
Aaron R. Folsom, MD, MPH
Gary D. Friedman, MD
Ichiro Kawachi, MD, PhD
Muin J. Khoury, MD, PhD
Mark Klebanoff, MD
Myron M. Levine, MD, DRPH
Martha S. Linet, MD, MPH
George G. Rhoads, MP, MPH
Donna Spiegelman, ScD
Janet L. Stanford, PhD
David Vlahov, PhD

Assistant to the Editor-in-Chief


Stephen Cole
Statistical recommendations (AJE)

Abbreviations. To improve clarity and readability, the Journal strictly limits the use
of abbreviations. Only those needed for long, involved terms, such as hepatitis B
surface antigen (HBsAg), will be allowed. The abbreviations CI, RR, OR, and SMR
may be used only in parentheses after being defined the first time used. ...

p values. Note style for probability: p < 0.01, with a lowercase letter p. Avoid
reporting an excessive number of digits beyond the decimal for estimates, especially
when the estimate has a wide confidence interval. If p values are given, they should
be reported to at most two digits beyond any leading zeros. They may alternatively
be reported as less than some specified value (e.g., p < 0.05 or p < 0.001). Indicate
whether p values are one sided or two sided.

Means, standard deviations, and standard errors. To report means, standard


deviations, and standard errors, use the following format: “mean (SD)” and “mean
(SE).” Do not use “±.”

Confidence intervals. In the text, all confidence intervals are expressed by using a
colon and with a comma instead of a dash between values, for example, (95 percent
confidence interval: 1.20, 1.90). In tables, place confidence intervals in a separate
column without parentheses, for example, 1.20, 1.90.

Statistical notation. Equations can appear within the text or displayed. Whenever
possible, mathematical equations should be written on a single line, as a/ (a + b) and
exp(x). With proper use of braces, brackets, parentheses, and exponents, even
complicated expressions can be put into this form. However, any mathematical
expression that contains a character taller than a line of type should be displayed
and numbered as an equation. When referring to an equation in the text, use
“equation 6” or “expression 6,” with a lowercase “e.”

When preparing math, use italic type for variables and single letters, bold type for
vectors, and regular type for short words such as “exp” or “lim.” Insert a space before
and after any mathematical sign or symbol. .......

Regression analyses. When presenting results of regression analyses, regression


coefficients should usually be converted into more generally meaningful terms (e.g.,
relative odds instead of beta coefficients). Note that, because regression coefficients
are unit dependent for continuous variables and category dependent for discrete or
ordinal variables, the Journal requires statements specifying the units or categories,
that is, as parenthetical statements in the text or in table footnotes or figure legends.
Instructions for Authors

Data Analysis: It is the author's responsibility to document that the results are
reproducible and that the differences found are not due to random variation. No
absolute rules can be applied, but in general quantitative data should be from no
fewer than three replicate experiments. Appropriate statistical methods should be
used to test the significance of differences in results. The term "significant" should
not be used unless statistical analysis was performed, and the probability value used
to identify significance (e.g., P > 0.05) should be specified.
When several t tests are employed, authors should be aware that nominal probability
levels no longer apply. Accordingly, the multiple t test, multiple range test, or similar
techniques to permit simultaneous comparisons should be employed. Also, in lieu of
using several t tests, it is often more appropriate to utilize an analysis of variance
(ANOVA) to permit pooling of data, increase the number of degrees of freedom, and
improve reliability of results. Authors should use appropriate nonparametric tests
when the data depart substantially from a normal distribution.
Analysis of variance tables should not be inserted in manuscripts. F values with the
degrees of freedom as subscripts together with the P values are sufficient.
In presenting results of linear regression analyses, it is desirable to show 95%
confidence limits.
When data points are fitted with lines (as in Scatchard or Lineweaver-Burk plots), the
method used for fitting (graphical, least squares, computer program) should be
specified. If differences in slopes and/or axis intercepts are claimed for plotted lines,
these should be supported by statistical analysis.
Useful references for statistical methods are
McArthur, J. W., and T. Colten (eds.), Statistics in Endocrinology, MIT Press,
Cambridge, 1970, and Finney, D. J., Statistical Method in Biologic Assays, ed. 2,
Griffin, London, 1967.
Advice to contributors
Special methods
Statistical methods

Please define the methods and support them with references, describing in detail any that are not
in common use.

General guidelines on using statistical methods and interpreting and presenting statistical material,
as well as specific recommendations on statistical estimation and significance, have been
published in the BMJ. Please see the linked articles.
Also see :Altman DG, Machin D, Bryant TN, Gardner MJ (eds). Statistics with

Confidence. 2nd edition. London: BMJ Books, 2000.

Randomised controlled trials

Please report these in accordance with the CONSORT (Consolidated Standards of Reporting
Trials) statement.

See - The CONSORT statement: revised recommendations for improving the quality of reports of
parallel-group randomised trials.
See: Better reporting of randomised controled trials: the CONSORT statement

See Statisticians' Checklists

Systematic reviews and meta-analyses of randomised controlled trials

Please report these in accordance with the QUOROM (Quality of Reporting of Meta-analyses)
statement (Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF, for the QUOROM
Group. Improving the quality of reports of meta-analyses of randomised controlled trials: the
QUOROM statement. Lancet 1999; 354:1896-1900. www.thelancet.com )
Una “estadística”

de los métodos estadísticos


más utilizados en
publicaciones biomédicas.
• Con la finalidad de determinar los métodos y programas estadísticos más
frecuentemente utilizados en algunas publicaciones norteamericanas y europeas,
Pouso (2002) revisó todos los artículos científicos originales publicados durante
el año calendario 1999.

• Publicaciones: American Journal of Medicine, British Medical Journal,, Circulation,


European Heart Journal , New England Journal of Medicine y The Lancet.

• En total se consideraron 784 artículos que utilizaron 1702 pruebas estadísticas.

• La mayoría de estos artículos disponía de un subcapítulo "análisis estadístico" o


"métodos estadísticos".

• De los 712 artículos que utilizaron métodos estadísticos descriptivos o


inferenciales sólo en 233 (32.7%) se dejó constancia de la utilización de software
estadístico específico (SAS, SPSS, Splus, etc…)
• Sobre el total de 784 artículos, el 9.2% de ellos no tenían métodos estadísticos
(se trataba en general de artículos de métodos diagnósticos o de descripción de
técnicas), el 28.7% tenían una prueba estadística, el 25.4% tenían dos, el 18.4%
tenían tres y el 18.4% restante, cuatro o más.

30

25

20

% Artículos 15

10

0
0 1 2 3 >=4
Nº de técnicas estadísticas

• De las 1702 pruebas estadísticas las 10 más frecuentemente utilizadas (que en


conjunto constituyen el 74.6% de las mismas), se muestran en siguiente tabla:

Pruebas más utilizadas Nº %


T de Student 241 14.16
Chi cuadrado 204 11.99
ANOVA 158 9.28
Regresión Logística 140 8.23
Prueba de Fisher 106 6.23
Modelo de Cox 104 6.11
Test de Mann-Whitney 89 5.23
Método de Kaplan-Meier 87 5.11
Test de Wilcoxon 71 4.17
Correlación-regresión lineales 70 4.11
Otras 432 25.38
Total 1702 100
BIOESTADÍSTICA

• CONCEPTOS BÁSICOS.

• TIPOS DE VARIABLES.

• BASES DE DATOS.
POBLACIÓN: Es el conjunto (o universo) de individuos a los cuales va dirigida
nuestra investigación.

INDIVIDUO: Cada uno de los elementos que componen la población.

Personas, animales de experimentación, células, plantas,......

VARIABLE ALEATORIA (X)


Es la característica (numérica o no) que interesa estudiar en una población.
Sus respuestas surgen al AZAR.
Ej. Talla, Grupo sanguíneo, etc,

PARÁMETRO: Medida que interesa conocer en una variable aleatoria.

MEDIA =µ = Promedio de una v.a.


VARIANZA = σ
2

Puesto que la población es inaccesible, en general, realizamos un muestreo.

MUESTRA ALEATORIA: Subconjunto de individuos de la población (al azar).

TAMAÑO MUESTRAL (n): nº de individuos que componen la muestra.

Si X es la v.a. de interés, la muestra aleatoria se representa por :

( X1 , X 2 ,...., X n )
ESTADÍSTICO MUESTRAL: Es una función de la muestra aleatoria, que permite
aproximar el parámetro de interés.
MEDIA =µ → MEDIA MUESTRAL
1 1 n
X = ( X 1 + X 2 + .... + X n ) = ∑ X i
n n i =1
1 n
∑ ( Xi − X )
2
VARIANZA = σ → S2 =
2
VARIANZA MUESTRAL
n − 1 i=1
POBLACIÓN
Conjunto de pacientes cirróticos

VARIABLE ALEATORIA
X=Albúmina

PARÁMETRO
µ = promedio de albúmina

n=500

MUESTRA ALEATORIA

ESTADÍSTICA Subconjunto ALEATORIO de 500 pacientes cirróticos


INFERENCIAL ( X 1, X 2,...., X 500 )
ESTADÍSTICO “MEDIA” MUESTRAL
1
X= ( X 1 + X 2 + .... + X 500 ) = media muestral de albúmina
500

UNA MUESTRA PARTICULAR

( 2.35, 3.21, 4.20, .....,3.60 )

MEDIA DE LA MUESTRA
ESTADÍSTICA
1
x= (2.35 + 3.21 + 4.20 + ..... + 3.60)
500 DESCRIPTIVA
DEFINICIÓN DE “BIOESTADÍSTICA”

La ESTADÍSTICA es el conjunto de métodos necesarios para:

(a) Recoger, clasificar, representar y resumir datos de una MUESTRA

(b) Extraer conclusiones científicamente válidas acerca de la

POBLACIÓN.

Según estos objetivos, las grandes ramas de la Estadística son:

• ESTADÍSTICA DESCRIPTIVA (a)


RAMAS

• INFERENCIA ESTADÍSTICA (b)

La BIOESTADÍSTICA ha de entenderse como una disciplina que trata


del desarrollo y aplicación de la teoría y métodos estadísticos, en aquellos
fenómenos que surgen de las Ciencias Biomédicas.
TIPOS DE VARIABLES

1. CUANTITATIVAS: Son variables que toman valores numéricos.


A) DISCRETAS: Toman valores enteros, y se asocian a procesos de conteo.

Nº de hijos/mujer.
Nº de casos nuevos de SIDA/mes en un área hospitalaria.

B) CONTÍNUAS: Pueden tomar infinitos valores dentro de un rango.

Edad del paciente,


Albúmina (gr/100ml), linfocitos(%), glucosa (mg/dl).(variables bioquím. y
analíticas).
Peso, talla, IMC, etc. (variables antropométricas en Pediatría)
Tiempo de vida del paciente (años), tamaño del tumor (mm.) (Oncología)
Tensión arterial sistólica/diastólica (mm Hg).
Recuento de Linfocitos T CD4 + /µL, Carga Viral (copias/ml). (VIH/SIDA)

2. CUALITATIVAS : No son numéricas. Presentan una serie de k categorías.

A) NOMINALES: Son de carácter y no existe un orden

Sexo: “varón”, “mujer”.


Grupo Sanguíneo: “A”, “B”, “AB”, “0”.
Cirrosis : “si”, “no”.

B) ORDINALES: Los k niveles admiten un orden.

Nivel de estudios: “sin estudios”, “primario”, “medio”, “superior”.


Clase social: “baja”, “media” , “alta”.
Grado de una lesión: “leve”, “moderado”, “grave”.

3. CATEGÓRICAS : Variables cuantitativas que se categorizan en k niveles.

Edad → “joven”, “mediana edad”, “mayor”.


Niveles de glucosa → ”<70” , “normales=(70-115]” , “(115-138]”,
“>138”.
Niveles de Hematocrito → “Normales:( ≥37)”, “<37”.
Linfocitos CD4 → “Inmunodepresión (<200) ” , “200-500” , “>500”.
Carga viral → “Indetectable (<200)” , “>=200”.
Ejemplo

“Identificar los factores de riesgo de infección post-quirúrgica”

EDAD (años)

SEXO 1=varón ; 2=mujer

PATOL (Patología) 1=inflamatoria; 2=neoplasia;3=trauma; 4=otras.

TIP_OPER (tipo operación)

1=limpia; 2=potencialente contaminada; 3=contaminada; 4=sucia

ALB (albúmina)

HB (Hemoglobina)

HCTO (Hematocrito)

LEUCOS (Leucocitos)

LINFOPCT (Linfocitos (%))

HEMAT (Hematíes)

GLUC (Glucosa)

OBES (Obesidad) 1=si ; 2=no.

DESNUTR (Desnutrición) 1=si; 2=no.

DIABETES 1=si; 2=no.

INFEC = Infección Post-quirúrgica 0=no; 1=si


infec.sav

“Factores de riesgo asociados a la infección post-quirúrgica”


(Hospital Clínico-Universitario de Santiago, Enero 1996 a Marzo 1997)
n=2353 operaciones
pediatría.sav
Estudio de Talla, Peso e IMC=Peso/Talla 2 por Sexo (1=varón; 2=mujer) y Edad .

n=3556 niños (3-12 años)


ESTADÍSTICA

DESCRIPTIVA

“Una buena estadística descriptiva

es fundamental

para la inferencia”
1. TABLAS DE FRECUENCIAS

Ø UNIVARIANTES
Ø BIVARIANTES: TABLAS DE CONTINGENCIA

2. MEDIDAS DE CENTRALIZACIÓN / LOCALIZACIÓN

Ø MEDIA
Ø MEDIANA
Ø MODA(S)

3. MEDIDAS DE POSICIÓN

Ø PERCENTILES

4. MEDIDAS DE DISPERSIÓN

Ø RANGO
Ø VARIANZA
Ø DESVIACION TÍPICA
Ø COEFICIENTE DE VARIACIÓN

5. REPRESENTACIONES GRÁFICAS

Ø DIAGRAMA DE SECTORES
Ø DIAGRAMA DE BARRAS
Ø HISTOGRAMA
Ø DIAGRAMA DE CAJAS (BOX-PLOT)
Ø DIAGRAMA DE LÍNEAS “MEDIA ± DT”
Ø CURVAS PERCENTIL
TABLAS DE FRECUENCIAS UNIVARIANTES

Permiten la clasificación de UNA variable por la frecuencia de aparición de sus


valores o niveles.

PATOL

Porcentaje Porcentaje
SEXO Frecuencia Porcentaje válido acumulado
Válidos inflam 1054 44.8 44.8 44.8
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado neo 518 22.0 22.0 66.8
Válidos varón 1154 49.0 49.0 49.0 traum 65 2.8 2.8 69.6
mujer 1199 51.0 51.0 100.0 otras 716 30.4 30.4 100.0
Total 2353 100.0 100.0 Total 2353 100.0 100.0

DESNUTR

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado INFEC
Válidos si 97 4.1 4.1 4.1 Porcentaje Porcentaje
no 2249 95.6 95.9 100.0 Frecuencia Porcentaje válido acumulado
Total 2346 99.7 100.0 Válidos si 464 19.7 19.7 19.7
Perdidos Sistema 7 .3 no 1889 80.3 80.3 100.0
Total 2353 100.0 Total 2353 100.0 100.0
TABLAS DE FRECUENCIAS BIVARIANTES: “TABLAS DE CONTINGENCIA”

Ø Permiten la clasificación de DOS variables cualitativas (o categóricas) por la frecuencia de aparición


simultánea de sus valores o niveles.
Ø Describen la posible “asociación” entre dichas variables.

Frecuencias absolutas Porcentaje sobre el total


Tabla de contingencia INFEC * TIP_OPER

Tabla de contingencia INFEC * TIP_OPER TIP_OPER


limpia pot_cont contam sucia Total
Recuento
INFEC si Recuento 51 146 83 184 464
TIP_OPER
% del total 2.2% 6.2% 3.5% 7.8% 19.7%
limpia pot_cont contam sucia Total
no Recuento 824 607 211 247 1889
INFEC si 51 146 83 184 464
% del total 35.0% 25.8% 9.0% 10.5% 80.3%
no 824 607 211 247 1889
Total Recuento 875 753 294 431 2353
Total 875 753 294 431 2353
% del total 37.2% 32.0% 12.5% 18.3% 100.0%

Porcentaje por filas Porcentaje por columnas


Tabla de contingencia INFEC * TIP_OPER Tabla de contingencia INFEC * TIP_OPER

TIP_OPER TIP_OPER
limpia pot_cont contam sucia Total limpia pot_cont contam sucia Total
INFEC si Recuento 51 146 83 184 464 INFEC si Recuento 51 146 83 184 464
% de INFEC 11.0% 31.5% 17.9% 39.7% 100.0% % de TIP_OPER 5.8% 19.4% 28.2% 42.7% 19.7%
no Recuento 824 607 211 247 1889 no Recuento 824 607 211 247 1889
% de INFEC 43.6% 32.1% 11.2% 13.1% 100.0% % de TIP_OPER 94.2% 80.6% 71.8% 57.3% 80.3%
Total Recuento 875 753 294 431 2353 Total Recuento 875 753 294 431 2353
% de INFEC 37.2% 32.0% 12.5% 18.3% 100.0% % de TIP_OPER 100.0% 100.0% 100.0% 100.0% 100.0%
MEDIDAS DE CENTRALIZACIÓN / LOCALIZACIÓN

Si X es la variable cuantitativa de interés y (x1, x2, .... , xn)

la muestra:

• MEDIA: es el valor promedio de los datos muestrales

1 1 n
X = ( x1 + x2 + ...... + xn ) = ∑ xi
n n i =1

• MEDIANA (Me):

Ø Una vez ordenada la muestra, Me es aquel valor tal que el 50% de


los datos son menores o iguales que Me.

Ø Es una medida mas “robusta” que la media.

• MODA(S): Valor(es) con máxima frecuencia de aparición en la


muestra.
MEDIDAS DE DISPERSIÓN

• RANGO
Rango = xmax − xmin

• VARIANZA
1 
S2 = n1 ( x1 − x ) + n2 ( x2 − x ) + ........ + nk ( xk − x )  =
2 2 2

n −1  
1 k
= ∑ i( i ) −
2
n x x
n − 1 i =1

• DESVIACIÓN TÍPICA
S = DT = + S 2

Los datos cuantitativos se suelen presentar como

X ± DT

• COEFICIENTE DE VARIACIÓN (CV)

DT
CV = (CV 100%)
X
MEDIDAS DE POSICIÓN

Generalizan el concepto de “mediana”.

CUARTILES:
Son 3 valores, Q 1, Q2, y Q 3 que dividen a la muestra en 4 partes de igual
frecuencia.

Q1 Q2 Q3

PERCENTILES:

Son 99 valores, P1, P2, ... P 99 que dividen a la muestra en 100 partes de igual
frecuencia.

La partición puede ser más “fina”:

α )100% a aquél valor que deja un (1-α


Llamamos PERCENTIL (1-α α )100% de
datos a su izquierda (y por tanto un α 100% a su derecha).

α )100%
(1-α α 100%

P(1-αα )100%
Queremos describir la EDAD de los pacientes operados..........

Estadísticos

EDAD
N Válidos 2351
Perdidos 2
Media 54.63
Mediana 59.00
Desv. típ. 20.011
Varianza 400.435
Rango 83
Mínimo 14
Máximo 97
Percentiles 10 24.00
25 38.00
50 59.00
75 71.00
90 79.00
Descriptivos por grupos
Queremos comparar la EDAD en varones y mujeres........

Analizar
→Tablas personalizadas
→ Tablas básicas.......

varón mujer
Total
Mínimo 14.00 14.00 14.00
Máximo 97.00 96.00 97.00
Media 53.53 55.69 54.63
Mediana 57.00 59.00 59.00
Moda 68.00 63.00 68.00
Percentil 25 37.00 41.00 38.00
Percentil 75 70.00 72.00 71.00
DT 20.23 19.74 20.01
N válido N=1154 N=1197 N=2351

CVvaron = 20.23 / 53.53=0.3779 (37.79%) CVmujer = 19.74 / 55.69=0.3544 (35.44%)


REPRESENTACIONES GRÁFICAS

Ø Diagrama de Sectores

Ø Diagrama de Barras

Ø Histograma

Ø Diagrama de Cajas (Box-Plot)

Ø Diagrama de Líneas “Media ± DT”

Ø Curvas Percentil
DIAGRAMA DE SECTORES

Representación gráfica de variables cualitativas y categóricas .

Distribución de IPO por sexo

(n=2353 pacientes)

mujer varón
51.0% 49.0%

IPO por tipo de operación


(n=2353 pacientes)

sucia

18.3%

limpia

37.2%
contam

12.5%

pot_cont

32.0%
DIAGRAMA DE BARRAS

Ø Representación gráfica de variables cualitativas, categóricas y discretas.

Ø Permite comparación de grupos.

Tipo de operación
40
%

30

20

10

0
limpia pot_cont contam sucia

Infección post-quirúrgica
(n=2353)
100

80
80

60

40

20
20
%

0
si no
HISTOGRAMA
Representación gráfica de variables CONTÍNUAS por intervalos.

Distribución de la Hemoglobina
1000

800

600

400
nº de pacientes

200
Desv. típ. = 2.13
Media = 13.1

0 N = 2344.00

4.0 6.0 8.0 10.0 12.0 14.0 16.0 18.0 20.0

Distribución de la Glucosa
600

500

400

300

200
nº de pacientes

100

0
60 80 100 120 140 160 180 200 220 240 260 280

Desventajas

Ø Depende de la elección del nº de intervalos, k, de la variable:

k=25 k=4
600

500

400

300

200

100

0
3 4 5 6 6 7 8 8 9 10 11 11 12 13 13 14 15 16 16 17 18 18 19 20 21

Ø No permite una representación conjunta de la variable por grupos.


DIAGRAMA DE CAJAS
Ø Es una representación gráfica de variables contínuas que visualiza su localización, extensión y su
grado y magnitud de la asimetría.
Ø Se basa en los cuartiles Q1, Q1 y Q3 .
Ø Permite comparaciones entre grupos.

-24 -20 -16 -12 -8 -4 0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64

Construcción

a) La caja comienza en Q1, y remata en Q3. La línea vertical más gruesa representa Q2 (la mediana).

b) Calcular los valores “separadores”

Interiores: f1 = Q1 - 1.5*IQR , f2 = Q3 + 1.5*IQR


Exteriores F1= Q1 - 3.0*IQR , F2= Q3 + 3.0*IQR

siendo IQR el rango intercuartílico=Q3-Q1.

c) Calcular los valores “adyacentes” :


a1= valor muestral más próximo a f1 (por encima).
a2= valor muestral más próximo a f2 (por debajo).

d) Los “bigotes” se extienden desde a1 hasta Q1 y desde Q3 hasta a2.

e) Valores “atípicos moderados” :

Ø Datos de la muestra que se encuentran en (F1, f1] ó en [f2,F2).

Ø Se representan por un círculo abierto ‘ ο ’ .

f) Valores “atípicos extremos” :

Ø Datos de la muestra ≤ F1 ó ≥ F2.

Ø Se representan por un asterisco ‘ * ’ .


EDAD (años)

Mínimo Máximo Media DT N Percentil 25 Mediana Percentil 75


INFEC 15 96 61 19 464 49 66 75
NO INFEC 14 97 53 20 1889 37 56 69
TOTAL 14 97 55 20 2353 38 59 71

100
100

90
90

80
80

70
70
60

EDAD (años)
60
EDAD (años)

50
50
40
40
30

30
20

20
10

10 0
N= 464 1887
0
INFEC NO INFEC

GLUCOSA

Mínimo Máximo Media DT N Percentil 25 Mediana Percentil 75


INFEC 56 270 123 38 464 95 113 139
NO INFEC 55 291 110 32 1889 92 102 117
TOTAL 55 291 113 33 2353 92 103 121

INFEC

NO INFEC

50 100 150 200 250 300 50 100 150 200 250 300

glucosa GLUCOSA
± DT”
DIAGRAMA “MEDIA±

Ø Representación gráfica para variables cuantitativas


Ø Representa la media de la variable ± la desviación típica.
Ø Gráfico SPSS: “Barras de error”.
Ø Recomendado para variables con un cierto grado de simetría.

Talla de niños gallegos de 10 años


(Media+-DT)
141.6

141.4

141.2

141.0

140.8

140.6

140.4

140.2
N= 255 243

varón mujer

Informe

TALLA
Talla (cms.) de niños gallegos de 10 años
SEXO 170

varón mujer Total 160

N 255 243 498


150

Mínimo 122.20 122.50 122.20


140

Máximo 160.30 168.00 168.00


130
Media 140.8106 141.0016 140.9038
120
Desv. típ. 6.36141 6.84593 6.59630
110
Mediana 140.8000 141.0000 141.0000 N= 255 243

varón mujer

Talla(cms.) de niños gallegos por edad y sexo


165

150

135

120 SEXO

105 varón

90 mujer
3 4 5 6 7 8 9 10 11 12

EDAD (años)
CURVAS “ PERCENTIL”

Ø Representación gráfica para variables cuantitativas.


Ø Representa percentiles de interés.
Ø Grafico SPSS: “Líneas”.

En nuestro estudio de Pediatría, se quiere representar, por cada sexo,

las curvas Percentil 5, 10, 25, 50, 75, 90 y 95

de Peso, Talla e IMC en función de la edad.

percentilado de peso (Kgs) percentilado de peso (Kgs)


varones gallegos (3-12 años) niñas gallegas (3-12 años)
70 70

60 60

50 50

40 40

30 30

20 20

10 10
3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00

EDAD EDAD

percentilado de talla (cms) percentilado de talla (cms)


varones gallegos (3-12 años) niñas gallegas (3-12 años)
180 180

160 160

140 140

120 120

100 100

80 80
3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00

EDAD EDAD

percentilado de IMC (Kgs/m2) percentilado de IMC (Kgs/m2)


varones gallegos (3-12 años) niñas gallegas (3-12 años)
26 26
25 25

24 24

23 23

22 22

21 21

20 20

19 19

18 18

17 17

16 16

15 15

14 14

13 13

12 12
11 11

3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00

EDAD EDAD

Das könnte Ihnen auch gefallen