Introduccion A La Estadistica

TALLER
DE
BIOESTADÍSTICA
Carmen M. Cadarso-Suárez
(eicadar@usc.es)
Unidad de Bioestadística
Departamento de Estadística e IO
Facultad de Medicina
Universidad de Santiago de Compostela
NECESIDAD DE LA ESTADÍSTICA EN LAS CIENCIAS BIOMÉDICAS
A) La variabilidad biológica de los individuos objeto de estudio.
Dos individuos nunca son iguales, lo que implica que la

experimentación biologica sea aleatoria y las conclusiones que se
derivan llevarán implícito un error, “controlado” en términos de
probabilidad.
B) La naturaleza cuantitativa de las Ciencias Biomédicas.
La Estadística permite manejar toda la información obtenida en la

experimentación aleatoria.
C) La investigación biomédica.
requiere de la Estadística en sus etapas de diseño, recopilación de

datos y anáilsis de los resultados.
D) La naturaleza del trabajo clínico
La estadística y la probabilidad ofrecen rigor y objetividad a los

clásicos procesos subjetivos de diagnóstico, pronóstico y tratamiento.
E) Necesidad del método inductivo.
En general, las Ciencias Biomédicas son experimentales y se basan

en el Método Inductivo que proporciona la Estadística. Esto es:
“La extensión a la población de las conclusiones obtenidas en una

muestra particular “.
F) La Estadística en la literatura biomédica:
El volumen de información que recibe el profesional biomédico requiere

del conocimento de la estadística para realizar una lectura crítica de los
resultados científicos ya publicados.
PANORAMA
DE LA ESTADÍSTICA
EN LA LITERATURA MÉDICA
• De los artículos publicados en revistas médicas, aproximadamente UN GRAN
PORCENTAJE de los que incorporan métodos estadísticos, los utilizan
incorrectamente.
• Los errores son habituales y el sistema actual de revisión editorial no es capaz

de evitarlos (Altman, 1998).
ERRORES HABITUALES
(Altman, 1998)
I. DISEÑO
II. ANÁLISIS
III. PRESENTACIÓN
IV. INTERPRETACIÓN
Acuerdo de Vancouver (British Columbia)
El Comité Internacional de Editores de Revistas Médicas (Grupo

Vancouver), se reúne anualmente para lograr consenso sobre la calidad
de las publicaciones en Medicina.
Apartado: Estadística
• Los métodos estadísticos deben ser descritos con suficiente detalle para
permitir que un lector interesado, con acceso a los datos originales,
pueda verificar los resultados que se informan.
• Siempre que sea posible se deberá cuantificar los hallazgos y
presentarlos con indicadores apropiados de error o incertidumbre
(como los intervalos de confianza).
• Evite basarse sólo en pruebas de hipótesis, como el uso de valores de
“p”, que fallan en proporcionar importante información cuantitativa, y
discuta la elegibilidad de los sujetos dando detalles acerca de la
aleatorización.
• Señale el número de observaciones y las pérdidas durante el estudio
(tales como abandonos en un ensayo clínico).
• Las referencias acerca del diseño del estudio y métodos estadísticos
deben ser de publicaciones estándar siempre que sea posible
(señalando las páginas pertinentes), más bien que de los artículos
donde fueron originalmente propuestos.
• Se debe especificar el empleo de cualquier programa computacional de
uso general.
• Evite el uso no técnico de términos estadísticos, tales como “azar” (lo
cual implica un mecanismo aleatorio), “normal”, “significativo”,
“correlaciones” y “muestra”. Defina los términos estadísticos,
abreviaciones y los símbolos.
¿Qué suelen exigir las revistas biomédicas?
• La mayoría, suele seguir las recomendaciones de Vancouver.
• El nivel de exigencia estadístico es variable.
• Sólo una minoría cuenta con bioestadísticos en el Consejo

Editorial.
AUTHOR INFORMATION
…….
D. STATISTICS
• The AJO recommends that authors ensure statistical expertise for a study
that has statistical content.
• Statistical methods must be identified in the manuscript whenever they are used.
• Software programs used for statistical analyses should be identified since

reviewers or readers may wish to verify calculations.
• When P values are used, the actual P value (for example, P = .032) is preferred to
an inequality (for example, P < .05).
• Reporting basic summary statistics, such as the mean and the standard error, as
well as confidence limits, also helps the reader understand the conclusions of the
study.
• Models such as analysis of variance, covariance, multiple regressions, and the

like must be specified.
• A sample size calculation and power analysis should be included when

appropriate.
• Authors should state the levels for alpha and beta errors and the clinically
significant difference that was used to determine the power calculation.
• Numeric equivalents should precede all percentages, as in these examples: "Of

80 patients, 20 (25%) had retinopathy" or "20 (25%) of 80 patients had
retinopathy."
……….
Editorial Board
Editor-in-Chief
Moyses Szklo, MD, DrPH
American Journal of Epidemiology Editorial Office
111 Market Place, Ste 840
Baltimore, MD 21202-6709
USA
Editorial Board
Donna K. Arnett, Phd, MSPH
Tim Byers, MD, MPH
Harvey Checkoway, PhD, MPH
Francesca Dominici, PhD
Janice Dorman, PhD
Manning Feinleib, MD, DRPH
Aaron R. Folsom, MD, MPH
Gary D. Friedman, MD
Ichiro Kawachi, MD, PhD
Muin J. Khoury, MD, PhD
Mark Klebanoff, MD
Myron M. Levine, MD, DRPH
Martha S. Linet, MD, MPH
George G. Rhoads, MP, MPH
Donna Spiegelman, ScD
Janet L. Stanford, PhD
David Vlahov, PhD
Assistant to the Editor-in-Chief

Stephen Cole
Statistical recommendations (AJE)
Abbreviations. To improve clarity and readability, the Journal strictly limits the use
of abbreviations. Only those needed for long, involved terms, such as hepatitis B
surface antigen (HBsAg), will be allowed. The abbreviations CI, RR, OR, and SMR
may be used only in parentheses after being defined the first time used. ...
p values. Note style for probability: p < 0.01, with a lowercase letter p. Avoid
reporting an excessive number of digits beyond the decimal for estimates, especially
when the estimate has a wide confidence interval. If p values are given, they should
be reported to at most two digits beyond any leading zeros. They may alternatively
be reported as less than some specified value (e.g., p < 0.05 or p < 0.001). Indicate
whether p values are one sided or two sided.
Means, standard deviations, and standard errors. To report means, standard

deviations, and standard errors, use the following format: “mean (SD)” and “mean
(SE).” Do not use “±.”
Confidence intervals. In the text, all confidence intervals are expressed by using a
colon and with a comma instead of a dash between values, for example, (95 percent
confidence interval: 1.20, 1.90). In tables, place confidence intervals in a separate
column without parentheses, for example, 1.20, 1.90.
Statistical notation. Equations can appear within the text or displayed. Whenever
possible, mathematical equations should be written on a single line, as a/ (a + b) and
exp(x). With proper use of braces, brackets, parentheses, and exponents, even
complicated expressions can be put into this form. However, any mathematical
expression that contains a character taller than a line of type should be displayed
and numbered as an equation. When referring to an equation in the text, use
“equation 6” or “expression 6,” with a lowercase “e.”
When preparing math, use italic type for variables and single letters, bold type for
vectors, and regular type for short words such as “exp” or “lim.” Insert a space before
and after any mathematical sign or symbol. .......
Regression analyses. When presenting results of regression analyses, regression

coefficients should usually be converted into more generally meaningful terms (e.g.,
relative odds instead of beta coefficients). Note that, because regression coefficients
are unit dependent for continuous variables and category dependent for discrete or
ordinal variables, the Journal requires statements specifying the units or categories,
that is, as parenthetical statements in the text or in table footnotes or figure legends.
Instructions for Authors
Data Analysis: It is the author's responsibility to document that the results are
reproducible and that the differences found are not due to random variation. No
absolute rules can be applied, but in general quantitative data should be from no
fewer than three replicate experiments. Appropriate statistical methods should be
used to test the significance of differences in results. The term "significant" should
not be used unless statistical analysis was performed, and the probability value used
to identify significance (e.g., P > 0.05) should be specified.
When several t tests are employed, authors should be aware that nominal probability
levels no longer apply. Accordingly, the multiple t test, multiple range test, or similar
techniques to permit simultaneous comparisons should be employed. Also, in lieu of
using several t tests, it is often more appropriate to utilize an analysis of variance
(ANOVA) to permit pooling of data, increase the number of degrees of freedom, and
improve reliability of results. Authors should use appropriate nonparametric tests
when the data depart substantially from a normal distribution.
Analysis of variance tables should not be inserted in manuscripts. F values with the
degrees of freedom as subscripts together with the P values are sufficient.
In presenting results of linear regression analyses, it is desirable to show 95%
confidence limits.
When data points are fitted with lines (as in Scatchard or Lineweaver-Burk plots), the
method used for fitting (graphical, least squares, computer program) should be
specified. If differences in slopes and/or axis intercepts are claimed for plotted lines,
these should be supported by statistical analysis.
Useful references for statistical methods are
McArthur, J. W., and T. Colten (eds.), Statistics in Endocrinology, MIT Press,
Cambridge, 1970, and Finney, D. J., Statistical Method in Biologic Assays, ed. 2,
Griffin, London, 1967.
Advice to contributors
Special methods
Statistical methods
Please define the methods and support them with references, describing in detail any that are not
in common use.
General guidelines on using statistical methods and interpreting and presenting statistical material,
as well as specific recommendations on statistical estimation and significance, have been
published in the BMJ. Please see the linked articles.
Also see :Altman DG, Machin D, Bryant TN, Gardner MJ (eds). Statistics with
Confidence. 2nd edition. London: BMJ Books, 2000.
Randomised controlled trials
Please report these in accordance with the CONSORT (Consolidated Standards of Reporting
Trials) statement.
See - The CONSORT statement: revised recommendations for improving the quality of reports of
parallel-group randomised trials.
See: Better reporting of randomised controled trials: the CONSORT statement
See Statisticians' Checklists
Systematic reviews and meta-analyses of randomised controlled trials
Please report these in accordance with the QUOROM (Quality of Reporting of Meta-analyses)
statement (Moher D, Cook DJ, Eastwood S, Olkin I, Rennie D, Stroup DF, for the QUOROM
Group. Improving the quality of reports of meta-analyses of randomised controlled trials: the
QUOROM statement. Lancet 1999; 354:1896-1900. www.thelancet.com )
Una “estadística”
de los métodos estadísticos

más utilizados en
publicaciones biomédicas.
• Con la finalidad de determinar los métodos y programas estadísticos más
frecuentemente utilizados en algunas publicaciones norteamericanas y europeas,
Pouso (2002) revisó todos los artículos científicos originales publicados durante
el año calendario 1999.
• Publicaciones: American Journal of Medicine, British Medical Journal,, Circulation,

European Heart Journal , New England Journal of Medicine y The Lancet.
• En total se consideraron 784 artículos que utilizaron 1702 pruebas estadísticas.
• La mayoría de estos artículos disponía de un subcapítulo "análisis estadístico" o

"métodos estadísticos".
• De los 712 artículos que utilizaron métodos estadísticos descriptivos o

inferenciales sólo en 233 (32.7%) se dejó constancia de la utilización de software
estadístico específico (SAS, SPSS, Splus, etc…)
• Sobre el total de 784 artículos, el 9.2% de ellos no tenían métodos estadísticos
(se trataba en general de artículos de métodos diagnósticos o de descripción de
técnicas), el 28.7% tenían una prueba estadística, el 25.4% tenían dos, el 18.4%
tenían tres y el 18.4% restante, cuatro o más.
30
25
20
% Artículos 15
10
0
0 1 2 3 >=4
Nº de técnicas estadísticas
• De las 1702 pruebas estadísticas las 10 más frecuentemente utilizadas (que en

conjunto constituyen el 74.6% de las mismas), se muestran en siguiente tabla:
Pruebas más utilizadas Nº %

T de Student 241 14.16
Chi cuadrado 204 11.99
ANOVA 158 9.28
Regresión Logística 140 8.23
Prueba de Fisher 106 6.23
Modelo de Cox 104 6.11
Test de Mann-Whitney 89 5.23
Método de Kaplan-Meier 87 5.11
Test de Wilcoxon 71 4.17
Correlación-regresión lineales 70 4.11
Otras 432 25.38
Total 1702 100
BIOESTADÍSTICA
• CONCEPTOS BÁSICOS.
• TIPOS DE VARIABLES.
• BASES DE DATOS.
POBLACIÓN: Es el conjunto (o universo) de individuos a los cuales va dirigida
nuestra investigación.
INDIVIDUO: Cada uno de los elementos que componen la población.
Personas, animales de experimentación, células, plantas,......
VARIABLE ALEATORIA (X)

Es la característica (numérica o no) que interesa estudiar en una población.
Sus respuestas surgen al AZAR.
Ej. Talla, Grupo sanguíneo, etc,
PARÁMETRO: Medida que interesa conocer en una variable aleatoria.
MEDIA =µ = Promedio de una v.a.

VARIANZA = σ
2
Puesto que la población es inaccesible, en general, realizamos un muestreo.
MUESTRA ALEATORIA: Subconjunto de individuos de la población (al azar).
TAMAÑO MUESTRAL (n): nº de individuos que componen la muestra.
Si X es la v.a. de interés, la muestra aleatoria se representa por :
( X1 , X 2 ,...., X n )
ESTADÍSTICO MUESTRAL: Es una función de la muestra aleatoria, que permite
aproximar el parámetro de interés.
MEDIA =µ → MEDIA MUESTRAL
1 1 n
X = ( X 1 + X 2 + .... + X n ) = ∑ X i
n n i =1
1 n
∑ ( Xi − X )
2
VARIANZA = σ → S2 =
2
VARIANZA MUESTRAL
n − 1 i=1
POBLACIÓN
Conjunto de pacientes cirróticos
VARIABLE ALEATORIA
X=Albúmina
PARÁMETRO
µ = promedio de albúmina
n=500
MUESTRA ALEATORIA
ESTADÍSTICA Subconjunto ALEATORIO de 500 pacientes cirróticos

INFERENCIAL ( X 1, X 2,...., X 500 )
ESTADÍSTICO “MEDIA” MUESTRAL
1
X= ( X 1 + X 2 + .... + X 500 ) = media muestral de albúmina
500
UNA MUESTRA PARTICULAR
( 2.35, 3.21, 4.20, .....,3.60 )
MEDIA DE LA MUESTRA
ESTADÍSTICA
1
x= (2.35 + 3.21 + 4.20 + ..... + 3.60)
500 DESCRIPTIVA
DEFINICIÓN DE “BIOESTADÍSTICA”
La ESTADÍSTICA es el conjunto de métodos necesarios para:
(a) Recoger, clasificar, representar y resumir datos de una MUESTRA
(b) Extraer conclusiones científicamente válidas acerca de la
POBLACIÓN.
Según estos objetivos, las grandes ramas de la Estadística son:
• ESTADÍSTICA DESCRIPTIVA (a)

RAMAS
• INFERENCIA ESTADÍSTICA (b)
La BIOESTADÍSTICA ha de entenderse como una disciplina que trata

del desarrollo y aplicación de la teoría y métodos estadísticos, en aquellos
fenómenos que surgen de las Ciencias Biomédicas.
TIPOS DE VARIABLES
1. CUANTITATIVAS: Son variables que toman valores numéricos.

A) DISCRETAS: Toman valores enteros, y se asocian a procesos de conteo.
Nº de hijos/mujer.
Nº de casos nuevos de SIDA/mes en un área hospitalaria.
B) CONTÍNUAS: Pueden tomar infinitos valores dentro de un rango.
Edad del paciente,

Albúmina (gr/100ml), linfocitos(%), glucosa (mg/dl).(variables bioquím. y
analíticas).
Peso, talla, IMC, etc. (variables antropométricas en Pediatría)
Tiempo de vida del paciente (años), tamaño del tumor (mm.) (Oncología)
Tensión arterial sistólica/diastólica (mm Hg).
Recuento de Linfocitos T CD4 + /µL, Carga Viral (copias/ml). (VIH/SIDA)
2. CUALITATIVAS : No son numéricas. Presentan una serie de k categorías.
A) NOMINALES: Son de carácter y no existe un orden
Sexo: “varón”, “mujer”.

Grupo Sanguíneo: “A”, “B”, “AB”, “0”.
Cirrosis : “si”, “no”.
B) ORDINALES: Los k niveles admiten un orden.
Nivel de estudios: “sin estudios”, “primario”, “medio”, “superior”.

Clase social: “baja”, “media” , “alta”.
Grado de una lesión: “leve”, “moderado”, “grave”.
3. CATEGÓRICAS : Variables cuantitativas que se categorizan en k niveles.
Edad → “joven”, “mediana edad”, “mayor”.

Niveles de glucosa → ”<70” , “normales=(70-115]” , “(115-138]”,
“>138”.
Niveles de Hematocrito → “Normales:( ≥37)”, “<37”.
Linfocitos CD4 → “Inmunodepresión (<200) ” , “200-500” , “>500”.
Carga viral → “Indetectable (<200)” , “>=200”.
Ejemplo
“Identificar los factores de riesgo de infección post-quirúrgica”
EDAD (años)
SEXO 1=varón ; 2=mujer
PATOL (Patología) 1=inflamatoria; 2=neoplasia;3=trauma; 4=otras.
TIP_OPER (tipo operación)
1=limpia; 2=potencialente contaminada; 3=contaminada; 4=sucia
ALB (albúmina)
HB (Hemoglobina)
HCTO (Hematocrito)
LEUCOS (Leucocitos)
LINFOPCT (Linfocitos (%))
HEMAT (Hematíes)
GLUC (Glucosa)
OBES (Obesidad) 1=si ; 2=no.
DESNUTR (Desnutrición) 1=si; 2=no.
DIABETES 1=si; 2=no.
INFEC = Infección Post-quirúrgica 0=no; 1=si

infec.sav
“Factores de riesgo asociados a la infección post-quirúrgica”

(Hospital Clínico-Universitario de Santiago, Enero 1996 a Marzo 1997)
n=2353 operaciones
pediatría.sav
Estudio de Talla, Peso e IMC=Peso/Talla 2 por Sexo (1=varón; 2=mujer) y Edad .
n=3556 niños (3-12 años)

ESTADÍSTICA
DESCRIPTIVA
“Una buena estadística descriptiva
es fundamental
para la inferencia”
1. TABLAS DE FRECUENCIAS
Ø UNIVARIANTES
Ø BIVARIANTES: TABLAS DE CONTINGENCIA
2. MEDIDAS DE CENTRALIZACIÓN / LOCALIZACIÓN
Ø MEDIA
Ø MEDIANA
Ø MODA(S)
3. MEDIDAS DE POSICIÓN
Ø PERCENTILES
4. MEDIDAS DE DISPERSIÓN
Ø RANGO
Ø VARIANZA
Ø DESVIACION TÍPICA
Ø COEFICIENTE DE VARIACIÓN
5. REPRESENTACIONES GRÁFICAS
Ø DIAGRAMA DE SECTORES
Ø DIAGRAMA DE BARRAS
Ø HISTOGRAMA
Ø DIAGRAMA DE CAJAS (BOX-PLOT)
Ø DIAGRAMA DE LÍNEAS “MEDIA ± DT”
Ø CURVAS PERCENTIL
TABLAS DE FRECUENCIAS UNIVARIANTES
Permiten la clasificación de UNA variable por la frecuencia de aparición de sus

valores o niveles.
PATOL
Porcentaje Porcentaje
SEXO Frecuencia Porcentaje válido acumulado
Válidos inflam 1054 44.8 44.8 44.8
Frecuencia Porcentaje válido acumulado neo 518 22.0 22.0 66.8
Válidos varón 1154 49.0 49.0 49.0 traum 65 2.8 2.8 69.6
mujer 1199 51.0 51.0 100.0 otras 716 30.4 30.4 100.0
Total 2353 100.0 100.0 Total 2353 100.0 100.0
DESNUTR
Frecuencia Porcentaje válido acumulado INFEC
Válidos si 97 4.1 4.1 4.1 Porcentaje Porcentaje
no 2249 95.6 95.9 100.0 Frecuencia Porcentaje válido acumulado
Total 2346 99.7 100.0 Válidos si 464 19.7 19.7 19.7
Perdidos Sistema 7 .3 no 1889 80.3 80.3 100.0
Total 2353 100.0 Total 2353 100.0 100.0
TABLAS DE FRECUENCIAS BIVARIANTES: “TABLAS DE CONTINGENCIA”
Ø Permiten la clasificación de DOS variables cualitativas (o categóricas) por la frecuencia de aparición

simultánea de sus valores o niveles.
Ø Describen la posible “asociación” entre dichas variables.
Frecuencias absolutas Porcentaje sobre el total

Tabla de contingencia INFEC * TIP_OPER
Tabla de contingencia INFEC * TIP_OPER TIP_OPER

limpia pot_cont contam sucia Total
Recuento
INFEC si Recuento 51 146 83 184 464
TIP_OPER
% del total 2.2% 6.2% 3.5% 7.8% 19.7%
limpia pot_cont contam sucia Total
no Recuento 824 607 211 247 1889
INFEC si 51 146 83 184 464
% del total 35.0% 25.8% 9.0% 10.5% 80.3%
no 824 607 211 247 1889
Total Recuento 875 753 294 431 2353
Total 875 753 294 431 2353
% del total 37.2% 32.0% 12.5% 18.3% 100.0%
Porcentaje por filas Porcentaje por columnas

Tabla de contingencia INFEC * TIP_OPER Tabla de contingencia INFEC * TIP_OPER
TIP_OPER TIP_OPER
limpia pot_cont contam sucia Total limpia pot_cont contam sucia Total
INFEC si Recuento 51 146 83 184 464 INFEC si Recuento 51 146 83 184 464
% de INFEC 11.0% 31.5% 17.9% 39.7% 100.0% % de TIP_OPER 5.8% 19.4% 28.2% 42.7% 19.7%
no Recuento 824 607 211 247 1889 no Recuento 824 607 211 247 1889
Total Recuento 875 753 294 431 2353 Total Recuento 875 753 294 431 2353
MEDIDAS DE CENTRALIZACIÓN / LOCALIZACIÓN
Si X es la variable cuantitativa de interés y (x1, x2, .... , xn)
la muestra:
• MEDIA: es el valor promedio de los datos muestrales
1 1 n
X = ( x1 + x2 + ...... + xn ) = ∑ xi
n n i =1
• MEDIANA (Me):
Ø Una vez ordenada la muestra, Me es aquel valor tal que el 50% de

los datos son menores o iguales que Me.
Ø Es una medida mas “robusta” que la media.
• MODA(S): Valor(es) con máxima frecuencia de aparición en la

muestra.
MEDIDAS DE DISPERSIÓN
• RANGO
Rango = xmax − xmin
• VARIANZA
1 
S2 = n1 ( x1 − x ) + n2 ( x2 − x ) + ........ + nk ( xk − x )  =
2 2 2
n −1  
1 k
= ∑ i( i ) −
2
n x x
n − 1 i =1
• DESVIACIÓN TÍPICA
S = DT = + S 2
Los datos cuantitativos se suelen presentar como
X ± DT
• COEFICIENTE DE VARIACIÓN (CV)
DT
CV = (CV 100%)
X
MEDIDAS DE POSICIÓN
Generalizan el concepto de “mediana”.
CUARTILES:
Son 3 valores, Q 1, Q2, y Q 3 que dividen a la muestra en 4 partes de igual
frecuencia.
Q1 Q2 Q3
PERCENTILES:
Son 99 valores, P1, P2, ... P 99 que dividen a la muestra en 100 partes de igual
frecuencia.
La partición puede ser más “fina”:
α )100% a aquél valor que deja un (1-α

Llamamos PERCENTIL (1-α α )100% de
datos a su izquierda (y por tanto un α 100% a su derecha).
α )100%
(1-α α 100%
P(1-αα )100%
Queremos describir la EDAD de los pacientes operados..........
Estadísticos
EDAD
N Válidos 2351
Perdidos 2
Media 54.63
Mediana 59.00
Desv. típ. 20.011
Varianza 400.435
Rango 83
Mínimo 14
Máximo 97
Percentiles 10 24.00
25 38.00
50 59.00
75 71.00
90 79.00
Descriptivos por grupos
Queremos comparar la EDAD en varones y mujeres........
Analizar
→Tablas personalizadas
→ Tablas básicas.......
varón mujer
Total
Mínimo 14.00 14.00 14.00
Máximo 97.00 96.00 97.00
Media 53.53 55.69 54.63
Mediana 57.00 59.00 59.00
Moda 68.00 63.00 68.00
Percentil 25 37.00 41.00 38.00
Percentil 75 70.00 72.00 71.00
DT 20.23 19.74 20.01
N válido N=1154 N=1197 N=2351
CVvaron = 20.23 / 53.53=0.3779 (37.79%) CVmujer = 19.74 / 55.69=0.3544 (35.44%)

REPRESENTACIONES GRÁFICAS
Ø Diagrama de Sectores
Ø Diagrama de Barras
Ø Histograma
Ø Diagrama de Cajas (Box-Plot)
Ø Diagrama de Líneas “Media ± DT”
Ø Curvas Percentil
DIAGRAMA DE SECTORES
Representación gráfica de variables cualitativas y categóricas .
Distribución de IPO por sexo
(n=2353 pacientes)
mujer varón
51.0% 49.0%
IPO por tipo de operación

(n=2353 pacientes)
sucia
18.3%
limpia
37.2%
contam
12.5%
pot_cont
32.0%
DIAGRAMA DE BARRAS
Ø Representación gráfica de variables cualitativas, categóricas y discretas.
Ø Permite comparación de grupos.
Tipo de operación
40
%
30
20
10
0
limpia pot_cont contam sucia
Infección post-quirúrgica
(n=2353)
100
80
80
60
40
20
20
%
0
si no
HISTOGRAMA
Representación gráfica de variables CONTÍNUAS por intervalos.
Distribución de la Hemoglobina
1000
800
600
400
nº de pacientes
200
Desv. típ. = 2.13
Media = 13.1
0 N = 2344.00
4.0 6.0 8.0 10.0 12.0 14.0 16.0 18.0 20.0
Distribución de la Glucosa
600
500
400
300
200
nº de pacientes
100
0
60 80 100 120 140 160 180 200 220 240 260 280
Desventajas
Ø Depende de la elección del nº de intervalos, k, de la variable:
k=25 k=4
600
500
400
300
200
100
0
3 4 5 6 6 7 8 8 9 10 11 11 12 13 13 14 15 16 16 17 18 18 19 20 21
Ø No permite una representación conjunta de la variable por grupos.

DIAGRAMA DE CAJAS
Ø Es una representación gráfica de variables contínuas que visualiza su localización, extensión y su
grado y magnitud de la asimetría.
Ø Se basa en los cuartiles Q1, Q1 y Q3 .
Ø Permite comparaciones entre grupos.
-24 -20 -16 -12 -8 -4 0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 60 64
Construcción
a) La caja comienza en Q1, y remata en Q3. La línea vertical más gruesa representa Q2 (la mediana).
b) Calcular los valores “separadores”
Interiores: f1 = Q1 - 1.5*IQR , f2 = Q3 + 1.5*IQR

Exteriores F1= Q1 - 3.0*IQR , F2= Q3 + 3.0*IQR
siendo IQR el rango intercuartílico=Q3-Q1.
c) Calcular los valores “adyacentes” :

a1= valor muestral más próximo a f1 (por encima).
a2= valor muestral más próximo a f2 (por debajo).
d) Los “bigotes” se extienden desde a1 hasta Q1 y desde Q3 hasta a2.
e) Valores “atípicos moderados” :
Ø Datos de la muestra que se encuentran en (F1, f1] ó en [f2,F2).
Ø Se representan por un círculo abierto ‘ ο ’ .
f) Valores “atípicos extremos” :
Ø Datos de la muestra ≤ F1 ó ≥ F2.
Ø Se representan por un asterisco ‘ * ’ .

EDAD (años)
Mínimo Máximo Media DT N Percentil 25 Mediana Percentil 75

INFEC 15 96 61 19 464 49 66 75
NO INFEC 14 97 53 20 1889 37 56 69
TOTAL 14 97 55 20 2353 38 59 71
100
100
90
90
80
80
70
70
60
EDAD (años)
60
EDAD (años)
50
50
40
40
30
30
20
20
10
10 0
N= 464 1887
0
INFEC NO INFEC
GLUCOSA
Mínimo Máximo Media DT N Percentil 25 Mediana Percentil 75

INFEC 56 270 123 38 464 95 113 139
NO INFEC 55 291 110 32 1889 92 102 117
TOTAL 55 291 113 33 2353 92 103 121
INFEC
NO INFEC
50 100 150 200 250 300 50 100 150 200 250 300
glucosa GLUCOSA
± DT”
DIAGRAMA “MEDIA±
Ø Representación gráfica para variables cuantitativas

Ø Representa la media de la variable ± la desviación típica.
Ø Gráfico SPSS: “Barras de error”.
Ø Recomendado para variables con un cierto grado de simetría.
Talla de niños gallegos de 10 años

(Media+-DT)
141.6
141.4
141.2
141.0
140.8
140.6
140.4
140.2
N= 255 243
varón mujer
Informe
TALLA
Talla (cms.) de niños gallegos de 10 años
SEXO 170
varón mujer Total 160
N 255 243 498

150
Mínimo 122.20 122.50 122.20

140
Máximo 160.30 168.00 168.00

130
Media 140.8106 141.0016 140.9038
120
Desv. típ. 6.36141 6.84593 6.59630
110
Mediana 140.8000 141.0000 141.0000 N= 255 243
varón mujer
Talla(cms.) de niños gallegos por edad y sexo

165
150
135
120 SEXO
105 varón
90 mujer
3 4 5 6 7 8 9 10 11 12
EDAD (años)
CURVAS “ PERCENTIL”
Ø Representación gráfica para variables cuantitativas.

Ø Representa percentiles de interés.
Ø Grafico SPSS: “Líneas”.
En nuestro estudio de Pediatría, se quiere representar, por cada sexo,
las curvas Percentil 5, 10, 25, 50, 75, 90 y 95
de Peso, Talla e IMC en función de la edad.
percentilado de peso (Kgs) percentilado de peso (Kgs)

varones gallegos (3-12 años) niñas gallegas (3-12 años)
70 70
60 60
50 50
40 40
30 30
20 20
10 10
3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00
EDAD EDAD
percentilado de talla (cms) percentilado de talla (cms)

180 180
160 160
140 140
120 120
100 100
80 80
3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00
EDAD EDAD
percentilado de IMC (Kgs/m2) percentilado de IMC (Kgs/m2)

26 26
25 25
24 24
23 23
22 22
21 21
20 20
19 19
18 18
17 17
16 16
15 15
14 14
13 13
12 12
11 11
3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 11.00 12.00
EDAD EDAD

Introduccion A La Estadistica

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Introduccion A La Estadistica

Hochgeladen von

Copyright:

Verfügbare Formate

TALLER

A) La variabilidad biológica de los individuos objeto de estudio.

Dos individuos nunca son iguales, lo que implica que la

B) La naturaleza cuantitativa de las Ciencias Biomédicas.

La Estadística permite manejar toda la información obtenida en la

requiere de la Estadística en sus etapas de diseño, recopilación de

D) La naturaleza del trabajo clínico

La estadística y la probabilidad ofrecen rigor y objetividad a los

E) Necesidad del método inductivo.

En general, las Ciencias Biomédicas son experimentales y se basan

“La extensión a la población de las conclusiones obtenidas en una

F) La Estadística en la literatura biomédica:

El volumen de información que recibe el profesional biomédico requiere

• Los errores son habituales y el sistema actual de revisión editorial no es capaz

El Comité Internacional de Editores de Revistas Médicas (Grupo

• La mayoría, suele seguir las recomendaciones de Vancouver.

• El nivel de exigencia estadístico es variable.

• Sólo una minoría cuenta con bioestadísticos en el Consejo

• Software programs used for statistical analyses should be identified since

• Models such as analysis of variance, covariance, multiple regressions, and the

• A sample size calculation and power analysis should be included when

• Numeric equivalents should precede all percentages, as in these examples: "Of

Assistant to the Editor-in-Chief

Means, standard deviations, and standard errors. To report means, standard

Regression analyses. When presenting results of regression analyses, regression

Confidence. 2nd edition. London: BMJ Books, 2000.

Randomised controlled trials

See Statisticians' Checklists

Systematic reviews and meta-analyses of randomised controlled trials

de los métodos estadísticos

• Publicaciones: American Journal of Medicine, British Medical Journal,, Circulation,

• En total se consideraron 784 artículos que utilizaron 1702 pruebas estadísticas.

• La mayoría de estos artículos disponía de un subcapítulo "análisis estadístico" o

• De los 712 artículos que utilizaron métodos estadísticos descriptivos o

• De las 1702 pruebas estadísticas las 10 más frecuentemente utilizadas (que en

Pruebas más utilizadas Nº %

INDIVIDUO: Cada uno de los elementos que componen la población.

Personas, animales de experimentación, células, plantas,......

VARIABLE ALEATORIA (X)

PARÁMETRO: Medida que interesa conocer en una variable aleatoria.

MEDIA =µ = Promedio de una v.a.

Puesto que la población es inaccesible, en general, realizamos un muestreo.

MUESTRA ALEATORIA: Subconjunto de individuos de la población (al azar).

TAMAÑO MUESTRAL (n): nº de individuos que componen la muestra.

Si X es la v.a. de interés, la muestra aleatoria se representa por :

ESTADÍSTICA Subconjunto ALEATORIO de 500 pacientes cirróticos

UNA MUESTRA PARTICULAR

( 2.35, 3.21, 4.20, .....,3.60 )

La ESTADÍSTICA es el conjunto de métodos necesarios para:

(a) Recoger, clasificar, representar y resumir datos de una MUESTRA

(b) Extraer conclusiones científicamente válidas acerca de la

Según estos objetivos, las grandes ramas de la Estadística son:

• ESTADÍSTICA DESCRIPTIVA (a)

• INFERENCIA ESTADÍSTICA (b)

La BIOESTADÍSTICA ha de entenderse como una disciplina que trata

1. CUANTITATIVAS: Son variables que toman valores numéricos.

B) CONTÍNUAS: Pueden tomar infinitos valores dentro de un rango.

Edad del paciente,

2. CUALITATIVAS : No son numéricas. Presentan una serie de k categorías.

A) NOMINALES: Son de carácter y no existe un orden

Sexo: “varón”, “mujer”.

B) ORDINALES: Los k niveles admiten un orden.

Nivel de estudios: “sin estudios”, “primario”, “medio”, “superior”.

Interiores: f1 = Q1 - 1.5IQR , f2 = Q3 + 1.5IQR