Beruflich Dokumente
Kultur Dokumente
Introduccin
Qu es la Estadstica?
Cuando coloquialmente se habla de Estadstica, se suele pensar en una relacin de datos
numricos presentada de forma ordenada y sistemtica. Esta idea es la consecuencia del concepto
popular que existe sobre el trmino y que cada vez est ms extendido debido a la influencia de
nuestro entorno, ya que hoy da es casi imposible que cualquier medio de difusin, peridico,
radio o televisin, no nos aborde diariamente con cualquier tipo de informacin sobre accidentes
de trfico, ndices de crecimiento de poblacin, turismo, tendencias polticas, etc. Slo cuando
nos adentramos en un mundo ms especfico como es el campo de la investigacin de las Ciencias
Sociales, Medicina, Biologa, Psicologa,... empezamos a percibir que la Estadstica no slo es
algo ms, sino que se convierte en la nica herramienta que, hoy en da, permite dar luz y
obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y
relaciones, por su variabilidad intrnseca, no puedan ser abordadas desde la perspectiva de las
leyes deterministas. Podramos, desde un punto de vista ms amplio, definir la Estadstica como
la ciencia que estudia cmo debe emplearse la informacin y cmo dar una gua de accin en
situaciones prcticas que entraan incertidumbre.
La Estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir,
hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea
una causa intrnseca de los mismos; as como de realizar inferencias a partir de ellos, con la
finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.
Podramos por tanto clasificar la Estadstica en Descriptiva, cuando los resultados del anlisis no pretenden ir ms all del conjunto de datos, e Inferencial cuando el objetivo del estudio
es derivar las conclusiones obtenidas a un conjunto de datos ms amplio.
Estadstica Descriptiva: Describe, analiza y representa un grupo de datos utilizando
mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos.
1
Definiciones Bsicas
Se establecen a continuacin algunas definiciones de conceptos bsicos como son: elemento,
poblacin, muestra, caracteres, variables, etc., a las cuales se hace referencia continuamente a
lo largo del curso.
Ejemplo
Consideramos la poblacin formada por todos los estudiantes de la Universidad Carlos III
(finita). La altura media de todos los estudiantes es el parmetro . El conjunto formado por
los alumnos del Grado en Ecologa es una muestra de dicha poblacin y la altura media de esta
muestra, x, es un estadstico.
Variables cuantitativas ordinales son las que, aunque sus modalidades son de tipo
nominal, es posible establecer un orden entre ellas. Por ejemplo, si estudiamos la llegada a
la meta de un corredor en una competicin de 20 participantes, su clasificacin C es tal que
C {1o , 2o , 3o , . . . , 20o }.
Otro ejemplo de variable cuantitativa ordinal es el nivel de dolor, D, que sufre un paciente
Variables cuantitativas son las que tienen por modalidades cantidades numricas con las
que podemos hacer operaciones aritmticas. Dentro de este tipo de variables podemos distinguir
dos grupos:
Discretas, cuando no admiten siempre una modalidad intermedia entre dos cualesquiera
de sus modalidades. Un ejemplo es el nmero de caras X, obtenido en el lanzamiento repetido
de una moneda. Es obvio que cada valor de la variable es un nmero natural X N.
Continuas, cuando admiten una modalidad intermedia entre dos cualesquiera de sus mo-
dalidades, por ejemplo, el peso X de un nio al nacer. En este caso, los valores de las variables
son nmeros reales, es decir, X R.
Ocurre a veces que una variable cuantitativa continua por naturaleza, aparece como discreta.
Este es el caso en que hay limitaciones en lo que concierne a la precisin del aparato de medida
de esa variable, por ejemplo, si medimos la altura en metros de personas con una regla que
ofrece dos decimales de precisin, podemos obtener C {. . . , 1.50, 1.51, 1.52, 1.53, . . . }. En
realidad lo que ocurre es que con cada una de esas mediciones expresamos que el verdadero
valor de la misma se encuentra en un intervalo de radio 0,005.
Por tanto cada una de las observaciones de X representa ms bien un intervalo que un valor
concreto.
Tal como hemos citado anteriormente, las modalidades son las diferentes situaciones posibles
que puede presentar la variable. A veces, stas son muy numerosas (por ejemplo, cuando una
variable es continua) y conviene reducir su nmero, agrupndolas en una cantidad inferior de
clases. Estas clases deben ser construidas de modo que sean exhaustivas e incompatibles, es
decir, cada modalidad debe pertenecer a una y slo una de las clases.
Tablas Estadsticas
Consideremos una poblacin estadstica de n individuos, descrita segn un carcter o variable C cuyas modalidades han sido agrupadas en un nmero k de clases, que denotamos
mediante c1 , c2 , . . . , ck . Para cada una de las clases ci , i = 1, . . . , k, se pueden considerar las
siguientes magnitudes:
Frecuencia absoluta de la clase ci es el nmero, ni , de observaciones que presentan una
modalidad perteneciente a esa clase.
Frecuencia relativa de la clase ci es el cociente, fi , entre las frecuencias absolutas de dicha
clase y el nmero total de observaciones, es decir,
fi =
ni
n
Obsrvese que fi es el tanto por uno de observaciones que estn en clase ci . Multiplicado por
100 representa el porcentaje en % de la poblacin que comprende esa clase.
Frecuencia absoluta acumulada Ni , se calcula sobre variables cuantitativas o cuantitativas ordinales, y es el nmero de elementos de la poblacin cuya modalidad es inferior o
equivalente a la modalidad ci :
Ni = n1 + n2 + . . . + ni =
i
X
j=1
nj
Frecuencia relativa acumulada, Fi , se calcula sobre variables cuantitativas o cuantitativas ordinales, siendo el tanto por uno de los elementos de la poblacin que estn en alguna de
las clases y que presentan una modalidad inferior o igual a la ci , es decir,
X
n1 + n2 + . . . + ni
Ni
=
= f1 + f2 + . . . + fi =
fj ,
Fi =
n
n
j=1
i
nj = n1 + n2 + . . . + nk = n,
j=1
o lo que es lo mismo,
k
X
j=1
fj =
k
X
nj
j=1
Pk
j=1
nj
n
= 1.
n
nj
cj
nj
fj =
n
nk
ck
nk
fk =
n
n
1
Modalidades Frec. Abs. Acum. Frec. Rel. Acum
C
Ni
Fi
N1
c1
N1 = n1
F1 =
= f1
n
Nj
= fj
cj
Nj = n1 + . . . + nj
Fj =
n
ck
Nk = n
Fk = 1
Ejemplo
Calcular los datos que faltan en la siguiente tabla:
li1 li
0 10
10 20
20 30
30 100
100 200
ni fi Ni
60 f1 60
n2 0,4 N2
30 f3 170
n4 0,1 N4
n5 f5 200
n
Solucin:
Sabemos que la ltima frecuencia acumulada es igual al total de observaciones, luego n =
200.
Como N3 = 170 y n3 = 30, entonces N2 = N3 n3 = 170 30 = 140.
Adems al ser n1 = 60, tenemos que n2 = N2 n1 = 140 60 = 80.
Por otro lado podemos calcular n4 teniendo en cuenta que conocemos la frecuencia relativa
correspondiente:
f4 =
n4
= n4 = f4 n = 0,1 200 = 20.
n
As:
N4 = n4 + N3 = 20 + 170 = 190.
Este ltimo clculo nos permite obtener n5 = N5 N4 = 200 190 = 10.
Al haber calculado todas las frecuencias absolutas, es inmediato obtener las relativas:
n1
60
=
= 0,3
n
200
n3
30
=
=
= 0,15
n
200
10
n5
=
= 0,05
=
n
200
f1 =
f3
f5
ni
fi
Ni
60 0,3 60
80 0,4 140
30 0,15 170
20 0,1 190
10 0,05 200
200
6
En estos casos llamaremos amplitud del intervalo a las cantidades ai = li li1 y marca
de clase ci , a un punto representativo del intervalo. Si ste es acotado, tomamos como marca
de clase al punto ms representativo, es decir, el punto medio del intervalo, ci =
li +li1
.
2
La
marca de clase no es ms que una forma abreviada de representar un intervalo mediante uno
de sus puntos. Por ello hemos tomado como representante al punto medio del mismo. Esto est
plenamente justificado si recordamos que cuando se mide una variable continua como el peso,
la cantidad con cierto nmero de decimales que expresa esta medicin, no es el valor exacto de
la variable, sino una medida que contiene cierto margen de error, y por tanto representa a todo
un intervalo del cual ella es el centro.
En el caso de variables continuas, la forma de la tabla estadstica es la siguiente:
l0 l1
...
lj1 lj
...
lk1 lk
F. Rel. Ac.
Fi
F1 = f1
...
Fj = Fj1 + fj
...
Fk = 1
ste es un convenio que tomaremos en las pginas que siguen. El considerar los intervalos
por el lado izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que
expondremos. El nmero de intervalos, k, a utilizar no est determinado de forma fija y por
tanto tomaremos un k que nos permita trabajar cmodamente y ver bien la estructura de los
datos. Como referencia nosotros tomaremos una de los siguientes valores aproximados:
N o intervalos = k
si n no es muy grande
1 + 3,22 log(n)
en otro caso
hacerse tomando:
l0 = xmin
l1 = l0 + a
..........
lk = xmax = l0 + ka
Observacin:
Podra ocurrir que la cantidad a fuese un nmero poco cmodo a la hora de escribir los
intervalos (ej. a = 10,325467). En este caso, es recomendable variar simtricamente los extremos,
l0 < xmn < xmax < lk , de forma que se tenga que a es un nmero ms simple (ej. a = 10).
Ejemplo
Sobre un grupo de n = 21 personas se realizan las siguientes observaciones de sus pesos,
medidos en kilogramos:
X
58 42
56 58
70 72
x1 , x2 , . . . , x21
51 54 40 39 49
57 59 63 58 66
71 69 70 68 64
no sea muy relevante seguimos el criterio de utilizar k = 21 intervalos (no son demasiadas
las observaciones). En este punto podemos tomar bien k = 4 o bien k = 5. Arbitrariamente se
elige una de estas dos posibilidades. Por ejemplo, vamos a tomar k = 5.
Lo siguiente es determinar la longitud de cada intervalo, ai i = 1, . . . , 5. Lo ms cmodo
es tomar la misma longitud en todos los intervalos, ai = a (aunque esto no tiene por qu ser
necesariamente as), donde
l0 = xmn = 39
l5 = xmax = 72
A = l5 l0 = 72 39 = 33
A 33
=
= 6,6
a =
5
5
Entonces, tomaremos k = 5 intervalos de longitud a = 6,6 comenzando por l0 = xmn = 39
y terminando en l5 = 72:
i=1
i=2
i=3
i=4
i=5
li1 li
39 45,6
45,6 52,2
52,2 58,8
58,8 65,4
65,4 72
ci
42,3
48,9
55,5
62,1
68,7
ni
3
2
6
3
7
21
fi
Ni
0,1428 3
0,0952 5
0,2857 11
0,1428 14
0,3333 21
1
Fi
0,1428
0,2381
0,5238
0,6667
1
Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con
cantidades ms simples a la hora de construir los intervalos, es la siguiente. Como la regla para
i=1
i=2
i=3
i=4
i=5
10