Sie sind auf Seite 1von 6

REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA. DISTRIBUCIÓN NORMAL.

Éste es un breve repaso de conceptos básicos de estadística que se han visto en cursos
anteriores y que son imprescindibles antes de acometer la Inferencia Estadística.
Simbología:
xi → Variable estadística (Valor que puede tomar un dato, altura, peso, etc. )
fi → Frecuencia absoluta (Número de veces que se repite un dato )
N → Número total de datos. N  f i

xi f i
Media → x    
N

Distribución de los Datos. Los datos de una variable estadística se distribuyen alrededor de
la media de forma que en una distribución normal
encontraremos aproximadamente el mismo
número de datos más grandes que la media que los
que son más pequeños, con mayor cantidad de
datos cerca de la media. En una gráfica con la
variable xi en el eje OX y la fi en el eje OY se
obtendría algo parecido a esto.

Varianza (v ó también σ2). Sirve para medir lo agrupados o dispersos que se


encuentran los datos respecto a la media. Se utiliza poco aunque os la podéis encontrar en el
enunciado de algún problema y conviene por tanto saber lo que es. Se calcula mediante las
fórmulas:
f i xi  x 
2 2
xi f i
v   
2
o mejor aún, porque es más sencilla v   
2
 x2
N N

Desviación típica ó estándar (σ) Sirve también para medir la dispersión de los
datos y es la que más se utiliza; no es mas que la raíz cuadrada de la varianza. Normalmente
este dato os lo darán, pero se calcula obviamente con las fórmulas:
f i  xi  x 
2 2
x f
  N
ó también y de forma más habitual    iN i  x 2

Cuanto más pequeña es la desviación típica σ más


agrupados estarán los datos alrededor de la media.
En cualquier caso en una distribución Normal
aproximadamente tendríamos:
En el intervalo x   , x    → 68,3% de datos
En el intervalo x  2 , x  2  → 95,5% de datos
En el intervalo x  3 , x  3  → 99,7% de datos

Coeficiente de Variación de Pearson. Para poder comparar la dispersión de dos


Distribuciones Estadísticas diferentes no basta con conocer la desviación típica de cada una
sino que depende también de la media de cada distribución.

Se define entonces el coeficiente de variación de Pearson de la siguiente forma: Cv 
x
Tablas estadísticas. Aunque vosotros no lo tendréis que hacer porque os lo darán, para
calcular todos los parámetros anteriores se suelen utilizar unas tablas parecidas a la que sigue:
“Datos relativos al dinero que llevan en el bolsillo 15 alumnos de un curso de bachillerato”.
xi fi xi fi xi2 fi 62
x  4.133 €
2 2 4 8 15
3 8 24 72 316
6 3 18 108   (4.133) 2  21.0667  17.08444  3.9822  1.995 €
15
8 2 16 128 1.995
SUMAS 15 62 316 Cv   0.4827
4.133
Si la distribución es Normal, aproximadamente un 68.3% de los alumnos llevan entre 2.14€ y
6.13 €.

Tipificación de la variable. Supongamos que un alumno ha sacado un 6 en Matemáticas y


un 7 en Historia. ¿En cuál de las dos materias tiene mejor nota en comparación con el resto de
compañeros de su grupo?.
La respuesta depende de la media del grupo en cada una de las materias y de la
desviación típica que tenga cada una. Para tener una medida objetiva que podamos comparar se
utiliza la variable tipificada o normalizada de cada una de ellas con la fórmula:
xx
z obteniendo el valor en cada caso sabremos en cuál tiene mejor puntuación

comparativamente (obsérvese que si el valor “x” está por encima de la media " x" la variable
tipificada “z” sale positivo y si está por debajo negativo)

DISTRIBUCIÓN NORMAL. Una distribución de media x y desviación típica σ diremos


que es Normal y se representará N x ,   si es simétrica respecto a la media x y cumple los
parámetros anteriormente descritos (cuando el número de datos es lo suficientemente elevado, la
mayoría de las distribuciones se parecen mucho a la normal). La gráfica de una distribución de
este tipo tiene una forma muy característica y se llama Curva Normal o Campana de
Gauss. .

DISTRIBUCIÓN NORMAL TIPIFICADA. Si tipificamos la variable x, y utilizamos la


nueva variable z la distribución también es Normal de media   0 y desviación típica σ=1 ,
es decir será una distribución N(0,1) cuya gráfica tiene la misma forma y es simétrica respecto
al Eje OY

Esta gráfica está tabulada y el área que hay bajo la


curva para distintos intervalos de la variable “z”
viene dada por una tabla que se os dará y que
deberéis utilizar para resolver los ejercicios y,
por supuesto, también en los exámenes.
USO DE LA TABLA NORMAL.
Para utilizar la tabla Normal hay que tener en cuenta:
a) En la fila y columna correspondiente se obtiene el valor de la probabilidad de que z
sea menor o igual que un cierto valor k ( desde   hasta k ) que es el número que
debemos buscar en la tabla P( z  k ) . En la tabla este número “k” sólo se puede
buscar si es positivo. Por ejemplo:
P( z  1,35)  0,9115 P( z  2,9)  0,9981
Esa probabilidad es igual al área comprendida bajo la curva en el intervalo deseado

b) Si la z recorre todo el eje real desde   hasta   se obtiene toda el área bajo la
curva y ese área debe ser 1 ya que en ese caso la probabilidad de que z esté entre
  y   es el suceso seguro P( z  )  1

c) La gráfica es simétrica respecto a OY, luego a izquierda y derecha del eje OY hay la
misma área por tanto: P( z  0)  0,5 y P( z  0)  0,5

d) Hay que tener en cuenta que la tabla siempre nos da la probabilidad de que z  k
pero basta observar la gráfica para comprender que: P( z  k )  1  P( z  k )

Por ejemplo: P( z  0,63)  1  P( z  0,63)  1  0,7357  0,2643

e) Si el número -k es negativo, por simetría podremos calcular el área de una zona


equivalente con k positivo.

P( z  k )  P( z  k )
Por ejemplo: P( z  1,24)  P( z  1,24)  1  P( z  1,24)  1  0,8925  0,1075

f) Si queremos calcular la probabilidad de que z esté comprendida entre dos valores


P(a  z  b) , debemos calcular el área entre a y b. Esto es una simple resta del
área hasta “b” menos el área hasta “a”.

P(a  z  b)  P( z  b)  P( z  a)
Por ejemplo: P(0,75  z  1,5)  P( z  1,5)  P( z  0,75)  0,9332  0,7734  0,1598
Otro ejemplo: P(1,25  z  2,32)  P( z  2,32)  P( z  1,25)  P( z  2,32)  P( z  1,25) 
P( z  2,32)  1  P( z  1,25)  0,9898  1  0,8924  0,8823
EJERCICIOS CON UNA DISTRIBUCIÓN NORMAL
1.- Pedro mide 175 cm. y reside en una ciudad donde la estatura media es de 160 cm. con
una desviación típica de 20 cm. Arturo mide 180 cm. y vive en una ciudad donde la
estatura es de 170 cm. y la desviación típica es de 15 cm. ¿Cuál de las dos personas es más
alta respecto a sus conciudadanos?
175  160 180  170
z PEDRO   0,75 z ARTURO   0,67 Pedro es más alto.
20 15

2.- Un alumno ha sacado un 6 en Matemáticas y un 7 en Lengua. ¿En cuál de las dos


asignaturas ha sacado mejor nota respecto a sus compañeros de curso si en Mates la media
ha sido de un 6,5 con una varianza de 4 y en Lengua la media ha sido de 7,5 con una
desviación típica de 2,1?
Sol: Un poquito mejor en Lengua, aunque por debajo de la media

3.- Las precipitaciones anuales en una región son, en media, de 2000 l/m2 con una
desviación típica de 300 l/m2 . Calcular, suponiendo una distribución normal, la
probabilidad de que este año la lluvia no supere los 2800 l/m2 .
 2800  2000 
P( x  2800)  P z    P( z  2,67)  0,9962  99,6%
 300 

4.- El número de hijos por mujer en España sigue una distribución normal con una media
de 1,3 y desviación típica de 0,8 hijos. ¿Qué porcentaje de mujeres españolas tiene como
máximo dos hijos?
Sol: El 80,92% tiene dos hijos o menos

5.- Una empresa instala 20000 bombillas. La duración de una bombilla sigue una
distribución normal con media de 305 días y desviación típica de 40 días.
a) ¿cuál es la probabilidad de que una bombilla determinada dure menos de 365
días?
P( x  365)  P( z  1,5)  0,9332  93,32%
b) ¿Cuántas bombillas se espera que se fundan antes de un año?
N º bombillas fundidas  93,32% de 20000 0,9332  20000  164

6.- La duración media de un lavavajillas es de 15 años y su desviación típica es de 2 años.


Sabiendo que la vida útil de un lavavajillas se distribuye normalmente.
a) Hallar la probabilidad de que al adquirir un lavavajillas dure más de 15 años.
 15  15 
P( x  15)  P z    P( z  0)  0,5
 2 
b) Hallar la probabilidad de que dure más de 19 años.
 19  15 
P( x  19)  P z    P( z  2)  1  P( z  2)  1  0,9772  0,0228
 2 

7.- En una muestra de 1000 personas de una determinada población, resultó que la talla
media era de 170 cm. con una desviación típica de 10 cm. Sabiendo que la talla se
distribuye normalmente, calcula el número de personas que miden:
a) Menos de 180 cm. P( x  180)  P( z  1)  0,8413  84,13%
N º personas  84,13% de 1000 0,8413  1000  841
b) Más de 2 m. P( x  200)  P( z  3)  1  P( z  3)  1  0,99865  0,00135  0,135%
N º personas  0,00135  1000  1
8.- En un examen de Filosofía realizado por 65 alumnos de 2º de bachillerato se han
obtenido unos resultados que siguen una distribución Normal N(6,2). ¿Cuántos alumnos
han aprobado el examen? Sol: Aprobaron 45 alumnos

9.- Los resultados de una prueba de selección a 200 personas indicaron que la distribución
de puntuación era normal, con media de 80 puntos y desviación típica de 6 puntos.
a) Cuántos examinados han obtenido una nota entre 70 y 90 puntos.
P(70  x  90)  P(1,67  z  1,67)  P( z  1,67)  P( z  1,67)  P( z  1,67)  1  P( z  1,67)
= 0,9525 - [1 - 0,9525] = 0,905
N º personas  0,905  200  181
b) Si se eligen al azar dos personas, calcular la probabilidad de que ambas tengan
mas de 86 puntos.
Para una sola persona: P( x  86)  P( z  1)  1  P( z  1)  1  0,8413  0,1587
Para dos personas: P( P1  86  P2  86)  0,1587  0,1587  0,0252

10.- Una fábrica debe producir recipientes de 10 l. de capacidad. En la cadena de


producción se observa que los recipientes no salen todos iguales pero tienen una
capacidad media de 10 l. con una desviación típica de 0,1 l. Un recipiente será defectuoso
y será rechazado si su capacidad no está comprendida entre 9,90 l. y 10,17 l. ¿Qué
probabilidad tiene un recipiente extraído al azar de ser defectuoso?
Calculamos primero la probabilidad de que el recipiente sea correcto:
P(Correcto)  P(9,90  x  10,17)  P(1  z  1,7)  P( z  1,7)  P( z  1)  P( z  1,7)  1  P( z  1) 
= 0,9554 – [1-0,8413 ] = 0,7967
Luego la probabilidad de que sea defectuoso será : P(Def)= 1 - 0,7967 = 0,2033

11.- Cuando el servicio militar era obligatorio se tallaba (medían la talla) a todos los
mozos, obteniéndose en un determinado año una distribución Normal de media 168 cm. y
una desviación típica de 10 cm.
a) Calcular la probabilidad de que un mozo al azar midiera entre 1,68 m y 1,90 m.
Sol: 0,4861
b) Se libraban de ir a la mili por “cortos de talla” todos aquellos cuya altura fuera
inferior a metro y medio. Si en el llamamiento había 50.000 mozos. ¿Cuántos se libraron
por esa causa? Sol: Se libraron 1.795 mozos

12.- La distribución de puntos obtenidos por los participantes en unas oposiciones es una
normal de media 110 puntos y desviación típica 15 puntos.
a) ¿Cuál es la probabilidad de que un opositor obtenga de 125 puntos en adelante?
P( x  125)  P( z  1)  1  P( z  1)  1  0,8413  0,1587
b) Para obtener plaza en la oposición hay que conseguir 100 o más puntos. ¿qué
porcentaje de opositores aprueba?
P( x  100)  P( z  0,67)  P( z  0,67)  0,7486  74,86%
c) Si suponemos que sólo hay plazas para el 25% que ha obtenido mejor
puntuación. ¿Cuántos puntos como mínimo habrá sacado un opositor que haya
conseguido plaza?

Debemos calcular la zc que deja al 75% por debajo y al 25% por encima.
Es decir, debe darse que: P( z  z c )  0,75
Si buscamos en la tabla, la probabilidad más próxima a 0,75 es 0,7486, que
corresponde a una zc=0,67. Con este valor de z calculamos el valor de x que le corresponde.
xx x  110
z   0,67  x  120,05  120
 15
Habrá sacado de 120 puntos en adelante
13.- La renta anual de las familias españolas sique una curva normal es media de 30.000 €
con una desviación típica de 16.000 €.
a) ¿Qué probabilidad tenemos de que escogida una familia al azar resulte tener
una renta superior a 50.000 €?
Sol: 0,1056
b) ¿Qué porcentaje de familias viven con menos de 9.000 € anuales?
Sol: 9,51%
c) Si en España se estima que viven unos 16 millones de familias, ¿Cuántas pasan
el año con menos de 9.000 € anuales?
Sol: 1.521.600 familias
d) ¿Cuántas familias ganan entre 25.000 € y 42.000 € al año?
Sol: 6.321.600 familias
e) ¿Cuánto dinero debes ganar al año si pretendes estar entre el 1% más rico del
país? Sol: 67.280 €

14.- Una determinada facultad oferta 40 plazas para acceso de nuevos alumnos en 1º. Si
sabemos que se han presentado 200 solicitudes con unas notas de Selectividad que siguen
una distribución Normal de media 8 y desviación típica 1,3, ¿conseguirá plaza un alumno
cuya nota de selectividad ha sido un 9?
Sol: No, pero se quedará cerquita. Igual se queda en lista de espera

15.- En una distribución N(20,5) encontrar un intervalo simétrico respecto a la media (con
la media en el centro) de forma que la probabilidad de que un determinado valor de la
variable “x” se encuentre dentro de dicho intervalo sea del 88%

Si nos fijamos en la simetría de la función, estamos buscando un intervalo en la curva


Normal Tipificada N(0,1) de la forma (-zc , +zc ) en el que se encuentre el 88% de los datos.
Debemos calcular, por tanto, la zc que deja al 94% (88%+6%) por debajo.
Es decir, debe darse que: P( z  z c )  0,94
Si buscamos en la tabla, la probabilidad más próxima a 0,94 es: 0,9394 ó 0,9406, que
corresponde a una zc=1,555 (hemos hecho la media entre 1,55 y 1,56)
El intervalo tipificado que buscamos es (-zc , +zc ) , es decir z   1,555 ,  1,555
Con estos valores de z calculamos el valor de x que le corresponde a cada uno.
 x  20 
 1,555  12,225
xx 
 5 x   12,225 ,  27,775
z    
 x  20
  1,555  27,775 

 5 

16.- Se sabe que el gasto semanal de los jóvenes de 18 años sique una curva normal de
media 45€ y una desviación típica de 15€.
a) Calcular el porcentaje de jóvenes que se gasta entre 40 y 60 € a la semana.
Sol: 47,06%
b) Encontrar cuánto dinero se gasta a la semana el 20 % que menos consume.
xx x  45
z c  0,84  z   0,84  x  32,40 €
 15
Sol: El 20% que menos consume se gasta menos de 32,40 €
c) Encontrar un intervalo simétrico respecto a la media (con la media en el centro)
en el que se encuentre el consumo del 95% de los jóvenes.
Sol: El 95% de los jóvenes gasta entre 15,60 € y 74,40 €

Das könnte Ihnen auch gefallen