Sie sind auf Seite 1von 12

TEMA 9: ESTADSTICA

CONCEPTOS BSICOS
Poblacin. Es el conjunto de todos los elementos cuyo conocimiento nos interesa y que seran objeto de nuestro estudio.
Muestra es un subconjunto extrado de la poblacin, cuyo estudio sirve para inferir caractersticas de toda la poblacin.
Individuo es cada uno de los elementos que forman la poblacin o la muestra.
Caracteres son los aspectos que deseamos estudiar en los individuos de una poblacin. Los valores que damos a los
caracteres se llaman variables y estas pueden ser de dos tipos:
- Variable cuantitativa si toman valores numricos. Estas a su vez se dividen en dos tipos:
Discretas si solo toman valores aislados. Por ejemplo
Continuas si pueden tomar cualquier valor de un intervalo. Por ejemplo
- Variable cualitativa si toman valores no numricos. Por ejemplo ..
LAS DOS RAMAS DE LA ESTADSTICA
La estadstica descriptiva trata de describir y analizar algunos caracteres de los individuos de un grupo dado
(poblacin) sin extraer conclusiones para un grupo mayor.
Por ejemplo si hacemos un estudio sobre los resultados acadmicos de los alumnos de 4 eso de nuestro colegio para
compararlos con otros estudios de aos anteriores sera estadstica descriptiva, pues se realiza sobre la totalidad de la
poblacin.
La estadstica inferencial trabaja con muestras y pretende, a partir de ellas, inferir caractersticas de toda la poblacin.
Es decir, se pretende tomar como generales propiedades que solo se han verificado para casos particulares. En este proceso
hay que operar con mucha cautela: Cmo se elige la muestra? Qu grado de confianza se puede tener en el resultado
obtenido?
Por ejemplo se realiza una encuesta 400 alumnos de una universidad sobre sus preferencias en la lectura, con el fin de
extraer consecuencias vlidas para todos los universitarios. Esto es estadstica inferencial, pues , a partir de una muestra,
se desea obtener informacin de toda la poblacin.
TABLAS DE FRECUENCIA
Una vez recogidos los datos estos se agrupan en tablas de frecuencia.
Cuando los valores que toma la variable son pocos se colocan los valores en una columna (xi) y a su lado las veces que se
repite cada dato (fi)

Cuando el nmero de valores que toma la variable es grande, conviene elaborar una tabla de frecuencias agrupndolos en
intervalos. Para ello vamos a ver un ejemplo.
En una maternidad se han tomado los pesos (en kilogramos) de 50 recin nacidos:
2,8 3,2 3,8 2,5 2,7 3,7 1,9 2,6 3,5 2,3
3,0 2,6 1,8 3,3 2,9 2,1 3,4 2,8 3,1 3,9
2,9 3,5 3,0 3,1 2,2 3,4 2,5 1,9 3,0 2,9
2,4 3,4 2,0 2,6 3,1 2,3 3,5 2,9 3,0 2,7
2,9 2,8 2,7 3,1 3,0 3,1 2,8 2,6 2,9 3,3
Localizamos los valores extremos, que son . y . , y calculamos el recorrido que es su diferencia
r=
Decidimos el nmero de intervalos que vamos a tomar (entre 6 y 15), y segn el nmero calculamos la longitud de cada
intervalo (ha de ser igual para todos)

Nosotros tomaremos intervalos. Empezaremos por un nmero algo menor que el extremo menor y terminaremos
en un nmero algo mayor que el extremo mayor. Y ahora viene lo peor, hemos de contar cuntos datos hay en cada
intervalo.
El punto medio de cada intervalo se llama marca de clase, y es el valor que utilizaremos para futuros clculos.

PARMETROS ESTADSTICOS
A partir de una tabla de frecuencia veremos cmo se obtienen los parmetros

Media aritmtica: x

x f
f
i

. Para calcular ste parmetro aadimos una nueva columna

Desviacin tpica:

x f
f
2
i

x . Para calcular ste parmetro aadimos una nueva columna

Coeficiente de variacin. Sirve para comparar las dispersiones de poblaciones heterogneas, pues indica la variacin
relativa. C.V .

En nuestro ejemplo el C.V. =

Ejercicio.
1. Calcula los anteriores parmetros en la siguiente distribucin

MEDIDAS DE POSICIN
Mediana. Es el valor que queda en medio si colocamos los valores en orden creciente. Se representa Me y por encima de
ella est el 50% de la poblacin y por debajo, el otro 50%. Si el nmero de valores es par se toma como mediana la media
de los dos valores centrales.
Por ejemplo:
6 , 7 , 7, 7 , 8 , 9 , 10 , 12 , 15 la mediana ser Me =
6 , 7 , 7, 7 , 8 , 9 , 10 , 12 , 15 , 16 La mediana ser Me=
Cuartiles. Si en lugar de dividir los valores en dos mitades, lo hacemos en cuatro partes iguales, los nuevos puntos de
separacin se llaman cuartiles.
Q1 es el cuartil inferior y tiene por debajo el 25% de la poblacin y por encima, el 75%
Q2 es la mediana
Q3 es el cuartil superior t tiene por debajo el 75% de la poblacin y por encima, el 25%
Por ejemplo en la distribucin 1 , 2 , 2 , 3 , 4 , 5, 5 , 5 , 6 , 8 , 9 , 10 los cuartiles sern:
Q1 =

Q2 = Me =

Q3 =

Percentiles. Si partimos la poblacin en 100 partes y sealamos el lugar que deja debajo k de ellas, el valor
correspondiente a ese lugar se designa pk y se denomina percentil k.
La mediana es Me = p50, y los cuartiles, Q1 = , Q3 = ..

Ejercicio.
2. Calcula Me, Q1, Q3, p10 y p80 en la distribucin:
1 , 1 , 2 , 3 , 4 , 4, 5 , 5 , 5 , 5 , 6 , 7 , 7 , 7 , 8 , 9 , 10

Frecuencias acumuladas. Cuando las distribuciones estn dadas por tablas de frecuencias acudimos al concepto de
frecuencia acumulada para facilitar los clculos.
Veamos un ejemplo.

El percentil pk es el valor para el cual la frecuencia


acumulada correspondiente supera el k%.
En el caso de que una de ellas coincida con k%, se
toma como pk el valor intermedio entre ese valor de xi
y el siguiente

Q1 =
P73 =

Q2 = Me =

Q3 =

P85 =

Ejercicio.
3. En la fabricacin de cierto tipo de bombillas se han detectado algunas defectuosas. Se han estudiado 200 cajas de 100
bombillas cada una, obtenindose la siguiente tabla:

Calcula la mediana, los cuartiles y los percentiles p10, p90 y p95.

DIAGRAMAS DE CAJA
El diagrama de caja (tambin llamado de caja y bigotes) son una forma de representar las distribuciones estadsticas.

La caja abarca el intervalo Q1 , Q3 y en ella se seala el valor de la mediana, Me.


Los bigotes se trazan hasta abarcar la totalidad de los individuos, con la condicin de que cada largo no supere 1,5 veces
la longitud de la caja.
Si uno o ms valores queda por debajo o por encima de esa longitud, el correspondiente bigote se dibujara con esa
limitacin y se sealaran los individuos que quedaran fuera mediante un asterisco (seran valores atpicos)
Ejercicios.
4. Interpreta el siguiente diagrama de caja. En l se representan las alturas de un grupo de personas.

Todos miden entre . cm y .. cm, excepto uno que mide cm.


Un 25% de las personas miden menos de ..
Un 25% mide entre . cm y cm
Un 25% mide entre . cm y . cm
Un 25% mide ms de .. cm.
5. Haz el diagrama de caja correspondiente a esta distribucin

ESTADSTICA INFERENCIAL
Esta rama de la estadstica trabaja con muestras, y del estudio de sta, se infieren conclusiones para toda la poblacin.
Las causas para elegir una muestra pueden ser los siguientes:
- La poblacin es excesivamente numerosa.
- La poblacin es difcil o imposible de controlar.
- El proceso de medicin es destructivo o demasiado caro.
- Se desea conocer rpidamente los resultados y se tardara demasiado tiempo en realizar las mediciones.
El tamao de la muestra no tiene que ser pequeo y sta se ha de elegir al azar, de este modo todos los individuos de la
poblacin tienen la misma probabilidad de ser elegidos.
Ejercicio.
6. Se desea conocer el nmero de horas que dedican al estudio los 1000 alumnos de un colegio, para ello se extrae una
muestra de 100 de ellos. Reflexiona sobre la validez de cada uno de los mtodos seguidos para escoger la muestra.
a) El director los elige procurando que haya alumnos de todo tipo.
b) Se eligen los 100 primeros que lleguen al colegio un cierto da
c) Se numeran del 1 al 1000 y se eligen al azar 100 de ellos.
EJERCICIOS
1. El nmero de faltas de ortografa que cometieron un grupo de estudiantes en un dictado fue:
03120
21304
01143
53241
50210
00021
21003
05321
a) Di cul es la variable y de qu tipo es.
b) Haz una tabla de frecuencias y representa los datos en un diagrama adecuado.
2. Las urgencias atendidas durante un mes en un centro de salud fueron:
15321
64223
43510
15336
24632
43215
a) Cul es la variable y de qu tipo es?
b) Haz una tabla de frecuencias y representa los datos.
3. En una maternidad se han tomado los pesos (en kilogramos) de 50 recin nacidos:
2,8 3,2 3,8 2,5 2,7
3,0 2,6 1,8 3,3 2,9
2,9 3,5 3,0 3,1 2,2
2,4 3,4 2,0 2,6 3,1
2,9 2,8 2,7 3,1 3,0

3,7 1,9 2,6 3,5 2,3


2,1 3,4 2,8 3,1 3,9
3,4 2,5 1,9 3,0 2,9
2,3 3,5 2,9 3,0 2,7
3,1 2,8 2,6 2,9 3,3

a) Cul es la variable y de qu tipo es?


b) Construye una tabla con los datos agrupados en 6 intervalos de 1,65 a 4,05.
c) Representa grficamente esta distribucin.
4. A un grupo de 30 personas se les ha tomado el nmero de pulsaciones por minuto (ritmo cardaco) obtenindose los
siguientes resultados:
87 85 61 51 64 75 80 70 69 82
80 79 82 74 92 76 72 73 63 65
67 71 88 76 68 73 70 76 71 86
Representa grficamente esta distribucin agrupando los datos en 6 intervalos (desde 50,5 a 92,5).
5. Deseamos hacer una tabla con datos agrupados a partir de 384 datos, cuyos valores extremos son 19 y 187.
a) Si queremos que sean 10 intervalos de amplitud 17, cules sern esos intervalos?
b) Haz otra distribucin en 12 intervalos de la amplitud que creas conveniente.

6. Halla la media, la desviacin tpica y el coeficiente de variacin en las siguientes distribuciones:


a)
b)
c)
d)

Sol: a) x = 1,7 = 1,57 CV = 0,9235 b) x = 3,1 = 1,59 CV = 0,5129


c) x = 2,9 = 0,39 CV = 0,1345 d) x = 74,3 = 9,1 CV = 0,1225.
7. Los gastos mensuales de una empresa A tienen una media de 100 000 euros y una desviacin tpica de 12 500 euros.
En otra empresa B la media es 15 000 euros, y la desviacin tpica, 2 500 euros. Calcula el coeficiente de variacin y
di cul de las dos tiene ms variacin relativa. Sol: Tiene mayor variacin relativa la empresa B.
8. El peso medio de los alumnos de una clase es de 58,2 kg, y su desviacin tpica, 3,1 kg. El de las alumnas de esa
clase es 52,4 kg y su desviacin tpica es 5,2 kg. Calcula el coeficiente de variacin y compara la dispersin de
ambos grupos. Sol: El peso medio de las alumnas es ms variable que el peso de los alumnos.
9. Se han pedidos los pesos y las alturas de 6 personas, obtenindose los siguientes datos:

Calcula el coeficiente de variacin y di si estn ms dispersos los pesos o las alturas.


Sol: Estn ms dispersas las alturas que los pesos.
10. La mediana y los cuartiles de la distribucin de Aptitud para la msica (escala 1-100) en un colectivo de personas
son Q1 = 31, Me = 46 y Q3 = 67.
Completa las siguientes afirmaciones:
a) El 75% tiene una aptitud superior o igual a .
b) El 25% tiene una aptitud superior o igual a .
c) El % tiene una aptitud igual o menor a 46 puntos.
d) El % tiene una aptitud superior o igual a 46 e inferior o igual a 67.
e) El % tiene una aptitud superior o igual a 31 e inferior o igual a 67.
11. La altura, en centmetros, de un grupo de alumnos y alumnas de una misma clase es:
150 169 171 172 172 175 181
182 183 177 179 176 184 158
Calcula la mediana y los cuartiles y explica el significado de estos parmetros.
Sol: Me = 175,5 cm; Q1 = 171 cm (4. lugar); Q3 = 181 cm (posicin 11).
12. Calcula la mediana y los cuartiles de la siguiente distribucin:

Sol: Me = 1, Q1 = 0 y Q3 = 3.

13. Halla la mediana, los cuartiles y el percentil 60 en cada una de las siguientes distribuciones, correspondientes a las
notas obtenidas en un test que han hecho dos grupos de estudiantes:
A: 25 22 27 30 23 22 31 18 - 24 25 32 35 20 28 30
B: 27 32 19 22 25 30 21 - 29 23 31 21 20 18 27
Sol: A: Me = 25, Q1 = 22 (4 posicin), Q3 = 30 (12 posicin) y p60 = 27,5 (entre 9 y 10 posicin)
B: Me = 24, Q1 = 21 (4 posicin), Q3 = 29 (11 posicin) y Q3 = 29 (11 posicin)
14. En la fabricacin de cierto tipo de bombillas se han detectado algunas defectuosas. Se han estudiado 200 cajas de
100 bombillas cada una, obtenindose la siguiente tabla:

Calcula la mediana, los cuartiles y los percentiles p10, p90 y p95.


Sol: Q1 = p25 = 3 , Q3 = p75 = 6 , p10 = 2,5 , p90 = 6,5 , p95 = 7
15. Las puntuaciones obtenidas por 87 personas tienen los siguientes parmetros de posicin:
Q1 = 4,1; Me = 5,1 y Q3 = 6,8. Todas las puntuaciones estn en el intervalo 1 a 9. Haz el diagrama de caja.
16. Las estaturas de 35 alumnos de una clase estn comprendidas entre 153 y 188. Los tres restantes miden 151, 152
y 190. Conocemos los siguientes parmetros: Q1 = 161; Me = 166 y Q3 = 176.
Haz un diagrama de caja para esta distribucin.
17. Se quiere realizar los siguientes estudios:
III. Tipo de transporte que utilizan los vecinos de un barrio para acudir a su trabajo.
III. Estudios que piensan seguir los alumnos y alumnas de un centro escolar al terminar la ESO.
III. Edad de las personas que han visto una obra de teatro en una ciudad.
IV. Nmero de horas diarias que ven la televisin los nios y nias de tu comunidad autnoma con edades
comprendidas entre 5 y 10 aos.
a) Di en cada uno de estos casos cul es la poblacin.
b) En cules de ellos es necesario recurrir a una muestra? Por qu?
18. Cmo se puede contar el nmero aproximado de palabras que tiene un cierto libro?
Se seleccionan, abriendo al azar, unas cuantas pginas y se cuentan las palabras en cada una.
Se calcula el nmero medio de palabras por pgina.
Se da un intervalo en el que pueda estar comprendido el nmero total de palabras.
Hazlo con algn libro. O si no, imagina que lo has hecho e inventa los resultados.
19. Para hacer un sondeo electoral en un pueblo de 400 electores, aproximadamente, se va a elegir una muestra de
200 individuos. Di si te parece vlido cada uno de los siguientes modos de seleccionarlos y explica por qu.
a) Se le pregunta al alcalde, que conoce a todo el pueblo, qu individuos le parecen ms representativos.
b) Se eligen 200 personas al azar entre las que acuden a la verbena el da del patrn.
c) Se seleccionan al azar en la gua telefnica y se les encuesta por telfono.
d) Se acude a las listas electorales y se seleccionan al azar 200 de ellos.
20. En una urbanizacin de 25 familias se ha observado la variable nmero de coches que tiene la familia y se han
obtenido los siguientes datos:
0 1 2 3 1 0 1 2 3 1 0 1 1 1 4 0 1 1 1 43 2 2 1 1
a) Construye la tabla de frecuencias de la distribucin.
c) Calcula la media y la desviacin tpica.
e) Haz el diagrama de caja.
Sol: c) x = 1,48 = 1,14 d) Me = 1, Q1 = 1 y Q3 = 2.

b) Haz el diagrama de barras.


d) Halla la mediana y los cuartiles.

21. El nmero de personas que acudieron cada da a las clases de natacin de una piscina municipal fueron:
38 31 54 47 50 56 52 48 55 60 58 46 47 55 60 53 43 52 46 55
43 60 45 48 40 56 54 48 39 50 53 59 48 39 48
a) Haz una tabla de frecuencias agrupando los datos en intervalos.
b) Representa grficamente la distribucin.
Sol: c) x = 49,43

c) Halla x y .

= 7,34.

22. Un dentista observa el nmero de caries en cada uno de los 100 nios de un colegio y obtiene los resultados
resumidos en esta tabla:

a) Completa la tabla obteniendo x, y, z.


b) Calcula el nmero medio de caries.
Sol: a) y = 35 y z= 0,35 b) El nmero medio de caries es de 1,55.
23. El nmero de errores cometidos en un test por un grupo de personas viene reflejado en la siguiente tabla:

a) Halla la mediana y los cuartiles inferior y superior, y explica su significado.


b) Cul es el nmero medio de errores por persona?
Sol: a) Me = 2, Q1 = 1 y Q3 = 3 b) El nmero medio de errores por persona es ligeramente superior a 2.
24. Al preguntar a un grupo de personas cunto tiempo dedicaron a ver televisin durante un fin de semana, se
obtuvieron estos resultados:

Dibuja el histograma correspondiente y halla la media y la desviacin tpica.


AYUDA: Como los intervalos no son de la misma longitud, para representar la distribucin mediante un
histograma pondremos en cada barra una altura tal que el rea sea proporcional a la frecuencia:

Sol: x = 2,57

= 1,93.

25. Estas tablas recogen la frecuencia de cada signo en las quinielas durante las 20 primeras jornadas:

a) Haz una tabla de frecuencias para el nmero de veces que sale el 1 en cada una de las 20 jornadas:

Halla su media y su desviacin tpica.


b) Haz lo mismo para la X y para el 2.

c) Halla el C.V. en los tres casos y compralos.

Sol: a) x = 7,45 = 1,96. b) EQUIS: x = 4,3 = 1,71 DOSES: x = 2,25


c) UNOS: CV = 0,2631 EQUIS: CV = 0,3977 DOSES: CV = 0,64.

= 1,44.

26. Cada alumno de un grupo cuenta el nmero de personas y el nmero de perros que viven en su portal. Suman sus
resultados y obtienen una muestra con la que se puede estimar el nmero de perros que hay en su ciudad. Por
ejemplo, supongamos que en su observacin obtienen un total de 747 personas y 93 perros. Y saben que en su
ciudad viven 75 000 personas.
a) Cuntos perros estiman que habr en la ciudad?
b) Cmo es de fiable esta estimacin?
c) Es aleatoria la muestra que han utilizado?
Sol: a) 9 337 perros, aproximadamente.
27. Para hacer un estudio sobre los hbitos ecolgicos de las familias de una ciudad, se han seleccionado por sorteo las
direcciones, calle y nmero, que sern visitadas. Si en un portal vive ms de una familia, se sortear entre ellas la
que ser seleccionada. Obtendremos con este procedimiento una muestra aleatoria?
28. Se ha medido el nivel de colesterol en cuatro grupos de personas sometidas a diferentes dietas. Las medias y las
desviaciones tpicas son las que figuran en esta tabla:

Las grficas son, no respectivamente:

Asocia a cada dieta la grfica que le corresponde.


29. Completa la tabla de esta distribucin en la que sabemos que su media es 2,7.

Sol: 5.

30. Dos distribuciones estadsticas, A y B, tienen la misma desviacin tpica.


a) Si la media de A es mayor que la de B, cul tiene mayor coeficiente de variacin?
b) Si la media de A es el doble que la de B, cmo sern sus coeficientes de variacin?
Sol: a) B tiene mayor coeficiente de variacin. b) El coeficiente de variacin de A es la mitad que el de B.
31. La validez de la informacin que nos proporciona una encuesta depende, en gran medida, de la cuidadosa
elaboracin del cuestionario. Algunas caractersticas que deben tener las preguntas son:
Ser cortas y con un lenguaje sencillo.
Sus esquemas deben presentar opciones no ambiguas y equilibradas.
Que no requieran esfuerzo de memoria.
Que no levanten prejuicios en los encuestados.
Estudia si las siguientes preguntas son adecuadas para formar parte de una encuesta y corrige los errorres que
observes:
a) Cunto tiempo sueles estudiar cada da?
Mucho
Poco
Segn el da
b) Cuntas veces has ido al cine este ao?
c) Qu opinin tienes sobre la gestin del director?
Muy buena
Buena
Indiferente
d) Pierden sus hijos el tiempo viendo la televisin?
S
No
e) En qu grado cree usted que la instalacin de la planta de reciclado afectara al empleo y a las condiciones
de salud de nuestra ciudad?
32. En una fbrica se ha medido la longitud de 1 000 piezas de las mismas caractersticas y se han obtenido los datos
que puedes ver en esta tabla.

a) Representa el histograma correspondiente.


b) Se consideran aceptables las piezas cuya longitud
est en el intervalo [75, 86].
Cul es el porcentaje de piezas defectuosas?
Sol: b) 9,25% de las piezas sern defectuosas.

33. Se ha pasado un test de 80 preguntas a 600 personas. Este es el nmero de respuestas correctas:

a) Comprueba que la mediana est en el intervalo [40-50). Asgnale un valor repartiendo homogneamente
los 105 individuos que hay en el intervalo.
b) Haz lo mismo para los cuartiles.
Sol: a) Me = 43,33 b) Q1 = 26,66 Q3 = 59,41.

1.

AUTOEVALUACIN
En una clase de 4 ESO se ha realizado un examen final de tipo test que constaba de 30 preguntas. El nmero de
respuestas
15 10 30 5 25
20 25 5 25 30

30 25 10 15 20
20 10 5 15 30

a) Resume estos datos mediante una tabla de frecuencias.

b) Representa grficamente esta distribucin.

2. Hemos preguntado las edades a un grupo de 50 personas. Los resultados obtenidos se reflejan en la tabla siguiente:
EDAD

0, 5

5, 10

10, 15

15, 20

20, 25

25, 30

N DE PERSONAS

10

17

Halla la media y la desviacin tpica.


3. En la siguiente tabla hemos resumido los resultados obtenidos al lanzar un dado 120 veces:
N OBTENIDO

N DE VECES

18

30

21

25

17

Calcula Me, Q1, Q3 y p20.


4. a) Los tiempos que un grupo de personas han empleado en hacer un test se distribuyen entre 0 y 50 minutos.
Construye el diagrama de caja sabiendo que Q1 = 23, Me = 34 y Q3 = 39.
b) En un grupo, A, de personas, la media de edad es 16,4 aos con una desviacin tpica de 2,1.
En otro grupo, B, la media de edad es 4,3 aos, y la desviacin tpica, 1,8. Calcula el coeficiente de variacin
en los dos casos y compara la dispersin de ambos grupos.
5. a) En un centro universitario se desea conocer el nmero de estudiantes que se financian sus estudios. Para ello,
el encuestador se pone en la parada del autobs de la universidad un da laborable de 11 h a 12 h y pregunta a
100 estudiantes. Reflexiona si el procedimiento de seleccin para obtener una muestra aleatoria es adecuado.
b) Interpreta el siguiente diagrama de caja relativo a las calificaciones obtenidas por un grupo de estudiantes:

6. En una gasolinera estudian el nmero de vehculos que repostan a lo largo de un da, obteniendo:
HORAS

0, 4

4, 8

8, 12

12, 16

16, 20

20, 24

N DE VEHCULOS

14

110

120

150

25

Calcula Me , Q3 y p80

Das könnte Ihnen auch gefallen