Beruflich Dokumente
Kultur Dokumente
CONCEPTOS BSICOS
Poblacin. Es el conjunto de todos los elementos cuyo conocimiento nos interesa y que seran objeto de nuestro estudio.
Muestra es un subconjunto extrado de la poblacin, cuyo estudio sirve para inferir caractersticas de toda la poblacin.
Individuo es cada uno de los elementos que forman la poblacin o la muestra.
Caracteres son los aspectos que deseamos estudiar en los individuos de una poblacin. Los valores que damos a los
caracteres se llaman variables y estas pueden ser de dos tipos:
- Variable cuantitativa si toman valores numricos. Estas a su vez se dividen en dos tipos:
Discretas si solo toman valores aislados. Por ejemplo
Continuas si pueden tomar cualquier valor de un intervalo. Por ejemplo
- Variable cualitativa si toman valores no numricos. Por ejemplo ..
LAS DOS RAMAS DE LA ESTADSTICA
La estadstica descriptiva trata de describir y analizar algunos caracteres de los individuos de un grupo dado
(poblacin) sin extraer conclusiones para un grupo mayor.
Por ejemplo si hacemos un estudio sobre los resultados acadmicos de los alumnos de 4 eso de nuestro colegio para
compararlos con otros estudios de aos anteriores sera estadstica descriptiva, pues se realiza sobre la totalidad de la
poblacin.
La estadstica inferencial trabaja con muestras y pretende, a partir de ellas, inferir caractersticas de toda la poblacin.
Es decir, se pretende tomar como generales propiedades que solo se han verificado para casos particulares. En este proceso
hay que operar con mucha cautela: Cmo se elige la muestra? Qu grado de confianza se puede tener en el resultado
obtenido?
Por ejemplo se realiza una encuesta 400 alumnos de una universidad sobre sus preferencias en la lectura, con el fin de
extraer consecuencias vlidas para todos los universitarios. Esto es estadstica inferencial, pues , a partir de una muestra,
se desea obtener informacin de toda la poblacin.
TABLAS DE FRECUENCIA
Una vez recogidos los datos estos se agrupan en tablas de frecuencia.
Cuando los valores que toma la variable son pocos se colocan los valores en una columna (xi) y a su lado las veces que se
repite cada dato (fi)
Cuando el nmero de valores que toma la variable es grande, conviene elaborar una tabla de frecuencias agrupndolos en
intervalos. Para ello vamos a ver un ejemplo.
En una maternidad se han tomado los pesos (en kilogramos) de 50 recin nacidos:
2,8 3,2 3,8 2,5 2,7 3,7 1,9 2,6 3,5 2,3
3,0 2,6 1,8 3,3 2,9 2,1 3,4 2,8 3,1 3,9
2,9 3,5 3,0 3,1 2,2 3,4 2,5 1,9 3,0 2,9
2,4 3,4 2,0 2,6 3,1 2,3 3,5 2,9 3,0 2,7
2,9 2,8 2,7 3,1 3,0 3,1 2,8 2,6 2,9 3,3
Localizamos los valores extremos, que son . y . , y calculamos el recorrido que es su diferencia
r=
Decidimos el nmero de intervalos que vamos a tomar (entre 6 y 15), y segn el nmero calculamos la longitud de cada
intervalo (ha de ser igual para todos)
Nosotros tomaremos intervalos. Empezaremos por un nmero algo menor que el extremo menor y terminaremos
en un nmero algo mayor que el extremo mayor. Y ahora viene lo peor, hemos de contar cuntos datos hay en cada
intervalo.
El punto medio de cada intervalo se llama marca de clase, y es el valor que utilizaremos para futuros clculos.
PARMETROS ESTADSTICOS
A partir de una tabla de frecuencia veremos cmo se obtienen los parmetros
Media aritmtica: x
x f
f
i
Desviacin tpica:
x f
f
2
i
Coeficiente de variacin. Sirve para comparar las dispersiones de poblaciones heterogneas, pues indica la variacin
relativa. C.V .
Ejercicio.
1. Calcula los anteriores parmetros en la siguiente distribucin
MEDIDAS DE POSICIN
Mediana. Es el valor que queda en medio si colocamos los valores en orden creciente. Se representa Me y por encima de
ella est el 50% de la poblacin y por debajo, el otro 50%. Si el nmero de valores es par se toma como mediana la media
de los dos valores centrales.
Por ejemplo:
6 , 7 , 7, 7 , 8 , 9 , 10 , 12 , 15 la mediana ser Me =
6 , 7 , 7, 7 , 8 , 9 , 10 , 12 , 15 , 16 La mediana ser Me=
Cuartiles. Si en lugar de dividir los valores en dos mitades, lo hacemos en cuatro partes iguales, los nuevos puntos de
separacin se llaman cuartiles.
Q1 es el cuartil inferior y tiene por debajo el 25% de la poblacin y por encima, el 75%
Q2 es la mediana
Q3 es el cuartil superior t tiene por debajo el 75% de la poblacin y por encima, el 25%
Por ejemplo en la distribucin 1 , 2 , 2 , 3 , 4 , 5, 5 , 5 , 6 , 8 , 9 , 10 los cuartiles sern:
Q1 =
Q2 = Me =
Q3 =
Percentiles. Si partimos la poblacin en 100 partes y sealamos el lugar que deja debajo k de ellas, el valor
correspondiente a ese lugar se designa pk y se denomina percentil k.
La mediana es Me = p50, y los cuartiles, Q1 = , Q3 = ..
Ejercicio.
2. Calcula Me, Q1, Q3, p10 y p80 en la distribucin:
1 , 1 , 2 , 3 , 4 , 4, 5 , 5 , 5 , 5 , 6 , 7 , 7 , 7 , 8 , 9 , 10
Frecuencias acumuladas. Cuando las distribuciones estn dadas por tablas de frecuencias acudimos al concepto de
frecuencia acumulada para facilitar los clculos.
Veamos un ejemplo.
Q1 =
P73 =
Q2 = Me =
Q3 =
P85 =
Ejercicio.
3. En la fabricacin de cierto tipo de bombillas se han detectado algunas defectuosas. Se han estudiado 200 cajas de 100
bombillas cada una, obtenindose la siguiente tabla:
DIAGRAMAS DE CAJA
El diagrama de caja (tambin llamado de caja y bigotes) son una forma de representar las distribuciones estadsticas.
ESTADSTICA INFERENCIAL
Esta rama de la estadstica trabaja con muestras, y del estudio de sta, se infieren conclusiones para toda la poblacin.
Las causas para elegir una muestra pueden ser los siguientes:
- La poblacin es excesivamente numerosa.
- La poblacin es difcil o imposible de controlar.
- El proceso de medicin es destructivo o demasiado caro.
- Se desea conocer rpidamente los resultados y se tardara demasiado tiempo en realizar las mediciones.
El tamao de la muestra no tiene que ser pequeo y sta se ha de elegir al azar, de este modo todos los individuos de la
poblacin tienen la misma probabilidad de ser elegidos.
Ejercicio.
6. Se desea conocer el nmero de horas que dedican al estudio los 1000 alumnos de un colegio, para ello se extrae una
muestra de 100 de ellos. Reflexiona sobre la validez de cada uno de los mtodos seguidos para escoger la muestra.
a) El director los elige procurando que haya alumnos de todo tipo.
b) Se eligen los 100 primeros que lleguen al colegio un cierto da
c) Se numeran del 1 al 1000 y se eligen al azar 100 de ellos.
EJERCICIOS
1. El nmero de faltas de ortografa que cometieron un grupo de estudiantes en un dictado fue:
03120
21304
01143
53241
50210
00021
21003
05321
a) Di cul es la variable y de qu tipo es.
b) Haz una tabla de frecuencias y representa los datos en un diagrama adecuado.
2. Las urgencias atendidas durante un mes en un centro de salud fueron:
15321
64223
43510
15336
24632
43215
a) Cul es la variable y de qu tipo es?
b) Haz una tabla de frecuencias y representa los datos.
3. En una maternidad se han tomado los pesos (en kilogramos) de 50 recin nacidos:
2,8 3,2 3,8 2,5 2,7
3,0 2,6 1,8 3,3 2,9
2,9 3,5 3,0 3,1 2,2
2,4 3,4 2,0 2,6 3,1
2,9 2,8 2,7 3,1 3,0
Sol: Me = 1, Q1 = 0 y Q3 = 3.
13. Halla la mediana, los cuartiles y el percentil 60 en cada una de las siguientes distribuciones, correspondientes a las
notas obtenidas en un test que han hecho dos grupos de estudiantes:
A: 25 22 27 30 23 22 31 18 - 24 25 32 35 20 28 30
B: 27 32 19 22 25 30 21 - 29 23 31 21 20 18 27
Sol: A: Me = 25, Q1 = 22 (4 posicin), Q3 = 30 (12 posicin) y p60 = 27,5 (entre 9 y 10 posicin)
B: Me = 24, Q1 = 21 (4 posicin), Q3 = 29 (11 posicin) y Q3 = 29 (11 posicin)
14. En la fabricacin de cierto tipo de bombillas se han detectado algunas defectuosas. Se han estudiado 200 cajas de
100 bombillas cada una, obtenindose la siguiente tabla:
21. El nmero de personas que acudieron cada da a las clases de natacin de una piscina municipal fueron:
38 31 54 47 50 56 52 48 55 60 58 46 47 55 60 53 43 52 46 55
43 60 45 48 40 56 54 48 39 50 53 59 48 39 48
a) Haz una tabla de frecuencias agrupando los datos en intervalos.
b) Representa grficamente la distribucin.
Sol: c) x = 49,43
c) Halla x y .
= 7,34.
22. Un dentista observa el nmero de caries en cada uno de los 100 nios de un colegio y obtiene los resultados
resumidos en esta tabla:
Sol: x = 2,57
= 1,93.
25. Estas tablas recogen la frecuencia de cada signo en las quinielas durante las 20 primeras jornadas:
a) Haz una tabla de frecuencias para el nmero de veces que sale el 1 en cada una de las 20 jornadas:
= 1,44.
26. Cada alumno de un grupo cuenta el nmero de personas y el nmero de perros que viven en su portal. Suman sus
resultados y obtienen una muestra con la que se puede estimar el nmero de perros que hay en su ciudad. Por
ejemplo, supongamos que en su observacin obtienen un total de 747 personas y 93 perros. Y saben que en su
ciudad viven 75 000 personas.
a) Cuntos perros estiman que habr en la ciudad?
b) Cmo es de fiable esta estimacin?
c) Es aleatoria la muestra que han utilizado?
Sol: a) 9 337 perros, aproximadamente.
27. Para hacer un estudio sobre los hbitos ecolgicos de las familias de una ciudad, se han seleccionado por sorteo las
direcciones, calle y nmero, que sern visitadas. Si en un portal vive ms de una familia, se sortear entre ellas la
que ser seleccionada. Obtendremos con este procedimiento una muestra aleatoria?
28. Se ha medido el nivel de colesterol en cuatro grupos de personas sometidas a diferentes dietas. Las medias y las
desviaciones tpicas son las que figuran en esta tabla:
Sol: 5.
33. Se ha pasado un test de 80 preguntas a 600 personas. Este es el nmero de respuestas correctas:
a) Comprueba que la mediana est en el intervalo [40-50). Asgnale un valor repartiendo homogneamente
los 105 individuos que hay en el intervalo.
b) Haz lo mismo para los cuartiles.
Sol: a) Me = 43,33 b) Q1 = 26,66 Q3 = 59,41.
1.
AUTOEVALUACIN
En una clase de 4 ESO se ha realizado un examen final de tipo test que constaba de 30 preguntas. El nmero de
respuestas
15 10 30 5 25
20 25 5 25 30
30 25 10 15 20
20 10 5 15 30
2. Hemos preguntado las edades a un grupo de 50 personas. Los resultados obtenidos se reflejan en la tabla siguiente:
EDAD
0, 5
5, 10
10, 15
15, 20
20, 25
25, 30
N DE PERSONAS
10
17
N DE VECES
18
30
21
25
17
6. En una gasolinera estudian el nmero de vehculos que repostan a lo largo de un da, obteniendo:
HORAS
0, 4
4, 8
8, 12
12, 16
16, 20
20, 24
N DE VEHCULOS
14
110
120
150
25
Calcula Me , Q3 y p80