Sie sind auf Seite 1von 12

CLASES PARTICULARES MATEMÁTICA

CURSOS ENSEÑANZA MEDIA - 2019


E-mail: srojasclases@gmail.com
Sitio Web: srojasc.milaulas.com

Apunte: E STAD ÍSTICA D ESCRIPTIVA


Profesor: Sebastián Rojas Canales

Nombre del Estudiante:

Estadı́stica
La estadı́stica descriptiva es una rama de la matemática que emplea métodos y técnicas que se utilizan
en la recolección, ordenamiento, resumen, análisis, interpretación y comunicación de un conjunto de da-
tos de una determinada población de interés.

La población es un conjunto de individuos o elementos que poseen alguna variable cualitativa (carac-
terı́sticas) o cuantitativa (valores, datos) común que se quiere estudiar. Las poblaciones pueden ser finitas
o infinitas. Por lo general la población de interés suelen ser de gran tamaño y por lo tanto su estudio re-
querirı́a de mucho tiempo dinero. Es por ello que se suele tomar una muestra de la población, que es un
subconjunto de la población, que debe ser representativa.

Una encuesta es una forma de recabar información, lo cual se realiza sobre la muestra de la población,
son el fin de obtener opiniones, caracterı́sticas, mediciones, etc.

Variables
Es una caracterı́stica que se asocia a los elementos de una muestra o población.

Variable Cualitativa: Son aquellas en que las observaciones realizadas se refieren a un atributo (no son
numéricos), por ejemplo: sexo, nacionalidad, profesión, etc. Las variables cualitativas pueden ser de 2
tipos:

Nominal: son clasificadas en categorı́as y no admiten criterio de orden: estado civil (casado, viudo,
divorciado), color de pelo (negro, rubio, castaño), etc.
Ordinal: en ellas existe una relación de orden intuitivo: nivel educacional (básica, media, superior),
medallas deportivas (oro, plata, bronce), etc.

Variable Cuantitativa: Son aquellas en que cada observación tiene un valor expresado por un número
real, por ejemplo: peso, temperatura, salario, etc. Las variables cuantitativas pueden ser de 2 tipos:

Discreta: toman sólo variables enteros, por ejemplo: número de hijos, número de departamentos de un
edificio, etc.
Continua: toman cualquier valor decimal, por ejemplo: peso de un estudiante, estatura de un recién
nacido, etc.

Ejercicios
Conteste Verdadero (V) o Falso (F) a las siguientes afirmaciones:

1. La estatura de los jugadores de un equipo de fútbol es una variable cuantitativa.

2. La carrera preferida por los estudiantes del Preuniversitario es una variable nominal.

3. La cantidad de habitantes de Isla negra es una variable continua.

4. El color de pelo es una variable de tipo discreta.

5. El número de celular es una variable continua.

6. Una muestra es un subconjunto de la población.

7. El color de pelo es una variable cuantitativa.

8. Para que un estudio estadı́stico de una población sea válido a partir de una muestra, basta que la
muestra sea aleatoria.

9. El número de computadores es una biblioteca es una variable continua.

10. La distancia entre el preuniversitario y las casas de los estudiantes es una variable continua.

Tabulación de datos
Cuando recabamos la información esta debe ser ingresada en tablas para que su interpretación sea más
simple. A este proceso se le llama, tabulación de datos. Sus elementos son:

Dato (x): Información que se está estudiando en la estadı́stica.

Frecuencia (f ): Número de veces que se repite un dato en un intervalo o clase (también se le denomina
frecuencia absoluta).

Frecuencia acumulada (fac ): esta se obtiene sumando ordenadamente las frecuencia absoluta hasta la
que ocupa la última posición.

Frecuencia relativa (fr ): esta se obtiene dividiendo la frecuencia absoluta y el total de observaciones de
cada uno de los datos. Se puede expresar en fracción, decimal o porcentaje.

Frecuencia relativa acumulada (fra ): Esta se obtiene sumando ordenadamente las frecuencia absoluta
acumuladas hasta la que ocupa la última posición.

2
E JEMPLO 1 Tabla de frecuencia de datos no agrupados.

x f fac fr fra
1 2 2 20 % 20 %
2 3 5 30 % 50 %
3 5 10 50 % 100 %

Ejercicios
Los siguientes datos corresponden a las notas obtenidas por un curso en un examen de ma-
temática: 1 − 5 − 3 − 4 − 3 − 7 − 2 − 6 − 5 − 4 − 3 − 2 − 3 − 5 − 4 − 3 − 6 − 5 − 4 − 4 − 6 − 7 − 5 − 4 − 6.
Complete la tabla con esta información.

Nota f fac fr fra fra %

Construcción de tablas de frecuencias de datos agrupados


También es posible construir tablas de frecuencia de datos agrupados. La decisión de su elaboración to-
mará en cuenta la cantidad de observación distintas que tenga la muestra, ası́ como también del criterio
del investigador.

Para construir la tabla de frecuencia con datos agrupados en intervalos, se puede seguir el siguiente
procedimiento:

Paso 1: Calcular el rango de la muestra. El rango es la diferencia entre el mayor y menor valor de la
muestra.

Paso 2: Determinar la cantidad de intervalos que se quiera tener.

Paso 3: Calcular la amplitud de los intervalos, que es el cuociente entre el rango u la cantidad de inter-
valos. La amplitud no necesariamente tiene que ser la misma en todos los intervalos, depende del
criterio del investigador.

3
Paso 4: Agregar la Marca de clase (M C), que es el promedio de los valores extremos de un intervalo.

E JEMPLO 2 Tabla de frecuencia de datos agrupados.

Tramo Ingreso (en miles) M C (en miles) f


1 [0, 100[ 50 20
2 [100, 200[ 150 30
3 [200, 300] 250 50

Ejercicios
La tabla adjunta muestra la distribución de frecuencia de los ingresos familiares en miles de
pesos (agrupados por intervalos), que tienen 200 familias.

Ingreso familiar en Marca de Frecuencia (n◦


Tramo
miles de pesos clase de familias)
1 [0, 100[ 67
2 [100, 200[ 66
3 [200, 300[ 39
4 [300, 400[ 28

Conteste verdadero (V) o falso (F) a las siguientes afirmaciones

1. Exactamente 133 familias tienen como ingreso menos de $200.000.

2. La marca de clase del tamo 2 es 150.

3. El total del ingreso familiar en el tramo 4 es, al menos $8.400.000.

4. La amplitud de los intervalos es 99.

Medidas de Tendencia Central


Las medidas de Tendencia Central (MTC) son indicadores que representan valores numérico en torno a
los cuales tienden a agruparse los valores de una variable estadı́stica. Estas son la media aritmética, la
mediana y la moda.

Moda (M o)
Es el dato que aparece con mayor frecuencia, es decir, el que más se repite.

Si no hay un dato que tenga mayor frecuencia que otro se dice que la distribución de frecuencias es
amodal. Si existe un solo dato que tenga mayor frecuencia la distribución de frecuencia es unimodal. De
existir dos (o más) datos que tienen la misma frecuencia, siendo esta la mayor, se dice que la muestra es
binomial o polimodal.

4
O BSERVACI ÓN 1 En el caso de la PSU de matemática, para el calculo de la moda en tablas de datos agrupados en
intervalos, se considerará o se preguntará por el intervalo modal.

Moda en Intervalos
Li Extremo inferior del intervalo modal.

fi Frecuencia absoluta del intervalo modal.

fi − fi−1 fi−1 Frecuencia absoluta del intervalo anterior al modal.


M o = Li + · ti
(fi − fi−1 ) + (fi − fi+1 )
fi+1 Frecuencia absoluta del intervalo posterior al modal.

ti Amplitud de los intervalos

O BSERVACI ÓN 2 El intervalo modal es el intervalo que presenta mayor frecuencia absoluta.

O BSERVACI ÓN 3 Se debe considerar:

+ Si la moda está en el primer intervalo, entonces ti−1 = 0.


+ Si la moda está en el último intervalo, entonces ti+1 = 0.

E JEMPLO 3 Dada la siguiente tabla determinar la Solución


moda.
Datos f
(45 − 25)
[10, 15[ 20 M o = 20 + ·5
(45 − 25) + (45 − 10)
[15, 20[ 25
20
[20, 25[ 45 = 20 + ·5
20 + 35
[25, 30[ 10 100
= 20 + = 20 + 1, 81 = 21, 81
Total 100 55

Mediana (M e)
Es el dato que ocupa la posición central de la muestra cuando estos se encuentran ordenados en forma
creciente (%) o decreciente (&). Si la muestra tiene un número par de datos, la mediana es la media
aritmética de los dos términos centrales.

Sea n el número de datos:



 x n+1 si n es impar

 2

Me =
 x n + x n2 +1
 2

si n es par
2

O BSERVACI ÓN 4 En el caso de la PSU de matemática, para el calculo de la moda en tablas de datos agrupados en
intervalos, se considerará o se preguntará por el intervalo en el que se encuentra la mediana.

5
E JEMPLO 4 Determine la media en los siguientes datos:

1−1−2−3−4−5−5−6

Solución

En este caso los datos ya se encuentran ordenados de menor a mayor, contando los datos son
n = 8, entonces la mediana serı́a:

1 − 1 − 2 − 3| {z
− 4} −5 − 5 − 6
Me

Ası́ la mediana serı́a:


3+4 7
Me = = = 6, 5
2 2

Mediana en Intervalos
n Es el número total de datos.

Li Extremo inferior del intervalo modal.


n
− Fi−1 fi Frecuencia absoluta del intervalo modal.
M e = Li + 2 · ti
fi Fi−1 Es la frecuencia acumulada anterior a la calse media-
na.

ti Amplitud de los intervalos

Solución
E JEMPLO 5 Dada la siguiente tabla de-
terminar la estimación de la mediana. n 100
Si = = 50, entonces el intervalo de la mediana es:
2 2
Datos f F [20, 25[. Ası́:
[10, 15[ 20 20
50 − 45
[15, 20[ 25 45 M e = 20 + ·5
45
[20, 25[ 45 90 5
= 20 + ·5
[25, 30[ 10 100 45
Total 100 25
= 20 + = 20 + 0, 5 = 20, 5
45

Media Aritmética (X)


La media aritmética o promedio, es el cuociente entre la suma de todos los datos y el número de datos.
Si se tienen n datos: x1 , x2 , x3 , ..., xn , su media aritmética es:
x1 + x2 + x3 + ... + xn
X=
n

6
Media Aritmética para datos organizados en una tabla de frecuencia
La media aritmética o promedio para datos ordenados en tabla es el resultado de la multiplicación de
los datos por sus frecuencias, dividido por la cantidad de datos. Si se tienen n datos: x1 , x2 , x3 , ..., xn , y
sus respectivas frecuencias f1 , f2 , f3 , ..., fn , entonces la media aritmética es:

x1 · f1 + x2 · f2 + x3 · f3 + ... + xn · fn
X=
f1 + f2 + f3 + ... + fn

Media Aritmética para datos agrupados en intervalos organizados en una tabla de fre-
cuencia
La media aritmética o promedio para datos agrupados en intervalos ordenados en tabla es el resultado
de la multiplicación de los datos por sus frecuencias, dividido por la cantidad de datos. Si se tienen
n marcas de clase: m1 , m2 , m3 , ..., mn , y sus respectivas frecuencias f1 , f2 , f3 , ..., fn , entonces la media
aritmética es:
m1 · f1 + m2 · f2 + m3 · f3 + ... + mn · fn
X=
f1 + f2 + f3 + ... + fn

Propiedades de la Media Aritmética


+ Si cada dato de una muestra se aumenta o disminuye en una constante k, la media aritmética
aumenta o disminuye en la constante k.

+ Si cada datos de una muestra se multiplica o divide por una constante k, la media aritmética se
multiplica o divide por k.

Ejercicios
1. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s) con respecto a los datos
presentados en la tabla adjunta? (DEMRE, 2015)

I. El intervalo modal de las estaturas de los hombres y el de las mujeres es el mismo.


II. La mediana de las estaturas de las mujeres está en el intervalo 1.56, 1.60.
III. El promedio y la mediana de lose estaturas de los hombres se encuentran en el
mismo intervalos.

A) Solo I

B) Solo I y II Estatura (metros)


Genero 1.51 − 1.55 1.56 − 1.60 1.61 − 1.65 1.66 − 1.70
C) Solo I y III
Hombre 1 2 10 7
D) Solo II y III Mujer 4 7 8 1

E) I, II y III

7
Ejercicios
2. Si la tabulación del peso de 50 niños recién nacidos se muestra en la tabla adjunta,
¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)? (DEMRE, 2015)

I. La mediana se encuentra en el segundo intervalo.


II. Un 20 % de los recién nacidos pesó 4 o más kilogramos.
III. El intervalo modal es 3.0 − 3.4.

A) Solo III Peso (Kg) N◦ de niños


B) Solo I y II 2.5 − 2.9 5
3.0 − 3.4 23
C) Solo I y III
3.5 − 3.9 12
D) Solo II y III 4.0 − 4.4 10
E) I, II y III

Medidas de Dispersión
Desviación estándar
Es una medida de dispersión y nos indica cuánto tienden a alejarse los datos del promedio aritmético.
Para calcular la desviación estándar (σ) se utilizan las siguientes fórmula:

Para datos no agrupados: Para datos agrupados:


r s
(x1 − x)2 + (x2 − x)2 + ... + (xn − x)2 f1 · (x1 − x)2 + f2 (x2 − x)2 + ... + fn · (xn − x)2
σ= σ=
n f1 + f2 + ... + fn

Propiedades de la desviación estándar


Sea x una variable aleatoria y k un número real:

σ(x) ≥ 0 σ(k) = 0 σ(x + k) = σ(x) σ(kx) = k · σ(x)

Varianza
Es otra medida de dispersión que corresponde al cuadrado de la desviación estándar. V ar(x) = σ 2

8
Propiedades de la varianza
Sea x una variable aleatoria y k un número real, se cumple:

σ 2 (x) ≥ 0 σ 2 (k) = 0 σ 2 (x + k) = σ 2 (x) σ 2 (kx) = k 2 · σ 2 (x)

Medidas de Posición
Cuartiles
Son los tres valores que dividen a un conjunto ordenado de datos en cuatro partes iguales.

Q1 , Q2 y Q3 determinan los valores correspondientes al 25 %, 50 % y 75 % de los datos, respectivamente.


Paso a paso para el cálculo de los cuartiles:

Paso 1: Se ordenan los datos de menor a mayor.


k·n
Paso 2: Se determina la población que ocupa cada cuartil mediante la formula Qk = , en donde
4
k = {1, 2, 3} y n es el número de datos. En caso de ser un número decimal se aproxima al entero
superior más cercano.

Paso 3: Buscar el dato que ocupa la posición Qk encontrada.

O BSERVACI ÓN 5 (I MPORTANTE ) Q2 siempre coincide con la mediana.

Recorrido Intercuartı́lico: Es la diferencia positiva entre Q1 y Q3 .

Percentiles
Son los valores que dividen a un conjunto ordenando de datos en 100 partes iguales.

El percentil de orden k se denota por Pk y en el caso discreto es la observación cuya frecuencia absoluta
acumulada alcanza el valor igual al k % de las observaciones.

Paso a paso para el calculo de las percentiles:

Paso 1: Se ordenan los datos de menor a mayor.


k·n
Paso 2: Se calcula la posición que ocupa el percentil, con la fórmula Pk = , en donde
100
k = {1, 2, ..., 99} y n el número de datos. Si es decimal se aproxima al entero superior más cercano.

Paso 3: Busca el dato que ocupa la posición Pk encontrar.

O BSERVACI ÓN 6 (I MPORTANTE ) P50 coincide con la mediana.

9
O BSERVACI ÓN 7 (Q UINTIL ) Son pocos los ejercicios que se presenta el concepto de quintil, no obstante, es bueno
conocer la fórmula para determinar la posición del quintil qk .
k·n
Se calcula la posición que ocupa el quintil, con la fórmula qk = , en donde k = {1, 2, 3, 4} y n el número de
5
datos. Si es decimal se aproxima al entero superior más cercano.

Ejercicios
1. Si a, b y c son tres números enteros cuya desviación estándar es σ, entonces la desviación
estándar de na, nb y nc, con n un número entero positivo, es (DEMRE, 2014)

A) n2 σ
B) σ

C) nσ
D) nσ
E) 3nσ

2. De acuerdo a los 100 datos de la tabla adjunta, ¿cuál(es) de las siguientes afirmaciones
es (son) verdadera(s)? (DEMRE, 2015)

I. El primer cuartil se ubica en el intervalo [45, 50[.


II. El intervalo donde se ubica el percentil 50 coincide con el intervalo modal.
III. La cantidad de datos que se encuentran en el cuarto intervalo corresponden a una
10 % del total de los datos.

A) Solo III Intervalo fac


[40, 45[ 17
B) Solo I y II
[45, 50[ 15
C) Solo I y III [50, 55[ 21
D) Solo II y III [55, 60[ 10
[60, 65[ 18
E) I, II y III [65, 70] 19

10
Representación gráfica e Interpretación de Gráficos
La representación gráfica de una distribución de frecuencia nos permite ver de manera clara y ordenada
un determinado estudio estadı́stico. Hay varios tipos de gráficos, siendo los más comunes:

Gráficos de caja
El diagrama de caja (o bigote) es una representación gráfica basada en cuartiles. Para elaborar este gráfi-
co, se necesitan cinco datos: el valor mı́nimo, el primer cuartil, la mediana, el tercer cuartil y el valor
máximo de la muestra. Los gráficos resultantes pueden ser:

11
Ejercicios
1. Después de medir los largos de una colección de objetos, se obtiene el gráfico de fre-
cuencia de la figura adjunta. ¿Cuál es el percentil 50 de los datos representados en este
gráfico?

A) 3, 5 cm

B) 5 cm

C) 4 cm

D) 6 cm

E) 3 cm

2. Los datos que corresponden a la masa en kilogramos de 12 alumnos de 3◦ medio de un


colegio, han sido registrado en el gráfico de cajas de la figura. Entonces, ¿cuál(es) de las
siguientes aseveraciones es(son) VERDADERA(s)?

I. El primer cuartil es 50.


II. El recorrido intercuartı́lico es 5
III. La muestra es negativamente
asimétrico

A) Solo I
B) Solo II
C) Solo III
D) Solo I y III
E) I, II y III

SRC 18 de noviembre de 2019

12

Das könnte Ihnen auch gefallen