Beruflich Dokumente
Kultur Dokumente
POSICIÓN
Media muestral:
Media poblacional:
MEDIA ARITMÉTICA - Ejemplo
Calcular la media aritmética de los siguientes datos relacionados con las notas
de test en Estadística obtenidas por un cierto alumno:
MEDIA ARITMÉTICA
Para datos agrupados:
Media muestral
Media poblacional:
MEDIA ARITMÉTICA - Ejemplo
Datos: 4, 7, 5, 6, 3, 2, 7 𝑀𝑒 = 𝑋7+1 = 𝑥4 = 5
Datos ordenados: 2, 3, 4, 5, 6, 7, 7 2
2, 3, 4, 5, 6, 6, 7, 7,9,10
MEDIANA - Ejemplo
𝑋𝑛 + 𝑋𝑛+1
2 2
Para una muestra con número par de datos: 𝑀𝑒 =
2
𝑋8 + 𝑋8
2 2
+1 𝑋4 + 𝑋5
𝑀𝑒 = = = (13 + 12)/2 = 12,5
2 2
MEDIANA
Datos agrupados
𝑛
− 𝐹𝑎𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∗a
𝑓𝑖
𝑑1
𝑀𝑜 = 𝐿𝑖 + ∗a
𝑑1 + 𝑑2
7.07 7.00 7.10 6.97 7.00 7.03 7.01 7.01 6.98 7.08.
𝑅 = 𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
𝑅 = 𝐿𝑚𝑎𝑥 − 𝐿𝑚𝑖𝑛
VARIANZA
D. E. muestral D. E. poblacional:
DESVIACIÓN ESTÁNDAR
DESVIACIÓN ESTÁNDAR
Datos agrupados
D. E. muestral D. E.
poblacional:
DESVIACIÓN ESTÁNDAR
COEFICIENTE DE VARIACIÓN
Es la razón entre la desviación típica y la media
Mide la desviación típica en forma de que tamaño tiene con respecto a la media
𝑆
𝐶𝑉 =
𝑥ҧ
• Frecuente mostrarla en porcentajes
Si la media es 80 y la desviación típica 20 entonces
CV= 20/80 = 0,25 = 25%
• Cantidad adimensional
• Compara variabilidad de diferentes variables
Si el peso tiene CV= 30% y la altura tiene CV=10%, los individuos
presentan más dispersión en peso que en altura
EJERCICIO
Calcular CV para hombres, mujeres y total para los datos de peso de los estudiantes
de 2do semestre de BQF.
S2h = 76,01
S2m = 24,21
S2t =50,11
Xh = 63,92
Xm = 57,94
Xt = 60,93
CVh = raíz 76,1/57,94 =1,14
CVm =0,64
CVt = 0,91
¿Cuál es la medida de variabilidad más
importante?
El rango de la muestra tiene aplicaciones en el área del control
estadístico de la calidad. La varianza de la muestra y la desviación
estándar de la muestrareflejan el mismo concepto en la variabilidad de
la medición, pero la desviación estándar de la muestra mide la
variabilidad en unidades lineales; en tanto que la varianza muestral se
mide en unidades cuadradas. Ambas desempeñan papeles
importantes en el uso de los métodos estadísticos. El contexto de la
inferencia estadística implica la obtención de conclusiones acerca de
las características de poblaciones. Entre tales características son
constantes los denominados parámetros de la población.
Dos parámetros importantes son la media de la población y la varianza
de la población. La varianza de la muestra desempeña un papel
explícito en los métodos estadísticos para obtener inferencias sobre la
varianza de la población. La desviación estándar de la muestra
desempeña un papel importante, junto con la media de la muestra, en
las inferencias que se realizan acerca de la media de la población. En
general, la varianza se considera más en la teoría inferencial, mientras
que la desviación estándar se utiliza más en aplicaciones.
1.6 Modelado estadístico, inspección científica
y diagnósticos gráficos
El análisis podría requerir cierto modelo para los datos; por ejemplo,
que las dos muestras provengan de distribuciones normales o
gaussianas.
Los científicos y los ingenieros están acostumbrados a manejar
conjuntos de datos. Debería ser obvia la importancia de describir o
resumir la naturaleza de los conjuntos de datos. Con frecuencia el
resumen gráfico de un conjunto de datos puede proporcionar
información sobre el sistema del que se obtuvieron los datos.
En esta sección se estudia con detalle el papel del muestreo y de la
traficación de los datos para mejorar la inferencia estadística.
Diagrama de dispersión
Por ejemplo, considere a
un fabricante de textiles
que diseña un
experimento en donde se
producen especímenes de
tela que contienen
diferentes porcentajes de
algodón. Considere los
datos de la tabla 1.3
A veces las gráficas o el análisis exploratorio de los datos pueden
enseñar al analista información que no se obtiene del análisis formal.
Casi cualquier análisis formal requiere suposiciones que se desarrollan
a partir del modelo de datos. Las gráficas pueden resaltar la violación
de suposiciones que de otra forma no se notarían.
Histograma
Al dividir cada frecuencia de clase entre el número total de
observaciones, obtenemos la proporción del conjunto de
observaciones en cada una de las clases. Una tabla que lista
las frecuencias relativas se denomina distribución de frecuencias
relativas. En la tabla 1.7 se presenta la distribución de frecuencias
relativas para los datos de la tabla 1.4, que muestra los puntos medios
de cada intervalo de clase.
Se dice que una distribución es simétrica si se puede doblar a lo largo de
un eje vertical de manera que ambos lados coincidan. Si una distribución
carece de simetría respecto de un eje vertical, se dice que está sesgada.
Gráfica de caja y bigote o gráfica de caja
Encierra el rango intercuartil de los datos en una caja que contiene
la mediana representada. El rango intercuartil tiene como extremos el
percentil 75 (cuartil superior) y el percentil 25 (cuartil inferior). Además
de la caja se prolongan “bigotes”, que indican las observaciones
alejadas en la muestra. Para muestras razonablemente grandes la
presentación indica el centro de localización, la variabilidad y el grado
de asimetría.
Además, una variación denominada gráfica de caja puede ofrecer al
observador información respecto de cuáles observaciones son valores
extremos.
Ejemplo 1.5: Se midió el contenido de nicotina en una muestra
aleatoria de 40 cigarrillos. Los datos se presentan en la tabla 1.8.
Lección 2 número frecuencia
0,9 2
Realizar un 5,0 2
histograma de los 0,5 4
datos siguientes: 1,5 6
3,8 9
2,0 8
1,9 5
1,2 2
3,5 4
0,6 9
1,7 10