Beruflich Dokumente
Kultur Dokumente
ESTADÍSTICA
La recopilación y el análisis de datos son fundamentales en la ciencia e ingeniería. Al
analizar los datos recopilados en experimentos, los científicos descubren los principios que
gobiernan el mundo físico y los ingenieros aprenden cómo diseñar nuevos productos y
procesos importantes. Una dificultad muy importante que se presenta con los datos
científicos es que éstos se encuentran sujetos a variaciones aleatorias o incertidumbre. Es
decir, cuando se repiten las mediciones científicas cada vez salen un poco diferentes. Lo
anterior plantea un problema: ¿cómo se pueden obtener conclusiones de los resultados
de un experimento cuando éstos pueden ser diferentes? Para analizar esta pregunta, es
esencial contar con cierto conocimiento estadístico.
La estadística descriptiva está formada por procedimientos empleados para resumir y
describir las características importantes de un conjunto de mediciones. La estadística
inferencial está formada por procedimientos empleados para hacer inferencias acerca de
características poblacionales, a partir de información contenida en una muestra sacada de
esta población.
Iniciaremos este curso con el desarrollo de la estadística descriptiva haciendo uso del
software SPSS.
ESTADÍSTICA DESCRIPTIVA
La Estadística descriptiva es una rama de la estadística que se ocupa de describir
conjuntos de mediciones, tanto muestras como poblaciones. Una vez que se haya
recolectado un conjunto de mediciones, ¿cómo puede mostrar este conjunto en una
forma clara, entendible y fácil de leer?
En esta parte aprenderemos a trabajar con los datos y a resumirlos, de manera gráfica y
numérica, para convertirlos en información útil para el problema en estudio.
La estadística descriptiva trata dos aspectos: el obtener información de los datos ta mbién
conocido como “análisis exploratorio de datos” y por otro lado se preocupa de la
"presentación de resultados".
Primero definamos algunos términos del lenguaje estadístico.
Variable
Definición: Una variable es una característica que cambia o varía con el tiempo y/o
para diferentes personas u objetos bajo ciertas consideraciones.
Por ejemplo, la temperatura del aceite que se encuentra en un motor es una variable que
cambia con el tiempo; también varía de un motor en otro.
1
Prof. V. Contreras T ESTADISTICA FIME
Unidad experimental
Una unidad experimental es el individuo u objeto en el que se mide una variable. Resulta
una sola medición o datos cuando una variable se mide en realidad en una unidad
experimental.
Si se genera una medición para toda unidad experimental en toda la colección, el conjunto
de datos resultante constituye la población de interés. Cualquier conjunto más pequeño
de mediciones es una muestra.
Población
Una población es el conjunto de mediciones de interés para el investigador.
Muestra
Una muestra es un subconjunto de mediciones seleccionado de la población de interés.
Por ejemplo si entre todos los alumnos de la FIME se selecciona un conjunto de cinco
Estudiantes y las mediciones se introducen en una hoja de cálculo, podemos identificar
diversas variables La unidad experimental en la que se miden las variables es un alumno
de la FIME en particular. Se miden cinco variables para cada estudiante: promedio de
calificaciones (PC), género, ciclo de estudios, número de curso en la que está matriculado
y denominación de los cursos. Cada una de estas características varía de un estudiante a
otro. Si consideramos los PC de todos los estudiantes de la FIME como la población de
interés, las cinco PC representan una muestra de esta población.
Si se hubiera medido la PC de cada estudiante de la FIME, hubiéramos generado toda la
población de mediciones para esta variable.
Tipos de Variables
Variables cualitativas son aquellas que clasifican las unidades en categorías. Las
categorías pueden tener un orden natural (ordinales) o no (nominales). Las variables
cualitativas también se llaman variables categóricas. Con estas variables podemos contar
número de casos, comparar entre categorías, pero no podemos realizar operaciones
numéricas.
Ejemplo
Nominal: está asociada a nombres.
Ejemplo: Marca de auto, Sexo, Religión.
Variables cuantitativas tienen valores numéricos que representan medidas (largo, peso,
etc.) o frecuencias (número de). Tiene sentido realizar operaciones numéricas con estas variables.
Además distinguimos dentro de las variables cuantitativas las discretas y las continuas.
2
Prof. V. Contreras T ESTADISTICA FIME
Una variable discreta es aquella en la cual se puede contar el número posible de valores.
Ejemplo:
Como parte de un estudio para conocer la aceptación de la nueva mega tienda “Vendo”
ubicada en la ciudad de Mayaguez, se eligió una muestra de 35 clientes para conocer sus
impresiones. Los resultados son los siguientes:
3
Prof. V. Contreras T ESTADISTICA FIME
4
Prof. V. Contreras T ESTADISTICA FIME
DISTRIBUCION DE FRECUENCIAS
Una vez que conocemos la distribución de la variable, nos interesa presentarla de alguna
manera gráfica, uno de los gráficos o diagramas más usados en variables cualitativas son
los diagramas sectoriales o de torta y los gráficos de barra.
5
Prof. V. Contreras T ESTADISTICA FIME
6
Prof. V. Contreras T ESTADISTICA FIME
7
Prof. V. Contreras T ESTADISTICA FIME
8
Prof. V. Contreras T ESTADISTICA FIME
Formas de distribuciones
Los términos usados para describir la forma de una distribución son:
Simétrica: La distribución puede ser dividida en dos partes alrededor de un valor
central y cada parte es el reflejo de la otra.
Sesgada: Un lado de la distribución se alarga más que el otro. La dirección del
sesgo es la dirección del lado más largo.
Unimodal: La distribución tiene un único máximo que muestra el o los valores más
comunes en los datos.
Bimodal: La distribución tiene dos máximos. Esto resulta a menudo cuando la
muestra proviene de dos poblaciones.
Uniforme: Los valores posibles tienen la misma frecuencia
9
Prof. V. Contreras T ESTADISTICA FIME
10
Prof. V. Contreras T ESTADISTICA FIME
Usando el SPSS se tiene el diagrama de Tallos y Hojas para los datos de gastos
semanales de la tienda VENDO
Gastos semanales Stem-and-Leaf Plot
2.00 0 . 33
5.00 0 . 45555
11.00 0 . 66666777777
5.00 0 . 88899
9.00 1 . 000001111
2.00 1 . 23
1.00 1 . 4
Diagrama de dispersión
Recuento
Razón de visita
oferta permanente guardería tarjeta de crédito parking amplio Aire acondicionado Total
Forma de pago Efectivo 5 2 2 3 3 15
Crédito 3 3 6 7 1 20
Total 8 5 8 10 4 35
11
Prof. V. Contreras T ESTADISTICA FIME
x i
X i 1
n
Para Datos Agrupados
k
f i Xi
X i 1
n
donde
f i : frecuencia de la clase k-ésima.
X i : Marca de clase en el k-ésimo intervalo.
EJEMPLO
Durante los últimos 32 días el valor de las compras en periódicos fue:
5.2 10.2 7.0 7.1 10.2 8.3 9.4 9.2 6.5 7.1 6.6 7.8 6.8
7.1 8.4 9.6 8.5 5.7 6.4 10.1 8.2 9.0 7.8 8.2 5.3 6.2
9.1 8.6 7.0 7.7 8.3 7.5
Halle el gasto promedio en periódicos.
Solución
12
Prof. V. Contreras T ESTADISTICA FIME
2. LA MEDIANA
Es el valor que ocupa la posición central de un conjunto de observaciones ordenadas. El
50% de las observaciones son mayores que este valor y el otro 50% son menores.
𝑛
𝑖 = El menor intervalo 𝑖 tal que se cumpla 𝐹𝑖 ≥ 2
13
Prof. V. Contreras T ESTADISTICA FIME
3. LA MODA
Es el valor, clase o categoría que ocurre con mayor frecuencia y sus características son:
- Puede no existir o existir más de una moda
- Su valor no se ve afectado por los valores extremos en los datos
- Se utiliza para analizar tanto la información cualitativa como la cuantitativa
- Es una medida “inestable” cuando en número de datos es reducido.
Por ejemplo, durante los últimos 32 días el valor de las compras en periódicos fue:
{ 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1,
8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 }
Moda = Mo = 7.1; Es el valor más frecuente, ocurre 3 veces.
14
Prof. V. Contreras T ESTADISTICA FIME
4. MEDIA GEOMÉTRICA
Corresponde al valor representativo central de observaciones secuenciales y
estrechamente relacionadas entre sí tales como tasas de: interés, inflación, devaluación,
variación, crecimiento, disminución. El promedio geométrico de los valores
es:
15
Prof. V. Contreras T ESTADISTICA FIME
5. PROMEDIO PONDERADO
fi
Donde los valores Wi se denominan “Ponderaciones o pesos”
n
6. PROMEDIO TOTAL
16
Prof. V. Contreras T ESTADISTICA FIME
7. MEDIA ARMÓNICA5
El promedio armónico de los valores: (X1 X2 ..... Xn ) donde ninguno toma el valor “cero”
es:
Este promedio se utiliza para que los valores “extremos” no afecten al valor del promedio.
Los valores extremos sí afectan cuando se usa el promedio aritmético o el promedio
geométrico.
17
Prof. V. Contreras T ESTADISTICA FIME
Cuartiles: Son 3 valores Q1; Q2 y Q3 que dividen a los datos en 4 partes iguales
Deciles: Son 9 valores D1, D2; D3; D4; D5; D6; D7; D8 y D9 que dividen a un conjunto de
datos en 10 partes iguales.
El Decil 7(Percentil 70%) se ubicará en el cuarto inte
18
Prof. V. Contreras T ESTADISTICA FIME
El lugar o posición donde se encuentran los cuartiles para n datos ordenados es:
19
Prof. V. Contreras T ESTADISTICA FIME
B. MEDIDAS DE VARIABILIDAD
1. AMPLITUD O RANGO
Sean los valores: (x1 x2 x3 ... xn ). La amplitud o rango de estos dato es A=(Xmax-Xmin)
2. VARIANCIA
Para Datos No Agrupados
20
Prof. V. Contreras T ESTADISTICA FIME
3. DESVIACIÓN ESTÁNDAR
Es una medida de variabilidad que corresponde a la raíz cuadrada de la variancia. Este
indicador tiene la misma unidad de medida en la que se expresa el promedio.
4. COEFICIENTE DE VARIABILIDAD
Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se
compara la desviación estándar con el respectivo valor del promedio de los datos:
Evalúa el grado de distorsión o inclinación que adopta la distribución de los datos respecto
a su valor promedio tomado como centro de gravedad. El coeficiente de asimetría de
Pearson es:
21
Prof. V. Contreras T ESTADISTICA FIME
GRAFICA DE CAJAS
22
Prof. V. Contreras T ESTADISTICA FIME
Del ejemplo, valores de compras en periódicos en los últimos 32 días del Hotel AAA
{ 5.2, 10.2, 7.0, 7.1, 10.6, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1,
8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 }
Se tiene la grafica de cajas:
23
Prof. V. Contreras T ESTADISTICA FIME
24
Prof. V. Contreras T ESTADISTICA FIME
25