Beruflich Dokumente
Kultur Dokumente
LCC
Probabilidad
el tratamiento de datos
Equipo:
1.-Tratamiento de datos 3
2.¿Qué es la estadística? 3
Conceptos 4
Ejemplo: Velocidades del viento 4
Ejemplo: Velocidades del viento 2.0 5
5. Regla empírica 12
1. Tratamiento de datos
El tratamiento de datos realiza el tratamiento estadístico de todos los datos
seleccionados, que consiste en afirmaciones estadísticas de los datos. Sin embargo,
en la vida real el análisis no puede quedar reducido a una operación contable de
obtención de promedios, medias e índices, etc. Hay que analizarlos, interpretarlos y
darles sentido.
2. ¿Qué es la estadística?
Conceptos
Promedio de velocidades del viento (en millas por hora) para 45 ciudades de
Estados Unidos.
vientos = [8.9, 7.1, 9.1, 8.8, 10.2, 12.4, 11.8, 10.9, 12.7, 10.3,
8.6, 10.7, 10.3, 8.4, 7.7, 11.3, 7.6, 9.6, 7.8, 10.6, 9.2, 9.1, 7.8, 5.7, 8.3,
8.8, 9.2, 11.5, 10.5, 8.8, 35.1, 8.2, 9.3, 10.5, 9.5, 6.2, 9.0, 7.9, 9.6, 8.8,
7.0, 8.7, 8.8, 8.9, 9.4]
Para obtener el límite (L) con el que vamos a trabajar, se debe encontrar el valor
más pequeño y el más grande y dividirlo entre el número de intervalos deseados.
35.1 − 5.7
L= = 4.9
6
Histograma
12.7 − 5.7
L=
6
5 11.6 13 12.3 3 3 / 44 44 / 44
Histograma
Definiciones
Media muestral/aritmética (x
̅)
La media de una muestra de n medidas X1, X2, … , Xn está dada por
𝑋1 + 𝑋2 + . . . + 𝑋𝑛 ∑𝑛𝑖= 1 𝑋𝑖
x̅ = =
𝑛 𝑛
Mediana
En un conjunto de datos ordenados en forma creciente la mediana es el dato que se
encuentra en la posición de enmedio cuando el número de datos es impar y es el
promedio de los datos centrales cuando el número de datos es par.
Moda ( 𝑥̂ )
Es el dato que se repite con mayor frecuencia.
Varianza
La varianza de una muestra de mediciones 𝑋1 + 𝑋2 , . . . , 𝑋𝑛 denotada por 𝑠 2 se
define por:
2 ∑𝑛
𝑖 = 1 (𝑋𝑖 − 𝑋 )
2
𝑠 = 𝑛−1
Desviación estándar ( s )
La desviación estándar de una muestra de mediciones, es la raíz cuadrada positiva
de la varianza.
Cuando se trabaja con datos que han sido agrupados en una distribución de
frecuencias, no se sabe con certeza los valores individuales de cada dato. Por lo
que se utilizan métodos alternos para aproximar los valores de las medidas
descriptivas.
∑𝑐𝑖 = 1 𝑓𝑖 ∗ 𝑚𝑖
x̅ =
𝑛
donde
c : número de clases (o intervalos)
𝑓𝑖 : frecuencia absoluta de la clase i
𝑚𝑖 : marca de la clase i
n : número total de clases
donde
𝐿𝑖 : límite inferior del intervalo de la mediana
n : tamaño de la muestra
𝐹𝑖 − 1: Frecuencia absoluta acumulada del intervalo anterior, al intervalo de la
mediana
𝑓𝑖 : frecuencia absoluta simple del intervalo de la mediana
a : amplitud del intervalo de la mediana. Se le resta al limite superior el limite inferior
del intervalo de la mediana.
∑ 𝑐 2 2
𝑖 = 1 𝑓𝑖 ∗ (𝑚𝑖 ) − 𝑛 ( x̅ )
𝑠2 =
𝑛 − 1
donde
𝑥 : media agrupada
c : número de clases (o intervalos)
𝑓𝑖 : frecuencia absoluta de la clase i
𝑚𝑖 : marca de la clase i
n : número total de clases
Marca de 𝑓𝑖
la clase
6.4 4
7.85 9
9.3 18
10.8 10
12.3 3
5. Regla empírica
Muchas distribuciones de datos de la vida real tienen forma de montículo; esto es,
se pueden aproximar por medio de una distribución de frecuencia en forma de
campana conocida como curva normal. Los datos que poseen distribuciones en
forma de montículo tienen características definidas de variación.
Regla empírica
Para una distribución de mediciones que sea aproximadamente normal (forma de
campana), se deduce que el intervalo con puntos extremos
Ejemplo
Suponga que se sabe que las calificaciones de un examen de preparatoria en un
estado tienen, aproximadamente, una distribución normal con media de μ = 64 y
desviación estándar 𝝈 = 10. Entonces se puede deducir que aproximadamente 68%
de las calificaciones están entre 54 y 74, que aproximadamente 95% de las
calificaciones están entre 44 y 84 y que casi todas las calificaciones están entre 34 y
94. Así, el conocimiento de la media y la desviación estándar nos da una imagen
más o menos buena de la distribución de frecuencia de las calificaciones.