Beruflich Dokumente
Kultur Dokumente
1.1 QU ES ESTADSTICA?
1.3.1 Entidad
Cada uno de los elementos de un grupo o conjunto que se va a someter a estudio
estadstico
1.3.2 Variable
1
CAPTULO 1. Conceptos generales de probabilidad
Continua
Variable
Cuantitativa
VARIABLE Discreta
ALEATORIA Variable
Cualitativa o
Categorica
Se dice que una variable es cuantitativa siempre que los valores queson el resultado de
medidas numericas.Ejemplo de variable cuantitativa son la densidad, el peso,la
viscocida, la temperatura, etc.
Cuando los valores numericos que pueden tomar una variable son numeros
enteros, la variable se denomina discreta. Por ejemplo, si la variable es la
edad cumplida en aos de una persona, esta solo puede tomar los valores de
1,2,3,, 120 (si la expectativa de voda es 120 aos)
2
CAPTULO 1. Conceptos generales de probabilidad
hay muchas cosas en que no es posible hacer medidas numericas. Por ejemplo,
la variable color puede recibir los valores cualitativas de rojo, verde, amarillo,
etc. Una variable cuyos valores consiste en categorias de clacificacion se
denomina variable cualitativa.
1.3.4 Muestra
Para la realizacion de un estudio estadistico se deben seguir ciertas etapas entre las
cuales las mas importantes son:
I. Plantamiento o formulacion del problema
II. Formulacion de objetos
III. Definicion de la entidad a estudiar o investigar
IV. Formulacion de hipotesisi
V. Metodo de investigacion (total o parcial)
VI. Recoleccion de datos
VII. Generalizacion o inferencia final
VIII. Presentacion del informe y publicacion
3
CAPTULO 1. Conceptos generales de probabilidad
VARIABLES
X = peso en gramos
gm
Y = densidad ( cm3 )
Z = color
ENTIDAD
(producto determinado)
1.5 Redondeo
Redondear una medida numerica es aproximada siempre que se reguistren, en este
texto,resultados finales o intermedios se tendran las suiguientes reglas:
digito a retener n m
m n
<5 se deja igual
=5 es par se deja igual
impar se le suma la 1
m ultimo digito a retener >5 se le suma la unidad
EJEMPLO
4
CAPTULO 1. Conceptos generales de probabilidad
175.78 7 175.79
175.78 3 175.78
175.78 5 175.78
175.77 5 175.78
1.6DISTRIBUCIONES DE FRECUANCIA
Una distribucion de frecuancia o tabla de frecuancia es una disposicin tabular
de datos; los datos se distribuyen por clases o caregorias con sus
correspondientes frecuancias. Primero se divide el rango de los datos en clases,
si es posible, las clases deben tener el mismo ancho con la finalidad de mejorar
la informacion visnal en la distribucion de frecuancias. Para la solucion del
numero de clases debe emplearse cierto creterio de modo que pueda
desarrollarse un diagrama razonable. El minimo de clases depende del numero
de observacones y de la dispersion de los datos. En general, una distribucion de
ferecuancias que emplea muy pocas clases o demaciadas clases no contiene
mucha informacion, por lo general el minimo de clases debe fluctuar entre 5 y
10 clases.
El numero de clases se puede obtener mediante cualquiera de las formulas siguinetes:
M =1+3.322 log 10 n
M = n
n = tamao de muetra
M = numero de clases
5
CAPTULO 1. Conceptos generales de probabilidad
El limete inferior de la primera clase debe ser menor o igual que el dato menor
C X min
(LI 1 ) y el limete superior de la ultima debe cumplir la condicion
X max
LSCn .
C : ancho de la clase
aprox : aproximacion de los datos
LICi +lSCi
Marca de clase=
2
La marca de clase es el punto medio de la clase, los datos que se encasillan en una
clase determinada, para efectos practicos miden su marca de clase.
R= X max X min
R= rango
6
CAPTULO 1. Conceptos generales de probabilidad
LS Cn X max
VII. debe enplearse que , con el fin de que ningun dato se
queda fuera de la tabulacion.
VIII. Establecer los datos examinado cada uno de ellos con el fin de conocer
en que categoria debe colocarse.
El formato general de la tabla de conteo es:
LI C 2LS C3
.
.
.
LI C nLS C n+1
EJEMPLO
A continuacion se desarrollara una tabla de conteo para un analisis de la
resistencia a la tension, en libras por pulgada cuadrada (Psi), de uan muestra de
tamao 80 (n=80) de una nueva aleacion de aluminio y litio, que esta siendo
evaluada como posible material para la fabricacion de elementos estructurales de
aeronaves
Resistencia a la tencion (Psi) de aleacion aluminio-litio
7
CAPTULO 1. Conceptos generales de probabilidad
1 221 105
2 174 97
3 245 110
4 208 115
5 207 123
6 229 76
7 218 101
8 199 142
9 237 87
10 201 118
Despues se busca el mayor dato de los mayores datos por filas y este sera el mayor dato
(245); igual se hace con el menor por filas (76).
X max =245
X min =76
R=24576
R=169
8
CAPTULO 1. Conceptos generales de probabilidad
R
C=
M
169
C=
7.32
C=23.
LS C1 =LI C1 + ( Caprox )
LS C1 =76+(231)
LS C1 =98
LI C 2=76+C
LI C 2=76+23
LI C 2=99
LS C2 =98+C
LS C2 =98+23
9
CAPTULO 1. Conceptos generales de probabilidad
LS C2 =121
10
CAPTULO 1. Conceptos generales de probabilidad
La suma de las reas de los rectngulos del histograma es igual al rea total limitada por
el polgono de frecuencia y el eje X.
mi=mi1+C
mi1=clase anterior
C=tamao de la clase
0 Tabla 1-4
1 2 3 4 5 6 7 8 9 10
Figura 1-1
11
CAPTULO 1. Conceptos generales de probabilidad
La representacin grfica de la
tabla 1-5, es un histograma y
polgono de frecuencias relativas.
Figura 1-2
30
25
20
15
10
0
1 2 3 4 5 6 7 8 9 10
12
CAPTULO 1. Conceptos generales de probabilidad
Un grfico que recoja las frecuencias acumuladas por debajo de cualquiera de los
formatos de clase superiores respecto de dicha frontera (lmite superior de clase) se
llama un polgono de frecuencia acumulada u ojiva; se acostumbra a iniciar la
grfica con el lmite superior de una clase que tiene frecuencia acumulada cero; si
existiera la clase que 53-75; no existen probetas con resistencias menos o iguales a 75
Psi. Por lo tanto la frecuencia acumulada es cero, para 75 Psi.
13
CAPTULO 1. Conceptos generales de probabilidad
90
80
70
60
50
40
30
20
10
0
75 98 121 144 167 190 213 236 259
Figura 1-3
45
100 =56.25 .
80
14
CAPTULO 1. Conceptos generales de probabilidad
190 81.25
213 92.50
236 97.50
259 100.00 Tabla 1-7
120
100
80
60
40
20
0
75 98 121 144 167 190 213 236 259
Figura 1-4
1.8.1 Media
15
CAPTULO 1. Conceptos generales de probabilidad
x 1 , x 2 , x 3,, x n
Si las observaciones de una muestra de tamao n son ,
entonces la media muestral es:
x + x + x ++ x n
X = 1 2 3
n
n
xi
X = i=1
n
EJEMPLO 2
Kgf
Encontrar la media muestral de la resistencia a la tensin (en cm 2 ) de 10
Observaciones:
16.85, 16.40, 17.21, 16.35, 16.52, 17.04, 16.96, 17.15, 16.59, 16.57.
X =media
167.64
X =
10
Kgf
X =16.764 2
cm
El valor de la medida, X , es mas proceso que la precisin asociado con cada
observacin, por esto se acostumbra calcular la media con un digito ms que los
utilizados en cada medicin de la muestra.
Si ordenamos las medidas de menor a mayor magnitud, y los ubicamos como
puntos es un eje horizontal x calibrado, en este mismo eje determinamos el valor
Datos ordenados:
16.35
16.40
16
CAPTULO 1. Conceptos generales de probabilidad
16.52
16.57
16.59
16.85
16.96
17.04
17.15
17.21
Notndose en la figura 1-4 que la media muestral X =16.764, puede considerarse
como un punto de equilibrio.
Esto significa, que si cada observacin individual representa, por ejemplo, una libra de
masa colocndolo en esos puntos del eje horizontal, un punto de apoyo localizado en
X equilibrara todo el sistema de pesos.
Para los datos de resistencia de la aleacin de aluminio litio de la tabla 1-2, la media
muestral es:
13013
X =
80
lb
X =162.7 2
pul
Si se examina el histograma de la figura 1-1, se observa que la media muestral 162.7 Psi
es un valor tpico de la resistencia a la tensin, ya que este se presenta en la parte
media de los datos, donde se concentran las observaciones.
Una desventaja de la media como medida de tensin central es que puede ser influida
muy frecuentemente por un solo valor extremo y dar una idea distorsionada de los
datos; para entender lo anterior, supongamos que las observaciones de muestra de
tamao 7 (n=7) son las siguientes:
1, 3, 4, 2, 7, 2450, 8
17
CAPTULO 1. Conceptos generales de probabilidad
X =353.57
En este caso, es evidente que la media muestral no dice mucho con respecto a la
tendencia central de la mayor parte de los datos.
Cuando se agrupan la media ( X ) se coloca la mediante la siguiente frmula:
mi f i
X = i=1
n
Tambin es posible pensar en el clculo de la media para todas las observaciones de una
poblacin, este promedio se conoce como media poblacional y se simboliza con la letra
griega (miu). Cuando existe un mnimo finito de observaciones (N) la media es:
N
xi
= i=1
N
1.8.2 Mediana
18
CAPTULO 1. Conceptos generales de probabilidad
x 1 , x 2 , x 3,, x n
Sean los valores de una muestra acumulada en orden creciente
x1 x2
de magnitud; esto es es la segunda observacin ms pequea, es la
xn
segunda observacin,, es la observacin ms grande. Entonces, la
~ n+1
mediana X se define como el elemento que este en la posicin si
2
Una ventaja de la mediana es que los valores extremos no tienen mucha de influencia
sobre ella.
EJEMPLO 3
1, 3, 4, 2, 7, 6 y 8
La media ser
1 2 3 4 6 7 8
x1 x2 x3 x4 x5 x6 x7
19
CAPTULO 1. Conceptos generales de probabilidad
X n +1 =X 7 +1 =X 8 = X 4
2 2 2
~
X=mediana=X 4=4.0
La media muestral es 4.43, mientras que la mediana muestral es 4.00; ambas cantidades
proporcionan una medida razonable de la tendencia central de los datos. Ahora
supngase que en los datos originales se cambia el 6 por 2450, al ordenarlos quedara
as
1 2 3 4 7 8 2450
x1 x2 x3 x4 x5 x6 x7
~
La mediana sigue igual X = 4.00, para estos datos la media es
La media muestral X
=353.57 no dice mucho con respecto a la tendencia central de
~
datos, la mediana sigue siendo X =4.00, y esta es una medida de tendencia mas
significativa para la mayor parte de la observaciones.
EJEMPLO 3.
0 91 92 93 94 95 95 96 97 98
x1 x2 x3 x4 x5 x6 x7 x8 x9 x 10
n =10 (par)
X =X 10 =X 5 =94
2
X n =X 10 = X 6=95
+1 +1
2 2
La mediana es:
20
CAPTULO 1. Conceptos generales de probabilidad
~ x + x 94 +95
X= 5 6 = =94.5
2 2
La media es:
Si usted fuera profesor de esta clase que medida de tendencia central prefiriera
informar como el comportamiento general de la clase: la mediana 94.5 o la media 88.1?
1.8.3 La Moda
La moda es la observacin que se presenta con mayor frecuencia en la muestra; un
grupo de datos puede no tener ninguna moda o tener ms de una.
Esto no ocurre con la media y la mediana, medidas que para un conjunto de datos,
siempre existen y son nicas. La moda no es una medida muy utilizada.
EJEMPLO 4
Muestra # 1.
3, 6, 9, 3, 5, 8, 3, 10, 4, 6, 3, 1
Muestra # 2.
3, 6, 9, 3, 5, 8, 3, 10, 4, 6, 3, 1, 6, 2, 5, 6
Solucin:
Se procede a ordenar la
1, 3, 3, 3, 3, 4, 5, 6, 6, 8, 9, 10.
^
X =3.0
El dato que ms se repite es el 3, ocurre cuatro veces, por lo tanto la moda es
21
CAPTULO 1. Conceptos generales de probabilidad
1, 2, 3, 3, 3, 3, 4, 5, 5, 6, 6, 6, 6, 9, 8 10
Para esta muestra, las modas son 3 y 6, ya que ambos valores se presentan el mismo
nmero de veces, cuatro y ninguno otro lo hace con mayor frecuencia. En este caso se
dice que los datos son bimodales .
Tanto la mediana como la moda se puede calcular para datos agrupados las formulas son
las siguientes:
n
^
X =MEDIANA=LI R MEDIANA +
2 i
f
f MEDIANA(C )
Dnde:
n=tamao de clase
1
^
X =MODA LIR MODAL= ( 1 + 2 )
C
Dnde:
EJEMPLO 5.
22
CAPTULO 1. Conceptos generales de probabilidad
Encontrar:
Solucin:
a.
n
mi f i
^
X = i=1
n
^ 75014
X= =937.675
80
b.
23
CAPTULO 1. Conceptos generales de probabilidad
n 80
= =40
2 2
^ ( 4020 )
X =144.5+ 23=162.90
25
c.
15
^
X =144.5+ ( 15+5 ) 23=161.75
EJEMPLO 6
24
CAPTULO 1. Conceptos generales de probabilidad
Solucin:
n
q =LI R +
( 4
f )
c
i 3
fq 1
122121
LI R3= =121.5
2
f =3+7=10
f q =10
Por lo tanto, 1
y C = 23
Entonces:
25
CAPTULO 1. Conceptos generales de probabilidad
80
q =121.5+
( 4
10 )
23
1
10
q1 =144.5
3
n
b. Se busca la clase donde se ubique los 4 de los datos.
3n
=3 ( 20 )=60
4
( 3+7+10+25+ 15 )=6
168167
LI R3= =167.5
2
3n
q =LI R +
( 4
f )
c
3 5
fq 3
(6045 )
q3 =167.5+ 23=184.75
20
p50=?
26
CAPTULO 1. Conceptos generales de probabilidad
50 n
100
f
p50=Li R 4 + C
f p50
4020
p50=144.5+ .23=162 g
25
145+ 144
Li R4 = =144.5
2
d.
p80=?
6045
p80=167.5+ .23=189.35
20
168+167
Li R S= =167.5
2
27
CAPTULO 1. Conceptos generales de probabilidad
1.9.1Rango
Una de las medidas ms sencillas de variabilidad es el rango de la muestra, y se define
como la diferencia entre la observacin grande y la pequea. La forma ms comn es:
R= X maxX min
Donde
La facilidad de clculo del rango de una muestra es evidente, sin embargo ste ignora
toda la informacin que hay en la muestra entre la observacin ms grande y la ms
pequea. Por ejemplo, si tenemos las siguientes muestras:
n = 5 (tamao de la muestra)
Las dos muestras tienen el mismo valor de rango, sin embargo, en la segunda muestra
solo existe variabilidad en los valores extremos, a diferencia que en la primera muestra
R1
el cambio se nota en los tres intermedios (esto no lo capta el )
Los valores extremos no son tan pequeos al aparecer en las muestras pequeas y s en
las muestras grandes, en consecuencia, muestras pequeas tienden a tener rangos
pequeos y los grandes rangos grandes.
28
CAPTULO 1. Conceptos generales de probabilidad
En general, lo que se desea es tener una medida de variabilidad que depende de todas
las observaciones y no de una pequea parte, como ocurre con el rango.
1.9.2Varianza
Las limitaciones del rango se pretenden evitar con otras medidas de
variabilidad conocidas como varianza y desviacin estndar.
La varianza se puede calcular para la muestra o para toda la poblacin, cuando esta es
infinita y est formada por N variables, las frmulas adecuadas son:
n n n
( x ix )2 n x i2 ( xi ) 2
2 i=1 i=1 i =1
S= =
n1 n ( n1 )
xi
N
2
i=1
N
N x i2
i =1
N
( x i )2
2= i=1 =
N
( mix )2
S 2= i=1 f i varianza muestral para datosagrupados
n1
29
CAPTULO 1. Conceptos generales de probabilidad
fi
k
mi2 2
i =1
k
n mi2 f i
i=1
S2 =
( mi )2
2= i=1 f i varianza poblacinal para datos agrupados
N
fi
k
mi 2
i=1
k
N mi2 f i
i=1
2=
Las unidades de medicin de la varianza son iguales al cuadrado de las unidades con
que se mide la variable. De esta manera, si X se mide en lbs, las unidades de S2 y 2 ,
2
ser lbs la desviacin estndar tiene la ventaja de medirse en las unidades
originales de la variable de inters, X
EJEMPLO 7
30
CAPTULO 1. Conceptos generales de probabilidad
Xi # de piezas mi2 f i mi f i
1 30 30 30
2 40 160 80
3 30 270 90
Totales 100 460 200
Xi # de piezas mi2 f i mi f i
0 20 0 0
1 10 10 10
2 30 120 60
3 30 270 90
4 10 160 40
Totales 100 560 200
Solucin:
mi f i 1 ( 30 ) +2 ( 40 )+3 (3)
A= i=1 = =2.0 cm
N 100
fi
k
mi 2
i=1
k
2
N mi f i
i=1
2A=
2
100 (560 )( 200)
2B= 2
=1.6 cm 2
100
31
CAPTULO 1. Conceptos generales de probabilidad
Para las dos mquinas las piezas tienen un promedio 2.0 cm de diferencia por debajo
con respecto al patrn o prototipo, pero la mquina B exhibe una mayor variabilidad.
1.9.3Coeficiente De Variacin
En ocasiones es deseable expresar la variacin como una funcin de la media.
Para hacer esto se utiliza una medida adimensional de la variacin relativa,
denominada coeficiente de variacin muestral.
S
CV = o CV =
X u
EJEMPLO 8:
Con un micrmetro, se realizan mediciones del dimetro de un tornillo, que tiene una
media 4.03 mm y una desviacin estndar de 0.012 mm; con otro micrmetro se toman
mediciones de la longitud del tornillo, la media de la longitud es de 1.76 pulgadas y una
desviacin estndar de 0.0075 pulgadas.
0.012 mm
CVd= =0.0030
4.03 mm
0.0075 pulg
CVi= =0.0043
1.76 pulg
CVd <CVi
0.0030<0.0043
32
CAPTULO 1. Conceptos generales de probabilidad
Media=Mediana=Moda
X =~
X= ^
X
Pero si la distribucin unidimensional tiene una cola ms larga hacia uno de los lados,
se dice que es asimtrica a deforme. Si la deformacin o alargamiento de la cola se
presenta hacia valores ms grandes de la variable, es decir, hacia la derecha se dir
Simtrica
~
Asimtrica positiva Asimtricanegativa X = X= ^
X^ X~ X~
X X X ^ X
33
CAPTULO 1. Conceptos generales de probabilidad
1.9.4.1Sesgo
Se conoce como sesgo al grado de asimetra de una distribucin, es decir cunto se
aparta de la simetra.
m3 ( X i X ) mi ( X i X )
As= 3
m3= i=1 m3= i=1
S n n
A =0
La curva normal es el referente terico y no tiene sesgo ( s ) ; entonces el sesgo de
una distribucin puede ser:
A s = = 0 simtrica
1.9.4.2 Apuntamiento
Es tambin conocido como curtosis y permite establecer el grado de apuntamiento o
A p=3
achatamiento de la curva o polgono de frecuencia; la curva normal tiene ; la
frmula es:
A p=apuntamiento
n k
4 4
( X i X ) f i ( X i X )
m4= i=1 m4= i=1
n n
m4
A p=
S4
>3
A p= = 3
34
CAPTULO 1. Conceptos generales de probabilidad
<3
105798.87
m 3= =1313.46 m4=349018638.02
80
m3 1313.46
S 2=1213.27 S=34.83 sesgo= 3
= =0.03
S ( 34.83 )3
m4 349018638.02
curtosis= 4
=
S ( 34.83 )4
35
CAPTULO 1. Conceptos generales de probabilidad
36