Beruflich Dokumente
Kultur Dokumente
Introducción
Las Variables aleatorias numéricas se pueden clasificar en dos grupos: Variables discretas y Variable
continuas. Las Variables discretas se caracterizan porque cada posible valor del espacio muestral es un
evento, mientras que un evento para las Variables continuas está definido a través de: Y+dy.
A pesar de que una variable sea continua, su manejo se efectúa por medio de variables discretas
debido al límite de resolución de los equipos usados para realizar las mediciones.
No en todos los casos los valores de la variable coinciden con los valores del espacio muestral
(conjunto de valores que puede tomar la variable), en algunas ocasiones la variable está definida como una
función de los valores del espacio muestral, en estos casos la función que define a la variable debe de quedar
claramente definida. Por ejemplo: El espacio muestra de arrojar un dado de 6 caras es S={1,2,3,4,5,6}. Una
posible variable aleatoria es: “cada uno de los posibles valores del número de marcas que tiene en cada cara
un dado”, en este caso los elementos del espacio muestra coinciden con los posibles valores de la variable
aleatoria.
Otra definición de variable aleatoria sobre el mismo espacio muestra es: Sea “0” el valor de la
variable aleatoria para los valores {2,4,6} del espacio muestral y sea “1” el valor de la variable aleatoria para
los valores {1,3,5} del espacio muestral.
Cuando se cuenta con un número considerable de datos (10, 15, 20, 100 ó más) que representan
valores de alguna variable (edad de una población, ingresos por familia, masa de un lote de objetos, longitud
de un lote de barras de acero, etc.), los cuales se han obtenido ya sea a través de alguna encuesta, como es el
caso de las variables de interés en la Ciencias Sociales, o realizando alguna medición, como es el caso de las
Ciencias Experimentales. No basta contar con una tabla que muestre a estos datos para poder obtener
información valiosa del proceso o fenómeno, se requiere hacer un análisis de los mismos, el cual se puede
iniciar con la construcción de un histograma de frecuencias o de un histograma de frecuencias relativas.
Tabla de frecuencia
Frecuencia Valor de la variable
1 17,821
1
1 17,90
2 17,95
2 18,02
2 18,09
4 18,10
2 18,15
1 18,20
1 18,25
1 18,30
2 18,37
1 18,40
Si se hiciese una gráfica de la frecuencia con la que aparece cada uno de los valores en el conjunto de
datos en función de los posibles valores de la variable, se obtiene una gráfica como la mostrada en la figura
1, en donde solamente se observan un conjunto de puntos aislados, es claro que una gráfica de estas
características no es de gran ayuda..
Histograma de Frecuencias.
Si ahora el intervalo en el que quedan comprendidos los valores, espacio muestral, que forman el
conjunto de datos es dividido en sub-intervalos, llamados clases y que tienen las siguientes características:
Figura 1
1
De acuerdo con la NORMA Oficial Mexicana NOM-008-SCFI-2002, Sistema General de Unidades de Medida, los decimales se
separan de los enteros a través de una coma (,).
2
a). Cada uno de los datos debe pertenecer a una y sólo una clase. Los intervalos que forman las clases
son cerrados por la izquierda y abiertos por la derecha ([x1, xfñ), excepto el último que es cerrado por
ambos lados.
b). Las clases deben tener igual longitud.
c). Es deseable que no haya clases con frecuencia cero
d). El número de clase depende del número de datos, una buena aproximación es que el número de clases
es igual a la raíz cuadrada del tamaño de la muestra.
Otra alternativa es hacer uso de la siguiente tabla.
Tamaño de la muestra número de clases
(número de datos)
menos de 10 4
de 10 a 20 5
de 20 a 45 6
de 45 a 90 7
de 90 a 180 8
de 180 a 360 9
de 360 a 720 10
más de 720 entre 10 y 20
Para determinar el tamaño de las clases, una vez que se ha determinado el número de clases, se aplica:
Xmáximo -Xmínimo
Tamaño de clase =
Número de clases (1)
Para facilitar la construcción del histograma y para que el tamaño de las clases sea igual, es
recomendable que el tamaño de cada clase se un múltiplo de la resolución del equipo que se está utilizando,
así por ejemplo si se miden longitudes con un vernier cuya resolución es de 0,05 mm, dependiendo del
número de datos, el tamaño de la clase puede ser 0,05 mm, 0,10 mm, 0,15 mm, etc. Pero no es recomendable
0,08 mm, 0,12mm.
Una vez determinado el número de clases, el tamaño de las clases y el intervalo de valores de cada
clase es posible construir una tabla de frecuencias y clases, donde la frecuencia (F) es el número de datos que
pertenece a cada clase. Si cada frecuencia se divide entre el número total de datos entonces se tiene una tabla
de una frecuencia relativas (f) y clases. Es posible construir ahora una gráfica de frecuencias en función de
clases con lo que se obtiene un histograma de frecuencia (fig. 2), mientras que si se gráfica frecuencia
relativa en función de intervalo se obtiene un histograma de frecuencias relativas (fig. 3).
3
18,40 17,82
tamaño de clase =
5
En el caso de tener un histograma de frecuencia si se considera la base de cada una de las barras es
igual a uno entonces, el área total de las barras que forman el histograma es el número total de datos.
Mientras que en el caso de un histograma de frecuencias relativas se tiene que el área total de las barras es
uno en este caso el área de cada barra es la probabilidad de ocurrencia de cada clase, es decir la probabilidad
de que al realizar una nueva medición el resultado de ésta pertenezca a una clase.
4
HISTOGRAMA DE FRECUENCIAS
FRECUENCIAS
4
0
17,85 17,95 18,05 18,15 18,25 18,35
VARIABLE
Figura 2
Figura 3
Probabilidad
Por ejemplo la probabilidad de que al escoger a una persona al. azar, ésta sea del sexo femenino es: el
Número de valores de la variable que hacen que el evento se cumpla es 1 (el valor de la variable es
femenino), el tamaño del espacio muestral es 2 (la variable sexo solamente toma el valor femenino y el valor
masculino). Entonces: PApr = ½.
¿Cuál es la probabilidad de que al arrojar un dado, legal, caiga un número par? El número de valores
de la variable que hacen que el evento se cumpla es 3 ( los números pares en un dado son 2, 4, 6), el tamaño
del espacio muestral es 6 (los posible valores que puede tomar la variable son: 1, 2, 3, 4, 5, 6), entonces la
probabilidad A priori es: PApr = 3/6; PApr = ½..
Para determinar la probabilidad A posteriori es necesario contar con un conjunto de resultados
experimentales, ya que:
Probabilidad A posteriori:
Así por ejemplo de los datos reportados en la tabla 1 ¿Cuál es la probabilidad de que la variable tome
el valor 18.1? El número de datos que satisfacen este evento (que la variable tome el valor 18.1) es 4, el
número de veces que se realizó el experimento es 20, entonces: PApo= 4/20 es decir PApos = 1/5.
La probabilidad del evento seguro es 1 (P(S)=1), mientras que la probabilidad del evento imposible es
cero (P(S)=0). Así por ejemplo la probabilidad de que al escoger a algún alumno el sexo de éste sea
masculino o femenino es 1. Mientras que la posibilidad de que la variable sexo tome el valor 20 (la variable
sexo sólo puede tomar los valores masculino y femenino) es cero.
- �x i
x= i=1
n
(4)
donde xi es cada uno de los valores y n es el número total de datos. Sí el conjunto de datos se encuentra
agrupado en clases el procedimiento es el siguiente:
F x
j=1
j j
x=
n
(5)
XI XF
XJ =
2
(6)
Para el caso de contar con frecuencias relativas el promedio de los datos se obtiene:
m
x=�fj x j
j=1
(7)
Vale la pena hacer notar que los promedios obtenidos con las ecuaciones 5 y 7 no coinciden
exactamente con el obtenido con la ecuación 4, con la que se obtiene el valor exacto del promedio, sin
embargo representan una buena aproximación.
7
17,82 17,90 17,95 17,95 18,02 18,02 18,09 18,09 18,10 18,10
x=
18,10 18,10 18,15 18,15 18,20 18,25 18,30 18,37 18,37 18,40
20
x = 18,12
de donde:
362,70
x=
20
y x = 18,1352
x x
2
i
s= i =1
n 1
(8)
Para el caso de tener los datos agrupados en clases se utiliza:
2
Es necesario hacer notar que el número de cifras significativas que se están informando es mayor que el adecuado, debería de
reportarse hasta las centésimas, esto se ha hecho con el fin de hacer notar la diferencia entre el resultado obtenido a través de la
expresión 2 y el obtenido por medio de la expresión 3, de hecho el valor que debería de informarse es 18.4, debido al redondeo. El
mismo comentario aplica para la desviación típica.
8
F x x
m
2
j j
j=1
s=
n 1
(9)
La situación en la que se cuenta con las frecuencias relativas permite calcular la desviación típica
como:
n f j x x j
m
2
j=1
s=
n 1
(10)
Aplicando la Expresión 8 al ejemplo estudiado se tiene:
(17,82 18,12) 2 (17,90 18,12) 2 (17,95 18,12) 2 (17,95 18,12)2 (18,02 18,12) 2
s=
(18,02 18,12)2 (18,09 18,12)2 (18,09 18,12)2 (18,10 18,12)2 (18,10 18,12)2
(18,10 18,12)2 (18,10 18,12)2 (18,15 18,12)2 (18,15 18,12)2 (18,20 18,12)2
(18,25 18,12) 2 (18,30 18,12) 2 (18,37 18,12) 2 (18,37 18,12) 2 (18,40 18,12) 2
20
0,0900 0,0484 0,0289 0,0289 0,0100 0,0100 0,0009 0,0009 0,0004 0,0004
s=
0,0004 0,0004 0,0009 0,0009 0,0064 0,0169 0,0324 0,0625 0,0625 0,0784
19
0,4805
s= 19
s= 0,025
s = 0,1590
Al aplicar la ecuación 9 se tiene que la desviación típica de los datos utilizados en el ejemplo es:
Clases
x=
x1* +x f Frecuencias x x
j
2
Fj x x j
2
2
17.8;17.9 17,85 1 ,0812 ,0812
17.9;18.0 17,95 3 ,0342 ,1026
18.0;18.1 18,05 4 ,0072 ,0288
18.1;18.2 18,15 6 ,0002 ,0012
18.2;18.3 18,25 2 ,0132 ,0264
[18.3;18.4 18,35 4 ,0462 ,1848
9
m ,4250
. F (x x
j =1
j j )2
de donde:
0,4250
s=
19
s= 0,0223
s = 0,1496
Es indispensable aclarar, que tanto la media como la desviación típica tienen las unidades de la
variable de los datos, en el ejemplo presentado este hecho se ha obviado, es decir la variable estudiada es
adimensional entonces la media y la desviación típica también lo son.. La moda, la mediana y la desviación
media tienen las mismas unidades de los datos de los que provienen; no así la varianza cuyas unidades son
las unidades de los datos elevadas al cuadrado.
Dentro de los parámetros de dispersión se tienen también a:
Desviación Media =
x i x
n 1
(11)
y la
x x
2
i
Varianza =
n 1
(12)
Existen dos parámetros más de tendencia central: la moda y la mediana. La moda se define como el
valor de mayor frecuencia dentro del conjunto de datos, en el caso de contar con un histograma la moda
corresponde a la clase con la barra más alta.
Al ordenar en forma ascendente los datos, el valor o valores que se encuentren a la mitad representan
la mediana; en caso de contar con un histograma, la clase o clases que se encuentran a la mitad del intervalo
de valores representan la mediana.
Para el caso del conjunto de datos estudiado se tiene que la moda y la mediana coinciden. El valor
18,10 aparece 4 veces y es el de mayor frecuencia, por lo tanto la moda es 18,10.
Al ordenar los datos en forma ascendente se tiene que el valor 18,10 ocupa el décimo y el undécimo
lugar por lo tanto la median avale 18,10.
17,82, 17,90, 17,95, 17,95, 18,02, 18,02, 18,09, 18,09, 18,10, 18,10, 18,10, 18,10, 18,15, 18,15, 18,02, 18,25, 18,30, 18,37, 18,37, 18,40.
10
MEDIANA
Para el caso de contar con los datos en un histograma se tiene:
11
Figura 5
Si se unen los puntos medio de los extremos superiores de las barras que forman el histograma de
frecuencias relativas, se obtiene un polígono irregular (figura 6) conocido como Polígono de Frecuencias; la
curva continua que se traza, de tal manera que pasa por la mayor parte de los vértices del Polígono de
Frecuencias, recibe el nombre de Curva de Distribución. La construcción de la Curva de Distribución de
algún experimento permite aplicar alguna de las Funciones de Distribución conocidas en el análisis de los
datos.
POLÍGONO DE FRECUENCIAS
0.3
0.25
FRECUENCIAS
RELATIVAS
0.2
0.15
0.1
0.05
0
17,85 17,95 18,05 18,15 18,25 18,35
VARIABLE
Figura 6
f(x)dx =1
1. f(x) está normalizada a la unidad .
2. La probabilidad de que x caiga entre dos valores reales a y b está dada por:
b
P(a x b) = a
f(x)dx
12
x
F(x) =
f(x)dx
donde la función F(x) se conoce como función de distribución de probabilidad o función integral de
distribución.
El valor de la media poblacional () de la función de densidad de probabilidad está dado por:
μ = xf(x)dx
(13)
Es necesario destacar que la media obtenida a través de la ecuación (13) es la media poblacional,
mientras que x es un estimador de esta media. Que tan buen estimador resulte x depende de que tan
representativa es la muestra de la población.
Algunas propiedades de la media poblacional, que también son validas para la media muestral
definida en la ecuación 2, son:
1.-Si c es una constante (magnitud no aleatoria)se cumple
c)= c
(14)
cx)= cx)
(15)
2.- Si la magnitud aleatoria x es la suma de n magnitudes independientes
x = x1 + x2 + . . . +xn
el valor medio de la variable x es igual a la suma de los valores medios de cada una de las n variables
aleatorias
x) = x1) + x2) + . . . +xn)
(16)
3.- Si la magnitud aleatoria y es una cierta función no lineal de n magnitudes aleatorias
independientes
y = f(x1,x2, . . ., xn)
que varía poco en intervalos pequeños de variación de los argumentos, para la media y) se cumple, en
forma aproximada que
y) = f(x1),x2), . . ., xn))
(17)
La varianza poblacional () se obtiene:
σ2 = (x μ)
2
f(x)dx
13
(18)
La varianza tiene las siguientes propiedades:
1.- Si c es un número constante entonces
c) = 0
(19)
cx) = c2x)
(20)
2.- La ley de adición de las varianzas: Si la magnitud aleatoria x es la suma de n magnitudes
independientes
x=x1 + x2 + . . . +xn
el valor de la varianza de la variable x es igual a la suma de los valores de las varianzas de cada una de las n
variables aleatorias
x) = x1) + x2) + . . . +xn)
(21)
vale la pena hacer notar que la ley de adición es valida para las varianzas (xno así para las desviaciones
típicas (x
Sea la función y = f(x1,x2), a pesar de que el desarrollo se hará para dos variables es válido para n
variables, al desarrollar en series de Taylor y Δy se llega a
y y = f ( x1 x1 , x 2 x 2 )
(22)
f f
y Δy = f(x1 , x 2 ) Δx 1 Δx 2 terminos de orden mayor
x 1 x 2
(23)
entonces
f f
Δy = Δx1 Δx 2 terminos de orden mayor
x1 x 2
(24)
Es necesario hacer notar que en particular, si el desarrollo se hace en torno del valor medio entonces
14
σ ( y) =
Δy 2
n
(25)
La n en el numerador se debe a que se está considerando la varianza poblacional. Sustituyendo el
valor de y se tiene
2
1 f f
σ ( y) =
2
Δx 1 Δx 2
n x 1 x 2
(26)
al desarrollar el cuadrado del binomio llega a
1 f 2
f
2
f f
σ 2 ( y) = Δx 1 2 Δx 2 2 2 Δx 1 Δx 2
n x 1 x 2 x 1 x 2
(27)
Distribuyendo la suma y n
f 2 Δx Δx f f Δx1 Δx 2
2 2 2
f
σ ( y) = 2
1 2
2
x 1 n x 2 n x 1 x 2 n
(28)
pero
x
2
i
= σ 2 (x i )
n
(29)
aplicando este resultado a la expresión
f 2 f f Δx1 Δx 2
2
f 2
σ ( y) =
2
σ 2 (x1 ) σ (x 2 ) 2
x 1 x 2 x 1 x 2 n
(30)
El comportamiento de Δx Δx 1 2
depende de la relación que hay entre las variables x 1 y x2.
Efectuando la suma
Δx Δx = Δx Δx Δx Δx
i =1
1 i 2 i 1 1 2 1 1 2 2 2 ... Δx 1 n Δx 2 n
(31)
15
y
X 2 = x 2 1 , x 2 2 ,... x 2 n
(32)
Y X = Y X cos
(33)
al sustituir en el doble producto de la expresión (30) se tiene
f f
2 x1 x 2 cos
x1 x 2
(34)
Tomando como origen los valores promedio ( x1 y x 2 ) se refieren los puntos (x1)i ,(x2)i dando lugar al
siguiente conjunto de puntos
X2 X1
x2 1 x2 x1 1 x1
x2 2 x2 x 1 2 x1
... ...
x2 k x2 x1 k x1
... ...
x2 n x2 x1 n x 1
Se construyen las rectas X1 = m2X2 y X2 = m1X1 que se cruzan en el origen del nuevo sistema de ejes
16
Se tiene tres posibles situaciones con las rectas:
17
El cosse obtiene del producto punto de los vectores X1 = (x1' )1 , (x1' ) 2 ,...(x1' ) n y
X1 X 2
cos =
X1 X 2
(35)
de donde
cos =
X X 1 2 i
X X
2 2
1 i 2 i
(36)
expresando x1' y x '2 en términos de (x1)i y (x2)i se llega a
cos =
�((x x )(x x ))
1 1 2 2 i
�(x x ) �( x x )
1
2
1 i 2
2
2 i
(37)
que se conoce como coeficiente de correlación lineal (r).
Si hay una correlación directa entre x1 y x2 entonces 1 r 0 .
Si x1 y x2 no están correlacionados entonces r=0..
Si x1 y x2 están correlacionados inversamente entonces 0 r 1
De lo anterior se tiene que la ecuación (25) se puede expresar como
f 2 f
2
2 f f
2 ( y ) = 2 ( x1 ) ( x 2 ) 2 ( x1 ) ( x 2 ) r
x
1 x 2 x1 x 2
(38)
el caso general en el que y = f(x1, x2, x3, . . . , x N) entonces la varianza de y (y)) es
N f
2
2 N 1 N
f f
2 ( y ) = ( xi ) 2
( xi ) ( x j ) rij
i =1 xi i =1 j =1 xi x j
(39)
18
Es necesario hacer notar que la ecuación (39) es la utilizada en la “GUÍA BIMP/ISO PARA LA
EXPRESIÓN DE LAS INCERTIDUMBRES EN LAS MEDICIONES” para determinar la incertidumbre
combinada.
Al obtener el valor promedio de la variable x se tiene
1
x= x1 x 2 x 3 ... x n
n
(40)
x x x x
x = 1 2 3 ... n
n n n n
(42)
introduciendo este resultado en la expresión 39
1
2
1
2
1
2
2 ( x ) = s 2 x1 s 2 x 2 ... s 2 x n
n n n
(43)
Se han sustituido las σ(xk ) por s(xk ) ; ya que solamente se cuenta con las desviaciones típicas de cada valor
individual de x. Ya que las varianzas s2(xk) son varianzas de la misma variable entonces cumplen
s x �s x �... �s x
2
1
2
2
2
n
(44)
de donde se obtiene que la varianza del promedio está dada por
s 2 x
2 x =
n
(45)
19