Estadistica

ESTADÍSTICA
Introducción
Las Variables aleatorias numéricas se pueden clasificar en dos grupos: Variables discretas y Variable
continuas. Las Variables discretas se caracterizan porque cada posible valor del espacio muestral es un
evento, mientras que un evento para las Variables continuas está definido a través de: Y+dy.
A pesar de que una variable sea continua, su manejo se efectúa por medio de variables discretas
debido al límite de resolución de los equipos usados para realizar las mediciones.
No en todos los casos los valores de la variable coinciden con los valores del espacio muestral
(conjunto de valores que puede tomar la variable), en algunas ocasiones la variable está definida como una
función de los valores del espacio muestral, en estos casos la función que define a la variable debe de quedar
claramente definida. Por ejemplo: El espacio muestra de arrojar un dado de 6 caras es S={1,2,3,4,5,6}. Una
posible variable aleatoria es: “cada uno de los posibles valores del número de marcas que tiene en cada cara
un dado”, en este caso los elementos del espacio muestra coinciden con los posibles valores de la variable
aleatoria.
Otra definición de variable aleatoria sobre el mismo espacio muestra es: Sea “0” el valor de la
variable aleatoria para los valores {2,4,6} del espacio muestral y sea “1” el valor de la variable aleatoria para
los valores {1,3,5} del espacio muestral.
Cuando se cuenta con un número considerable de datos (10, 15, 20, 100 ó más) que representan
valores de alguna variable (edad de una población, ingresos por familia, masa de un lote de objetos, longitud
de un lote de barras de acero, etc.), los cuales se han obtenido ya sea a través de alguna encuesta, como es el
caso de las variables de interés en la Ciencias Sociales, o realizando alguna medición, como es el caso de las
Ciencias Experimentales. No basta contar con una tabla que muestre a estos datos para poder obtener
información valiosa del proceso o fenómeno, se requiere hacer un análisis de los mismos, el cual se puede
iniciar con la construcción de un histograma de frecuencias o de un histograma de frecuencias relativas.
Tabla de frecuencia
Frecuencia Valor de la variable
1 17,821
1
1 17,90
2 17,95
2 18,02
2 18,09
4 18,10
2 18,15
1 18,20
1 18,25
1 18,30
2 18,37
1 18,40
Si se hiciese una gráfica de la frecuencia con la que aparece cada uno de los valores en el conjunto de
datos en función de los posibles valores de la variable, se obtiene una gráfica como la mostrada en la figura
1, en donde solamente se observan un conjunto de puntos aislados, es claro que una gráfica de estas
características no es de gran ayuda..
Histograma de Frecuencias.
Si ahora el intervalo en el que quedan comprendidos los valores, espacio muestral, que forman el
conjunto de datos es dividido en sub-intervalos, llamados clases y que tienen las siguientes características:
Figura 1
1
De acuerdo con la NORMA Oficial Mexicana NOM-008-SCFI-2002, Sistema General de Unidades de Medida, los decimales se
separan de los enteros a través de una coma (,).
2
a). Cada uno de los datos debe pertenecer a una y sólo una clase. Los intervalos que forman las clases
son cerrados por la izquierda y abiertos por la derecha ([x1, xfñ), excepto el último que es cerrado por
ambos lados.
b). Las clases deben tener igual longitud.
c). Es deseable que no haya clases con frecuencia cero
d). El número de clase depende del número de datos, una buena aproximación es que el número de clases
es igual a la raíz cuadrada del tamaño de la muestra.
Otra alternativa es hacer uso de la siguiente tabla.
Tamaño de la muestra número de clases
(número de datos)
menos de 10 4
de 10 a 20 5
de 20 a 45 6
de 45 a 90 7
de 90 a 180 8
de 180 a 360 9
de 360 a 720 10
más de 720 entre 10 y 20
Para determinar el tamaño de las clases, una vez que se ha determinado el número de clases, se aplica:
Xmáximo -Xmínimo
Tamaño de clase =
Número de clases (1)
Para facilitar la construcción del histograma y para que el tamaño de las clases sea igual, es
recomendable que el tamaño de cada clase se un múltiplo de la resolución del equipo que se está utilizando,
así por ejemplo si se miden longitudes con un vernier cuya resolución es de 0,05 mm, dependiendo del
número de datos, el tamaño de la clase puede ser 0,05 mm, 0,10 mm, 0,15 mm, etc. Pero no es recomendable
0,08 mm, 0,12mm.
Una vez determinado el número de clases, el tamaño de las clases y el intervalo de valores de cada
clase es posible construir una tabla de frecuencias y clases, donde la frecuencia (F) es el número de datos que
pertenece a cada clase. Si cada frecuencia se divide entre el número total de datos entonces se tiene una tabla
de una frecuencia relativas (f) y clases. Es posible construir ahora una gráfica de frecuencias en función de
clases con lo que se obtiene un histograma de frecuencia (fig. 2), mientras que si se gráfica frecuencia
relativa en función de intervalo se obtiene un histograma de frecuencias relativas (fig. 3).
Aplicando al ejemplo numérico se tiene:
3
18,40  17,82
tamaño de clase =
5
tamaño de clase = 0,116
con el fin de que el tamaño de clase no imponga complicaciones se puede hacer:
tamaño de clase = 0,10
y entonces la tabla de clases y frecuencias queda como:
Tabla de Clases y Frecuencias

Clases Frecuencias
17,80; 17,90 1
17,90; 18,00 3
18,00; 18,10 4
18,10; 18, 20 6
18,20; 18,30 2
[18,30; 18,40 4
En el caso de tener un histograma de frecuencia si se considera la base de cada una de las barras es
igual a uno entonces, el área total de las barras que forman el histograma es el número total de datos.
Mientras que en el caso de un histograma de frecuencias relativas se tiene que el área total de las barras es
uno en este caso el área de cada barra es la probabilidad de ocurrencia de cada clase, es decir la probabilidad
de que al realizar una nueva medición el resultado de ésta pertenezca a una clase.
4
HISTOGRAMA DE FRECUENCIAS
FRECUENCIAS
4
0
17,85 17,95 18,05 18,15 18,25 18,35
VARIABLE
Figura 2
Figura 3
Probabilidad
Es posible definir de dos formas la probabilidad de un evento, la probabilidad A priori y la

probabilidad A posteriori.
En el primer caso basta con saber el número de valores del espacio muestral que forman el evento estudiado
y el tamaño del espacio muestral:
Probabilidad A priori:
5
Número de valores de la variable que cumplen la condición impuesta
PApr =
Tamaño del espacio muestral
(2)
Por ejemplo la probabilidad de que al escoger a una persona al. azar, ésta sea del sexo femenino es: el
Número de valores de la variable que hacen que el evento se cumpla es 1 (el valor de la variable es
femenino), el tamaño del espacio muestral es 2 (la variable sexo solamente toma el valor femenino y el valor
masculino). Entonces: PApr = ½.
¿Cuál es la probabilidad de que al arrojar un dado, legal, caiga un número par? El número de valores
de la variable que hacen que el evento se cumpla es 3 ( los números pares en un dado son 2, 4, 6), el tamaño
del espacio muestral es 6 (los posible valores que puede tomar la variable son: 1, 2, 3, 4, 5, 6), entonces la
probabilidad A priori es: PApr = 3/6; PApr = ½..
Para determinar la probabilidad A posteriori es necesario contar con un conjunto de resultados
experimentales, ya que:
Probabilidad A posteriori:
Número de datos en el que se cumplió la condición

PApos =
(PApos) = Número de veces que se realizó el experimento
(3)
Así por ejemplo de los datos reportados en la tabla 1 ¿Cuál es la probabilidad de que la variable tome
el valor 18.1? El número de datos que satisfacen este evento (que la variable tome el valor 18.1) es 4, el
número de veces que se realizó el experimento es 20, entonces: PApo= 4/20 es decir PApos = 1/5.
La probabilidad del evento seguro es 1 (P(S)=1), mientras que la probabilidad del evento imposible es
cero (P(S)=0). Así por ejemplo la probabilidad de que al escoger a algún alumno el sexo de éste sea
masculino o femenino es 1. Mientras que la posibilidad de que la variable sexo tome el valor 20 (la variable
sexo sólo puede tomar los valores masculino y femenino) es cero.
Parámetros de Tendencia Central y de Dispersión.

Sin proporcionar una información cuantitativa el histograma da cierta idea del comportamiento del
conjunto de datos estudiado. Así por ejemplo, si existe un solo máximo o sí hay más de uno, con lo que se
puede tener una idea del valor más representativo del conjunto de datos. También es posible ver qué tan
dispersos se encuentran los datos respecto al centro del histograma y si en éste es donde se localiza el
máximo.
Existen dos parámetros básicos (en realidad son estimadores de los parámetros ya que el conjunto de
datos estudiado sólo representa una muestra del universo total de datos) que permiten cuantificar las
6
características globales del conjunto de datos analizado. El primero de ellos es el promedio o media
aritmética o simplemente media ( x ), que pertenece al grupo de parámetros de tendencia central y que se
calcula de la siguiente manera:
- �x i
x= i=1
n
(4)
donde xi es cada uno de los valores y n es el número total de datos. Sí el conjunto de datos se encuentra
agrupado en clases el procedimiento es el siguiente:
F x
j=1
j j
x=
n
(5)
donde m es el número total de clases, F j la frecuencia de la j-esima clase y x j el valor representativo de la j-

esima clase, el cual, si no existe algún valor preferencial se obtiene al promediar los extremos de la clase.
XI  XF
XJ =
2
(6)
Para el caso de contar con frecuencias relativas el promedio de los datos se obtiene:
m
x=�fj x j
j=1
(7)
Vale la pena hacer notar que los promedios obtenidos con las ecuaciones 5 y 7 no coinciden
exactamente con el obtenido con la ecuación 4, con la que se obtiene el valor exacto del promedio, sin
embargo representan una buena aproximación.
Aplicando la ecuación 4 al conjunto de datos del ejemplo se tiene:
7
17,82  17,90  17,95  17,95  18,02  18,02  18,09  18,09  18,10  18,10 
x=
18,10  18,10  18,15  18,15  18,20  18,25  18,30  18,37  18,37  18,40
20
x = 18,12
Mientras que al aplicar la expresión 7, se llaga a:
Clases x1* +x f Frecuencias Fj x j

x=
2
17.8;17.9 17,85 1 17,85
17.9;18.0 17,95 3 53,85
18.0;18.1 18,05 4 72,20
18.1;18.2 18,15 6 108,90
18.2;18.3 18,25 2 36,50
[18.3;18.4 18,35 4 73,40
m 362,70
. F
j =1
jxj
de donde:
362,70
x=
20
y x = 18,1352
El segundo parámetro que permite caracterizar un conjunto de datos es la desviación típica y

pertenece a los parámetros de medida de dispersión, la desviación típica se calcula como:
x  x 
2
i
s= i =1
n 1
(8)
Para el caso de tener los datos agrupados en clases se utiliza:
2
Es necesario hacer notar que el número de cifras significativas que se están informando es mayor que el adecuado, debería de
reportarse hasta las centésimas, esto se ha hecho con el fin de hacer notar la diferencia entre el resultado obtenido a través de la
expresión 2 y el obtenido por medio de la expresión 3, de hecho el valor que debería de informarse es 18.4, debido al redondeo. El
mismo comentario aplica para la desviación típica.
8
 F x  x 
m
2
j j
j=1
s=
n 1
(9)
La situación en la que se cuenta con las frecuencias relativas permite calcular la desviación típica
como:
n f j  x  x j 
m
2
j=1
s=
n 1
(10)
Aplicando la Expresión 8 al ejemplo estudiado se tiene:
(17,82  18,12) 2  (17,90  18,12) 2  (17,95  18,12) 2  (17,95  18,12)2  (18,02  18,12) 2 
s=
(18,02  18,12)2  (18,09  18,12)2  (18,09  18,12)2  (18,10  18,12)2  (18,10  18,12)2 
(18,10  18,12)2  (18,10  18,12)2  (18,15  18,12)2  (18,15  18,12)2  (18,20  18,12)2 
(18,25  18,12) 2  (18,30  18,12) 2  (18,37  18,12) 2  (18,37  18,12) 2  (18,40  18,12) 2
20
0,0900  0,0484  0,0289  0,0289  0,0100  0,0100  0,0009  0,0009  0,0004  0,0004 
s=
0,0004  0,0004  0,0009  0,0009  0,0064  0,0169  0,0324  0,0625  0,0625  0,0784
19
0,4805
s= 19
s= 0,025
s = 0,1590
Al aplicar la ecuación 9 se tiene que la desviación típica de los datos utilizados en el ejemplo es:
Clases
x=
x1* +x f Frecuencias x  x 
j
2
Fj  x  x j 
2
2
17.8;17.9 17,85 1 ,0812 ,0812
17.9;18.0 17,95 3 ,0342 ,1026
18.0;18.1 18,05 4 ,0072 ,0288
18.1;18.2 18,15 6 ,0002 ,0012
18.2;18.3 18,25 2 ,0132 ,0264
[18.3;18.4 18,35 4 ,0462 ,1848
9
m ,4250
.  F (x  x
j =1
j j )2
de donde:
0,4250
s=
19
s= 0,0223
s = 0,1496
Es indispensable aclarar, que tanto la media como la desviación típica tienen las unidades de la
variable de los datos, en el ejemplo presentado este hecho se ha obviado, es decir la variable estudiada es
adimensional entonces la media y la desviación típica también lo son.. La moda, la mediana y la desviación
media tienen las mismas unidades de los datos de los que provienen; no así la varianza cuyas unidades son
las unidades de los datos elevadas al cuadrado.
Dentro de los parámetros de dispersión se tienen también a:
Desviación Media =
x i x
n 1
(11)
y la
x  x
2
i
Varianza =
n 1
(12)
Existen dos parámetros más de tendencia central: la moda y la mediana. La moda se define como el
valor de mayor frecuencia dentro del conjunto de datos, en el caso de contar con un histograma la moda
corresponde a la clase con la barra más alta.
Al ordenar en forma ascendente los datos, el valor o valores que se encuentren a la mitad representan
la mediana; en caso de contar con un histograma, la clase o clases que se encuentran a la mitad del intervalo
de valores representan la mediana.
Para el caso del conjunto de datos estudiado se tiene que la moda y la mediana coinciden. El valor
18,10 aparece 4 veces y es el de mayor frecuencia, por lo tanto la moda es 18,10.
Al ordenar los datos en forma ascendente se tiene que el valor 18,10 ocupa el décimo y el undécimo
lugar por lo tanto la median avale 18,10.
17,82, 17,90, 17,95, 17,95, 18,02, 18,02, 18,09, 18,09, 18,10, 18,10, 18,10, 18,10, 18,15, 18,15, 18,02, 18,25, 18,30, 18,37, 18,37, 18,40.
10
MEDIANA
Para el caso de contar con los datos en un histograma se tiene:
MEDIA, MODA, MEDIANA

Figura 4.
18.10;18.20
es decir la media, la moda y la mediana están en la clase .
Vale la pena mencionar que cuando se tiene un histograma simétrico respecto a un valor máximo
central los valores de los tres parámetros de tendencia central coinciden, esto mismo pasa cuando la función
de distribución de probabilidades es simétrica respecto al máximo. En la figura 5 se muestra la localización
de los parámetros de tendencia central (moda, mediana y media) en una función de distribución de
probabilidad.
11
Figura 5
Si se unen los puntos medio de los extremos superiores de las barras que forman el histograma de
frecuencias relativas, se obtiene un polígono irregular (figura 6) conocido como Polígono de Frecuencias; la
curva continua que se traza, de tal manera que pasa por la mayor parte de los vértices del Polígono de
Frecuencias, recibe el nombre de Curva de Distribución. La construcción de la Curva de Distribución de
algún experimento permite aplicar alguna de las Funciones de Distribución conocidas en el análisis de los
datos.
POLÍGONO DE FRECUENCIAS
0.3
0.25
FRECUENCIAS
RELATIVAS
0.2
0.15
0.1
0.05
0
17,85 17,95 18,05 18,15 18,25 18,35
VARIABLE
Figura 6
Si se aumenta el número de mediciones o de encuestas realizadas, se incrementaría el número de

datos, con lo cual, sí el espacio muestral no cambia, el número de clases aumenta mientras su ancho
disminuye con lo que se obtiene un Polígono de Frecuencias "más suave". Si este proceso se continúa hasta
contar con un número infinito de datos, el Polígono de Frecuencias deja de ser una curva quebrada y se
convierte en una Curva de Distribución. La función que genera a la Curva de Distribución se conoce como
función de densidad de probabilidad (f(x)) y cumple con las siguientes propiedades:
1. f(x) es una función unívaluada y positiva para todos los valores x   .


 f(x)dx =1
1. f(x) está normalizada a la unidad  .
2. La probabilidad de que x caiga entre dos valores reales a y b está dada por:
b
P(a  x  b) = a
f(x)dx
y la probabilidad de que se obtenga un valor  x está dada por:
12
x
F(x) = 
f(x)dx
donde la función F(x) se conoce como función de distribución de probabilidad o función integral de
distribución.
El valor de la media poblacional () de la función de densidad de probabilidad está dado por:

μ =  xf(x)dx

(13)
Es necesario destacar que la media obtenida a través de la ecuación (13) es la media poblacional,
mientras que x es un estimador de esta media. Que tan buen estimador resulte x depende de que tan
representativa es la muestra de la población.
Algunas propiedades de la media poblacional, que también son validas para la media muestral
definida en la ecuación 2, son:
1.-Si c es una constante (magnitud no aleatoria)se cumple
c)= c
(14)
cx)= cx)
(15)
2.- Si la magnitud aleatoria x es la suma de n magnitudes independientes
x = x1 + x2 + . . . +xn
el valor medio de la variable x es igual a la suma de los valores medios de cada una de las n variables
aleatorias
x) = x1) + x2) + . . . +xn)
(16)
3.- Si la magnitud aleatoria y es una cierta función no lineal de n magnitudes aleatorias
independientes
y = f(x1,x2, . . ., xn)
que varía poco en intervalos pequeños de variación de los argumentos, para la media y) se cumple, en
forma aproximada que
y) = f(x1),x2), . . ., xn))
(17)
La varianza poblacional () se obtiene:
σ2 =  (x  μ)
2
f(x)dx
13
(18)
La varianza tiene las siguientes propiedades:
1.- Si c es un número constante entonces
c) = 0
(19)
cx) = c2x)
(20)
2.- La ley de adición de las varianzas: Si la magnitud aleatoria x es la suma de n magnitudes
independientes
x=x1 + x2 + . . . +xn
el valor de la varianza de la variable x es igual a la suma de los valores de las varianzas de cada una de las n
variables aleatorias
x) = x1) + x2) + . . . +xn)
(21)
vale la pena hacer notar que la ley de adición es valida para las varianzas (xno así para las desviaciones
típicas (x
Relación Entre la Desviación Típica Poblacional y Muestral.
Sea la función y = f(x1,x2), a pesar de que el desarrollo se hará para dos variables es válido para n
variables, al desarrollar en series de Taylor y  Δy se llega a
y  y = f ( x1  x1 , x 2  x 2 )
(22)
f f
y  Δy = f(x1 , x 2 )  Δx 1  Δx 2  terminos de orden mayor
x 1 x 2
(23)
entonces
f f
Δy = Δx1  Δx 2  terminos de orden mayor
x1 x 2
(24)
Es necesario hacer notar que en particular, si el desarrollo se hace en torno del valor medio entonces
Δy = y  y , Δx 1 = x 1  x 1 y Δx 2 = x 2  x 2 ya que y = f( x 1 , x 2 ) , de donde la varianza de y está dada por
14
σ ( y) =
  Δy  2
n
(25)
La n en el numerador se debe a que se está considerando la varianza poblacional. Sustituyendo el
valor de y se tiene
2
1  f   f  
σ ( y) =  
2
 Δx 1     Δx 2  
n  x 1   x 2  
(26)
al desarrollar el cuadrado del binomio llega a
1  f  2
 f 
2
 f  f  
σ 2 ( y) =     Δx 1  2     Δx 2  2  2   Δx 1  Δx 2  
n  x 1   x 2   x 1  x 2  
(27)
Distribuyendo la suma y n
 f  2   Δx    Δx   f  f    Δx1  Δx 2  
2 2 2
 f 
σ ( y) =       2  
1 2
2

 x 1  n  x 2  n  x 1  x 2  n 
(28)
pero
  x 
2
i
= σ 2 (x i )
n
(29)
aplicando este resultado a la expresión
 f  2  f  f    Δx1  Δx 2  
2
 f  2
σ ( y) = 
2
 σ 2 (x1 )    σ (x 2 )  2   
 x 1   x 2   x 1  x 2  n 
(30)
El comportamiento de   Δx  Δx  1 2
depende de la relación que hay entre las variables x 1 y x2.
Efectuando la suma
  Δx   Δx  =  Δx   Δx    Δx   Δx 
i =1
1 i 2 i 1 1 2 1 1 2 2 2  ... Δx 1  n  Δx 2  n
(31)
El término  Δx1  k  Δx 2  k es un sumando del producto punto de los vectores

 ΔX  =  Δx  ,  Δx  ,... Δx  
1 1 1 1 2 1 n
15
y
 X 2  =  x 2  1 ,  x 2  2 ,... x 2  n 
(32)
Recordando que el producto punto de dos vectores está dado por
Y  X = Y X cos 
(33)
al sustituir en el doble producto de la expresión (30) se tiene
 f  f 
2    x1   x 2  cos 
 x1  x 2 
(34)
Para determinar el cos se grafica x1 en función de x2. Se determina el valor promedio x1 y x 2 .
Tomando como origen los valores promedio ( x1 y x 2 ) se refieren los puntos (x1)i ,(x2)i dando lugar al
siguiente conjunto de puntos
X2 X1
 x2  1  x2  x1  1  x1
 x2  2  x2  x 1  2  x1
... ...
 x2  k  x2  x1  k  x1
... ...
 x2  n  x2  x1  n  x 1
Se construyen las rectas X1 = m2X2 y X2 = m1X1 que se cruzan en el origen del nuevo sistema de ejes
coordenados, el punto ( x1 , x 2 ) del sistema de ejes original.
16
Se tiene tres posibles situaciones con las rectas:
Figura 7.- Caso en el que 0    90 y entonces el cosse encuentra entre 0,1
Figura 8.- Caso en el que  = 90 y el cos=
Figura 9.- Caso en el que 90    180 y el cos se encuentra entre  1,0
17
El cosse obtiene del producto punto de los vectores X1 = (x1' )1 , (x1' ) 2 ,...(x1' ) n y
X1 = (x '2 )1 , (x '2 ) 2 ,...(x '2 ) n , entonces
X1  X 2
cos  =
X1 X 2
(35)
de donde
cos =
 X X  1 2 i
 X   X 
2 2
1 i 2 i
(36)
   
expresando x1' y x '2 en términos de (x1)i y (x2)i se llega a
cos  =
�((x  x )(x  x ))
1 1 2 2 i
�(x  x ) �( x  x )
1
2
1 i 2
2
2 i
(37)
que se conoce como coeficiente de correlación lineal (r).
Si hay una correlación directa entre x1 y x2 entonces 1  r  0 .
Si x1 y x2 no están correlacionados entonces r=0..
Si x1 y x2 están correlacionados inversamente entonces 0  r  1
De lo anterior se tiene que la ecuación (25) se puede expresar como
 f  2  f
2
 2  f  f  
 2 ( y ) =    2 ( x1 )     ( x 2 )  2   ( x1 ) ( x 2 ) r 
x
 1   x 2   x1  x 2  
(38)
el caso general en el que y = f(x1, x2, x3, . . . , x N) entonces la varianza de y (y)) es
N  f
2
 2 N 1 N
 f  f  
 2 ( y ) =     ( xi )  2    

 ( xi ) ( x j ) rij 

 i =1  xi  i =1 j =1  xi  x j  
(39)
18
Es necesario hacer notar que la ecuación (39) es la utilizada en la “GUÍA BIMP/ISO PARA LA
EXPRESIÓN DE LAS INCERTIDUMBRES EN LAS MEDICIONES” para determinar la incertidumbre
combinada.
Al obtener el valor promedio de la variable x se tiene
1
x=  x1  x 2  x 3  ...  x n 
n
(40)
x x x x 
x =  1  2  3  ...  n 
n n n n 
de donde las derivadas parciales son:

f 1
=
x k n
(42)
introduciendo este resultado en la expresión 39

 1 
2
1
2
1
2


 2 ( x ) =   s 2  x1     s 2  x 2   ...    s 2  x n  

 n   n   n  

(43)
Se han sustituido las σ(xk ) por s(xk ) ; ya que solamente se cuenta con las desviaciones típicas de cada valor
individual de x. Ya que las varianzas s2(xk) son varianzas de la misma variable entonces cumplen
 s  x  �s  x  �... �s  x  
2
1
2
2
2
n
(44)
de donde se obtiene que la varianza del promedio está dada por
s 2  x
 2  x =
n
(45)
La expresión (45) multiplicada por el factor de corrección t es la desviación poblacional de un conjunto

de datos y que debería de ser el método para determinar la incertidumbre tipo A, pero de acuerdo con la
norma NMX-CH-140-IMNC-2002 “Guía para expresión de incertidumbre en las mediciones” la
incertidumbre tipo A es igual a:
s ( x)
u A ( x) =
n
19

Estadistica

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Estadistica

Hochgeladen von

Copyright:

Verfügbare Formate

ESTADÍSTICA

Aplicando al ejemplo numérico se tiene:

tamaño de clase = 0,116

con el fin de que el tamaño de clase no imponga complicaciones se puede hacer:

tamaño de clase = 0,10

y entonces la tabla de clases y frecuencias queda como:

Tabla de Clases y Frecuencias

Es posible definir de dos formas la probabilidad de un evento, la probabilidad A priori y la

Número de datos en el que se cumplió la condición

Parámetros de Tendencia Central y de Dispersión.

donde m es el número total de clases, F j la frecuencia de la j-esima clase y x j el valor representativo de la j-

Aplicando la ecuación 4 al conjunto de datos del ejemplo se tiene:

Mientras que al aplicar la expresión 7, se llaga a:

Clases x1* +x f Frecuencias Fj x j

El segundo parámetro que permite caracterizar un conjunto de datos es la desviación típica y

MEDIA, MODA, MEDIANA

Si se aumenta el número de mediciones o de encuestas realizadas, se incrementaría el número de

1. f(x) es una función unívaluada y positiva para todos los valores x   .

y la probabilidad de que se obtenga un valor  x está dada por:

Relación Entre la Desviación Típica Poblacional y Muestral.

Δy = y  y , Δx 1 = x 1  x 1 y Δx 2 = x 2  x 2 ya que y = f( x 1 , x 2 ) , de donde la varianza de y está dada por

El término  Δx1  k  Δx 2  k es un sumando del producto punto de los vectores

Recordando que el producto punto de dos vectores está dado por

Para determinar el cos se grafica x1 en función de x2. Se determina el valor promedio x1 y x 2 .

coordenados, el punto ( x1 , x 2 ) del sistema de ejes original.

Figura 7.- Caso en el que 0    90 y entonces el cosse encuentra entre 0,1

Figura 8.- Caso en el que  = 90 y el cos=

Figura 9.- Caso en el que 90    180 y el cos se encuentra entre  1,0

X1 = (x '2 )1 , (x '2 ) 2 ,...(x '2 ) n , entonces

de donde las derivadas parciales son:

La expresión (45) multiplicada por el factor de corrección t es la desviación poblacional de un conjunto

Das könnte Ihnen auch gefallen