Beruflich Dokumente
Kultur Dokumente
MEDIA MUESTRAL
Supongamos que x1, x2, x3,..., Xn son las observaciones numricas de una muestra; entonces,
la medida ms usual de su tendencia central es proporcionada por la media (o promedio)
muestra, que es igual a la media aritmtica de todos los datos:
Es decir, la media muestral se obtiene sumando todos los datos y el resultado de la suma se
divide entre el nmero de datos (n).
MEDIANA O PERCENTIL 50
Otra medida de tendencia central de un conjunto de datos es la mediana X (barra), que es igual
al valor que divide a la mitad a los datos cuando son ordenados de menor a mayor. As, para
calcular la mediana cuando el nmero de datos es impar, estos se ordenan de manera
creciente y el que quede en medio de dicho ordenamiento ser la mediana. Pero si el nmero
de datos es par, entonces la mediana se calcula dividiendo entre dos la suma de los nmeros
que estn en el centro del ordenamiento.
MODA
Otra forma de medir la tendencia central de un conjunto de datos es mediante la moda, que es
igual al dato que se repite ms veces. Si varios datos tienen la frecuencia ms grande,
entonces cada uno de ellos es una moda, y se dice que el conjunto de datos es multimodal.
RANGO
Medicin de la variabilidad de un conjunto de datos que es resultado de la diferencia entre el
dato mayor y el dato menor de la muestra.
CUANTILES (PERCENTILES)
Los cuantiles son medidas de localizacin que dividen un conjunto de datos ordenados en
cierto nmero de grupos o partes que contienen la misma cantidad de datos. Por ejemplo, si los
datos ordenados se dividen en tres partes, entonces a los correspondientes cuantiles se les
conoce como terciles; pero si se divide en cuatro grupos tendremos los cuartiles; en cinco
sern los quintiles; si la divisin es en 10 partes tendremos los deciles y, por ltimo, si la
divisin se hace en 100 grupos se tendran los percentiles. De esta manera, los cuantiles de una
distribucin o de un conjunto de datos son medidas de localizacin relativa, que ayudan a
complementar la descripcin de la distribucin de una caracterstica de calidad. De manera
ms formal, sea x1, x2, ..., Xn un conjunto de n mediciones ordenadas en forma creciente, se
define su percentil p como el valor x tal que el p% de las mediciones es menor o igual a x, y el
(100 p)% mayor o igual.
A manera de ejemplo, a continuacin se muestran varios percentiles para los datos del grosor
de los discos:
1.0% = 1.11
5.0% = 1.125
10.0% = 1.135
25.0% = 1.17
50.0% = 1.19
75.0% = 1.21
90.0% = 1.23
95.0% = 1.23
99.0% = 1.25
Se ve que el primer decil o percentil 10 es igual a 1.135, eso quiere decir que 10% de las
mediciones de la tabla 2.1 son menores o iguales que 1.135. El decil cinco o percentil 50 que
corresponde a la mediana es igual a 1.19. Mientras que el percentil 95 es igual a 1.23, lo cual
indica que 95% de las mediciones son menores o iguales que 1.23.
CUARTILES
Como vimos antes, al percentil 25 tambin se le conoce como primer cuartil o cuartil inferior, Ci;
mientras que la mediana que es el percentil 50 corresponde al cuartil medio Cm; y el percentil
75 es el cuartil superior, Cs o tercer cuartil. El clculo de estos estadsticos se realiza mediante
cualquier software moderno de estadstica o incluso con hojas de clculo. En el caso de los
datos del grosor de los discos Ci = 1.17, Cm = 1.19 y Cs = 1.21. De aqu que 25% de los datos
sea menor o igual que 1.17.
MEDIDAS DE FORMA
SESGO
Como ya se dijo en la seccin anterior, un aspecto relevante en el anlisis de un conjunto de
datos o una variable es estudiar la forma de su distribucin. Por ello, en esta seccin se
complementa la informacin de la seccin anterior y se presentan las mediciones del sesgo
Estas parten del hecho de que el tipo de distribucin que se da con mayor frecuencia es la
forma de campana, con caractersticas similares a la distribucin normal.
Es frecuente que cuando la distribucin no es de este tipo, sea la seal de un hecho importante
que est ocurriendo en el proceso y que tiene un efecto negativo en la calidad.
Una medida numrica del sesgo o asimetra en la distribucin de un conjunto de datos se
obtiene a travs del sesgo y del sesgo estandarizado (skewness), los cuales estn dados por:
DIAGRAMA DE CORRELACIN-DISPERSIN
Es una herramienta grfica que permite demostrar la relacin existente entre dos clases de
datos y cuantificar la intensidad de dicha relacin. Se utiliza para conocer si efectivamente
existe una correlacin entre dos magnitudes o parmetros de un problema y, en caso positivo,
de qu tipo es la correlacin.
La secuencia a seguir para realizar un diagrama de dispersin es:
1. Recoger y ordenar los datos que se cree que tienen una posible correlacin. Los datos son
recogidos en una tabla, indicando el nmero de muestras y los valores de las caractersticas
que se quiere investigar. Es conveniente que el nmero de mediciones sea de al menos 30.
2. Representar grficamente los datos:
-Dibujar, en un diagrama cartesiano, los ejes vertical y horizontal de la misma longitud.
Observar los valores mximo y mnimo delos grupos de datos, para escoger la escala de
representacin adecuada a los mismos y evitar as errores de interpretacin.
-Representar en el diagrama mediante puntos cada par de datos, reflejando los valores de la
clase de datos que se considera dependiente (causa) sobre el eje horizontal X y los valores de
la clase de datos que se considera independiente (efecto) sobre el eje vertical Y.
-Si dos o ms pares de datos caen en el mismo punto, dibujar crculos concntricos alrededor
del punto individualizado.
3. Una vez construido el diagrama se analiza la forma que tiene la nube de puntos obtenida,
para as determinar las relaciones entre los dos tipos de datos. Este anlisis puede efectuarse
por tcnicas estadsticas que permitan determinar si existe o no relacin, y el grado de
existencia en su caso. Las herramientas utilizadas son: La recta de regresin y el coeficiente de
correlacin lineal.
3. RECTA DE REGRESIN
La recta de regresin es la lnea que mejor representa a un conjunto de puntos. La funcin que
aproxima la recta es:
COEFICIENTE DE CORRELACIN
.
El coeficiente de correlacin lineal r, viene determinado por la expresin:
Toma valores comprendidos entre 1 y 1. Cuanto ms prximo a 0 sea r menor ser la relacin
entre los datos, y cuanto ms prximo a 1 (en valor absoluto) mayor ser dicha relacin. Su
signo indica si se da una relacin positiva o negativa entre las variables x e y.