Beruflich Dokumente
Kultur Dokumente
NACIONAL AGRARIA LA
MOLINA
FACULTAD DE INGENIERIA EN
INDUSTRIAS ALIMENTARIAS
REVISIN DE LOS
FUNDAMENTOS DE
ESTADSTICA
CONTROL DE CALIDAD
INTEGRANTES:
Andamay Adaudto, Maria luz
Condori Huanca, Gabriela pilar
Distribucin de frecuencia:
En una forma simple, la distribucin de frecuencia es una tabla que indica el nmero de
observaciones o su frecuencia dentro de un rango de valores de una variable (Salinas y
Miranda, 2010).
Frecuencia relativa:
Frecuencia acumulada:
La suma de frecuencias absolutas de todos los valores iguales o inferiores al valor
considerado, se representa por Fi (Salinas y Miranda, 2010).
Clase: (nmero de intervalos)
Se utilizan exclusivamente para variables cuantitativas continuas y excepcionalmente para
variables cuantitativas discretas cuando el nmero de datos es relativamente grande (30). El
nmero de intervalos de clase es fijado por la persona que construye la tabla de frecuencias
de acuerdo a su experiencia (naturaleza, magnitud y orden de los datos) o determinado
mediante frmulas empricas (sturges). Generalmente se usa el mismo tamao de intervalo
de clase (TIC) o amplitud (A) y las observaciones son clasificadas en rangos cuyos lmites son
traslapantes, es decir, el valor del lmite superior de la clase i es igual al lmite inferior de la
clase i+1 (Salinas y Miranda, 2010).
clase Intervalo
1 [LI1 - LS1>
2 [LI2 LS2>
.
.
.
k [LIk LSk > o ]
Donde:
LI i= Lmite inferior de la clase i
LS i= Lmite superior de la clase i
LI 1= X Mnimo
K = numero de intervalos
Se cumple:
LI i = LS i TIC
LS i = LI i + TIC
LI (i+1)= LI i + TIC
Rango:
El rango mide la distancia que existe entre los valores extremos. Es una
medida de dispersin de datos, se calcula de la siguiente manera:
Histograma de frecuencia:
Los histogramas de frecuencias son diagramas de barras empleados para resumir e Ilustrar
la variacin que se presenta en un conjunto de datos. Sirven para investigar cmo se puede
solucionar un problema o mejorar un proceso (Fernndez et. al, 2002).
Polgono de frecuencia:
Tambin llamado polgono de frecuencia, es el nombre que recibe una clase de grafico que
se crea a partir de un histograma de frecuencia. Podramos decir que es el que se forma a
partir de la unin de los distintos puntos medios de la sima de la columna que configura lo
que es un diagrama de frecuencia. Normalmente se utiliza el polgono de frecuencias con
frecuencias absolutas, pero tambin se utiliza con frecuencias relativas (Fernndez et. al,
2002).
Diagrama de barras:
Diagrama de frecuencia:
Medidas de exactitud:
Segn Rohlf y Sokal (2002) Exactitud; el trmino denota el grado de coincidencia del
resultado de una medicin con el valor verdadero o aceptado de la misma y se expresa en
funcin del error. La exactitud implica una comparacin con el valor verdadero o aceptado
como tal.
A continuacin se muestra una sntesis de los mtodos para evaluar la exactitud.
E = Xi - XA
El signo asociado con el error es tan importante como el mismo valor numrico, dado que el
analista necesita conocer si el efecto del error ha provocado un aumento o disminucin del
resultado o resultados.
Cuando no se conoce el valor aceptado, se toma como tal, la media de una serie de datos.
Error Relativo: Se puede expresar como el porcentaje o tanto por mil, relacionndolo con la
media o la mediana.
Medidas de precisin:
N-1
N = Nmero de mediciones.
Distribucin normal:
Distribucin binomial
Ejemplo:
Distribucin Poisson:
Distribucion Hipergeometrica:
Segn (Quesada y Garca, 1988) Supongamos una caja la cual contenga N piezas, de las
cuales D son defectuosas y N - D aceptables, y consideremos el experimento aleatorio
consistente en la extraccin simultanea de n piezas de la citada caja. Este procedimiento
de seleccin equivale a ir sacando pieza a pieza de la caja, hasta completar el numero n,
sin devolverlas a ella (muestreo sin remplazamiento).
Correlacin:
(xi-x)2(yi-y)2 individuo i
-1 +1
Fuerte Fuerte
Negativa positiva
-0.5 +0.5
dbil dbil
Negativa positiva
Sin correlacin
Coeficiente de correlacin:
Segn Garca y Quesada; (1988); Dado dos variables, la correlacin permite hacer
estimaciones del valor de una de ellas conociendo el valor de la otra variable.
Los coeficientes de correlacin son medidas que indican la situacin relativa de los
mismos sucesos respecto a las dos variables, es decir, son la expresin numrica que nos
indica el grado de relacin existente entre las 2 variables y en qu medida se relacionan.
Son nmeros que varan entre los lmites +1 y -1. Su magnitud indica el grado de
asociacin entre las variables; el valor r = 0 indica que no existe relacin entre las
variables; los valores (1 son indicadores de una correlacin perfecta positiva (al crecer o
decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).
Valor Significado
regresin lineal:
El objeto de un anlisis de regresin es investigar la relacin estadstica que existe entre una
variable dependiente (Y) y una o ms variables independientes ( ,...). Para poder
realizar esta investigacin, se debe postular una relacin funcional entre las variables.
Debido a su simplicidad analtica, la forma funcional que ms se utiliza en la prctica es la
relacin lineal. Cuando solo existe una variable independiente, esto se reduce a una lnea
recta:
Regresin curvilnea:
Cuando las variables X e Y se relacionan segn una lnea curva, se habla de regresin no
lineal o curvilnea. Es una funcin de segundo grado la que se ajusta lo suficiente a la
situacin real dada.
Y=a+bX+cX2
El problema consiste, por tanto, en determinar dichos parmetros para una distribucin
dada. Se seguir para ello, un razonamiento y la utilizacin de las ecuaciones normales de
Gauss. Las ecuaciones normales son:
Y = na + b X + C X2 (1)
X Y = a X + b X2 + c x 3 (2)
X2Y = a X2 + b X3 + c x 4 (3)
Para lo cual se necesita elaborar el cuadro con cada una de las variables que aparecen en
las ecuaciones normales y los resultados obtenidos en este sustituirlos en ellas para
encontrar los valores de las constantes.
a. diseos experimentales
Un diseo experimental es un esquema de cmo realizar un experimento. El objetivo
fundamental de los diseos experimentales radica en el determinar si existe una
diferencia significativa entre los diferentes tratamiento del experimento y en caso que
la respuesta es afirmativa, cual sera la magnitud de esta diferencia. Una segunda meta
de los diseos experimentales es verificar la existencia de una tendencia derivado del
anlisis de los datos del experimento. La diferencia principal entre los diseos
experimentales radica en la forma en que se agrupan o clasifican las unidades
experimentales.[ CITATION Bad07 \l 10250 ]
EJEMPLO
Anlisis de varianza
Fcal > F tabulada entonces la Ho se rechaza, y por tanto, hay diferencia significativa
entre los mtodos de enseanza.
EJEMPLO
EJEMPLO
Los incisos b,c,d se pueden realizar usando una tabla de nmeros aleatorios, o bien a
travs de un simple sorteo. A continuacin se muestra un ejemplo de aleatorizacin para
un cuadrado latino de tamao 5 5.
De dos niveles 2k: se estudia un numero k de factores (por ejemplo 4 ), los factores
se toman en dos niveles (-) y (+), el numero de observaciones es 2x2x2x2 =16 = 2 4,
se reduce el numero de observaciones. [ CITATION Ter17 \l 10250 ]
Ejemplo
Por ultimo
Anlisis de varianza
Supondremos que solo se usa dos rplicas de tal modo que el experimento es un diseo
factorial 23. Al utilizar los totales bajos las combinaciones de los tratamientos; los efectos
de los factores pueden estimarse:[ CITATION DOU04 \l 10250 ]
El experimentos de altura de llenado
prueba t student
Condiciones: Se utiliza en muestras pequeas de 30 o menos elementos. La desviacin
estndar de la poblacin no se conoce.[ CITATION Cca12 \l 10250 ]
Caractersticas: La distribucin t-Student es menor en la media y ms alta en los extremos
que una distribucin normal. Tiene mayor parte de su rea en los extremos que la
distribucin normal.[ CITATION Cca12 \l 10250 ]
Prueba de Duncan
es otra prueba para determinar la diferencia entre pares de medias despus que se ha
rechazado la hiptesis nula en el anlisis de varianza.[ CITATION Ger03 \l 10250 ]
Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios "rangos"
(Duncan los llama rangos significativos mnimos) dados por la frmula:
Ejemplo
Se realiz un experimento para determinar la cantidad (en gramos) de grasa absorbida por
48 donas usando ocho tipos diferentes de grasas (aceites y mantecas). Las medias para los
ocho tratamientos se muestran a continuacin:
se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error de
141.6, los grados de libertad del error son 48 - 8 =40.
Seleccionando a = 0.05 para este ejemplo, los rangos de Duncan son:
Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan para a = 0.05, 2 p 8 y
40 grados de libertad.
El siguiente paso es ordenar las medias en orden creciente para establecer los "rangos".
El rango entre las medias mxima y mnima se compara con D8, esto es ,
, entonces
, entonces
, entonces
, entonces
Como las medias para las grasas 3, 2, 6 y 1 estn incluidos en el conjunto 43261 que fue no
significativo, los rangos de las medias en el subconjunto 3261 no se comparan
con D4; solamente los rangos de las medias en el subconjunto 2615 se comparan con D4; por lo
tanto,
, entonces
Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan con D4 porque ya
fueron declarados no significativos en los conjuntos de cinco medias. Por lo tanto, el proceso
termina.
Los resultados se muestran grficamente en la siguiente figura, donde las medias que estn
debajo de una lnea no son significativamente diferentes.
El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3 son
significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor que las 8 y 7
y las dems grasas no son significativamente diferentes en relacin con la cantidad absorbida.
[ CITATION Ger03 \l 10250 ]
RANGOS SIGNIFICATIVOS DE DUNCAN
Prueba de Tukey
La prueba de Diferencia Significativa Honesta (DSH) de Tukey, al igual que la DSM, slo se
debe usar despus que se ha rechazado la hiptesis nula en el anlisis de varianza y
cuando todos los tamaos de muestra son iguales; pero a diferencia de la DSM emplea el
Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos por
el gobierno para el control de desechos de fabricacin, pero quisiera determinar cul es la
situacin de las otras tres. Para el efecto se toman cinco muestras de los lquidos residuales de
cada una de las plantas y se determina la cantidad de contaminantes. Los resultados del
experimento aparecen en la siguiente tabla.
Conclusin: Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay diferencia significativa
(al 5%) entre las cantidades medias de contaminantes para las diferentes plantas.
Los valores absolutos de las diferencias entre se muestran en la siguiente
tabla.
Como se puede observar, las diferencias que exceden (DSH) estn entre las medias ,
y , por lo tanto, slo difieren las medias m 4 de m 1 y de m 3.
Es importante tener presente que la prueba DSH slo se debe emplear cuando el ANDEVA ha
conducido al rechazo de H0. Si las muestras no son del mismo tamao no se debe usar DSH.
[ CITATION Ger03 \l 10250 ]
2.4.2 Pruebas no paramtricas
Prueba para K muestras independientes: Las pruebas para muestras independientes comparan
las variables de dos o ms series de casos; permiten suponer que las muestras provienen de la
misma poblacin.
Ejemplo
Estadstico de contraste
Ejemplo
Solucin:
Ordenamos las puntuaciones obtenidas por cada persona en las tres condiciones y
obtenemos la siguiente tabla:
Edad 1 2 3 4 5 6 7 8 9 1 Oj
0
37 1 2 1 1 1 1 1 1 1. 1 11.
5 5
38 3 1 2 3 2 2 2.5 2 1. 3 22
5
39 2 3 3 2 3 3 2.5 3 3 2 26.
5
Aplicando el valos del estadstico de contraste:
F= 11,85
Bibliografa
Fernndez, S.; Cordero, J.; Crdoba, A. 2002. ESTADISTICA DESCRPTIVA. 2da edicin.
ed. esic. Madrid. PP. 83.
Garcia, A.; Quezada, V.1988. Lecciones de clculo y probabilidades. ed. Daz de santos
S.A. madrid.pp 103