Beruflich Dokumente
Kultur Dokumente
Introduccin
Despus de haber colectado las respuestas de los jueces o consumidores, que podemos decir sobre las muestras evaluadas?
GRACIAS GODOFREDO!
Fue el primero en usar el trmino estadstica Viene de la palabra alemana statistik que significa datos del estado
Y para qu sirve
Recolectamos datos para saber algo de una poblacin
Para conocer sus elementos mas importantes
1. Hacer inferencias de una poblacin con base en un una muestra La media como un prueba
Trminos Importantes
Variable.- Es la propiedad de un objeto o evento que puede tomar diferentes valores.
* Las operaciones aritmticas no tienen sentido con variables nominales y ordinales. Pruebas no paramtricas.
En las variables ordinales el intervalo o distancia entre un punto y el otro no son iguales!
Escalas de intervalo
Escalas de razn
Existe un verdadero cero en la escala, como ausencia o como punto central en las escala.
Ramas de la Estadstica
Hay dos ramas principales de la estadstica que se utilizan dependiendo de la forma en la que queremos utilizar los datos.
Descriptiva
Cuando el objetivo es nicamente describir un conjunto de datos. Grficas > medias, ndices > variaciones
Inferencial
Cuando queremos describir con ms detalle los datos, las diferencias entre ellos, cuando tenemos hiptesis. Describir datos > probar hiptesis
Distribuciones de Probabilidad
Una distribucin de probabilidad, es una grfica en donde se representa la probabilidad de encontrar un valor dado:
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 Enero Marzo Mayo Julio Sep Nov
Binomial
Poisson
Normal
Weibull
Numero fijo de ensayos Ensayos independientes Los resultados de cada ensayo deben estar clasificados en dos categoras (dicotmicos) Probabilidad constante en cada ensayo.
Es similar a la distribucin binomial pero no se ve afectada por el tamao de muestra, o nmero de ensayos.
30
La forma de la distribucin depende del valor de la media y de su desviacin estndar: (m, s) Podemos tener una sola distribucin normal?
Frequencia
20
10
20
80
Distribucin Normal
Es la distribucin + importante en estadstica Pruebas paramtricas
Binomial
Ampliamente usada en Ev.Sensorial Pruebas no paramtricas
Ho
Tipos de Errores
realidad decisin
Ho
HA Error tipo II b = .
Ho
HA
Dos enamorados recin casados, pero.. H0= ella es una chica infiel
Error tipo 1 =
Error tipo 2=
Ha: La proporcin de Jvenes en Mxico que prefieren Doritos X es mayor a 50%. Ha: P>0.5
Rechazo Ho
Error Tipo I
Ho es cierta
No se lanza
X
Realidad
Doritos X
Error Tipo II
Ho es falsa
Ji cuadrada
Karl Pearson 1857 1936 Fund 1 departamento de estadistica en el mundo en University
Ji cuadrada
Hace referencia a una distribucin particular matemtica que existe por ella misma sin referencia en el mundo exterior.
- Bondad de ajuste
- Independencia
2
5
3
8
4
15
F. T.
Ji cuadrada_Bondad de Ajuste
Calcular grados de libertad
Ji cuadrada_Independencia
Cuando se tienen frecuencias derivadas de diferentes segmentos de una prueba. Y se quiere saber la independencia entre las respuestas (ej: hombres y mujeres, diferentes sabores, etc.). Se utiliza la misma frmula de Ji 2 Bondad de Ajuste
Nombre:__________
Fecha:__________
Prueba las sopas que hay frente a ti, y determine el aroma dominante de cada muestra: poro, zanahoria, jitomate o papa. Escoja solamente un aroma
Cdigo 247 584 976 340 628 584 Poro Zanahoria Jitomate Papa
Ji cuadrada_Independencia
40 consumidores participaron en la prueba de las sopas, y se tuvieron las respuestas:
Sopa* Poro Zanahoria Jitomate Papa S
24
20 7
4
9 11
4
3 8
8
8 14
40
40 40
51
24
15
30
120
17
17
10
Ji2 = 17.74
Friedman
Milton Friedman 1912 2006 Gringo University of Chicago Nobel memorial price in
economics sciences
Friedman
Es una ji2 modificada para calcular rangos (ordenamiento de muestras) X2=
12 np (p+1)
(S Tp2)
(3n
(p+1) )
n= # personas P= # productos
Friedman
Nota: A un rango ms alto equivale mayor intensidad de aroma
g.d.l. = productos - 1
Calculando::
T Student_1 muestra
Una muestra < 30 observaciones, evaluadas por diferentes jueces
Todos los datos provienen de una sola muestra Se desea saber si los datos son diferentes entre s: jueces El valor obtenido se compara al valor terico de la distribucin t
T Student_1 muestra
Ejemplo 1: Intensidad de pungencia 25 jueces calificaron la pungencia de una salsa habanera y se quiere saber si los datos obtenidos son similares o diferentes: Escala no estructurada de 15 puntos:
T Student_1 muestra
La ilusin del tamao de la luna a interesado a muchos durante siglos, viene del hecho de que veamos la luna ms grande cuando est en el horizonte que cuando est en el zenit
Un estudio se interes en la percepcin de la gente sobre la ilusin del tamao, para ver si realmente la gente perciba una diferencia en el tamao. Luna estndar = 1.0 (zenit) Luna + grande = 1.5 Ho: m = 1.0
Density
8 Data
10
11
Las dos muestras son evaluadas por distintos jueces 2 muestras independientes evaluadas por el mismo juez El valor obtenido se compara al valor terico de la distribucin t
T Student_2 muestras
Ejemplo: 27 enlogos calificaron la intensidad del aroma a ciruela en dos vinos vinos carmenere. Las evaluaciones se hicieron de forma mondica
Density
8 Data
10
11
Las dos muestras son evaluadas por el mismo juez al mismo tiempo
El valor obtenido se compara al valor terico de la distribucin t
Analizar descriptivamente los datos Realizar una prueba t para muestras pareadas
ANOVA
Varianza, medida de dispersin de los datos.
ANOVA es ampliamente utilizada por 2 razones: Podemos comparar mltiples medias, (t de student compara nicamente 2)
El modelo subyacente
Ejemplo, como resumir el efecto de la estura del Mexicano:
INEGI dice que la estatura promedio es 1m 75 cm (H y M). Los hombre tienen una tendencia a pasar el promedio por 6 cm. Quiero ver el efecto que yo puedo tener independientemente de ser hombre y mexicano: (promedio mexicano ---- gnero ----- mi gentica) Estatura = 1m 75 cm + 6 cm + mi gentica (e)
Condiciones de aplicacin
Homogeneidad de la Varianza Cada una de las muestras analizadas debe de tener la misma varianza. (homoscdasticit)
Normalidad
Los residuales de las muestras deben de ser normales
ANOVA
10 jueces evalan la intensidad aromtica de un vino, en una escala contnua de 25 puntos
Cabernet Carmenere Pinot Noir Tempranillo Malbec
C1 C2
9 8
7 9
11 13
12 11
10 19
C3
C4 C5
6
8 10
6
6 11
8
6 14
16
11 9
14
5 10
C6
C7 C8
4
6 5
6
3 8
11
12 12
23
12 10
11
14 15
C9
C10
7
7
7
6
10
11
19
11
11
11
Comparacin de medias
Qu es la interaccin? Ej: Ej. 10 consumidores evaluaron el confort del aire acondicionado de la nueva Koleos Renault, en una escala hednica de 9 puntos. Con una repeticin
Comparaciones mltiples
Despus de una prueba paramtrica cules muestras son las diferentes?
Ligado al Error tipo I: Error de Comparacin (ej: mltiples t student). Suma de errores Error Grupo (Tukey). Error compartido
Prueba Error Comparacin Tipo A priori / Post Hoc
t multiples
t Bonferroni LSD Fisher
EC
EE EE
Por pares
Contraste Por pares
t
t mod t
A priori
A priori A posteriori
Newman-Keuls
Tukey Dunnett
EE
EE EE
Por pares
Por pares Grupo testigo
d
d F
A posteriori
A posteriori A posteriori
Tipo de datos
Cualitativos (categoriales)
Cuantitativos (medidas)
Tipo de categorizacin
Tipo de pregunta
Relacione
Diferencias
Tabla de contingencia x2
Nmero de predictores
Nmero de grupos
Uno
Varios
Dos
Varios
Medicin
Regresin mltiple
Continua
Rango
Independiente
Dependiente
Independiente
Dependiente
Inters primario
rs de Spearman
t de dos muestras
t de muestras pareadas
Medidas repetidas
Grado de relacin
Forma de relacin
Mann-Whitney
Wilcoxon
Una
Varias
Friedman
Correlacin de Pearson
Regresin
Kruskal-Wallis
ANOVA Factorial