Beruflich Dokumente
Kultur Dokumente
Y
Y
YYY
Y
YYYY
Y
Y
YYY
Y
YY
Y
Y
YY
Y
YY
Y
YY
RY los datos que son obviamente erróneos o irrelevantes. Esto ha de ser
hecho con precaución: no debiéramos borrar datos que son solamente "anómalos"
y no armonizan con nuestras hipótesis. Pueden también demostrar que la hipótesis
es defectuosa.
RY o
nuestros datos significa que eliminamos la influencia de algún
factor bien conocido pero sin interés. Por ejemplo, podemos eliminar el efecto de
la inflación dividiendo todos los precios por el índice de precios de la fecha de la
compra.
Los datos empíricos pueden entonces analizarse del modo siguiente: primero, el
investigador dispone los datos de acuerdo con el modelo y después considera en qué
grado el marco es adecuado a los datos o si ha de buscarse un modelo que se adapte
mejor.
En otras palabras, el investigador suele primero decidir qué tipo de patrón es el que está
buscando en los datos. Esto determinará los métodos para un análisis matemático. Así, la
primera cuestión a la hora de elegir el método de análisis es: ¿Queremos usar las variables
medidas para clasificar casos o individuos? ¿O deseamos analizar variables inconexas, o
bien las relaciones entre diversas variables?
Y
Y
Y
A continuación hay una lista de algunos métodos habituales para el análisis estadístico de
sola variable. Los métodos han sido dispuestos de acuerdo con la escala de medición
de la variable.
Métodos de
- Tabulación ; Presentación gráfica -
de los datos
- La moda -
Medias: - - La mediana -
- - - Media aritmética -
- - Desviación de cuartil -
Medidas de dispersión: - - El rango -
- - - Desviación estándar -
Y
Y!
Y
YY
Y
Si nuestros
estudios tienen
que ver con
personas, ocurrirá con bastante frecuencia que
nuestras mediciones estarán distribuidas de acuerdo
con cierta curva, la llamada ? (a la
izquierda) que es, por consiguiente, llamada la
Y. Una de sus propiedades es que el
68% de todas las mediciones diferirá de la media (en la
figura: #) en no más que la desviación estándar, y el
95% en no más que el doble de la desviación estándar.
#
Y
RY la moda
RY la mediana
RY la media aritmética.
#
es el valor en el medio de la selección, si todos los valores están dispuestos del
menor al mayor.
#
Y$%
& es la suma de todos los valores dividido por su número, o
De entre las medias que se han presentado más arriba, el investigador puede elegir
habitualmente aquella que muestra mejor el valor típico de la variable. La media
aritmética es el más popular, pero puede ofrecer un cuadro equivocado por ejemplo en
datos que incluyen un valor que difieren en gran medida de los otros (véase la imagen de
abajo).
Lo mismo ocurre si la
distribución está
como en la
imagen de la derecha. En
el ejemplo, se relacionan
los minutos que los
distintos sujetos tardan en
llevar a cabo una tarea.
Los más rápidos
necesitaron 5 minutos,
pero el resultado más
común (=la i) fue de
siete minutos. El valor en
el medio, es decir, la
i?
se ha mostrado en "M" rojo en la imagen. La mediana tenía aquí el valor 11.
Al elegir la media más apropiada, debemos tener en cuenta la escala que fue usada en la
recolección de los datos. Si la escala era nominal, la única media posible es la moda. Si la
escala fue ordinal, podemos usar la mediana o la moda.
Finalmente, si la media fue calculada a partir de una muestra, debemos examinar su
representatividad estadística, o qué probable es que la misma media sea cierta en la
población de la que la muestra se extrajo. Una comprobación apropiada para esto es la
prueba t.
6
YY
Y
YYY
Una vez que hemos calculado el valor medio, puede ser a veces interesante describir a
qué distancia en torno a la media están diseminados los valores singulares. Para este fin,
podemos elegir entre diversas estadísticas. La elección depende del tipo de media que
hayamos usado:
Sin embargo, si la desviación estándar sólo se refiere a una muestra, la formula es,
Y(Y
)
Y
*Y
Y+Y
YY
!YY
YYY
Y
Y
Y
Y
RY La confiabilidad
La confiabilidad se calcula mediante diversos métodos:
1.Y Medida de estabilidad; que se calcula aplicando a los participantes la
misma prueba dos veces y luego obteniendo un coeficiente de correlación
entre las puntuaciones de ambas aplicaciones.
2.Y Método de formas alternativas o paralelas; Se calcula a través de un
coeficiente de correlación entre los resultados de dos pruebas
supuestamente equivalentes.
3.Y Método de mitades partidas; Se calcula por medio de un coeficiente de
correlación entre las puntuaciones de las mitades del instrumento
4.Y Medidas de coherencia interna; Coeficientes de confiabilidad alfa de
Cronbach(ɲ) y los coeficientes KR-20 y KR
Todos estos coeficientes oscilan entre 0 y 1 donde un coeficiente de 0
significa nula confiabilidad y 1 representa un máximo de confiabilidad.
El investigador calcula su valor, lo reporta y lo somete a escrutinio de los
usuarios del estudio u otros investigadores.
El coeficiente que elijamos para determinar la confiabilidad debe ser
apropiado al nivel de medición de la escala de nuestra variable. Alfa trabaja
con variables de intervalos o de razón y KR-20 y KR-21 con ítems
dicotómicos (por ejemplo: si-no)
RY La validez
La evidencia sobre la validez del contenido se obtiene mediante las opiniones del
experto y al asegurarse que las dimensiones medidas por el instrumento sean
representativas del universo o dominio de dimensiones de la(s) variable(s) de
interés.
La evidencia de la validez de criterio se produce al correlacionar las puntuaciones
de los participantes, obtenidas por medio del instrumento, con sus valores
logrados en el criterio.
La evidencia de la validez de constructo se obtiene mediante el análisis de factores.
Tal método nos indica cuantas dimensiones integran a una variable y que ítems
conforman cada dimensión. Los reactivos que no pertenezcan a una dimensión
(están aislados) y no miden lo mismo que los demás ítems, por lo tanto deben
eliminarse.
Una vez que se determina la confiabilidad (de 0 a 1) y se muestra la evidencia
sobre la validez, si algunos ítems son problemáticos se elimina de los cálculos (pero
en el reporte de la investigación, se indica cuales fueron eliminados);
posteriormente se vuelve a realizar el análisis descriptivo
Y ,Y Y
Y
Y
-
Y Y "
Y
Y $Y
-
Y!
&Y
RY ¿Con que porcentaje de confianza el investigador generaliza, para suponer que tal
cercanía es real y no por un error de muestreo?
Existen dos niveles convenidos en ciencias sociales:
a)Y El nivel de significancia de 0.05, el cual implica que el investigador tiene
95% de seguridad para generalizar sin equivocarse y solo 5% en contra.
b)Y El nivel de significancia de 0.01, el cual implica que el investigador tiene
99% en su favor y 1% en contra.
RY ¿Cómo se relacionan la distribución muestral y el nivel de significancia?
El nivel de significancia se expresa en términos de probabilidad y la distribución
muestral también como probabilidad. El nivel de significancia lo tomamos como un
área bajo la distribución muestral.
Así el nivel de significancia representa aéreas de riesgo o confianza en la
distribución muestral.
RY Una vez definido el nivel de significancia ¿qué hacemos para ver si nuestra
hipótesis sobre la media poblacional es aceptada o rechazada?
Antes de estudiar el procedimiento es necesario hacer las siguientes
consideraciones:
a)Y La distribución muestral es una distribución normal de puntuaciones ͞z͟, la
base de la curva son puntuaciones z o unidades de desviación estándar.
b)Y Las puntuaciones z son distancias que indican aéreas bajo la distribución
normal. En este caso, aéreas de probabilidad.
c)Y El área de riesgo es tomada como el área de rechazo de la hipótesis; por el
contrario, el área de confianza, como el área de aceptación de la hipótesis
d)Y Se habla de una hipótesis acerca del parámetro
a)Y Sobre bases firmes, establecer una hipótesis acerca del parámetro
poblacional.
b)Y Definir el nivel de significancia
c)Y Recolectar datos en una muestra representativa.
d)Y Estimar la desviación estándar de la distribución muestral de la media
utilizando la siguiente fórmula:
A
Donde ͞Sx͟ es la desviación estándar de la distribución muestral de la
media, s representa la desviación estándar de la muestra y n es el tamaño
de la muestra
e)Y Transformar la media de la muestra en una puntuación z, en el contexto de
la distribución muestral, con una variación de la formula ya conocida para
obtener puntuaciones z:
´
A
Donde x es la media de la muestra, es la media hipotética de la
distribución muestra y Sx es la desviación estándar de la distribución
muestral de medias.
f)Y En la tabla de aéreas bajo la curva normal, buscar aquella puntuación z que
deje a 2.5% por encima de ella, que es 1.96. Se busca el 2.5% porque la
tabla solo abarca la mitad de la distribución y el riesgo que estamos
afrontando es de 5%. Las aéreas se expresan en proporciones. Lo que
buscamos es una puntuación z que deje por encima un área de 0.025. o
2.5%, esta puntuación z es de 0.96
g)Y Compare la media de la muestra transformada a puntuación z con el valor
1.96; si es menor, aceptar la hipótesis; si es mayor, rechazarla.
Análisis Paramétricos
YYY
YYY
Y
YY
-
Y%
/Y
¿Cuáles son los métodos o las pruebas estadísticas paramétricas más utilizadas?
%Y
Y
Y
!
Y
Y
Y
Y
/Y
Definición: es una prueba estadística para analizar la relación entre dos variables medidas
en un nivel por intervalos o razón.
r = 0.80
' =0.64
%Y
YY
Y
/Y
Definición: es un modelo matemático para estimar el efecto de una variable sobre otra.
Está asociada con el coeficiente r de Pearson. Brinda la oportunidad de predecir las
puntuaciones de una variable tomando las puntuaciones de la otra variable. Entre mayor
sea la correlación entre las variables (covariacion), mayor capacidad de predicción.
Variables: dos, una se considera como independiente y otra como dependiente. Pero, para
poder hacerlo, debe tenerse un sólido sustento teórico.
Donde:
Definición: es una prueba estadística para evaluar si dos grupos difieren entre si de
manera significativa respecto a sus medias.
Hipótesis: de diferencia entre dos grupos. La hipótesis de investigación propone que los
grupos difieren de manera significativa entre si y la hipótesis nula propone que los grupos
no difieren significativamente.
Donde:
t = valor estadístico de la prueba t de Student.
1 = valor promedio del grupo 1.
2 = valor promedio del grupo 2.
sp = desviación estándar ponderada de ambos grupos.
N1 = tamaño de la muestra del grupo 1.
N2 = tamaño de la muestra del grupo 1.
Pasos:
Ejemplo:
?
? ??
Tenemos un modelo experimental con dos muestras independientes.
?i
??
?
RY Hipótesis alterna (Ha). Las tallas de niños de 5 años de las dos muestras, de
condiciones socioeconómicas contrastantes, son distintas.
RY Hipótesis nula (Ho). Las diferencias observadas en las tallas de niños de las dos
muestras de condición socioeconómica similar se deben al azar.
??
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Ú??
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha
? ??
Suma de cuadrados.
Ecuación t.
gl = N1 + N2 -2 = 10 + 10 - 2 = 18
El valor de to se compara con los valores críticos de la tabla (tt) con 18 grados de libertad,
y se obtiene que en el valor más cercano al calculado, la probabilidad es de 0.001 (valor
crítico de t: 3.92).
ÿ?
Como el valor de to (3.99) tiene una probabilidad de significancia menor que 0.001,
también es menor que 0.05, propuesto como nivel de significancia, por lo cual se acepta
Ha y se rechaza Ho.
? ?
Las diferencias en talla de ambos niños de condiciones socioeconómicas antagónicas (alta
y baja) difieren notoriamente en el nivel de confianza de p menor que 0.001.
%Y
YY
Y
Y!
Y
Y
/Y
Variable: la comparación se realiza sobre una variable. Si hay varias, se efectuara una
prueba de diferencia de proporciones por variable.
Ejemplo:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2
de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120
objetos de cada máquina:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
%Y
Y
YY
Y Y
YY
YY!
/Y
Definición: es una prueba estadística para analizar si mas de dos grupos difieren
significativamente entre sí a cuantos sus medias y varianzas. La prueba ͞t͟ se utiliza para
os grupos y el análisis de varianza unidireccional se usa para tres, cuatro o más grupos.
Aunque con dos grupos se puede utilizar también.
El de que la variable independiente sea categórica significa que es posible formar grupos
diferentes. Puede ser una variable nominal, ordinal, por intervalos o de razón (pero en
estos últimos dos casos la variable debe reducirse a categorías).
'
'
'
'
Pues bien cuando F resulta significativa, quiere decir que los grupos difieren
͞significativamente͟ entre sí. Es decir , se acepta la hipótesis de investigación y se rechaza
la hipótesis nula .
Para realizar
YYY%
Ydebe partirse de los siguientes supuestos:
1. La distribución de los valores de la variable dependiente no es normal
2. La variable dependiente es categórica y sólo puede ser medida a nivel nominal y
ordinal
A continuación se ofrece un cuadro con las pruebas más utilizadas en ciencias sociales y su
utilidad.
Y Y *6 Y2Y 5)614Y Y
)1 36 *6Y )Y 654 )2Y 6*) )* 6
4Y 4YY*64 6YY654
2YY#26 6
7Y
Y
Y Correlacionar ͞A mayor X, Dos (2), ambas El coeficiente oscila
dos variables mayor Y͟ ó medibles por entre ʹ1 y +1, el
͞A menor X, nivel de intervalo signo indica la
menor Y͟ o de razón fuerza de la
correlación. Entre
más se acerque a 0
la correlación será
menor. La
significancia debe
ser menor a .05.
YY
YY7Y Evaluar la ͞El grupo X Dos (2). La Un valor ͞t͟ para
diferencia diferirá del grupo primera variable dos grupos debe
significativa Y͟ (de manera que provoca la tener un mínimo de
entre las estadísticamente diferencia de 95% de
medias de significativa entre grupo es probabilidad de
dos grupos sus medias) dicotómica y diferencia
puede ser significativa (.05) Se
nominal, ordinal utiliza para
o de intervalo, comparar
pero reducida a resultados de una
dos categorías. La preprueba con los
variable en que resultados de una
se contrastan las postprueba, o para
medias es de comparar
intervalos o razón prepruebas y
postpruebas en dos
grupos diferentes.
Y
Y Evaluar la ͞El grupo X Dos (2) La La varianza es una
Y diferencia diferirá del grupo variable que medida de
significativa Y y Z͟ (de manera provoca la variabilidad o
entre las estadísticamente diferencia es dispersión
medias de significativa entre categórica y con alrededor de la
tres o más sus medias) nivel de medición media. Se obtiene
grupos. nominal. La un valor ͞F͟ o razón
variable en que ͞F͟ que para que
se contrastan las sea significativo al
medias es de .05% debe será
medición por igual o menor al de
intervalo o razón la tabla
correspondiente.
Indica que hay más
variación
intergrupo que
intragrupo.
Y
!
Y
Y Correlacionar ͞A mayor X, Dos. Ambas El coeficiente oscila
Y
Y dos variables mayor Y͟ ó medidas en un entre ʹ1 y +1, el
Y Y categóricas ͞A menor X, nivel de signo indica la
Y 8
Y menor Y͟ medición nominal fuerza de la
(son u ordinal correlación. Entre
diferentes más se acerque a 0
pero hacen la correlación es
algo similar) menor. La
significancia debe
ser menor a .05.
Y
"
Evaluar la ͞Habrá Dos. Medidas en Un valor de X2 y su
correlación diferencias en X un nivel de significancia debe
entre dos al variar Y͟ medición probar que los
variables nominal, ordinal, valores observados
categóricas intervalos o razón puedan ser
pero reducidas a diferentes que los
categorías. valores esperados
en más del 95%
(.05)
Y
Y #Y Evaluar la ͞El grupo X diferirá La variable El valor de U se
9"
diferencia del grupo Y y Z͟ (de independiente es compara con el valor
entre dos o manera nominal y la crítico y si es igual o
más grupos estadísticamente dependiente es mayor, la diferencia es
en función significativa entre de intervalo o estadísticamente
de sus sus medias) razón significativa. Debe
medias. trabajarse con un nivel
de probabilidad del
95%.
Y Evaluar la ͞El grupo X diferirá La variable Se compara la
Y Y diferencia del grupo Y y Z͟ (de independiente es diferencia entre
entre dos o manera nominal y la medianas con un valor
más grupos estadísticamente dependiente es crítico. Si es igual o
en base a la significativa entre de intervalo o mayor, la diferencia
mediana sus medianas) razón será estadísticamente
significativa. Debe
trabajarse con un nivel
de probabilidad del 95%
Y
Las pruebas anteriores suponen la evaluación de una variable (entre dos o más grupos) o
la evaluación de la relación entre dos variables. Por lo tanto, en estos casos, se habla de
Y YY
Sin embargo, cuando se trata de relacionar varias variables independientes con una
dependiente, se utilizaYYY YEs un análisis más complejo, que requiere
del uso de computadoras y entre las pruebas más conocidas para realizarlo están ͞La
regresión múltiple͟, ͞el análisis lineal de patrones͟ y ͞el análisis multivariado de varianza͟
(MANOVA). Todos suponen que la variable dependiente tenga medición de intervalo o
razón.
Y
Y: Este paso implica, que una vez realizado nuestros análisis es posible que decidamos
realizar otros análisis extras o pruebas para confirmar tendencias y evaluar los datos desde
diferentes ángulos.
Y ;Se recomienda, una vez que se obtenga los resultados de los análisis estadísticos
(tablas, graficas, cuadros, etc.), las siguientes actividades -- sobre todo para quienes se inician
en la investigación---:
1.Y Revisar cada resultado [análisis general análisis especifico valores resultantes
(incluida la significancia) tablas, diagramas, cuadros, y graficas].
2.Y Organizar los resultados (primero los descriptivos, por variables; luego los resultados
relativos ala confiabilidad y la validez; posteriormente los inferenciales, que se pueden
ordenar por hipótesis o de acuerdo con su desarrollo).
3.Y Cotejar diferentes resultados: su congruencia y en caso de inconsistencia lógica
volverlos a revisar. Asimismo, se debe evitar la combinación de tablas, diagramas o
graficas que repitan datos. Por lo común, columnas o filas idénticas de datos no deben
aparecer en dos o más tablas. cuando este es el caso, debemos elegir la tabla o
elemento que ilustre o refleje mejor los resultados y sea la opción que presente mayor
claridad.
4.Y Priorizar la información mas valiosa (que es en gran parte resultado de la actividad anterior),
Sobre todo si se van a producir reportes ejecutivos y otros mas extensos.
5.Y Copiar y/o ͞formatear͟ las tablas en el programa con el cual se elaborara el reporte de la
investigación (procesador de textos o uno para presentaciones, como Word o power point).
6.Y Comentar o describir brevemente la esencia de los análisis, valores, tablas, diagramas,
graficas.
7.Y Volver a revisar los resultados.
8.Y Y, finalmente, elaborar el reporte de investigación.