Confiabilidad

CAPITULO VIII
CONFIABILIDAD DE INSTRUMENTO DE MEDICIN EDUCATIVA
Conceptualizacin
La confiabilidad es una medida de consistencia y uniformidad de un instrumento
de recoleccin de datos. Permite determinar si las calificaciones provenientes de la
aplicacin de un instrumento son estables en el tiempo y en lugares diferentes. Se
comprueba la confiabilidad de una balanza, si una persona que se pesa en ella en lugares
y momentos diferentes, obtienen un peso similar, es decir, sin diferencias significativas.
En el caso de los instrumentos educativos, se dice que ste es confiable si al aplicar el
instrumento dos veces a las mismas personas o al aplicar dos versiones de un mismo
instrumento a los mismos sujetos se obtiene los mismos resultados. Asimismo un
instrumento es confiable si los sujetos a quienes se le aplica el instrumento lo responden
homogneamente (consistentemente) en cuanto a la variable que se desea medir.
A continuacin se revisan algunas definiciones de confiabilidad. Se comienza con
Anastasi y Urbina (1.998) quienes al respecto expresa lo siguiente: ...El trmino de
confiabilidad se refiere a la consistencia de las puntuaciones obtenidas por las mima
personas cuando se las examina en distintas ocasiones con el mismo test, con conjunto
equivalentes de reactivos o en otras condiciones de examinacin...(P.84). Ms adelante
las autoras mencionadas definen la confiabilidad: ....en trminos ms tcnicos, la
confiabilidad de una prueba permite estimar qu proporcin de la varianza verdadera
total de las puntuaciones se debe a varianzas del error ...(P.84).
Es importante expresar que cuando se realizan mediciones en diferentes
ocasiones, siempre existen diferencias, por ejemplo, si nos pesamos hoy y luego lo
volvemos hacer el da siguiente siempre existe una diferencia, auque a veces es mnima,
la cual es originada por factores fortuitos como haber tomando el peso inmediatamente
despus de consumir alimentos. Este tipo de diferencias se conocen como varianza del
error y es originada por factores aleatorios, los cuales el investigador cuando aplica un
instrumento debe controlar.
La teora del error de medicin en la confiabilidad de los instrumentos se expresa
de la manera siguiente:
Y= T+E; donde:
Y= Puntuacin observada
T= Puntuacin verdadera
E= Error de la medicin
Transformndose la ecuacin en:

V= Vv+ Ve; donde:
V= Varianza total
Vv= Varianza verdadera
Ve= Varianza del error
Interpretacin del Coeficiente de Confiabilidad

La confiabilidad se interpreta a travs de un coeficiente que tiene los siguientes
rangos:
Rango
Interpretacin
0,81 a 1,00
Muy alta
0,61 a 0,80
Alta
0,41 a 0,60
Moderada
0,21 a 0,40
Baja
0,00 a 0,20
Muy Baja
Cuando es Negativo
Extremadamente Baja
Cuando es Mayor a 1
Extremadamente Alta
Lo normal es que el coeficiente de confiabilidad est entre 0 y 1; pero en algunos
casos traspasa est intervalo. Cuando un instrumento tiene una confiabilidad negativa,
significativa que sta es extremadamente baja, lo cual debe llevar a tomar la decisin de
rechazar el instrumento. Cuando sucede el caso contrario, el coeficiente mayor a 1, la
confiabilidad es extremadamente alta. Debe aceptarse el instrumento. Lo recomendable
cuando ocurre alguno de estos dos casos es revisar determinadamente las respuestas del
instrumento y los clculos. Es comn cuando esto ocurre que el resultado se debe a
incorrecta codificacin de las alternativas de
respuestas o clculos aritmticos incorrectos cuando el coeficiente se calcula en forma
manual.
Mtodos de Confiabilidad
Los mtodos de confiabilidad son tres, los cuales se desarrollan a continuacin:
Reaplicacin de la Prueba (Test-Retest)
Este mtodo de confiabilidad consiste en aplicar el instrumento a los mismos
sujetos en dos momentos diferentes. Es aconsejable que el intervalo de tiempo, entre las
dos aplicaciones no sea muy prolongado ni muy breve. Lo recomendable es entre 15 y

30 das. Debe tenerse cuidado que en el periodo entre ambas aplicaciones, los sujetos no
reciban algn estmulo que pudiera influir en la segunda aplicacin. Este mtodo
genera medida de estabilidad, porque garantiza que los resultados del instrumento sean
estables en el tiempo.
El procedimiento para aplicarlo es el siguiente:
1. Se aplica el instrumento en dos momentos a los mismos sujetos.
2. Se correlacionan los puntajes de ambas mediciones, a travs de un coeficiente
de correlacin; cuando la variable est en una escala de medicin de intervalo o
de razn se aplican el coeficiente de correlacin de Pearson. Si la variable est
expresada en una escala de medicin ordinal, el coeficiente de correlacin
apropiado es el Spearrman.
A continuacin se presentan dos (2) ejemplos que ilustran ambos casos:
Ejemplo 1
Aplicacin del Coeficiente de Correlacin de Pearson
Sujetos
1
2
3
4
5
6
7
8
9
10
N = 10
Puntuacin X
Puntuacin Y
(1 aplicacin)
10
20
15
13
8
10
11
17
20
5
X = 129
(2 aplicacin)
12
19
15
15
9
12
11
16
19
4
Y = 132
XY
Y2
X.Y
100
400
225
169
64
100
121
289
400
25
2
X = 1.893
144
361
225
225
81
144
121
256
361
16
2
Y = 1.934
120
380
225
195
72
120
121
272
380
20
XY = 1.905
X Y
N
2
x N y
X2
1.905
129132
10
129
10
1.893
132
1.934 10
202,20
0,97
209,42
El coeficiente de confiabilidad es 0,97; lo cual indica una confiabilidad muy alta

(ver rangos de interpretacin).
Ejemplo 2
Aplicacin del Coeficiente de Correlacin de Spearman
Sujetos
1
2
3
4
5
6
7
8
9
10
11
12
Primeros
Rango
Segundos
Rango
Di
puntajes
83
99
88
41
117
114
112
84
86
127
107
118
(RI)
2
6
5
1
10
9
8
3
4
12
7
11
Puntajes
43
47
40
38
66
89
87
57
63
93
55
83
(R2)
3
4
2
1
8
11
10
6
7
12
5
9
(R1-R2)
-1
2
3
0
2
-2
-2
-3
-3
0
2
2
Total
Di2
1
4
9
0
4
4
4
9
9
0
4
4
52
6 Di
6 52
r 1
0.82
N N 12 N
2
La confiabilidad es muy alta, aceptndose sin reservas el instrumento

Cuando dos o mas sujetos reciben el mimos puntaje, se le asignaba a cada uno el
promedio de los rangos de los sujetos empatados. A continuacin se muestra un
ejemplo:
Sujetos
1
2
3
Rango 1
(R1)
1
2
3
Puntuaciones
20
18
19
Rango 2
(R2)
(R1-R2)
1
3,5
2
0
-1,5
1
Di2
0
2,25
1
4
5
6
7
8
9
10
11
12
r 1
4
5
6
7
8
9
10
11
12
18
16
15
16
16
13
14
9
6
3,5
6
8
6
6
10
9
11
12
0,5
-1
-2
1
2
-1
1
0
0
Total
0,25
1
4
1
4
1
1
0
0
15,5
615,5
0,95
12 3 12
La confiabilidad es muy alta, por lo tanto, debe aceptarse el instrumento.

Hay programa estadstico, como Excel, STATISTICA, SPSS, etc., que calculan
ambos coeficientes de correlacin, lo cual facilita considerablemente la obtencin de
estos coeficientes. La rutina para obtenerlos es muy fcil de manejar y presenta adems
la prueba de contraste de hiptesis que complementa los resultados obtenidos a travs
de los coeficientes.
Pruebas de formas Equivalentes y formas alternas
Este mtodo consiste en elaborar dos versiones de un instrumento que miden la
misma variable, las cuales se aplican a un mismo grupo de sujetos. Genera en el
instrumento medidas de equivalencia, porque garantiza la obtencin de resultados
confiables cuando la variable se mide en dos versiones diferentes del instrumento.
Cuando las dos versiones no se aplican simultneamente al grupo de sujetos, sino que
se aplican en momentos diferentes; adems de generar medida de equivalencia, tambin
genera medida de estabilidad.
El procedimiento para obtener el coeficiente de confiabilidad de equivalencia es el
siguiente.
1. Elaborar las dos versiones equivalentes del instrumento.
2. Correlacionar los puntajes de ambas versiones de la prueba
de la misma
manera que en el caso del mtodo de reaplicacin de la prueba, es decir a travs del
coeficiente de correlacin de Pearson, si la escala de medicin de la variable es de
intervalo o de razn; si la escala de medicin de la variable es ordinal, se aplica el
coeficiente de correlacin de Spearman.
Hay autores que establecen
diferencias entre pruebas equivalentes y pruebas
alternas, argumentado que solamente puede hablarse de pruebas equivalentes cuando

ambas versiones no tiene diferencias significativas en la media y la varianza de las
puntuaciones obtenidas. Cuando slo se asume que hay dos versiones equivalentes de
una prueba, sin comprobar la igualdad de medias y varianzas, se est en presencia de
una prueba paralela.
Al respecto Cohen y Swerdlik (2.000) expresan lo siguiente:
Formas alternas y formas equivalentes son trminos que en ocasiones se
usan en forma indiscriminada, aunque hay una diferencia tcnicas entre
ellos. Existen formas equivalentes de una prueba cuando para cada forma de
la prueba son iguales las medias y las varianzas de las puntuaciones de
pruebas observadas. ... Las formas alternas tan slo son versiones diferentes
de una prueba que se han construido con el fin de ser equivalentes. Aunque
no cumplen con los requisitos para la designacin legtima de
equivalentes, las formas alternas de una prueba estn diseadas
generalmente para ser equivalentes con respecto a variables (o tems) como
contenido y nivel de dificultad. (p. 160)
Mtodo de Consistencia Interna
Este mtodo tiene como propsito determinar la homogeneidad en las respuestas
de sujetos a quienes se le aplic el instrumento, puede aplicarse a pruebas que miden
habilidades como prueba de aprovechamiento, aptitud, inteligencia, de nivel de
conocimiento, etc, y a pruebas afectivas (o de personalidad) como las escalas de actitud,
test de personalidad, escalas de motivacin, etc. Es incorrecto aplicar este mtodo a los
cuestionarios de opinin; porque al medir homogeneidad en las respuestas de los sujetos
a quienes se aplica el instrumento, es apropiado para aquellos instrumentos que
persiguen obtener una calificacin nica, con alternativas de respuestas en grado de
intensidad.
En los cuestionarios de opinin no hay inconsistencia si los sujetos responden las
preguntas en forma heterogneas, porque las mismas no son para obtener una
puntuacin nica que indica una alta, media o baja presencia del atributo (variable) en
los sujetos. En el caso de los cuestionarios de opinin, cada pregunta como se mencion
en el captulo V, se analiza por separado. No es posible una calificacin nica, porque,
primero, las opiniones estn en una escala de medicin nominal (slo son
clasificatorias), y en segundo lugar, generalmente este tipo de instrumento, aunque
describa una sola variable, incluye preguntas con las cuales no se puede obtener una
calificacin nica, porque los temes miden o describen aspectos diferentes de la

variable.
A continuacin se presentan varias frmulas para calcular la consistencia interna
de un instrumento.
Frmula Kuder-Richardson (KR 20) Datos dicotmicos.
Rt (
n
vt p.q
)(
)
n 1
vt
Rt (
n
p.q
) (1
)
n 1
vt
Rt = Coeficiente de Confiabilidad
n = Nmero de temes que contiene el instrumento.
Vt: Varianza total de la prueba
p.q = Sumatoria de la varianza individual de los temes
Se puede aplicar cualquiera de ambas frmulas, obtenindose resultados similares.
Determinar el coeficiente de la confiabilidad Kuder-Richardson
(Matriz de temes dicotmicos)
Sujetos
1
2
3
4
5
6
7
8
9
Total
P
q = 1-P
p.q
1
1
1
1
1
0
1
1
1
0
7
0,78
0,22
0,17
2
1
1
1
1
1
0
1
1
1
8
0,89
0,11
0,10
temes
3
1
1
1
1
1
0
1
1
1
8
0,89
0,11
0,10
4
1
1
1
1
1
1
1
1
1
9
1
0
0
5
1
1
1
1
1
1
1
1
0
8
0,89
0,11
0,10
Total
(x)
5
5
5
5
4
3
5
5
3
40
0,47
Clculo de la varianza
p.q = 0.47
Vt
( x x ) 2
n 1
Vt = Varianza total
n = nmero de sujetos
( x) 2
( 40) 2
184
n
9 0.78
n 1
9 1
x2
X2
25
25
25
25
16
9
25
25
9
184
-
La varianza, al igual que el coeficiente de confiabilidad de Kuder-Richardson, se

puede calcular por dos frmulas. Se recomienda calcular el promedio por la segunda
frmula que lo calcula abreviado y es menos susceptible a errores de redondeo, los
cuales cuando se calculan coeficientes pueden afectar significativamente los resultados.
Clculo del Coeficiente Kuder-Richardson
Rt (
n
p.q
) (1
)
n 1
vt
Rt (
5
0.47
) x(1
) 0,50
5 1
0.78
Rt = Coeficiente de confiabilidad Kuder-Richardson

n = nmero de temes que contiene el instrumento
Al interpretar los resultados de acuerdo a los rangos explicados, se concluye que
la confiabilidad de consistencia interna es moderada. Si el instrumento evaluado es un
test afectivo (como una escala de actitud, escala de motivacin, test de personalidad,
etc.) debe rechazarse el instrumento. Si es un instrumento que mide habilidades (como
una prueba de conocimiento, prueba de rendimiento acadmico, prueba de aptitud, etc.)
se puede aceptar el instrumento, complementando el anlisis con otros indicadores de
validacin. Cuando la confiabilidad es baja, muy baja o extremadamente baja (negativa)
debe rechazarse el instrumento, aunque sea un test de habilidades.
Datos en Escalas no Dicotmicas (ms de 2 Alternativas de Respuestas)
Frmula Alfa de Cronbach
n St Vi
rt ( ) (
)
n 1
Vt
rt (
n
Vi
) (1
)
n 1
Vt
rt = Coeficiente de confiabilidad
n = Nmero de temes que contiene el instrumento
Vt St = varianza total
Vi = varianzas individuales
Se puede aplicar cualquiera de las dos frmulas, obtenindose resultados
similares.
Determinar el coeficiente Alfa de Cronbach

(matriz de temes con cinco (5) alternativas de respuestas).
Sujetos
1
2
3
4
5
6
7
8
Total (x)
X2
Vi2
1
4
3
4
4
5
5
4
4
33
139
0.41
2
4
1
5
3
2
4
4
4
27
103
1,70
temes
3
4
3
2
3
3
4
4
2
3
4
4
3
2
2
3
2
5
23
26
71
92
0,70
1.07
5
1
1
4
1
3
4
2
2
18
52
1,64
6
1
2
4
1
1
2
3
4
18
52
1,64
Total
(X)
15
13
25
14
19
20
18
21
145
7,16
Clculo de la varianza
Varianza total
(145) 2
8
Vt
16,13
(331) 2
8
139
V 12 Clculo 8de las
0varianzas
,41
individuales
8 1
2.741
V 22
(23) 2
71
8 0,70
V 32
8 1
(27) 2
8 1,70
8 1
103
V 42
(26) 2
8 1,07
8 1
92
Coeficiente de Confiabilidad
(18) 2
52
8 1,64
V 52
8 1
rt=( n
) *( 1- Vi ) =( 6
V 32
(18) 2
8 1,64
8 1
52
)* (17,16/16,13)
X2
225
169
625
196
361
400
324
441
2.741
-
n- 1
VT
6-1
rt = 0,67
rt = Coeficiente de confiabilidad
n = nmero de temes que contiene el instrumento
Vt = Varianza total
Vi = Varianzas individuales
En este ejemplo la confiabilidad es alta. Si el instrumento mide habilidades se
debe aceptar el instrumento; pero cuando es una prueba afectiva, el coeficiente como
mnimo debe ser 0.81, es decir, poseer una confiabilidad muy alta.
La formula alfa de Cronbach tambin es aplicable a datos dicotmicos. Al
respecto Cohen y Swerdlik (2.000) expresa lo siguientes:.....El coeficiente alfa tambin
puede ser usado en pruebas con reactivos dicotmicos. Adems, el coeficiente alfa es
apropiado para ser usado en pruebas que contienen reactivos que no son dicotmicos...
(P.166). Los resultados de la confiabilidad de datos dicotmicos, aplicando la frmula
Alfa de Cronback, son similares a los obtenidos aplicando la formula KuderRichardson, si las respuestas de los sujetos a quienes se aplic el instrumento son muy
homogneas. En la medida que se incrementa la homogeneidad, mayor ser la similitud
de los resultados de ambas frmulas. Si las respuestas de los sujetos son heterogneas,
la diferencia de los resultados obtenidos por ambas frmulas ser considerable. En este
ltimo caso no es recomendable aplicar la frmula Alfa de Cronbach a temes de
respuestas dicotmicas. Se puede proceder en el clculo de la confiabilidad de datos
dicotmica de la manera siguiente: se calcula el coeficiente de confiabilidad alfa de
Cronbch a travs de SPSS, si el coeficiente es muy alto, se acepta como indicador
adecuado de la confiabilidad (en este caso los datos son muy homogneos). Si es bajo,
se considera heterogneo, siendo aconsejable determinar el coeficiente por la frmula
Kuder- Richardson, porque indica diferencias entre los resultados de ambas frmulas.
Cuando se calcula el coeficiente Kuder-Richardson hay que hacerlo manual; porque el
Programa SPSS no lo calcula. Se puede calcular tambin a travs del programa Excel,
siguiendo la rutina que se incluye en el anexo D. Se justifica la aplicacin de este
programa cuando el nmero de tems del instrumento es alto.
Correlacin tem-test y confiabilidad sin el tem
Correlacin tem-test
Este indicador de homogeneidad del test, permite establecer la correlacin entre

el tem y el total de la escala. Pardo y Ruiz (2.002) Expresan que ...lo deseable es que
esas correlaciones sean altas; una correlacin baja estara indicando que el elemento (el
tem) en cuestin no apunta en la misma direccin que el resto de los elementos. (p.
605)
El paquete estadstico SPSS, lo presenta como opcional cuando se calcula el
coeficiente de confiabilidad. Ruiz (1998) recomienda que el tem aceptado debe poseer
una relacin con el total, superior a 0,25; porque de lo contrario la relacin no es
aceptable.
Confiabilidad del Instrumento si se Excluye el tem Analizado
Este indicador de confiabilidad del instrumento, permite determinar si el tem
analizado aporta confiabilidad al instrumento. El criterio que se estable es excluir el
tem y observar el comportamiento de la confiabilidad del instrumento. Si la
confiabilidad sube o permanece igual a la obtenida con el tem incorporado, se toma la
decisin de excluirlo del instrumento; porque se demuestra que el mismo no aporta
confiabilidad al instrumento, en caso contrario, cuando la confiabilidad baja, debe
aceptarse el tem; porque indica que si ste se excluye del instrumento, la confiabilidad
ser afectada (disminuir).
Cclculo de Ambos Indicadores
Su clculo manual es muy engorroso y complejo; pero el programa SPSS lo

calcula, siguiendo la siguiente rutina: Men Estadstico ( o Men Analizar)
EscalasAnlisis de fiabilidadEstadstico: activar la opcin Escala si se elimina el
elemento ContinuarAceptar.
Confiabilidad de Dos Mitades
Es un mtodo que determina consistencia interna del instrumento. Consiste en
dividir el instrumento en dos mitades y proceder a determinar si existen relacin entre
ambas, aplicando el coeficiente de Spearman-Brown, el cual introduce en la frmula
una correccin, porque al dividir el instrumento en dos mitades se reduce el nmero de

temes, afectando la confiabilidad.
Cmo se constituyen las dos mitades?
Las dos mitades pueden conformarse de varias formas; las ms usuales son las
siguientes:
1. temes pares e temes impares
2. Procedimientos aleatorios para seleccionar los temes de cada mitad
Pasos para calcular el coeficiente de las dos mitades
1. Se constituyen las dos mitades
2. Se calcula el coeficiente de correlacin de Pearson correlacionando las dos
mitades
3. Se aplica la frmula de Spearman-Broawn
El procedimiento para calcularlo es similar a los mtodos de reaplicacin de la
prueba y al de confiabilidad de formas equivalentes y formas alternas. Se aplica la
frmula del coeficiente de correlacin de Pearson cuando la escala de medicin de la
variable es de intervalo o de razn. Si la escala de medicin de la variable es ordinal, el
coeficiente de correlacin adecuado es el de Speraman (ver en este mismo captulo la
subseccin correspondiente al mtodo de reaplicacin de la prueba).
Frmula de Spearman Brown
rsp
2r1, 2
1 r1, 2
rsp = coeficiente de correlacin Spearman-Brown
1,2 =
coeficiente de correlacin de las dos mitades

Ejemplo
Calificaciones de 10 estudiantes de un curso
Estudiantes
1
2
Calificaciones primera
Calificaciones segunda
mitad de la prueba
15
14
mitad prueba
16
13
3
4
5
6
7
8
9
10
20
8
17
19
14
12
20
8
20
10
16
19
15
13
20
6
En este ejemplo el coeficiente de correlacin de Pearson (r1,2) de las dos mitades

es 0,96
Se procede a calcular el coeficiente de confiabilidad aplicando la frmula de
Spearman-Brown. Los resultados son los siguientes:
rsp
2 0.96
0.98
1 0.96
4. Se interpreta la confiabilidad como muy alta (0,98), por lo tanto, el

instrumento tiene consistencia interna.
Diferencias entre Dos Mitades de la Prueba y Formas Paralelas

Pardo (2.000) al referirse a ambos indicadores de evaluacin de un instrumento,
expresa lo siguiente:
Dos Mitades. Divide la escala en dos partes y calcula la fiabilidad a partir de la
correlacin entre ambas partes. (p. 596). Al referirse a las formas paralelas de un
instrumento, expresa: ...Asume que todos los elementos (tems o variables) tienen
iguales varianzas observadas y error. (p. 596). Pardo, tambin establece diferencias
entre las formas paralelas de una prueba y el paralelo estricto. Al referirse a este ltimo
expresa: ...Asume los supuestos del modelo paralelo y, adems, que las medias de
todos los elementos son iguales."
Para acceder a estos tres modelos incorporados en el programa SPSS desde la
Base de datos que se analiza, se sigue la siguiente rutina: Clic en analizar
EscalaAnlisis de fiabilidaden Modelo cambiar Alfa (opcin por defecto) por
Dos Mitades o Paralelo o Paralelo estricto.
Factores que Incrementan la Confiabilidad
1.
Exclusin del instrumento temes ambiguos: las temes deben formularse

de manera clara y precisa, para evitar a quienes los responden
interpretaciones diferentes al sentido para el cual fue formulado.
2.
Instrucciones claras tienden a reducir los errores de medicin: el

instrumento de recoleccin de datos, debe ir acompaado de
instrucciones donde se especifique la manera de responder las preguntas
y donde se aclare posibles dudas del respondiente en el momento de
contestar las preguntas formuladas.
3.
Control de las condiciones del espacio fsico y el personal responsable de

aplicar el instrumento: cuando se aplica un instrumento debe disponerse
de condiciones de espacio fsico similares para todas aquellas personas a
quienes se le aplicar la prueba. Asimismo el personal responsable de
aplicarlas debe poseer el mismo entrenamiento y las mismas
instrucciones.
Estableciendo estos mecanismos de control se puede reducir la varianza del error,

la cual es causada por factores externos a la prueba. Si este tipo de varianza no se
controla, puede afectar considerablemente los resultados de la prueba, y por lo tanto, la
confiabilidad del instrumento.
Incremento de la Confiabilidad de un Instrumento
Si el instrumento posee baja confiabilidad, sta puede incrementarse agregando
temes de igual tipo y calidad
A continuacin se presenta ejemplos de cmo incrementar la confiabilidad
aumentando el nmero de temes:
Cuantos temes deben agregarse a un instrumento para alcanzar la confiabilidad
deseada?
Frmula
N= CD(1-CI)
CI(1-CD)
n = nmero de temes necesarios para lograr la confiabilidad desea
CI = Confiabilidad del test inicial

CD = Confiabilidad deseada
Ejercicios Resueltos
Si la confiabilidad de un instrumento de 10 temes es 0.46
Cuantos temes
deben agregarse para alcanzar una confiabilidad de 0.81?

N= 0,81(1-0,46) = 5 veces ms largo, es decir, necesita 50 temes para lograr la
0,46(1-0,81)
confiabilidad deseada
Si la confiabilidad de un instrumento de 30 temes es 0.05. Cuntos temes deben
agregarse para alcanzar una confiabilidad de 0.90?
N= 0,90(1-0,05)
0,05(1-0,90)
= 171 veces ms largo. Tendra que tener 5.130 temes
Si la confiabilidad de un instrumento de 30 temes es 0.55. Cuantos temes deben

agregarse para incrementarla a 0.61?
N= 0,61(1-0,55) = 1,28 veces ms largo. Tendra que tener 38 temes.
0,55(1-0,61)
EJERCICIOS PROPUESTOS
Actividad 1
CONFIABILIDAD POR REAPLICACIN DE LA PRUEBA Y POR PRUEBAS EQUIVALENTES
Calcule el coeficiente de estabilidad y equivalencia en las siguientes situaciones e interprete los resultados :
(Las pruebas F1 y F2 son dos versiones del mismo instrumento que miden la misma variable y
se asume los datos en una escala de medicin de intervalo)
Sujetos
Prueba (F1) aplicada

el 29/02/04

el 22/03/04

el 22/03/04
(Puntaje total)
(Puntaje Total)
(Puntaje total)
267
275
272
246
236
240
246
229
260
244
267
265
274
267
270
264
280
275
274
276
260
275
257
270
264
269
230
10
248
231
255
11
277
256
250
12
246
253
252
13
224
236
240
14
247
272
271
15
241
258
257
16
240
247
250
17
251
262
260
18
254
266
265
Actividad 2
Desarrolle el procedimiento manual exigido para calcular el coeficiente de
consistencia interna en los siguientes ejercicios e interprete los resultados
EJERCICIO 1
Sujetos
1
1
1
1
1
1
1
1
1
0
1
2
3
4
5
6
7
8
9
temes
3
1
1
0
1
1
1
1
1
1
2
1
0
1
1
1
1
0
0
1
4
1
1
0
1
1
1
0
0
1
5
1
1
0
1
1
1
1
0
0
EJERCICIO 2
Sujetos
1
2
3
4
Items
1
4
5
5
4
2
4
4
5
5
3
4
4
5
4
4
4
5
5
4
5
4
4
5
5
6
4
2
5
4
5
6
7
8
9
10
4
4
4
5
4
5
4
4
5
5
4
5
4
5
2
4
4
5
4
5
3
5
4
5
5
5
5
4
4
5
4
5
5
5
4
5
Actividad 3
Aplicando el programa SPSS como herramienta tecnolgica, calcule e interprete
en la siguente base de datos el coeficiente de confiabilidad alfa de Cronbach y excluye
del instrumento los tems que no aportan confiabilidad y presenten una correlacin temtest menor o igual a 0.25:
sujetos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
1
5
4
2
4
5
5
5
3
4
4
5
4
2
4
4
3
4
2
2
4
2
2
4
4
1
4
4
5
4
4
4
4
5
4
2
5
4
2
4
4
2
4
1
3
5
4
3
4
4
5
4
5
4
4
5
4
2
4
3
2
4
4
2
5
1
4
5
4
2
4
4
5
4
2
4
4
4
4
2
4
2
2
4
4
2
5
1
5
2
1
2
4
2
2
4
5
4
4
4
4
2
4
4
2
1
1
2
1
1
6
4
4
2
4
5
5
4
5
4
4
4
4
2
4
4
2
4
4
2
5
1
7
4
4
2
4
3
5
1
3
1
1
1
4
3
5
3
1
1
1
2
5
1
8
5
4
2
4
4
5
4
3
4
4
5
4
2
5
2
2
4
4
2
4
1
TEMS
9 10 11
4 1 5
4 1 4
1 2 1
4 2 4
4 4 5
5 2 5
4 2 4
3 2 5
4 2 4
4 4 4
5 5 4
4 4 4
2 2 2
5 1 5
4 5 4
4 1 2
4 1 4
4 1 5
2 2 2
4 2 5
1 1 1
12
5
5
1
4
5
5
4
2
4
4
4
4
2
5
4
4
4
5
2
1
1
13
4
5
1
4
2
5
4
5
4
4
4
4
2
5
4
2
4
4
2
4
2
14
4
4
2
4
4
5
5
2
4
4
5
4
2
5
4
4
4
2
2
4
2
15
5
4
2
1
4
5
5
4
1
4
1
4
2
5
1
2
2
1
2
4
1
16
5
4
3
4
4
5
4
4
4
4
5
4
1
5
4
4
4
4
2
2
2
17
5
5
4
4
5
1
5
5
4
4
4
4
1
5
5
2
4
2
2
5
2
18
5
4
5
4
5
5
5
4
4
4
2
4
2
5
4
4
4
5
2
5
1
19
5
4
2
4
4
5
4
4
4
4
3
4
2
5
5
2
4
5
2
5
1
Referencias
Anastasi, A., Y Urbina, U. (1.998). Test psicolgicos. Mxico: Prentice Hall.
Cohen, R., y Swerdlik, M. (2.001). Prueba y evaluacin psicolgicas. Mxico: Mc.
Graw Hill
Pardo, A. (2.000). SPSS 11: Gua para el anlisis de datos. Madrid: Mc Graw Hill.
Ruiz, B (2001) Instrumento de Investigacin Educativa. Barquisimeto: Ediciones

CIDEG. C.A.
Lecturas Sugeridas
Aiken, L. (1.996). Tests psicolgicos y evaluacin (octava edicin), Mxico; Prentice
Hall. Se recomienda el capitulo 4: Estandarizacin, confiabilidad y validez.
Apartado de confiabilidad.
Anastasi, A., Y Urbina, U. (1.998). Test psicolgicos. Mxico: Prentice Hall. Captulo
4: confiabilidad. Apartado: tipos de confiabilidad.
Ary, D., Jacobs, L., Y Razavieh, A. (1.989). Introduccin a la investigacin pedaggico.
Mxico: Mc Graw Hill. Se recomienda el captulo 8: validez y confiabilidad.
Apartado: confiabilidad.
Cohen, R., y Sswerdlik,, M. (2.001). Pruebas y evaluacin psicolgicas. Mxico: Mc
Graw Hill. Se recomienda el captulo 5: Confiabilidad. Apartado: Estimaciones de
confiabilidad.
Kerlinger, F. (1.988). Investigacin del comportamiento (tercera edicin en espaol).
Mxico: MC Graw Hill.. Se recomienda el captulo 26. El contenido es el siguiente:
definiciones de confiabilidad, teora de la confiabilidad, interpretaciones del
coeficiente de confiabilidad, error estndar de la media y el error estndar de la
medicin, mejoramiento de la confiabilidad y el valor de la confiabilidad.
Pardo, A. (2.000). SPSS 11: Gua para el anlisis de datos. Madrid: Mc Graw Hill. Se
recomienda leer el captulo 25: Fiabilidad de las escalas: Procedimiento. Anlisis
de Fiabilidad. Exxplica los mtodos de confiabilidad analizados en este captulo y
el procedimiento para calcularlos a travs del programa SPSS.
Ruiz, B (2001) Instrumento de Investigacin Educativa. Barquisimeto: Ediciones
CIDEG. C.A.

Confiabilidad

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Confiabilidad

Hochgeladen von

Copyright:

Verfügbare Formate

CAPITULO VIII

CONFIABILIDAD DE INSTRUMENTO DE MEDICIN EDUCATIVA

Transformndose la ecuacin en:

Interpretacin del Coeficiente de Confiabilidad

dos aplicaciones no sea muy prolongado ni muy breve. Lo recomendable es entre 15 y

Aplicacin del Coeficiente de Correlacin de Pearson

El coeficiente de confiabilidad es 0,97; lo cual indica una confiabilidad muy alta

La confiabilidad es muy alta, aceptndose sin reservas el instrumento

La confiabilidad es muy alta, por lo tanto, debe aceptarse el instrumento.

Hay autores que establecen

diferencias entre pruebas equivalentes y pruebas

alternas, argumentado que solamente puede hablarse de pruebas equivalentes cuando

calificacin nica, porque los temes miden o describen aspectos diferentes de la

La varianza, al igual que el coeficiente de confiabilidad de Kuder-Richardson, se

Rt = Coeficiente de confiabilidad Kuder-Richardson

Determinar el coeficiente Alfa de Cronbach

Correlacin tem-test y confiabilidad sin el tem

Este indicador de homogeneidad del test, permite establecer la correlacin entre

Su clculo manual es muy engorroso y complejo; pero el programa SPSS lo

una correccin, porque al dividir el instrumento en dos mitades se reduce el nmero de

rsp = coeficiente de correlacin Spearman-Brown

coeficiente de correlacin de las dos mitades

En este ejemplo el coeficiente de correlacin de Pearson (r1,2) de las dos mitades

4. Se interpreta la confiabilidad como muy alta (0,98), por lo tanto, el

Diferencias entre Dos Mitades de la Prueba y Formas Paralelas

Exclusin del instrumento temes ambiguos: las temes deben formularse

Instrucciones claras tienden a reducir los errores de medicin: el

Control de las condiciones del espacio fsico y el personal responsable de

Estableciendo estos mecanismos de control se puede reducir la varianza del error,

CI = Confiabilidad del test inicial

deben agregarse para alcanzar una confiabilidad de 0.81?

= 171 veces ms largo. Tendra que tener 5.130 temes

Si la confiabilidad de un instrumento de 30 temes es 0.55. Cuantos temes deben

Prueba (F1) aplicada

Prueba (F1) aplicada

Prueba (F2) aplicada

Ruiz, B (2001) Instrumento de Investigacin Educativa. Barquisimeto: Ediciones

Das könnte Ihnen auch gefallen