Sie sind auf Seite 1von 56

1

Confiabilidad y Validez

UNIVERSIDAD NACIONAL
JOS FAUSTINO SNCHEZ CARRION

ESCUELA DE POSTGRADO

MAESTRA
SALUD PBLICA
TEMA

CONFIABILIDAD Y VALIDEZ PARA EVALUAR LOS INSTRUMENTOS DE MEDICIN (*)


APLICACIN EN SPSS Y EXCEL

Escuela de Post Grado Jos Arias Pittman


2
Confiabilidad y Validez

Jos Augusto Arias Pittman


josepittman@yahoo.es

Huacho 20 de marzo de 2013

(*) Tema preparado y modificado por Jos Arias, para uso interno de la Escuela de Post Grado en la Maestra de Salud Pblica, de los Autores: Juan Bogliaccini Manuel Cardoso
Federico Rodrguez. Uruguay. 2005

Escuela de Post Grado Jos Arias Pittman


3
Confiabilidad y Validez

CONSTRUCCIN DE NDICES

RESUMEN . 03
INTRODUCCIN .. 03

1. DESCRIPCIN .. 03
2. EJEMPLO .. 03
3. EJERCICIO DE REVISIN . 05

CONFIABILIDAD 05

1. CONCEPTO DE CONFIABILIDAD. CONSISTENCIA INTERNA 05


2. INTERPRETACION DE LOS COEFICIENTES DE CONFIABILIDAD 07
3. PROCEDIMIENTO .. 07
4. ANLISIS DE RESULTADOS ... 10
5. PROCEDIMIENTO .. 12
6. ANLISIS DE RESULTADOS 14

CASO DE VARIABLES POLICOTOMICAS .. 17

CALIDAD DE LA FORMACIN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA


EN LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDAD
NACIONAL SAN CRISTBAL DE HUAMANGA .. 17

2.1 PROCEDIMIENTO . 17
2.2 ANLISIS DE RESULTADOS .... 18
2.3 PROCEDIMIENTO . 21
2.4 ANLISIS DE RESULTADOS .. 22
2.5 COEFICIENTE DE CORRELACIN BISERIAL PUNTUAL (R BP) .. 24

BIBLIOGRAFA DE REFERENCIA 27

Escuela de Post Grado Jos Arias Pittman


4
Confiabilidad y Validez

ANEXOS

FORMULAS . 29
MUESTRA ... 33

CALIDAD DE LA FORMACIN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA


EN LA UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDAD
NACIONAL SAN CRISTBAL DE HUAMANGA . 34

DATOS DE LA ENCUESTA 39

Escuela de Post Grado Jos Arias Pittman


5
Confiabilidad y Validez

CONSTRUCCIN DE NDICES
RESUMEN
Muy pocos instrumentos de medicin (o ningunos) que utilizan los investigadores son puros o infalibles. Mas bien las puntuaciones obtenidas por los instrumentos de medicin
puede descomponerse en dos elementos: una puntuacin verdadera y un componente de error. La primera es una entidad hipottica que representa el valor que podra
obtenerse si se pudiera llegar a una medicin perfecta. El componente de error o error de medicin, representa las inexactitudes que surgen en el proceso de medicin. Las
fuentes de error de medicin incluyen contaminantes situacionales, errores de grupo de respuesta, factores transitorios personales y otros tipos semejantes.

Una de las caractersticas importantes del instrumento de medicin es su confiabilidad, que denota el grado de congruencia o precisin con el cual el instrumento mide un
atributo. Cuanto mayor sea la confiabilidad del instrumento, menor ser el grado de error de las puntuaciones o mediciones obtenidas. Existen varios mtodos empricos para
evaluar los aspectos de la confiabilidad de un instrumento.

El aspecto de estabilidad, que se ocupa de la magnitud con la cual el instrumento genera los mismos resultados en aplicaciones repetidas, es corroborado por tcnicas de
prueba y nueva prueba. La congruencia interna u homogeneidad de la confiabilidad denota la magnitud con la cual todas las fracciones o puntos integrantes del instrumento
miden el mismo tributo.

La congruencia interna puede evaluarse por medio de la tcnica de confiabilidad de divisin en mitades o el mtodo alfa de Cronbach. Cuando en la corroboracin de la
confiabilidad se orienta a establecer equivalencias entre los observadores en cuando a conducta de calificacin, pueden obtenerse calificado de la confiabilidad entre
observadores.

La confiabilidad de un instrumento en parte de pende de su longitud (extensin), la adecuacin del muestreo de los puntos de indagacin y la heterogeneidad de los grupos a
los que se aplico el instrumento y la tcnica utilizada para obtener el coeficiente de confiabilidad. La mayor parte de los mtodos para estimar la confiabilidad se basa en el
clculo de un coeficiente de confiabilidad, ndice que refleja la proporcin de la verdadera variabilidad en un grupo de puntajes en relacin con la variabilidad total obtenida.

INTRODUCCIN
El instrumento ptimo de medicin es aquel que genera mediciones importantes, precisas, objetivas, sensibles, unidimensionales y eficientes. Los requerimientos anteriores son
bastantes importantes tal como ocurre con casi todos los conceptos de inters para los investigadores en enfermera, existen pocas tcnicas de recoleccin de datos (si las hay)
que cumplen o se acercan tal ideal. Las medidas de ndole fsica o fisiolgica, tiene mayores posibilidades de alcanzar las meta sealadas en comparacin con las ndoles
psicolgicas o conductual, pero prcticamente ningn instrumento de medicin es perfecto.

En l medida en que la medicin tiene una funcin central en el proceso de investigacin, los cientficos han creado diversas tcnicas para evaluar la calidad de sus instrumentos.
El investigador cuidadoso, por lo regular, duda en aceptar un instrumento de medicin sin antes hacer una evaluacin critica del mismo.

1. DESCRIPCIN
Muchas variables utilizadas en investigacin en ciencias humanas son latentes, y esto es especialmente cierto de algunas de las variables ms relevantes desde el punto de

Escuela de Post Grado Jos Arias Pittman


6
Confiabilidad y Validez

vista terico: status socio-econmico, inteligencia, nivel de aprobacin, logro acadmico, cultura organizacional, por mencionar solamente algunos ejemplos. Estas variables no
pueden ser medidas en forma directa, a travs de un nico indicador (a diferencia de las observables). Una de las formas habituales de medir variables latentes son los
ndices sumatorias, ya sean simples o ponderados.

2. EJEMPLO
En el estudio se plantean trece preguntas, de una encuesta realizada a 24 jvenes donde cada una de ellas tiene solo dos opciones (Dicotmicas) La base de datos contiene los
valores de cada uno de los 13 indicadores para una muestra aleatoria de 24 casos, extrada a su vez de la muestra (tambin aleatoria) ms grande.

3. EJERCICIO DE REVISIN
Describa en forma univariada el ndice resultante, teniendo en
cuenta su nivel de medicin (Ver tema relacionado con, "Anlisis
descriptivo univariado de variables continuas").

Como la inclusin de los 13 tems obedeci a criterios


conceptuales o tericos, nada asegura que efectivamente todos
los tems pertenezcan a la dimensin. La pregunta es
naturalmente, cules tems pertenecen y cules no. En el
procedimiento de ndices sumatorias el test que nos permite
despejar esta duda, se efecta calculando la fuerza de las
correlaciones de los tems entre s o de cada tem con el ndice.
Intuitivamente, la idea es sencilla, todos los tems que presentan
correlaciones altas formarn parte del ndice, los que tienen
correlaciones bajas es ms probable que no formen parte y por
lo tanto se eliminan. (Tener presente las fortalezas y
debilidades de un test de esta naturaleza).

CONFIABILIDAD

Escuela de Post Grado Jos Arias Pittman


7
Confiabilidad y Validez

1. CONCEPTO DE CONFIABILIDAD
La confiabilidad es la "exactitud o precisin de un instrumento de medicin". Existen distintos tipos de confiabilidad:
la estabilidad a travs del tiempo (medible a travs de un diseo test-retest);
la representatividad, que se refiere a la ausencia de variaciones en la capacidad del instrumento para medir un mismo constructo en distintas
subpoblaciones; y por ltimo
la equivalencia, que se aplica a las variables latentes, medidas a travs de mltiples indicadores, y que se puede poner a prueba mediante diversos
mtodos, incluyendo el llamado Alpha de Cronbach, split-half, y distintas formas de verificar la consistencia entre evaluadores.

La Confiabilidad del instrumento de medicin constituye el criterio fundamental para evaluar su calidad y adecuacin; no es un concepto unitario que pueda ser descrito o
definido con facilidad, lo que continu desventaja para el investigador novato. En esencia la confiabilidad de un instrumento es el grado de congruencia con la que mide el
atributo que se supone evala. Si una balanza arroja un dato de 54.43k para el peso de una persona ni un minuto despus da una lectura de 68.03k (descontando cualquier
intromisin con el instrumento o el sujeto), debemos tener gran cautela al usarla porque la informacin que genera ser poco fidedigna. Cuanto menor variacin produzca un
instrumento de mediciones repetidas de un atributo, mayor ser su confiabilidad de este modo, la confiabilidad puede equiparse con la estabilidad congruencia o confiabilidad de
un instrumento de medicin.

Otra forma de definir la confiabilidad es en trminos de precisin es posible sealar que un instrumento es confiable si sus mediciones reflejan exactamente las mediciones
verdaderas del atributo en estudios. La definicin anterior vincula la confiabilidad con puntos sealados en nuestro comentario del error de medicin. Intentaremos esclarecer
aun ms tal medicin, para indicar que el instrumento es confiable y preciso en la medida en que no existan errores de medicin en los resultados obtenidos. En otras palabras,
una medicin confiable es aquella que lleva al mximo el componente verdadero y el mnimo componente de error. Cuando mayor el error, mayor ser la falta de confiabilidad.

Las dos formas de abordar el concepto de confiabilidad no son distintas, tal como podra parecer a simple vista. Los errores de medicin son errores aleatorios, fuertemente
variables. Los factores que influyen en una medicin en un punto del tiempo tal vez no intervengan en otro momento o el mismo factor puede afectar en forma diferente a los
sujetos. En resumen, los errores de medicin que influyen en precisin de instrumento tambin alteran su congruencia. El ejemplo de la balanza de produca lecturas variables
de peso no servir para esclarecer el punto. Supongamos que el peso real del individuo es de 56.69k, pero que dos mediciones independientes generaron 54.42k y 68.03k. En
trminos de la ecuacin presentaba en la seccin anterior podemos expresar las mediciones de esta manera:

CONSISTENCIA INTERNA
Las escalas de tipo psicosocial se evalan a veces tomando en cuenta su consistencia interna. En circunstancias ptimas las escalas hechas para medir un atributo estn
compuestas por un conjunto de puntos de indagacin (reactivos) o de estudio de los cuales todos miden el atributo crtico y nada ms. Es una escala que intenta medir la
capacidad de decisin de las enfermeras, no seria adecuado incluir un punto que sea una medida mejor de la empatia que de la pericia en la toma de decisiones. Cabe sealar
que un instrumento tiene congruencia u homogeneidad interna en la medida en que todas sus fracciones o sus sub.-secciones miden la misma caracterstica.

En la actualidad la tcnica de congruencia interna para estimar l confiabilidad de un instrumento tal vez se el mtodo mas usado entre los investigadores. La razn de la gran
aceptacin de los mtodos que describiremos a dems de la economa (solos e necesita una sesin de prueba) tambin incluyen el hecho que son las formas mejores de
evaluar una de las fuentes mas importantes de error de cuantificacin que es la recoleccin o muestreo de los puntos de indagacin.

Uno de los mtodos ms antiguos para evaluar la congruencia interna es la tcnica de divisin por mitades. En ella, los puntos que comprende la prueba se divide en dos grupos
se cuantifica y se da una puntuacin independiente y los resultados cuantificados de las dos medias pruebas se utilizan para computar un coeficiente de correlacin. Para
ilustrar este mtodo, en la primera columna del cuadro siguiente se reproducen las puntuaciones ficticias de la primera aplicacin de la escala de capacidad de liderazgo. En aras

Escuela de Post Grado Jos Arias Pittman


8
Confiabilidad y Validez

de la simplicidad sealaremos que el instrumento total comprende 20 planteamientos. Para computar un coeficiente de confiabilidad de dos mitades habr de dividir los puntos
de estudio en dos grupos de 10. En la prctica es posible un nmero grande de divisiones, si bien la tcnica mas aceptada es usar y comprar los pares contra los nones. Por esa
razn, una de las mitades comprende los punto 1,3 1,5 1,7 1,9 1,11 1,13 1,15 1,17 1,19, en tanto que el resto comprende la segunda mitad, esto es los pares. Las puntuaciones
de las dos mitades del ejemplo se muestran en la segunda y tercera columnas del mismo cuadro. El coeficiente de correlacin que describe la relacin entre las dos mitades es
una estimacin de la congruencia interna de la escala de capacidad del liderazgo. Si los nones midieran el mismo atributo que los pares, en este caso el coeficiente de
confiabilidad debe ser alto.

Numero del Puntuacin Puntuacin de nmeros Puntuacin de Nmeros


sujeto Total impares Pares
1 55 28 27
2 49 26 23
3 78 36 42
4 37 18 19
5 44 23 21
6 50 30 20
7 58 30 28
8 62 33 29
9 48 23 25
10 67 28 39
r 0.67

El coeficiente de correlacin computado con la tcnica de dos mitades de algn atributo por medir tiende a generar una estimacin sistemticamente menor de la real en cuando
a la confiabilidad de toda la escala. Al igual que los otros aspectos, las escalas de menos tamao son ms fidedignas o confiables que las ms cortas. El coeficiente de
correlacin computado con base en los datos del cuadro es una estimacin de confiabilidad para un instrumento de 10 puntos y no para uno de 20. A fin de superar esta
dificultad se ha creado una formula para ajustar l coeficiente de correlacin, de tal manera que arrojen una estimacin de confiabilidad para toda la prueba. La ecuacin de
correlacin que se conoce como la formula del calculo (profeca) de Spearman - Brown, es la siguiente

r = 0.67
r1 = 2r/ (1 + r)

Done r es igual al coeficiente de correlacin computado en dos mitades y r 1= confiabilidad estimada de toda la prueba. Por ejemplo la formula, la confiabilidad de la medicin
hipottica de 20 reactivo de la capacidad de liderazgo seria:

r1 = 2(0.67)/(1 + 0.67) = 0.80

La tcnica de dos mitades es fcil de usar y elimina muchos de los problemas de la tcnica de prueba y nueva prueba. Sin embargo, la primera tcnica tiene como desventajas
que puede tenerse de diferentes estimaciones, de confiabilidad o uso de fracciones o mitades diferentes, esto es, siempre surgen diferencias y se usa una divisin entre pares y
nombres, una divisin de primera y segunda mitad o cualquier otro mtodo para dividir los puntos en dos grupos. Por tal razn, la tcnica de dos mitades ha sido sustituida cada
vez mas por formulas que compensan tal eficiencia. Los mtodos mas usados son: El coeficiente alfa o alfa Cronbach y la formula 20 de Kuder-Richardson (abreviada KR-20).
Va mas halla de los limites de este texto explica en detalle la aplicacin de tales formulas, pero dado que el coeficiente alfa constituye el ndice mas til de confiabilidad con que
se cuenta, convendra que el lector consultara las obras de Cronbach (1970) o Nunnalli (1978).

Escuela de Post Grado Jos Arias Pittman


9
Confiabilidad y Validez

Tanto el coeficiente alfa como la tcnica KR-20 producen un coeficiente de confiabilidad que pueden interpretarse en la misma forma que otro procedimientos de esta ndole aqu
descritos, es decir, la jerarqua normal de valores esta entre 0 y +1 y las cifras mas altas reflejan un grao mayor de congruencia interna. El coeficiente alfa (y la tcnica KR-20,
que en realidad es una especializacin o refinamiento del coeficiente alfa mas general utilizado con puntos dicotmicos), es preferible al mtodo de dos mitades porque
genera una estimacin de la correlacin de las mitades en todas las formas posibles de dividir la medida en dos mitades.

En resumen, los ndices de homogeneidad o congruencia interna estiman la magnitud en la cual a sus fracciones de un instrumento son equivalentes en trminos de la medicin
de atributo crtico. La tcnica de la mitades a menudo se ha utilizado para evaluar la homogeneidad, pero el coeficiente alfa, es el mtodo preferible, ninguno de los instrumentos
mencionados incluyen en las fluctuaciones con el paso del tiempo como fuente como falta de confiabilidad.

2. INTERPRETACION DE LOS COEFICIENTES DE CONFIABILIDAD


Los coeficientes de confiabilidad computados con base en los mtodos descrito pueden utilizarse como indicador importante de la calidad de un instrumento. Una medicin que
no es confiable interfiere con la corroboracin adecuada de las hiptesis del investigador. Si los datos no confirman una prediccin por investigar una de las posibilidades es que
los instrumentos de medicin no eran confiables y no obligadamente que las relaciones esperadas no exista. No hay un estndar respecto a los que debe ser un coeficiente de
confiabilidad. Si el investigador se interesa solo en hacer comparaciones a nivel de grupo, probablemente bastaran los coeficientes cercanos a 0.70 o incluso a 0.60.

Por comparaciones de niveles de grupo darnos a entender que el investigador se interesa comparar las puntuaciones grupo como varn en comparacin de mujer, enfermera en
comparacin con mdicos, fumador empedernido en relacin a fumar ocasional y este en comparacin con no fumador etc. Sin embargo si se tuvieran que usar las medidas
como base para decisiones respecto a de individuos el coeficiente de confiabilidad en estos casos deber ser de 0.90 o mayor.

Por ejemplo, si la puntuacin de una prueba de clases se empleara como criterio para admisin a un programa de post grado en enfermera si exactitud seria de importancia
fundamental para los solicitantes e individuales en la escuela de enfermera. El coeficiente de confiabilidad tiene una interpretacin especial que explicaremos someramente, sin
entrar en detalles tcnicos.

Tal interpretacin se relaciona con el comentario antes expuesto de descomponer una puntuacin observada en un componente de error y verdad. Supongamos que aplicamos a
50 enfermeras una escala que mide la empatia. Cabria esperar que las puntuaciones variaran de una persona a otra, pues alguna de las enfermeras tiene mayor empata. Que
sus compaeras. Parte de la variabilidad es verdadera pues refleja las diferencias reales de cada persona en lo que toca en atributo que se mide, pero otra fraccin de la
variabilidad no es verdadera, es decir, es error.

Si, por ejemplo el coeficiente de confiabilidad fuese 0.85 el 85% de la variabilidad de sus puntuaciones obtenidas podra aceptarse como una representacin de las diferencias
individuales verdaderas, en tanto que el 15% de la variabilidad reflejara fluctuaciones extraas y aleatorias. Considerado en esta forma el lector puede advertir con mayor
claridad porque instrumentos con confiabilidad de 0.60 o menos son riesgosos en la prctica.

La determinacin de la confiabilidad de un instrumento es til para los investigadores no solo porque los ayuda a interpretar un resultado, sino porque proporciona sugerencia si
se necesitan modificaciones del instrumento. Los creadores de instrumentos y escalas deben saber los siguientes puntos para mejorar sus mediciones:

a. La confiabilidad de una medicin es, en parte, funcin de su longitud (magnitud) o nmero de puntos de indagacin. Para mejorar tal confiabilidad habra
que agregar ms puntos en relacional mismo concepto.

b. En las escalas observacionales muchas veces pueden aumentarse la confiabilidad con una mayor precisin en las definiciones acompaadas de un
sistema de categoras, o si se entrena con mas intensidad a los observadores.

Escuela de Post Grado Jos Arias Pittman


10
Confiabilidad y Validez

c. La confiabilidad es un instrumento depende en parte de la heterogeneidad del grupo al cual se aplica. Cuanto mas homognea sea la muestra, esto es,
mas semejantes sean las puntuaciones obtenidas, menor ser el coeficiente de confiabilidad. Lo anterior se debe a que los instrumentos estn diseados para medir
diferencias entre los objetos que se miden. Si la muestra es homognea, es mas difcil para el instrumento discriminar confiablemente entre los que tienen grados diversos
del atributo que se mide.

d. Las estimaciones de confiabilidad varan con el metido que se utiliza para obtenerlas. El investigador debe precisar el aspecto de la confiabilidad, es decir,
estabilidad, congruencia interna, o equivalencia que tiene mayor importancia, en la relacin con el atributo y el instrumento en consideracin

TRABAJANDO CON EL SPSS


3. PROCEDIMIENTO

El anlisis de confiabilidad permite estudiar las propiedades de las escalas de medicin y los tems que las componen. El procedimiento Reliability Analisys calcula algunas
medidas comnmente usadas de confiabilidad de escalas y tambin provee informacin acerca de las relaciones entre tems individuales en la escala.
Utilizaremos el coeficiente de confiabilidad de Spearman Brown, de Rulon Guttman y el Kuder Richardson 20. Estos dos primeros coeficiente dividen los tems en dos
mitades y sobre ellos calcula el coeficiente de confiabilidad.
El coeficiente Alpha de Cronbach y KR 20 son modelos de consistencia interna, basado en el promedio de las correlaciones entre los tems. Entre las ventajas de esta medida se
encuentra la posibilidad de evaluar cunto mejorara (o empeorara) la confiabilidad del ndice si se excluyera un determinado tem. El KR 20 no se utiliza para tems
policotmicos.

Primeramente tenemos que dividir los tems en dos mitades, para ello creamos dos variables utilizando la funcin SUM(numexpr,numexpr,). Esta funcin nos permite crear
una variable de columnas pares y otra de valores impares.

Ingresamos al Men Transform, opcin Compute y se ingreso al siguiente cuadro de dialogo. Dentro del recuadro Funtions, buscamos la funcin SUM(numexpr,numexpr,
), y la ingresamos al recuadro mas grande. La nueva variable que vamos a crear se llama impar_1 (Target Variable).

Escuela de Post Grado Jos Arias Pittman


11
Confiabilidad y Validez

Los valores impares se encuentran en las variables: CN_9; CN_12, CN_14, CN_16, CN_18, CN_20, CN_22, tal como se muestra en el otro recuadro. Salimos pulsando OK.
Hemos creado una variable con la suma de los datos impar_1.

Escuela de Post Grado Jos Arias Pittman


12
Confiabilidad y Validez

Ahora los valores pares se encuentran en las variables: CN_11; CN_13, CN_15, CN_17, CN_19, CN_21, tal como se muestra en el otro recuadro. Salimos pulsando OK. Hemos
creado una variable con la suma de los datos par_1.

Escuela de Post Grado Jos Arias Pittman


13
Confiabilidad y Validez

Ahora estamos listos para determinar los coeficientes para encuesta dicotmicas.

El procedimiento consiste en ingresar al men Analyze, luego Scale (Escala) y opcin Reliability Anlisis (Anlisis de fiabilidad)

Se apertura la nueva ventana Reliability Anlisis

Seleccionar las variables que van a ser analizadas. En este


caso se ingresan las dos nuevas variables que hemos creado,
impar_1 y par_1, tal como se muestra a continuacin. Por
defecto la ventana Model es Alpha.

Escuela de Post Grado Jos Arias Pittman


14
Confiabilidad y Validez

Seleccionar el tipo de anlisis a utilizar, en el men Model: en este caso elegimos la opcin Split-half (Dos
mitades), se refiere al anlisis mitades o partir la mitad. Determina los coeficientes de Spearman y
Guttman.

Oprimir el botn Statistics, para solicitar informacin adicional. En el men de Statistics, marcar la opcin
Scale y Scale if tem deleted (Escala si se elimina elemento) , que me permite evaluar qu ocurrira
con la confiabilidad de la escala si excluyo cada uno de los tems.
Salir del men Statistics presionando el botn Continue.

Ejecutar el procedimiento presionando el botn OK, del grafico anterior.

4. ANLISIS DE RESULTADOS

Escuela de Post Grado Jos Arias Pittman


15
Confiabilidad y Validez

A mayor valor de Spearman y Guttman, mayor confiabilidad. El mayor valor terico de un


coeficiente es 1, y en general .80 se considera un valor aceptable. En este caso, los
valores de Coeficiente de Spearman Brown (Igual longitud o desigual longitud) (0.394) y el
coeficiente de Guttman dos mitades (0.392) se encuentran bastantes alejados, pero ya
veremos que existen posibilidades de elevar la confiabilidad del ndice.

Para saber el coeficiente de correlacin de cada tem, utilizaremos la opcin en el recuadro


Model: Alpha, ingresamos todas las variables o tems a excepcin de la variable par e impar.
Oprimir el botn Statistics, para solicitar informacin adicional. (Tambin su puede utilizar
Model: Guttman) En el men de Statistics, marcar la opcin Scale if tem deleted,
que me permite evaluar qu ocurrira con la confiabilidad de la escala si excluyo cada uno de los
tems. Salir del men Statistics presionando el botn Continue. Para ello, es recomendable
observar las dos ltimas columnas del anlisis tem por tem:

La columna etiquetada Corrected tem-Total Correlation (Correlacin elemento total corregida) proporciona una medida de la correlacin
entre el tem y el ndice, que como toda medida de correlacin vara entre -1 y 1. Si algn tem presenta correlaciones negativas, o bien correlaciones positivas muy
leves, es probable que sea recomendable excluir el tem del ndice.

Los tems cuyos coeficientes de correlacin tem - total arrojan valores menores a 0,35 deben ser desechados o reformulados (correlaciones a partir de
0,35 son estadsticamente significativas ms all del nivel del 1 %) (Cohen Manion, 1990), dado que una baja correlacin entre el tem y el puntaje total puede

Escuela de Post Grado Jos Arias Pittman


16
Confiabilidad y Validez

deberse a diversas causas, ya sea de mala redaccin del tem o que el mismo no sirve para medir lo que se desea medir. La depuracin de los tems tiene como
consecuencia aumentar el coeficiente de fiabilidad del instrumento.

La confiabilidad del instrumento se estima a travs del coeficiente Alfa de Cronbach. La ventaja de este coeficiente reside en que requiere de una sola
administracin del instrumento de medicin. Puede tomar valores entre 0 y 1, donde 0 significa nula confiabilidad y 1 representa la confiabilidad total. Obsrvese que los
tems CN-9, CN-13, CN-14, CN-16, CN-17, CN-19, CN-20, tienen coeficientes de correlacin cero o negativos, siendo el CN-16, el ms bajo.

La columna etiquetada Cronbachs Alpha if tem deleted (Alfa si se


elimina el elemento) proporciona el valor del coeficiente de confiabilidad Alpha de
Cronbach para el caso hipottico en que se excluyera un determinado tem del clculo del
ndice. Obsrvese que la exclusin del tem CN-9 y CN-16 permitiran un aumento del valor
de Alpha, pero la ganancia en confiabilidad sera mayor si se excluyera otros tem como se vera
posteriormente.

Escuela de Post Grado Jos Arias Pittman


17
Confiabilidad y Validez

Si observamos bien, el valor que nos da Alpha, es igual al Kuder Richardson 20, ya que hemos dicho anteriormente que Alpha de Cronbach si calcula coeficiente para
tems dicotmicos, por lo tanto se reemplaza por KR 20, y es valor es de -0.123. El valor negativo debido a una covarianza promedio entre el elemento negativo. Lo cual viola los supuestos del modelo de
confiabilidad. Puede que desee comprobar las codificaciones de loe elementos.

5. PROCEDIMIENTO
Se excluye los tems CN-9, CN_13, CN_14, CN-16, CN_17, CN_20, y se vuelve a calcular dos
nuevas variables par e impar; que ahora se llamara impar_2 y par_2. En estas dos nuevas
variables, ya no se consideran esos tems que han sido retirados, y se repite el procedimiento
descrito en el 2. PROCEDIMIENTO, tal como se muestra a continuacin. Como
puede verse se han retirado las seis variables con valores cero y negativo

Escuela de Post Grado Jos Arias Pittman


18
Confiabilidad y Validez

Seleccionamos las variables que van a ser analizadas, ahora es par_2 e


impar_2. En este caso se ingresan las variables, tal como se muestra a
continuacin. En Model seleccionamos Split-half.

En este caso, los valores de Coeficiente de Spearman (0.681) y el coeficiente de Guttman (0.676) se encuentran bastantes cerca, pero que si eliminamos aquellos tems que
todava son negativos o muy bajos se elevara la confiabilidad del ndice.

Para conocer los nuevos coeficientes de correlacin de cada tem, utilizaremos la opcin en el recuadro Model: Alpha, ingresamos todas las variables o tems a excepcin de
las variables pares e impares. Oprimir el botn Statistics, para solicitar informacin adicional. En el men de Statistics, marcar la opcin Scale if tem deleted, que me

Escuela de Post Grado Jos Arias Pittman


19
Confiabilidad y Validez

permite evaluar qu ocurrira con la confiabilidad de la escala si excluyo cada uno de los tems. Salir del men Statistics presionando el botn Continue. Debemos de tener
en cuenta que ahora ya no ingresan los tems que han sido retirados.

6. ANLISIS DE RESULTADOS
Se repite el anlisis de la instancia anterior, y se procede en forma iterativa, excluyendo tems uno a uno hasta que ya no se producen ganancias en el valor de Alpha aunque se
excluya cualquiera de los tems.

Escuela de Post Grado Jos Arias Pittman


20
Confiabilidad y Validez

Dados estos resultados que nos permiten alcanzar valor de Alpha de 0,570, que es positivo, y que este valor es equivalente al de Kuder
Richardson 20, continuamos eliminando tems? Qu ventajas obtenemos si lo hacemos? Lo que gano de incremento del Alpha
justifica seguir adelante con la depuracin de tems, o gano muy poco?

Finalmente se excluye los tems CN-15 ya que tiene un coeficiente de correlacin bajo de 0.056, y luego repetimos el procedimiento
descrito en el 2. PROCEDIMIENTO, tal como se muestra a continuacin. Como puede verse se han retirado las dos variables con valores
negativos.

Se vuelven a calcular las dos nuevas variables par e impar, que se llamara par_3 e impar_3. Los resultados son los siguientes

Los valores de Coeficiente de Spearman (0.806) y el coeficiente de Guttman (0.803) se encuentran por encima del 0.80, lo cual consideramos aceptable para nuestro estudio

Dados estos resultados que nos permiten alcanzar valor de Alpha de 0,618, que es positivo, y que este valor es equivalente al de Kuder Richardson 20,

Los resultados del tem-Total Statistics, se muestran a continuacin, y en donde se puede apreciar que existen coeficientes de correlacin negativos a los cuales se tiene que
depurar de la base.

Escuela de Post Grado Jos Arias Pittman


21
Confiabilidad y Validez

Podemos seguir eliminado variables para un mejor anlisis, aunque el tem CN_11 tiene un coeficiente de correlacin muy bajo 0.202? Para responder a esta interrogante es
necesario tener en cuenta que el nmero ideal de tems no se define slo por el test de correlaciones sino por la inconveniencia de tener cuestionarios muy extensos y costosos.
Si con 6 tems obtengo en un pre-test un Alpha muy prximo al encontrado con 13 tems, parece razonable definir el ndice por el nmero menor de tems si el instrumento ser
empleado en el estudio final.

Tabla de interpretacin de valores de coeficientes de confiabilidad hallados:

Escuela de Post Grado Jos Arias Pittman


22
Confiabilidad y Validez

VALORES INTERPRETACION
1,00 Confiabilidad perfecta
0,72 a 0,99 Excelente confiabilidad
0,66 a 0,71 Muy confiable
0,60 a 0,65 Confiable
0,54 a 0,59 Confiabilidad baja
Menos a 0,53 Confiabilidad nula

Determinacin del grado de dificultad del test:


X
Gd = ---------- x 100
Pm
Gd = grado de dificultad de la prueba
X = promedio de los puntajes obtenidos
Pm = puntaje mximo posible de alcanzarse en la prueba

Para interpretar las cifras obtenidas, se puede tomar como referencia la siguiente escala de KR 20

VALORES INTERPRETACION
81 % a mas Muy fcil
61 80 % Relativamente fcil
51 60 % Dificultad adecuada
31 50 % Relativamente difcil
11 30 % difcil
Menos de 10 % Muy difcil

Para nuestro ejemplo dicotmico, Pm viene dado por la suma de todos valores 1 en las trece variables, y en los 24 sujetos, por lo tanto el puntaje mximo ser de 312 (24*13).

Escuela de Post Grado Jos Arias Pittman


23
Confiabilidad y Validez

El puntaje X, viene dado por el promedio de los puntajes obtenidos (los que tienen valor) y es de 7.17.

Por lo tanto Gd, aplicando la formula ser de 2.3 %, con lo que podemos afirmar que al dificultad del test es muy difcil.
CALCULO DEL ERROR ESTANDAR DE LA MEDIDA
El error estndar de la medida nos proporciona una manera especialmente til de describir la confiabilidad del test, ya que nos indica la cantidad de error que debemos
considerar al interpretar puntuaciones individuales de un test. Para calcular basta con conocer la desviacin estndar , el coeficiente de confiabilidad ( r ), tal como se aprecia
Error estndar de medida =

GRADOS DE ERROR QUE SE PUEDEN ESPERAR DE LOS TEST


DE DIFERENTES CANTIDADES DE ITEMS

Numero de tems ERRAR ESTANDAR


del test
Menos de 24 02
24 - 47 03
48 - 89 04
90 - 109 05
110 - 129 06
130 - 150 07

Escuela de Post Grado Jos Arias Pittman


24
Confiabilidad y Validez

CASO DE VARIABLES POLICOTOMICAS

CALIDAD DE LA FORMACIN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA EN LA UNIVERSIDAD NACIONAL MAYOR


DE SAN MARCOS Y LA UNIVERSIDAD NACIONAL SAN CRISTBAL DE HUAMANGA

1. PROCEDIMIENTO

Cuando se trata de instrumentos policotmicos o no binarios, se utilizan los Coeficientes de Spearman-Brown, Coeficiente de Rulon Guttman y el Coeficiente
Alfa de Cronbach.

Se dividen los tems en dos mitades, para ello creamos dos variables utilizando la funcin SUM(numexpr,numexpr,). Esta funcin nos permite crear una variable de
columnas pares y otra de valores impares.

Los valores impares se encuentran en las variables: va1, va3, va5, va7, va9, va11, va13, va15, va17, va19, va21, va23, va251, tal como se muestra en el otro recuadro. Salimos
pulsando OK. Hemos creado una variable con la suma de los datos impar_1.

Ahora los valores pares se encuentran en las variables: : va2, va4, va6, va8, va10, va12, va14, va16, va18, va20, va22, va24, tal como se muestra en el otro recuadro. Salimos

Escuela de Post Grado Jos Arias Pittman


25
Confiabilidad y Validez

pulsando OK. Hemos creado una variable con la suma de los datos par_1.

Ahora estamos listos para determinar los coeficientes para la encuesta policotmicas.

El procedimiento consiste en ingresar al men Analyze, luego Scale y opcin Reliability Anlisis...

Se apertura la nueva ventana Reliability Anlisis

Seleccionar las variables que van a ser analizadas. En este caso se ingresan todas las variables ordinales, tal como se muestra a continuacin. Por defecto la ventana Model es
Alpha.

Escuela de Post Grado Jos Arias Pittman


26
Confiabilidad y Validez

Seleccionar el tipo de anlisis a utilizar, en el men Model: en este caso elegimos la opcin Split-half, se
refiere al anlisis mitades o partir la mitad. Determina los coeficientes de Spearman y Guttman.

Oprimir el botn Statistics, para solicitar informacin adicional. En el men de Statistics, marcar la opcin
Scale y Scale if tem deleted , que me permite evaluar qu ocurrira con la confiabilidad de la escala si
excluyo cada uno de los tems.
Salir del men Statistics presionando el botn Continue.

Ejecutar el procedimiento presionando el botn OK, del grafico anterior.

2. ANLISIS DE RESULTADOS

A mayor valor de Spearman y Guttman, mayor confiabilidad. El mayor valor terico de un coeficiente es 1, y en
general .80 se considera un valor aceptable. En este caso, los valores de Coeficiente de Spearman (0.890) y
el coeficiente de Guttman (0.883) se encuentran cercanos a 0.90, valores muy significativos, pero veremos que
existen posibilidades de elevar la confiabilidad del ndice.

Escuela de Post Grado Jos Arias Pittman


27
Confiabilidad y Validez

Para saber el coeficiente de correlacin de cada tem, utilizaremos la opcin en el recuadro Model: Alpha, ingresamos todas las variables o tems a excepcin de la variable par
e impar. Oprimir el botn Statistics, para solicitar informacin adicional. En el men de Statistics, marcar la opcin Scale if tem deleted, que me permite evaluar qu
ocurrira con la confiabilidad de la escala si excluyo cada uno de los tems. Salir del men Statistics presionando el botn Continue. Para ello, es recomendable observar
las dos ltimas columnas del anlisis tem por tem:

Escuela de Post Grado Jos Arias Pittman


28
Confiabilidad y Validez

La columna etiquetada Corrected tem-Total Correlation proporciona una medida de la correlacin entre el tem y el ndice, que como toda medida de
correlacin vara entre -1 y 1. Si algn tem presenta correlaciones negativas, o bien correlaciones positivas muy leves, es probable que sea recomendable excluir el
tem del ndice.
La confiabilidad del instrumento se estima a travs del coeficiente Alfa de Cronbach. La ventaja de este coeficiente reside en que requiere de una sola
administracin del instrumento de medicin. Puede tomar valores entre 0 y 1, donde 0 significa nula confiabilidad y 1 representa la confiabilidad total. Obsrvese que los
tems va9, va18, va20, tienen coeficientes de correlacin cero o negativos, siendo el v9, el ms bajo.
La columna etiquetada Cronbachs Alpha if tem deleted proporciona el valor del coeficiente de confiabilidad Alpha de Cronbach para el caso
hipottico en que se excluyera un determinado tem del clculo del ndice. Obsrvese que la exclusin del tem negativos permitiran un aumento del valor de Alpha,
pero la ganancia en confiabilidad sera mayor si se excluyera otros tem como se vera posteriormente.

Escuela de Post Grado Jos Arias Pittman


29
Confiabilidad y Validez

Si observamos bien, el valor que nos da Alpha, es igual a 0.854.

Escuela de Post Grado Jos Arias Pittman


30
Confiabilidad y Validez

3. PROCEDIMIENTO

Se excluye los tems va9, va18, va20, y se vuelve a calcular dos nuevas variables par e impar; que ahora se llamara impar_2 y par_2. En estas dos nuevas variables, ya no
se consideran esos tems que han sido retirados, y se repite el procedimiento descrito en el 2. PROCEDIMIENTO, tal como se muestra a continuacin. Como puede verse se
han retirado las TRES variables con valores negativos.

Escuela de Post Grado Jos Arias Pittman


31
Confiabilidad y Validez

Seleccionamos las variables que van a ser analizadas, ahora es par_2 e impar_2. En este caso se ingresan todas las variables ordinales, tal como se muestra a continuacin.
En Model seleccionamos Split-half.

En este caso, los valores de Coeficiente de Spearman (0.929) y el coeficiente de Guttman (0.967) se encuentran bastantes cerca de 1.00.

Escuela de Post Grado Jos Arias Pittman


32
Confiabilidad y Validez

Para conocer los nuevos coeficientes de correlacin de cada tem, utilizaremos la opcin en el recuadro Model: Alpha, ingresamos todas las variables o tems a excepcin de
las variables pares e impares. Oprimir el botn Statistics, para solicitar informacin adicional. En el men de Statistics, marcar la opcin Scale if tem deleted, que me
permite evaluar qu ocurrira con la confiabilidad de la escala si excluyo cada uno de los tems. Salir del men Statistics presionando el botn Continue. Debemos de tener
en cuenta que ahora ya no ingresan los tems que han sido retirados.

4. ANLISIS DE RESULTADOS
Se repite el anlisis de la instancia anterior, y se procede en forma iterativa, excluyendo tems uno a uno hasta que ya no se producen ganancias en el valor de Alpha aunque se
excluya cualquiera de los tems.

Dados estos resultados que nos permiten alcanzar valor de Alpha de 0,879, que es un coeficiente cerca de 0.90, por lo tanto creemos que el
estudio quedara validado con 22 tems, y con ello se hara el anlisis correspondientes.

Escuela de Post Grado Jos Arias Pittman


33
Confiabilidad y Validez

Finalmente diramos que con los coeficientes encontrados en Spearman y


Guttman, y con la determinacin del anlisis hecho por Alfa de Cronbach para las
correlaciones de cada tem, el estudio seria valido para solamente 22 variables
(tems) y con ello se dara al siguiente anlisis que seria de la Prueba Chi
Cuadrado para el grupo de variables.

Escuela de Post Grado Jos Arias Pittman


34
Confiabilidad y Validez

TRABAJAR CON EXCEL


5. COEFICIENTE DE CORRELACIN BISERIAL PUNTUAL (RBP)
Este coeficiente es muy utilizado en el mbito de la Psicometra para evaluar la discriminacin de los tems que componen un test. La Psicometra es una disciplina que segn
Muiz (1992) puede definirse en trminos generales como el conjunto de mtodos, tcnicas y teoras implicadas en la medicin de las variables psicolgicas. Dentro de este
conjunto de mtodos de medicin encontramos los tests, instrumentos de medida regidos por un procedimiento estndar y que son utilizados para obtener valores de los
indicadores de un determinado constructo. El test est formado por una serie de tems que representan variables que operativizan el constructo a medir (una habilidad, un rasgo
de personalidad, etc.).
La discriminacin de un tem es la capacidad de ste para distinguir entre individuos con diferente situacin en el rasgo o atributo medido por el test. Un tem discriminar bien si
las respuestas y puntuaciones de cada uno de estos sujetos al tem estn relacionadas con sus puntuaciones globales del test, de modo que cada tem se convierte en un
pequeo test que facilita la puntuacin que describe la capacidad, actitud, etc. de la persona evaluada.
Una forma de calcular el ndice de discriminacin de un tem i, se da mediante el ndice de correlacin biserial puntual entre el tem i (variable dicotmica: respuesta correcta
respuesta incorrecta) y la puntuacin total X del test (variable continua), de la que el tem forma parte como elemento. El coeficiente de correlacin biserial puntual oscila como la
r de Pearson entre 1, interpretndose de igual modo.
Si los tems estn bien enunciados, es de esperar que exista correlacin entre la respuesta dada al tem y la puntuacin del sujeto en la prueba.
En general, la correlacin biserial puntual se establece como una correlacin de Pearson entre dos variables, con la particularidad de que una de esas variables es de tipo
continuo y la otra es una variable dicotmica (no dicotomizada, como ocurre en el caso de la correlacin biserial). En el caso concreto que se expone, en el que la discriminacin
va a ser calculada mediante un coeficiente de correlacin tem-test, se considera a cada uno de los tems i como una variable dicotmica, puesto que lo que se tiene en cuenta
es si el sujeto contesta o no correctamente al tem. A la respuesta correcta se le puede asignar el valor uno y a la respuesta incorrecta el valor cero, de manera que cualquier
sujeto obtendr, como vector de respuesta a la prueba un conjunto de unos y de ceros. Las puntuaciones globales de los sujetos en la prueba, si las hay en nmero suficiente,
pueden considerarse como valores de una variable continua. (En tems no acertados incluimos tems no alcanzados y omisiones).
Sea p la proporcin de respuestas correctas dadas a un cierto tem y sea q = 1-p la de incorrectas. Designamos mediante mx, mp, mq y S2x, respectivamente, a la media de las
puntuaciones obtenidas en la prueba por el conjunto de todos los sujetos, la media de las puntuaciones obtenidas en la prueba por aquellos que dieron respuesta correcta a ese
tem, la media de las puntuaciones en la prueba por aquellos que no respondieron correctamente al tem y la variancia de las puntuaciones en la prueba.
El coeficiente de correlacin biserial puntual se obtiene mediante la expresin:

(La diferencia mp-mq ser tanto mayor cuanto ms difieran en puntuacin los que contestan correctamente, de aquellos que lo hacen incorrectamente. Para mp>mq, entonces rbp
tender a crecer con mp-mq, o sea, con la correccin entre el test y la respuesta correcta al tem).
O bien, podemos decir que, para un cierto tem i, el coeficiente de correlacin biserial puntual puede obtenerse mediante:

Escuela de Post Grado Jos Arias Pittman


35
Confiabilidad y Validez

donde mp representa la media de las puntuaciones de los sujetos que responden correctamente al tem i, mx indica la media de las puntuaciones de los examinados en el test,
Sx es la desviacin estndar de las puntuaciones obtenidas por todos los examinados en el test y pi expresa la dificultad del tem.
Para realizar los clculos indicados anteriormente, a la puntuacin total del test (X) hay que descontarle el tem cuyo ndice de discriminacin se pretende hallar (X-i), de lo
contrario una de las variables (el tem) estara impropiamente incluida en la otra (el test).
Si al calcular la correlacin tem-test no se descontase de ste las puntuaciones correspondientes al tem, se estara elevando impropiamente la correlacin, pues estrictamente
no se estara correlacionando el tem con el resto de los tems (test), sino con un test que incluira tambin al tem en cuestin. En suma, se estara correlacionando una variable
(test) con parte de ella (tem). Cuando el test consta de un nmero elevado de tems este efecto puede ser de poca relevancia emprica, pero ello no legtima su incorreccin.
Lo ms sencillo es calcular la correccin descontando el tem. Sin embargo, si por cualquier razn se tiene la correlacin tem-test sin descontar los efectos del tem, puede
utilizarse la siguiente frmula de correccin para obtener la correlacin pertinente:

donde ri(x-i) es la correlacin entre el tem j y el test tras descontar el tem (x-i), rix es la correlacin tem-test cuando el tem est incluido en el test, Sx es desviacin estndar del
test y Si es la desviacin estndar del tem.
A continuacin se proporciona la tabla de respuestas de 10 sujetos a 5 tems, donde el valor 1 indica respuesta correcta y el valor 0 respuesta incorrecta:

I
T
T
E O
T
A
M L

v v v v v PUNT
SUJ
a a a a a UACIO
ETO
1 2 3 4 5 NES

1 1 1 0 1 0 3
2 1 5
3 1 1 1 1 0 2
4 0 2
5 1 0 1 0 1 4
6

Escuela de Post Grado Jos Arias Pittman


36
Confiabilidad y Validez

7 0 2
8
0 1 0 1 1 4
9 0 2
10 1 1 0 1 0 2
1 4
1 0 1 0

0 1 1 1

1 1 0 0

1 0 1 0

1 1 1 0

Tota 8 7 6 5 4 30
l
tem
pi 0 0 0 0 0
. . . . .
8 7 6 5 4

qi 0 0 0 0 0
. . . . .
2 3 4 5 6

La media mx del test viene dada por: mx = pi. Este valor coincide con el hallado a partir de las puntuaciones totales del test:

mx = 0.8 + 0.7 + 0.6 + 0.5 + 0.4 = 3


La variancia del test es una variancia poblacional. As pues, su divisor es n y no n-1.

Escuela de Post Grado Jos Arias Pittman


37
Confiabilidad y Validez

Clculo del coeficiente de correlacin biserial puntual para el tem 3:


La puntuacin media de los sujetos que han contestado correctamente al tem viene dada por:

La media de las puntuaciones totales al test, la desviacin estndar, as como el ndice de dificultad del tem se ha calculado con anterioridad, lo cual nos permite hallar el
coeficiente de correlacin biserial puntual.

Si descontamos a las puntuaciones totales del test, el valor del tem, podemos obtener el coeficiente de correlacin biserial puntual corregido. Debemos pues, hallar la
puntuacin media de los sujetos que aciertan el tem, as como la media y la desviacin estndar de las puntuaciones totales corregidas:

V T PUNT PARA EL ITEM va3


a O UACI
ONES
3 T TOTAL
A ES
L CORR
EGIDA
S

0 3 3
1 5 4
1 2 1
0 2 2
0 4 4
1 2 1
1 4 3
0 2 2
1 2 1
1 4 3

Escuela de Post Grado Jos Arias Pittman


38
Confiabilidad y Validez

As, el coeficiente de correlacin biserial puntual corregido vendr dado por:

A la luz de los resultados, se puede comprobar el sesgo que se produce en el valor final al incluir la puntuacin obtenida en el tem. La discriminacin de un tem se ver pues,
muy afectada, por la inclusin impropia del mismo en el procedimiento de clculo. Este sesgo disminuye a medida que aumenta el nmero de tems que componen la puntuacin
total del test.
A continuacin se ofrece el valor del coeficiente de correlacin biserial puntual para cada uno de los tems que constituyen el test anterior, as como el de dicha correlacin
corregida.
Vector de coeficientes de correlacin biserial puntual

ITE 1 2 3 4 5
M
rbp 0 0.59 0.18 0.54 0.93
78 64 79 207

Vector de coeficientes de correlacin biserial puntual corregida

ITE 1 2 3 4 5
M
rbp - 0.21 - 0.11 0.80
0.34 82 0.25 04
29 67

Escuela de Post Grado Jos Arias Pittman


39
Confiabilidad y Validez

NDICE DE DISCRIMINACIN
Segn EBEL y FRISBIE (1986), nos dan la siguiente regla para determinar la calidad de la prueba (Test), en trminos de ndice de discriminacin.
La validez de una pregunta en una prueba nos permite determinar si la pregunta mide lo que la prueba se propone medir. En este sentido la correlacin
pregunta-prueba (punto biserial) es el indicador que nos mide el grado de validez de la pregunta. Es un ndice de validez interna pues la correlacin se calcula
con el puntaje total de la prueba, a falta del verdadero criterio o constructo.

El siguiente cuadro presenta las categoras que se usaron para evaluar la validez de las preguntas.

DISCRIMINACI CALIDAD RECOMENDACION


ON
> 0.39 Excelente Conservar
0.30 - 0.39 Buena Posibilidad de mejorar
0.20 - 0.29 Regular Necesidad de revisar
0.00 - 0.19 Pobre Descartar o revisar
< 0.00 Psima Eliminar

DIFICULTAD DE UN ITEM
Es la proporcin de sujetos que escoge la opcin correcta. Se suele obtener como el cociente entre el nmero de personas que lo aciertan y el nmero de personas que lo
responden.

La dificultad de las preguntas se mide en base al porcentaje de aciertos en la pregunta. El indicador vara entre 0 y 1. Una pregunta con una dificultad de 0.3
es ms difcil que una pregunta con una dificultad de 0.8. En el primer caso solo el 30% acertaron la pregunta y en el segundo caso acertaron el 80%. Es decir,
y como se ha observado en la literatura, el indicador se mide en forma inversa a la dificultad de la pregunta.

Una pregunta tiene una dificultad media si fue respondida correctamente por aproximadamente el 50% de los examinados, o sea, su ndice de dificultad es
cercano a 0.5. Generalmente ndices de dificultad entre 0.3 y 0.7 maximizan la informacin que el test provee sobre la diferencia entre los examinados.

El siguiente cuadro presenta las categoras para determinar el grado de dificultad de las preguntas de las pruebas.

ndice de dificulta de un tem

Escuela de Post Grado Jos Arias Pittman


40
Confiabilidad y Validez

ndice INTERPRETACION
0.75 - 1.00 Muy fcil
0.55 - 0.74 Fcil
0.45 - 0.54 Intermedio
0.25 - 0.44 Difcil
0.00 - 0.24 Muy difcil

BIBLIOGRAFA DE REFERENCIA
1. Pea, D. Romo, J - Introduccin a la Estadstica para las Ciencias Sociales. Mc Graw Hill 1997.
2. Mason y Lind - Estadstica para administracin y economa. Alfaomega 1998.Mxico, D.F. 8 edicin.
3. Juan Bogliaccini Manuel Cardoso Federico Rodrguez. Uruguay. 2005

Escuela de Post Grado Jos Arias Pittman


41
Confiabilidad y Validez

ANEXOS

Escuela de Post Grado Jos Arias Pittman


42
Confiabilidad y Validez

FORMULAS
COEFICIENTES DE CONFIABILIDAD DE ESCALAS PARA INSTRUMENTOS DICOTOMICOS O BINARIOS

La confiabilidad de divisin por mitades se obtiene correlacionando dos pares de puntuaciones obtenidas de mitades equivalentes de una slo prueba aplicada una vez.
Es til cuando es poco prctico o indeseable hacer otro procedimiento.
Los pasos implicados en este procedimiento seran:
1. Dividir la prueba en mitades equivalentes.
2. Calcular un r de Pearson entre las puntuaciones de las dos mitades de la prueba.
3. Ajustar la confiabilidad de la mitad de la prueba usando la frmula de Spearman-Brown.
Adems de la frmula de Spearman Brown (coeficiente de confiabilidad por mitades) hay otros dos estimadores de consistencia interna frecuentemente usados, Kuder Richardson
(1937) y Alfa de Cronbach (1951)

COEFICIENTE DE CONFIABILIDAD DE LAS MITADES DE SPEARMAN BROWN

= Coeficiente de Confiabilidad de Spearman - Brown


= Coeficiente de Confiabilidad de R Pearson entre los puntajes impares y pares

COEFICIENTE DE CONFIABILIDAD DE LAS MITADES DE RULON - GUTTMAN

= Coeficiente de Confiabilidad de Rulon Guttman


= Varianza de la diferencia de los puntajes impares y pares
= Varianza de la escala (Puntaje total)

COEFICIENTE DE CONFIABILIDAD SEGN LA FRMULA 20 DE HUDER RICHARDSON (KR 20)


Llegan a la formula por la insatisfaccin de los mtodos de divisin por mitades.

En el caso que los reactivos de la prueba sean homogneos, las estimaciones de confiabilidad KR-20 y de divisin por mitades ser similar (producir un coeficiente de confiabilidad
inferior a la divisin por mitades).

KR-20 ser mejor para determinar la consistencia entre reactivos de reactivos dicotmicos, sobre todos aquellos reactivos que pueden ser calificados como correctos o equivocados
(opciones mltiples).

Escuela de Post Grado Jos Arias Pittman


43
Confiabilidad y Validez

= Coeficiente de Confiabilidad KR 20
= Nmero de tems o variables
= Probabilidad de sujetos (encuestados) que contestan correctamente el tem i-avo
= Probabilidad de sujetos (encuestados) que contestan incorrectamente el tem i-avo
= Varianza de la escala (Puntaje total)

COEFICIENTE DE CONFIABILIDAD SEGN LA FRMULA 21 DE HUDER RICHARDSON (KR 21)

= Coeficiente de Confiabilidad KR 21
= Nmero de tems o variables
= Proporcin promedio de los que pasan todos los tems componentes de la escala
= Proporcin promedio de los que NO pasan todos los tems componentes de la escala
= Varianza de la escala (Puntaje total)

COEFICIENTE DE CORRELACION PUNTUAL BISERIAL

= Coeficiente de Correlacin Puntual Biserial


mp = representa la media de las puntuaciones de los sujetos que responden correctamente al tem i,
mx = indica la media de las puntuaciones de los examinados en el test
Sx = es la desviacin estndar de las puntuaciones obtenidas por todos los examinados en el test
pi expresa la dificultad del tem, mientras que q = 1 p

Escuela de Post Grado Jos Arias Pittman


44
Confiabilidad y Validez

COEFICIENTES DE CONFIABILIDAD DE ESCALAS PARA INSTRUMENTOS POLITOMICAS O NO BINARIOS

COEFICIENTE DE CONFIABILIDAD DE LAS MITADES DE SPEARMAN BROWN

= Coeficiente de Confiabilidad de Spearman - Brown


= Coeficiente de Confiabilidad de R Pearson entre los puntajes impares y pares

COEFICIENTE DE CONFIABILIDAD DE LAS MITADES DE RULON - GUTTMAN

= Coeficiente de Confiabilidad de Rulon Guttman


= Varianza de la diferencia de los puntajes impares y pares
= Varianza de la escala (Puntaje total)

COEFICIENTE DE CONFIABILIDAD ALFA DE CRONBACH


Desarrollado por Cronbach (1951) y ampliado posteriormente.

Puede considerarse como la medida de todas las correlaciones de divisin por mitades posibles, las buenas junto con las malas, corregidas por la frmula de spearman Brown.

El coeficiente alfa tambin puede ser usado en pruebas con reactivos dicotmicos, adems de las pruebas donde los reactivos no son dicotmicos: reactivos que pueden
calificarse de una forma individual a lo largo de un rango de valores (ejemplos: encuesta de opinin y de actitudes, donde se presenta un rango de alternativas posibles, las
pruebas de ensayo y respuesta corta, donde puede darse puntaje parcial).

Actualmente el coeficiente alfa es la estadstica preferida para obtener una medida de la consistencia interna.

= Coeficiente de Confiabilidad Alfa de Cronbach


= Nmero de tems o variables
= Varianza de la suma del tem i-avo
= Varianza de la escala (Puntaje total)

Escuela de Post Grado Jos Arias Pittman


45
Confiabilidad y Validez

COEFICIENTE DE REGRESION - R PEARSON

= Coeficiente de Regresin entre el conjunto X y Y


= Tamao del conjunto X y Y
= Sumatoria de puntajes simples de la variable X
= Sumatorias de puntajes al cuadrado de los puntajes de la variable X
= Sumatoria de puntajes simples de la variable Y
= Sumatorias de puntajes al cuadrado de los puntajes de la variable Y

Escuela de Post Grado Jos Arias Pittman


46
Confiabilidad y Validez

MUESTRA
El tipo de muestreo que se utiliza es el probabilstica, ya que todos los sujetos de la poblacin tienen la misma posibilidad de ser escogidos. El tamao muestral
se fija con un margen de error, que puede ser entre 0.01 al 0.05; y un nivel de confianza del 95 %, del 95.45 % o del 99.87 %; utilizando la frmula de Cochran,
donde el estimador es el porcentaje de eleccin de cada elemento.

Donde:

p = probabilidad de ocurrencia del evento


q = probabilidad de no ocurrencia
e = mrgenes de error promedio
Z = Nivel de confianza
N = Poblacin

Por ejemplo se tiene una poblacin de 1240 sujetos, y se desea estimar una muestra para realizar el estudio, para ello se fija un nivel de confianza del 95.45 %;
un 5 % de error y la probabilidad de que ocurrencia es 50 %. Calcule la muestra.

Nivel de confianza Valor de Z


99.87 % 3.000
95.45 % 2.000
95.00 % 1.960

Datos:
p = 50% (0.50)
q = 1 p (1-0.50) = 0.5
e = 5 % = 0.05
Z = 95.45 % ( 2.00)
N = 1240

Aplicando la formula nos da una muestra n de 150 elementos a ser observados.

Escuela de Post Grado Jos Arias Pittman


47
Confiabilidad y Validez

Nota: La muestra piloto debe ser por lo menos el doble de la cantidad de tems o variables estudiadas.

Escuela de Post Grado Jos Arias Pittman


48
Confiabilidad y Validez

CALIDAD DE LA FORMACIN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA EN LA


UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDAD NACIONAL SAN CRISTBAL DE
HUAMANGA

ENCUESTA ANNIMA
Estimado profesor, el presente cuestionario es parte de un proyecto de investigacin que tiene por finalidad la obtencin de informacin acerca de la calidad de la formacin que se
brinda en la escuela profesional de Obstetricia.

A. DATOS PERSONALES.
1. UNIVERSIDAD: UNMSM (1) UNSCH (2)
2. PROFESOR: PRINCIPAL (1) ASOCIADO (2) AUXILIAR (3)

B. INDICACIONES.
Al responder cada uno de los tems marcara solo una de las alternativas propuestas. Los tems estn clasificados de acuerdo a las variables de estudio: Planes de Estudio, Nivel
Profesional Docente, Contexto Acadmico, y Tecnologa de Sistema de Informacin.

C. VARIABLES DE ESTUDIOS
PLANES DE ESTUDIOS

1. Las asignaturas se encuentran estructuradas e integradas suficientemente para lograr una formacin de alta calidad.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo

2. El plan de tesis de su Escuela profesional prioriza asignaturas que inciden mas en la teora que en la practica.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo

Escuela de Post Grado Jos Arias Pittman


49
Confiabilidad y Validez

4. En desacuerdo
5. Totalmente en desacuerdo
3. Los contenidos de las asignaturas permiten una formacin que desarrolle las habilidades necesarias de los alumnos en el campo de la Obstetricia hacia niveles
profesionales competitivos.

1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
4. La programacin de las actividades acadmicas se encuentra diseada para posibilitar una actualizacin cientfica - tecnolgica permanente de los profesores.

1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo

5. Las actividades acadmicas promueven el desarrollo intelectual de los profesores para conocer y aplicar los avances cientficos tecnolgicos en el campo de la
obstetricia.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
6. El plan de estudios de su Escuela Profesional prioriza el desarrollo de asignaturas que son importantes para la produccin de investigaciones en el campo de la
obstetricia
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
7. En general los planes de estudios de su carrera profesional desarrollan el dominio terico practico de la metodologa para producir investigaciones.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo

Escuela de Post Grado Jos Arias Pittman


50
Confiabilidad y Validez

4. En desacuerdo
5. Totalmente en desacuerdo
8. Los alumnos estn capacitados para realizar proyectos de investigacin producto de la formacin investigativa recibid en su escuela profesional.
1. Todos los alumnos
2. La mayora de los alumnos
3. La mitad de los alumnos
4. Algunos alumnos
5. Ninguno de los alumnos
9. Los planes de estudios son lo suficientemente flexibles para potenciar el desarrollo de las capacidades cognitivas y valorativas de los alumnos.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
10. Los planes de estudio son evaluados permanentemente permitiendo una actualizacin acadmica de sus contenidos.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
NIVEL PROFESIONAL DOCENTE
11. El general los profesores de su escuela Profesional tienen un alto dominio terico practico para el desarrollo de las asignaturas.
1. Todos los docentes
2. La mayora de los docentes
3. La mitad de los docentes
4. Algunos docentes
5. Ninguno de los docentes
12. Los profesores de su escuela profesional poseen las competencias necesarias para producir investigaciones cientficas en el campo de la obstetricia.
1. Todos los docentes
2. La mayora de los Docentes
3. La mitad de los docentes
4. Algunos docentes
5. Ninguno de los docentes
13. Los docentes utilizan estrategias metodolgicas modernas para promover el desarrollo del pensamiento hacia niveles de reproduccin y produccin de los
conocimientos cientficos de la obstetricia.

Escuela de Post Grado Jos Arias Pittman


51
Confiabilidad y Validez

1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
14. La metodologa utilizadas por los profesores potencializan el desarrollo de las capacidades cognitivas y valorativas de los alumnos.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
15. Los profesores manejan adecuadamente el Internet y el e-mail como recursos para promover aplicacin de la ciencia y tecnologa de la obstetricia.
1. Todos los docentes
2. La mayora de los docentes
3. La mitad de los docentes
4. Algunos docentes
5. Ninguno de los docentes
16. En general las formas de evaluacin utilizadas por los profesores son adecuadas para evaluar las competencias de los alumnos.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
CONTEXTO ACADEMICO - ADMINISTRATIVO
17. La gestin acadmica administrativa de la escuela profesional crea las condiciones para que los profesores asuman el compromiso de lograr las metas y objetivos
institucionales.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
18. El contexto acadmico administrativo promueve la actualizacin acadmica y las actividades de investigacin de los profesores.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo

Escuela de Post Grado Jos Arias Pittman


52
Confiabilidad y Validez

5. Totalmente en desacuerdo
19. La gestin administrativa brinda las facilidades para el uso de soportes tecnolgicos modernos como Internet, e-mail que permitan el acceso a la informacin
actualizada.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
20. Existe cohesin interna en la comunidad universitaria de la escuela que se expresa en la cooperacin y la participacin en actividades acadmicas de los
profesores.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
21. En la escuela profesional existe un clima de motivacin que favorece el desarrollo intelectual y la actualizacin permanentemente de los profesores.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
TECNOLOGIA Y SISTEMA DE INFORMACION
22. Los equipos de computo con los que cuenta la escuela Profesional que permiten el acceso a Internet, e-mail a los profesores son en cantidad y en calidad.
1. Excelentes
2. Buenos
3. Regulares
4. Malos
5. Psimos
23. Los medios audiovisuales que se encuentran a disposicin de los profesores, como retroproyectores, videos, rotafolios, lminas entre otros son en cantidad y
calidad.
1. Excelentes
2. Buenos
3. Regulares
4. Malos
5. Psimos

Escuela de Post Grado Jos Arias Pittman


53
Confiabilidad y Validez

24. La biblioteca especializada de su escuela se encuentra lo suficientemente actualizada e implementada para coadyuvar una formacin de calidad en obstetricia.
1. Totalmente de acuerdo
2. De acuerdo
3. Ni de acuerdo ni en desacuerdo
4. En desacuerdo
5. Totalmente en desacuerdo
25. Los laboratorios de enseanza con los que cuenta su Escuela Profesional para coadyuvar a las investigaciones de calidad en el campo de la obstetricia son en
calidad y cantidad.
1. Excelentes
2. Buenos
3. Regulares
4. Malos
5. Psimos

Escuela de Post Grado Jos Arias Pittman


54
Confiabilidad y Validez

Escuela de Post Grado Jos Arias Pittman


55
Confiabilidad y Validez

DATOS DE LA ENCUESTA
CALIDAD DE LA FORMACIN PROFESIONAL DE LOS ALUMNOS DE OBSTETRICIA EN LA
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS Y LA UNIVERSIDAD NACIONAL SAN CRISTBAL DE
HUAMANGA

docent va va va va va va va va va va1 va1 va1 va1 va1 va1 va1 va1 va1 va1 va2 va2 va2 va2 va2 va2
e 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5
1 1 4 2 2 2 2 3 3 4 1 3 2 4 2 4 2 2 5 4 4 2 3 2 4 2
2 1 3 2 5 4 2 4 2 4 1 3 2 3 2 4 2 2 5 4 4 2 3 2 3 2
3 1 3 2 5 4 2 2 3 4 1 2 2 2 2 3 2 2 5 3 3 2 3 2 2 2
4 0 3 2 4 4 3 3 3 3 3 3 4 4 4 4 4 5 4 4 3 4 3 5 2 3
5 2 4 2 3 3 4 1 2 3 2 3 4 3 3 3 4 5 5 4 3 4 5 2 2 3
6 4 2 3 2 2 4 4 3 4 4 0 0 0 0 0 0 4 2 4 4 4 0 0 2 3
7 4 4 4 4 4 4 4 4 4 5 4 4 4 4 4 4 4 4 4 4 4 0 4 4 5
8 2 3 2 4 4 4 4 4 4 2 4 4 4 3 4 4 3 4 4 4 4 4 3 4 4
9 4 2 4 4 4 4 4 4 4 5 4 2 2 2 4 2 4 4 4 3 3 3 4 4 5
10 4 4 2 4 4 4 4 2 2 5 4 2 4 2 4 4 3 2 5 4 4 4 4 4 3

Escuela de Post Grado Jos Arias Pittman


56
Confiabilidad y Validez

Escuela de Post Grado Jos Arias Pittman

Das könnte Ihnen auch gefallen