Sie sind auf Seite 1von 3

Qu son la repetibilidad y la

reproducibilidad?
Parte 2: El punto de vista del E111
por Neil Ullman
P: Muchos mtodos de prueba de las normas ASTM contienen enunciados y valores de
repetibilidad y reproducibilidad. Qu variaciones pueden esperarse? Cul es la
desviacin estndar para la repetibilidad y reproducibilidad del mtodo?
R: El estudio entre laboratorios es el primer paso para obtener valores de contraste para la
repetibilidad y la reproducibilidad de un mtodo de prueba. Es una manera de saber el
comportamiento de un mtodo de prueba cuando se realiza en diferentes situaciones.
La norma E691 de ASTM, Prctica para realizar estudios entre laboratorios (ILS por sus siglas en
ingls) para determinar la precisin de un mtodo de prueba, es la norma bsica que describe la
manera de realizar un ILS y obtener valores para las variaciones esperables en las pruebas
realizadas en laboratorios tpicos. Segn se describe en el artculo anterior de esta serie (haga
clic aqu para el artculo), que un mismo operador con el mismo equipo tome un cierto nmero
de repeticiones dentro de cada laboratorio en un tiempo muy corto provee una situacin ideal,
que deber ser la variacin ms pequea entre lecturas. Esto se transforma en la medida de
repetibilidad de las mediciones y se representa calculando la desviacin estndar de la
repetibilidad.
Generalmente slo se necesita una pequea cantidad de repeticiones para cada protocolo de
prueba en cada laboratorio. Al promediar los resultados de muchos laboratorios nos damos
cuenta de cual debera ser el comportamiento de un laboratorio tpico. Por supuesto, todo esto
depende de la cantidad de laboratorios participantes y del grado en que representen el mundo
real de los laboratorios. Entonces, si slo participan 10 laboratorios, especialmente si han sido
los que desarrollaron la norma, puede objetarse el hecho de asumir que cualquier otro
laboratorio al azar tendr igual comportamiento. Este podra ser por cierto el caso de los nuevos
mtodos.
Cuando ejecutamos el mtodo de prueba en muchos laboratorios diferentes sobre el mismo
material, esperamos descubrir todas las variaciones potenciales que puedan ocurrir cuando se
utilice el mtodo de prueba. Debido a que ahora tenemos diferentes operadores, diferentes
equipos y diferentes condiciones ambientales, se habrn introducidas todas las condiciones
intermedias y otras ms. De este modo, debemos esperar tener una mayor variabilidad entre los
resultados de los diferentes laboratorios. La medida de esta variacin mayor debida a las
lecturas tomadas entre laboratorios se conoce como desviacin estndar de la reproducibilidad.
Una vez ms, el problema de interpretar esta variacin es que depende de la cantidad de
laboratorios que participan. Cuando slo se utiliza una muy pequea muestra de todos los
laboratorios que pueden realizar el mtodo, debe tenerse la precaucin de no creer que estos
resultados son tpicos de todo lo que pudieron haber hecho todos los laboratorio con la misma
prueba. Adems, tambin es importante analizar los resultados para ver si algunos laboratorios
siempre tienen un desempeo diferente. A menudo, la principal razn para la variacin entre
laboratorios es consecuencia de algn tipo de desviacin, o diferencia sistemtica, que ocurre en
uno o ms de los laboratorios. Es un problema darse cuenta de esto cuando solamente participa
una muy pequea cantidad de laboratorios (por ejemplo, menos de 10).
Si utilizamos los trminos repetibilidad y reproducibilidad como descriptores de la naturaleza de
la variacin, entonces esa variacin se computa mejor como desviacin estndar. Miremos ms
de cerca cmo se definen estos trminos en los ILS.
Cuando los trminos r y R se presentaron por primera vez, la idea era brindar una comparacin
simple aproximada para un caso muy especial en el uso de los resultados de los ILS. El valor
de r, llamado el intervalo de repetibilidad, se halla simplemente multiplicando la desviacin
estndar de la repetibilidad por 2.8, es similar a la estimacin estadstica de un intervalo de
confianza del 95% en la diferencia entre dos lecturas. Entonces, al utilizar rreducimos la jerga
estadstica. Lo mismo ocurre con R, que es la desviacin estndar de la reproducibilidad por 2.8.
Con estos clculos llegamos al intervalo de reproducibilidad, que usamos luego para comparar la
diferencia entre un par de resultados de prueba reales que podemos observar de dos
laboratorios.
Entonces, estos tipos particulares de intervalos suponen lo siguiente:
Los datos normalmente estn distribuidos, es decir, los laboratorios se eligen al azar de una
distribucin de laboratorios que tienen aproximadamente la misma variacin que los
resultados de los ILS.
Slo estamos comparando dos lecturas independientes; es decir, dos repeticiones realizadas
por un mismo operador o pruebas nicas realizadas en slo dos laboratorios.
Una decisin de significacin se basa en una probabilidad del 5% de que la diferencia sea
slo una diferencia al azar.
Que las pruebas en cuestin estn dentro del rango de las realizadas en los ILS.
Algunos otros comentarios a tener en cuenta:
Como mencion anteriormente, puede haber desviaciones graves en las pruebas realizadas
en los ILS, especialmente cuando slo participaron unos pocos laboratorios, lo que trae a
colacin la cuestin de cuanta confianza asignar a la estimacin para una muestra en
particular.
La E691 actualmente describe el caso en el que se toman dos muestras. La norma ILS de la
International Organization for Standardization(Organizacin Internacional de Normalizacin),
la ISO 5727, Exactitud (verdad y precisin) de los mtodos y resultados de medicin,
sugiere maneras de comparar muestras de tamao diferente ya sea para repetibilidad o
reproducibilidad basadas en la modificacin del multiplicador de la desviacin estndar.
Aqu surge una cuestin. Quizs se desee variar la posibilidad de tomar la decisin de que
hay problemas con los resultados; por ejemplo, si desea una posibilidad de 1% de obtener
accidentalmente una diferencia tan grande como su intervalo, el valor de 2.8 debera
cambiarse a alrededor de 3.6.
An ms importante resulta el uso de comparacin de muestras. Por ejemplo, si se hacen
muchas comparaciones en pares, la posibilidad de que una sea diferente al azar aumenta
rpidamente.
Ejemplo - estudio de glucosa srica E691
Para un estudio de glucosa srica (azcar en sangre utilizada para controlar la diabetes), ocho
laboratorios que realizaron pruebas a cinco muestras de sangre de referencia diferentes, que
oscilaban de bajo nivel de azcar a muy alto nivel, midieron cada material tres veces. En la tabla
se muestran las estadsticas clave resumidas (Tabla 11 en E691). La primera columna contiene
los promedios de material de muestra, seguidos por la desviacin estndar de la
repetibilidad, sr y luego la desviacin estndar de la reproducibilidad, sR. En todos los casos salvo
el primero, sR es mayor que sr. Debe tenerse en cuenta que r es 2.8 veces sr y R es 2.8
veces sR.
Para interpretar estos valores de la desviacin estndar, si tuviramos una lectura de alrededor
de 135 (material C), y tuviramos una gran cantidad de laboratorios que realizan una prueba a
ese material, entonces el 95% de las lecturas caera aproximadamente en +4.3 unidades (el
valor de r para el material C o alrededor de 2 desviaciones estndar del promedio o un rango de
alrededor de 8.6 unidades en total). Si se tomaran dos laboratorios al azar, entonces el 95 de las
veces la diferencia entre las dos lecturas no debera superar las 6 unidades (el valor de R para el
material C).

Material Sr SR r R
A 41.5183 1.0632 1.0632 2.98 2.98
B 79.6796 1.4949 1.5796 4.19 4.42
C 134.7264 1.5434 2.1482 4.33 6.02
D 194.7170 2.6251 3.3657 7.35 9.42

E 294.4920 3.9350 4.1923 11.02 11.74


Prximo nmero: Parte 3 - Repetibilidad y reproducibilidad en el anlisis de sistemas
de medicin o metodologa de "medida R&R.
Referencia
1. Comit de E11 de la ASTM sobre Calidad y estadsticas

P y R extra
P: Con respecto al uso de la condicin de precisin intermedia segn se muestra en la
columna Mediciones sucesivas de la edicin Marzo/abril: Existe una manipulacin de
uno de estos clculos que puede utilizarse cuando uno busca lmites relacionados con
la condicin de precisin intermedia? Jeff Monson
R. La respuesta breve es s. La precisin intermedia (R) se define en la norma ASTMD6299,
Prctica para aplicar el control de calidad estadstico y las tcnicas de grficos de control para
evaluar el desempeo del sistema de medicin analtica, como 2,77 veces la desviacin estndar
de los resultados de la prueba de control de calidad del laboratorio obtenidos bajo condiciones
de precisin en el lugar. Una aplicacin tpica de Rsera determinar si el material retenido de un
lote en particular de producto lanzado se ha degradado con el tiempo. Para esa aplicacin, un
laboratorio har pruebas del material retenido y comparar el resultado de la prueba con el
resultado de la prueba original. Si la diferencia excede R, entonces hay una evidencia slida de
que el material retenido se ha degradado, sujeta a la suposicin de que el mtodo de prueba
est bajo control estadstico al momento de obtenerse los resultados de la prueba original y al
material retenido, y que el material del control de calidad en el que se basa Res de composicin
similar al retenido. Alex Lau

Neil Ullman es profesor jubilado de matemticas y tecnologa mecnica y ex-presidente del


Comit E11 sobre Calidad y estadsticas. En la actualidad es presidente del Subcomit E11.20
sobre Evaluacin y control de calidad de mtodos de prueba, y es miembro de la ASTM y la
American Society for Quality (Sociedad estadounidense de calidad). Recientemente ha recibido
el premio Harold F. Dodge del Comit E11.
Dean Neubauer es el coordinador de la columna Data Points y presidente de las publicaciones
del E11.90.03.

Das könnte Ihnen auch gefallen