Sie sind auf Seite 1von 40

Cualquier medida llevada a cabo en el laboratorio analtico lleva asociado algn error.

Los errores en los resultados de anlisis bioanalticos pueden tener efectos sociales y personales de importancia. El verdadero valor de algo es imposible medirlo, siendo la mejor opcin la aplicacin cuidadosa de una tcnica establecida. Los cientficos usan clculos estadsticos para afinar sus juicios relativos a la calidad de las medidas experimentales. En este tema se tratan las aplicaciones ms comunes de las pruebas estadsticas al tratamiento de datos analticos.

En el trabajo cientfico se manejan tanto con nmeros exactos como inexactos. Como ejemplo de nmeros exactos, tenemos los nmeros enteros o fracciones (1, 2, 3; , ), las constantes matemticas (, e...) y las relaciones (1 kg=1000g; 4184 J=1 cal). Los nmeros inexactos son aquellos obtenidos a travs de mediciones experimentales, siempre conllevan una incertidumbre asociada.

Como ya se indic en el Tema 1, la definicin de varias rplicas de la muestra resulta indispensable para estimar la fiabilidad de los resultados, ya que un nico anlisis no informa acerca de la variabilidad asociada.

Los resultados de varias rplicas de una misma muestra tienden a ser distintos entre s, de forma general se considera al valor central del conjunto como la mejor estimacin. Supongamos que se determina la concentracin de hierro en una muestra en seis alcuotas de la muestra (los seis resultados aparecen representados como puntos rojos), cuyo valor verdadero de contenido de hierro es 20,00 ppm. El valor central corresponde a 19,78 ppm y debe ser ms fiable que cualquiera de los resultados individuales. La medida de la tendencia central ms utilizada es la media, tambin conocida como media aritmtica, valor medio o promedio. La media se obtiene al dividir la suma de los valores de las distintas medidas entre el nmero de medidas (N) del conjunto. La mediana es el resultado medio cuando los datos se escriben en orden creciente o decreciente. Para un nmero de resultados impar, la mediana se obtiene de forma directa, si el n de resultados es par, se usa la media del par central. En casos ideales, la media y la mediana coinciden, pero difieren cuando el nmero de medidas del conjunto es pequeo.

La precisin es una medida de la reproducibilidad de un resultado. Si se mide una cantidad varias veces exactamente de la misma manera y los valores obtenidos se aproximan mucho entre s, se dice que la medida es precisa. Si los valores varan mucho entre s, se dice que la medida no es precisa. Son tres los trminos de uso generalizado para describir la precisin de un conjunto de resultados: desviacin estndar, varianza y coeficiente de variacin. Las tres funciones informan de cunto difiere de la media una medida xi, lo que se llama desviacin de la media, di. La exactitud describe la proximidad del valor medido respecto al valor verdadero o aceptado.

La diferencia entre precisin y exactitud puede verse claramente a travs de esta diapositiva. Una medida puede ser reproducible pero errnea. Por ejemplo, si se comete un error al preparar una disolucin patrn de Fe, sta no tendr la concentracin deseada. Al llevar a cabo la cuantificacin de Fe en una muestra repetidas veces, los resultados pueden ser muy precisos pero inexactos, porque la concentracin real de la disolucin patrn no es la que desebamos preparar. En definitiva: buena precisin, mala exactitud. Pero tambin puede ocurrir que las medidas sean poco reproducibles, pero en torno al valor correcto, porque la disolucin patrn fuese preparada sin errores pero el mtodo analtico empleado no sea muy reproducible. En definitiva: mala precisin, buena exactitud. Situacin ideal: procedimientos exactos y precisos.

La exactitud es con frecuencia ms difcil de determinar que la precisin, pues para la precisin basta con analizar varias rplicas de la muestra. Pero para determinar la exactitud se requiere del valor verdadero. Para obtener el valor verdadero de un parmetro, ste habr tenido que ser medido experimentalmente y toda medida experimental lleva asociada un error. Podramos definir el valor verdadero como el obtenido por una persona experimentada empleando un procedimiento bien establecido o, mejor an sera preferible que ese valor hubiese sido obtenido a travs de diferentes procedimientos analticos y en distintos laboratorios analticos. En cualquier caso, el error asociado podra minimizarse pero nunca anularse, por ello parece ms apropiado hablar de valor aceptado ms que verdadero. La exactitud se expresa en trminos del error absoluto o relativo. El error absoluto del resultado (19,8) obtenido inmediatamente a la izquierda del valor verdadero (20) es 0,2ppm. El error absoluto del resultado 20,1 ppm es +0,1 ppm. Obsrvese que se mantiene el signo al expresar el error, pues nos informa si se produce por exceso o defecto. El error relativo es frecuentemente ms til que el error absoluto.

Cualquier medida lleva asociada una incertidumbre, que se llama error experimental. Los resultados pueden expresarse con un mayor o menor grado de confianza, pero nunca con total certeza. Los anlisis qumicos se ven afectados al menos por dos tipos de errores: SISTEMTICOS y ALEATORIOS. Existe otro tipo de error denominado BRUTO.

El error sistemtico o determinado hace que la media de un conjunto de datos difiera del valor aceptado y se origina principalmente por un fallo del diseo del experimento o por un fallo del equipo. Este tipo de error es difcil de descubrir aunque no imposible. Supongamos que para la liberacin de reactivo valorante en una volumetra directa utilizamos una bureta de 10 mL, que no hemos calibrado previamente y el volumen liberado hasta alcanzar el punto final de la valoracin es de 8,62 0,02 mL. Si supuestamente se estn obteniendo resultados por exceso, es probable que el volumen real liberado de valorante sea superior a los valores de lectura de bureta. La calibracin del material volumtrico sera una buena forma de corregir este error sistemtico. Existen diferentes modos de detectar un error sistemtico, citamos algunos de ellos: - Analizar muestras de composicin conocida, tales como un material de referencia certificado. - Analizar muestras blanco. Si se observa un resultado distinto de cero, el mtodo acarrea un error por exceso. - Usar mtodos analticos diferentes para llevar a cabo el anlisis. Si los resultados no concuerdan, hay un error en uno o ms de los mtodos. - Comparacin entre varios laboratorios. Designamos distintas personas para analizar la misma muestra mediante el mismo o distintos mtodos analticos.

10

El error aleatorio o indeterminado se origina por efecto de variables incontroladas. Tiene igual probabilidad de ser positivo que negativo. Siempre est presente y no puede ser corregido. Como ejemplo de error aleatorio podemos citar el producido al tomar la lectura de volumen en una bureta. Si una determinada lectura es llevada a cabo por personas diferentes, con toda probabilidad cada persona dara un valor distinto para la segunda cifra decimal, pues la interpolacin entre rayas es algo subjetiva. Incluso una misma persona al leer la misma magnitud varias veces puede dar lecturas distintas. Aunque estos errores no pueden eliminarse, s se pueden minimizar mejorando el trabajo experimental.

11

El error bruto generalmente ocurre de forma ocasional y suele ser grande. Puede ser comn que un humano cometa este tipo de errores, por ejemplo perder parte del precipitado antes de su pesada en una gravimetra. Estos errores dan ligar a valores atpicos, son valores que difieren mucho de los dems en un conjunto de datos de medidas replicadas. La determinacin de un valor atpico puede llevarse a cabo a travs de pruebas estadsticas.

12

En la mayora de los trabajos experimentales es necesario hacer operaciones aritmticas con varios datos, teniendo cada uno de ellos un error aleatorio asociado. La incertidumbre ms probable del resultado no es simplemente la suma de los errores individuales, pues es probable que algunos de ellos sean positivos y otros negativos. Por esta razn, es probable que algunos de los errores se anulen entre s. En la diapositiva se muestran las ecuaciones matemticas usadas para el clculo de propagacin de errores en sumas y restas, as como en productos y cocientes.

13

El nmero de cifras significativas es el mnimo nmero de dgitos necesarios para escribir un valor dado en notacin cientfica sin perder exactitud. Otra forma de definir lo que son las cifras significativas de una determinada medida es el nmero de dgitos conocidos con certeza ms el primero incierto. Por ejemplo: al tomar la lectura de volumen en la bureta de la diapositiva, se puede afirmar que el nivel del lquido es mayor de 9,6 y menor que 9,7 mL con certeza. Podemos estimar que el lquido entre las dos graduaciones corresponde a 0,08 mL, por tanto segn el acuerdo de cifras significativas podemos asegurar que el volumen medido es de 9,68 mL, que tiene 3 cifras significativas, dos ciertas y una incierta. La cifra cero puede ser significativa o no dependiendo de su ubicacin en el nmero: Un cero rodeado por otros dgitos siempre es significativo: 30,22 mL Los ceros que sitan slo la coma decimal no son significativos: 0,03022 L, sigue teniendo 4 cifras significativas. Los ceros al final del nmero pueden ser significativos o no: Si se expresa el volumen de un vaso como 2,0 L, la presencia del cero indica que el volumen se conoce hasta unas dcimas de litro, por lo que ese 0 es significativo. Si este mismo volumen lo expresamos como 2000 mL, si no se conoce el volumen en centsimas de litro, seguimos teniendo dos cifras significativas.

14

Cuntos dgitos deben mantenerse en un resultado tras hacer operaciones aritmticas? En la suma y resta si los trminos tienen el mismo nmero de dgitos, el resultado tendr el mismo nmero de decimales que los nmeros individuales. Si los nmeros que se suman o restan no tiene el mismo nmero de cifras significativas, el resultado debe expresarse con el mismo nmero de cifras decimales que la magnitud con menos cifras decimales. Ahora bien debe operarse con todas las cifras decimales y redondear al final. Cuando se opera con nmeros expresados en notacin cientfica, todos los trminos deben de tener el mismo exponente. En la multiplicacin y divisin, el resultado debe expresarse con el mismo nmero de cifras significativas del factor con menos cifras significativas. Las potencias de diez no influyen en el nmero de cifras que se pueden mantener en el resultado final.

15

La Estadstica nos proporciona herramientas para aceptar conclusiones que tienen alta probabilidad de ser correctas y rechazar las conclusiones cuya probabilidad de ser incorrectas es alta. Cuando las herramientas estadsticas son aplicadas al rea de la Qumica, hablamos de Quimiometra.

16

Cuando un experimento se repite un nmero elevado de veces y los errores son solamente aleatorios, los resultados tienden a agruparse simtricamente en torno al valor medio, asemejndose el perfil de la agrupacin obtenida a una curva ideal llamada Distribucin de Gauss. Aunque en realidad en un laboratorio no llevamos a cabo el anlisis de una misma muestra 200 ni 100 veces, lo ms habitual es repetirlo de 2 a 5 veces, tambin podemos estimar los parmetros estadsticos que caracterizan a una serie de un nmero grande de medidas. Decimos que la variacin de los datos experimentales est distribuida normalmente cuando al repetir medidas aparece una distribucin en forma de campana. Existe la misma probabilidad de que una medida sea mayor o menor que la media. Adems, la probabilidad de observar un valor disminuye a medida que aumenta la distancia a la media. La media constituye el centro de la distribucin y la desviacin estndar (s) mide el ancho de la distribucin, ste ltimo es uno de los parmetros de los que hablamos cuando al principio del tema presentamos la precisin. Se define como una medida del grado de proximidad de los datos en torno al valor de la media. Cuanto menor es s, ms estrechamente se agrupan los datos alrededor de la media y decimos que la precisin es alta.

17

Para una serie infinita de datos, la media se designa con la letra griega y la desviacin estndar con la letra griega . Hay que tener claro que nunca medimos y , pero la media y la desviacin estndar se acercan a ya , respectivamente, a medida que aumenta el nmero de medidas. Como se indic en el apartado 1.1. de este tema, la precisin se puede estimar a travs de tres trminos: desviacin estndar, varianza y coeficiente de variacin. Se denomina varianza al cuadrado de la desviacin estndar. Se llama desviacin estndar relativa (RSD) o coeficiente de variacin a la desviacin estndar expresada como porcentaje del valor medio.

18

Cuanto mayor es la desviacin estndar, ms ancha es la curva de Gauss. En toda curva de Gauss, el rea comprendida en el intervalo desde el valor medio menos la desviacin estndar hasta el valor medio mas la desviacin estndar supone el 68,3% del rea total. Es decir, es de esperar que ms de 2/3 de las medidas no disten de la media en ms de una desviacin estndar. Adems el 95,5% del rea est entre el resultado de sumar al valor medio el doble de la desviacin estndar y el resultado de restar al valor medio el doble de la desviacin estndar. El 99,7% del rea se encuentra entre los valores obtenidos al resta y sumar el triple de la desviacin estndar al valor medio. Supongamos que se emplean dos mtodos analticos diferentes, A y B para llevar a cabo la determinacin de hierro en una muestra de sangre, y que el mtodo A tiene una RSD de 0,4% y B de 1,1%. Se puede esperar que aproximadamente 2/3 de las medidas obtenidas mediante el mtodo A estn dentro del 0,4% de la media, mientras que para el mtodo B, 2/3 de las medidas estarn dentro del 1,1% de la media.

19

Para una serie finita de datos, se aproxima al valor medio y a la desviacin estndar. La Figura de la diapositiva representa la ecuacin de la curva de Gauss para =1 y =0. As el valor mximo de y se encuentra en x=, y la curva es simtrica respecto a x=. Resulta muy til expresar las desviaciones respecto de la media como mltiplos de la desviacin estndar. Esto se lleva a cabo transformando el valor de x en otro valor numrico llamado z a travs de la expresin matemtica que aparece en la diapositiva. De este modo, la probabilidad de medir z en un cierto intervalo es igual al rea de ese intervalo. Por ejemplo, la probabilidad de observar z entre -2 y -1 es 0,136 y corresponde a la zona coloreada en azul en la Figura, F1. Dado que la suma de las probabilidades de todas las medidas es la unidad, l rea debajo de la curva desde - a + es igual a la unidad.

20

La Tabla muestra los valores de las reas debajo de cada porcin de la curva de Gauss.

21

Se muestran dos casos concretos de clculo de la probabilidad de obtener valores comprendidos en ciertos intervalos.

22

La t de Student se usa muy frecuentemente para expresar intervalos de confianza y para comparar resultados de diferentes experimentos. Esta herramienta se podra utilizar para calcular la probabilidad de que el recuento de glbulos rojos de un paciente se encuentre dentro del intervalo normal. Cmo se calculan intervalos de confianza? Si se dispone de un nmero limitado de medidas, que es lo normal en anlisis qumico, no podemos hallar la verdadera media de la poblacin () ni la verdadera desviacin estndar (). Lo que podemos determinar es la media muestral y la desviacin estndar muestral. El intervalo de confianza es una expresin que me informa de que la verdadera media , est probablemente a una cierta distancia de la media obtenida experimentalmente. El intervalo de confianza de viene dado por una ecuacin matemtica, donde el valor de t se obtiene a partir de la tabla de t de Student (diapositiva 24) para (n-1) grados de libertad. A partir de la ecuacin del intervalo de confianza se observa claramente que se puede reducir la incertidumbre aumentando el nmero de anlisis (n).

23

24

Se presenta un ejercicio para clarificar el clculo de intervalos de confianza: La determinacin del contenido de hidratos de carbono en una glicoprotena, donde se obtienen los resultados replicados: 12,6; 11,9; 13,0; 12,7 y 12,5 % (m/m). Halle el intervalo de confianza del 50% del contenido en glucosa. Qu significan el resultado obtenido? Que existe un 50% de probabilidad de que la verdadera media () est en el intervalo obtenido. Si se incrementa el nivel de confianza, cmo afectar a la amplitud del nuevo intervalo de confianza?

25

Si se incrementa el nivel de confianza la amplitud del intervalo tambin lo har, si queremos aumentar la probabilidad de obtener la verdadera media, lgicamente se ampliar el intervalo aumentando la probabilidad de contener dicho valor.

26

El nmero de medidas tambin influye en la amplitud del intervalo de confianza. Cuantas ms veces se mide una cantidad, ms confianza se tiene que el valor de la media de las medidas hechas est prximo a la verdadera media de la poblacin n. De hecho, la incertidumbre disminuye en proporcin a 1/(n)1/2, siendo n el nmero de medidas.

Si mantenemos constante el nmero de medidas y el nivel de confianza, se cumplir que a mayor desviacin estndar mayor ser la amplitud del intervalo de confianza obtenido.

28

El test t se utiliza para comparar dos conjuntos de medidas y poder afirmar si son o no diferentes. Se trata de comprobar la hiptesis nula, o sea que partimos de afirmar que los valores medios de dos series de medidas no son diferentes. Idnticos no pueden ser, puesto que los errores aleatorios son inevitables. De manera que la estadstica predice una probabilidad de que la diferencia entre las dos medidas pueda deberse a dichos errores aleatorios. Si hay menos de un 5% de probabilidad de que la diferencia se deba a errores aleatorios, se suele rechazar la hiptesis nula. Segn este criterio se tendr una probabilidad del 95% de que la conclusin sea correcta.

29

Existen tres casos que se tratan de forma algo diferente, tal y como se detalla en la diapositiva.

30

Para la aplicacin de los casos puede aplicarse un patrn comn que consiste en las cuatro etapas detalladas en la diapositiva.

31

Supongamos el caso concreto en el que se compr una muestra de orina sinttica que corresponda a un material estndar de referencia certificado por el NIST (National Institute Standard Technology) con un contenido en selenio de (30,1 0,9) ng/mL. Se pretende validar un nuevo mtodo analtico para la determinacin de selenio en muestras de orina, para ello se analiza dicho material de referencia mediante el mtodo a validar. Siendo los valores obtenidos para 4 alcuotas del material de referencia: 27,6; 29,3; 28,1 y 28,9 ng/mL. Dado que el valor medio de estas cuatro medidas (28,5 ng/mL) no coincide exactamente con el valor certificado (valor verdadero o aceptado, en este caso 30,1 ng/mL), es necesario aplicar las frmulas correspondientes a este caso para calcular el valor de t. Ya que el valor de ttabulada (3,182) es menor que el de t calculada podemos afirmar que para este caso concreto existen diferencias significativas al nivel de confianza del 95% entre los dos resultados (el obtenido y el certificado), o lo que es lo mismo la probabilidad de que dichos valores sean iguales es inferior al 5%.

32

Se propone ahora el caso en el que se mide el contenido de selenio en una nica muestra de orina, mediante dos mtodos analticos diferentes, por ejemplo espectrometra de absorcin atmica con atomizacin electrotrmica (ETAAS) y espectrometra de absorcin atmica con generacin de hidruros (HG-AAS). En el caso propuesto se llevan a cabo cuatro medidas con cada tcnica. Una vez calculados el valor medio y la desviacin estndar para cada grupo de medidas, se plantea la pregunta Concuerdan entre s los dos resultados obtenidos dentro del error experimental? Para responder a esta pregunta se calcula el valor de scombinada mediante la ecuacin correspondiente y seguidamente el valor de tcalculada, que se comparar con el valor tabulado de t para (n1 + n2 -2) grados de libertad. En el caso propuesto el nmero de medidas llevadas a cabo con cada mtodo es el mismo, n1=n2, pero podran ser diferentes. Dado que tcalculada > ttabulada en este caso particular podemos afirmar que existen diferencias significativas al nivel de confianza del 95% entre los dos resultados.

33

En este caso se trata de dos mtodos analticos diferentes con los que se hace una nica medida de cada de las muestras bajo anlisis. No se duplica ninguna medida. En el caso propuesto ahora llevamos a cabo una nica medida de selenio en cuatro muestras diferentes de orina mediante dos mtodos diferentes de anlisis. El mtodo A ha aportado resultados ms bajos que el B en tres de las muestras analizadas. Son sistemticamente diferentes ambos mtodos?. Aplicamos el test de las diferencias individuales entre los resultados de cada muestra, calculando el valor de t y comparndolo con el tabulado. En el caso aqu propuesto, dado que tcalculada < ttabulada (al 95%de nivel de confianza) afirmamos que entre estas dos tcnicas no existen diferencias significativas al nivel de confianza citado.

34

El test F nos informa si dos desviaciones estndar son significativamente diferentes entre s. F es el cociente de los cuadrados de las desviaciones estndar, para su clculo se coloca siempre en el numerador la desviacin estndar mayor, de modo que se cumpla que el valor calculado para F sea mayor o igual a 1. El valor de F tabulado se extrae de la tabla que aparece en la siguiente diapositiva. Si Fcalculada > Ftabulada, la diferencia entre las desviaciones estndar s es significativa al 95% de confianza, que corresponde a los valores tabulados.

35

Cuando un dato no es coherente con los restantes, se puede usar el test Q como ayuda para decidir si se mantiene o se desecha dicho dato sospechoso. Consideremos los 5 resultados siguientes: 130,1; 130,7; 128,8; 137,8 y 131,4. Se rechaza o se mantiene el valor 137,8?. Para aplicar el test Q, se ordenan los datos en orden creciente y se calcula Q, sabiendo que el recorrido es la dispersin mxima entre los datos y la divergencia la diferencia entre el valor sospechoso y el valor ms prximo.

37

Seguidamente se obtiene el valor tabulado de Q, segn los datos de la tabla de valores de Q para el rechazo de datos, que se muestra en la siguiente diapositiva, para finalmente comparar los valores de Q. Si Qcalculada > Qtabulada, se descarta el punto sospechoso. En el caso propuesto el dato sospechoso debe descartarse, con un 90% de confianza dado que los valores de Q se hallan tabulados para dicho nivel. En realidad la decisin final depende de uno mismo, pues hay quien afirma que no se debe descartar nunca un dato a no ser que se sepa que existe un error de procedimiento que condujo a esa medida particular; hay quien repite la medida sospechosa varias veces hasta asegurarse si est o no realmente fuera de los esperable.

38

39

Das könnte Ihnen auch gefallen