You are on page 1of 45

!

UNIVERSIDAD NACIONAL MAYOR


DE SAN MARCOS
FACULTAD DE QUÍMICA E
INGENIERÍA QUÍMICA
ESCUELA ACADÉMICO
PROFESIONAL DE QUÍMICA
QUÍMICA ANALÍTICA CUANTITATIVA
CÓDIGO: QA7431
Prof. Quím. D. Inés DELMAS ROBLES 31  
Quimiometría

“Quimiometría es la disciplina Química


química que utiliza métodos Química Analítica Agroindustria
ambiental
matemáticos y estadísticos para
(a) diseñar o seleccionar
procedimientos de medida y Aplicaciones de
experimentos óptimos, y (b) para la quimiometría
proporcionar la máxima Industria
Farmacéutica
información química mediante el
Industria de los
análisis de datos químicos“
alimentos
Química Industria
forense Forestal

International Chemometrics Society (ICS), 1975

32  
INTRODUCCIÓN A LA ESTADÍSTICA

EVALUACIÓN DE LA CALIDAD DE LOS RESULTADOS


Es imposible realizar un análisis químico sin que los
resultados estén totalmente libres de errores o
incertidumbre. No obstante, se espera minimizarlos y
estimar su magnitud con una exactitud aceptable. Cada
medición esta sujeta a muchas incertidumbres que, al
combinarse, pueden producir una dispersión en los
resultados.
No es posible eliminar por completo la incertidumbre en las
mediciones, de ahí que no se conozca el verdadero valor de
una cantidad. Sin embargo, se puede evaluar la magnitud
del error en una medición y así, dentro de un cierto nivel de
probabilidad, es posible definir los límites entre los que se
puede encontrar el valor verdadero de una cantidad medida.
33  
Tampoco es fácil determinar la exactitud y precisión de los
datos experimentales; pero es imprescindible hacer estos
estimados siempre que se obtengan resultados en el
laboratorio, de lo contrario, los datos cuya precisión y
exactitud se desconocen son inútiles. Hay que tener en
cuenta, que los resultados que no son particularmente
exactos aun pueden servir si se conocen los límites de
incertidumbre.

Desafortunadamente, no existe un método simple y


universal para determinar la fiabilidad de los datos con
absoluta certeza. La fiabilidad de los datos se puede
evaluar de varias maneras:

1.  Diseñando los experimentos de tal forma que se detecten


los errores.
34  
2. Analizando patrones de concentración conocida, y
comparar los resultados obtenidos con el patrón en
referencia.
3. Calibración frecuente de los equipos mejora la calidad de
los datos.
4. Aplicando pruebas estadísticas a los datos obtenidos.

Aun así, ninguna de estas medidas es perfecta, y se tendrá


que juzgar la exactitud de los resultados con criterios
más rigurosos, a medida que se gana experiencia.

Es necesario también tener en cuenta ¿cuál es el máximo


error que se puede tolerar en el resultado? Contestar
esta pregunta, esta supeditado al uso que se le va a dar
a los resultados analíticos obtenidos.

35  
Estos ejemplos representan solo una parte de los
problemas posibles que surgen de la existencia de errores
experimentales en el análisis cuantitativo. Sin embargo,
como se ha visto, los problemas deben ser resueltos si los
datos cuantitativos tienen algún significado real. Es pues
obvio que se deban estudiar los diferentes Tipos de Error
con mas detalle.

1. Crasos, groseros o accidentales.


Se reconocen rápidamente, se pueden definir como
aquellos que son tan importantes que no existe otra
alternativa que abandonar el experimento y comenzar de
nuevo y esto se puede deber a:
a) Avería de un instrumento.
b) La caída o vertido accidental de una muestra crucial.
c) Contaminación de un reactivo que se considero puro.
36  
2.  Sistemáticos o determinados.
Influyen en la exactitud de los resultados, tienen un valor
definido, una causa conocida y una magnitud semejante
a la que tiene las mediciones repetidas efectuadas en la
misma forma.
Existen tres tipos de errores sistemáticos y se debe al:

a) Instrumento de medida. Todos los aparatos para medir


son una fuente de error sistemático, ya sea porque tenga
pequeños defectos o por inestabilidad de sus
componentes.
Ejemplo:
Las pipetas, buretas y los matraces volumétricos (fiolas)
pueden entregar o retener volúmenes distintos a lo que
indica su graduación. Se puede eliminar al calibrar el
material.
37  
b) Método. Que surgen del comportamiento químico o físico
no ideal de los sistemas analíticos. Este comportamiento
no ideal puede deberse a que algunas reacciones son
lentas o que no se completan, a la inestabilidad de
algunas especies, a las reacciones secundarias que
interfieren con el proceso de medición.

Ejemplo:
En las determinaciones volumétricas un error en el método
se atribuye al pequeño exceso del reactivo necesario para
el cambio de color del indicador que evidencia el punto
final de la reacción.

Estos errores son difíciles de detectar y son por lo tanto los


mas graves.

38  
c) Personal. Se producen por el mal manejo del analista
por falta de precaución o experiencia. Se debe tener en
cuenta que en la mayoría de los análisis es necesaria la
apreciación personal.

Ejemplo:
Al estimar la posición de la aguja ente dos divisiones de la
escala, al percibir el color de una solución en el punto
final de una titulación, al medir el nivel de un líquido
respecto a la graduación de una pipeta o bureta.

Los errores sistemáticos pueden ser:


a)  Constantes. Su magnitud no depende de la cantidad
medida. Este tipo de error se vuelve mas grave cuando
se reduce el tamaño de la cantidad medida.

39  
Ejemplo:
El volumen necesario para que cambie el color en una
titulación. Una forma de reducirlo es tomar una muestra
tan grande como sea posible.

b) Proporcionales. Aumentan o disminuyen conforme al


tamaño de la muestra que se analiza.

Ejemplo:
La presencia de contaminantes que interfieren en una
muestra. La única forma de reducirlo es separando al
contaminante que interfiere.

Ø  Los errores sistemáticos debido a los instrumentos suelen


ser detectados y corregidos con la calibración.

Ø  Los errores personales pueden reducirse si el analista es


cuidadoso y disciplinado.
40  
Ø  El error del método por la dificultad que presenta su
detección, es bueno realizar los siguientes pasos a fin de
detectar y corregir un error en el método.

1) Análisis por estándares de referencia. A los que se le ha


comprobado su concentración.
2) Utilizando un método analítico independiente y confiable
y de ser posible muy diferente al que sé esta usando.
3) Blanco. Se realizan todas las etapas del análisis sin la
muestra.

En el error sistemático total (puede existir varias fuentes de


error, algunos positivos y otros negativos) es denominado
el sesgo de la medida

41  
3. Aleatorios o indeterminados. Siguen la ley de la
probabilidad constituyen errores fortuitos (al azar). La
propia naturaleza de estos errores hace imposible
encontrar ejemplos que los alcancen.
El objeto de toda medida es establecer el valor verdadero
de la cantidad medida.

Las leyes de la probabilidad son casi evidentes por si


mismas:
a) Los errores muy grandes aparecen al azar.
b) Los errores pequeños aparecen con frecuencia.
c) Los errores positivos y negativos aparecen con igual
frecuencia; el valor más probable viene por la media
aritmética de los valores medidos.

42  
Fuente de errores aleatorios

Tipo de Método Fuente de error


Peso o pipeteo
Absoluto Tara de los crisoles
Peso de precipitado
Peso de la sustancia patrón
Cualquier enrase en fiolas
Estequiométricos Pipeteo de la muesra
Enrase de la bureta
Lectura de la bureta

Peso de la muestra
Peso de los patrones
Relativos Cualquier medida en volumen
Medida de la señal experimental
Calibración

Cuando estas fuentes se detectan se pueden eliminar.


43  
Ejemplo:
Cuatro estudiantes (A – D) valoran 10,00mL de NaOH
exactamente 0,1M con HCl exactamente 0,1M
Errores aleatorios y sistemáticos.

Valor promedio: A = 10,10; B = 10,01; C = 9,90; D = 10,01

44  
Diagrama de puntos de los datos de la tabla anterior.

45  
Exactitud.- La Organización Internacional de Estándares
(ISO) define la exactitud como “el grado de concordancia
entre el resultado de un ensayo y el valor de referencia
aceptado” del analito. Bajo esta definición, la exactitud de un
resultado individual puede ser afectada por los dos errores:
aleatorios y sistemático, y su resultado promedio también
tiene contribuciones de ambas fuentes de error.
Precisión.- Expresa la reproducibilidad de una medida, es
decir, la concordancia entre varias medidas de la misma
sustancia o propiedad. La precisión describe errores
aleatorios.
Repetibilidad.- Es cuando el que realiza el análisis es el
mismo analista utilizando los mismos materiales y los
realizaría en las mismas condiciones de laboratorio
(temperatura, humedad).
46  
Reproducibilidad.- Cuando estos mismos análisis son
realizados por diferentes analistas utilizando diferentes
materiales y en diferentes laboratorios

Valor verdadero

Una serie de Exacto y


Resultados preciso

Otra serie de Preciso pero


resultados inexacto

Una serie mas Impreciso e


de resultados inexacto

Magnitud del resultado


47  
TERMINOS ESTADÍSTICOS
__
Media o promedio (X). Es la media aritmética de todos los
valores medidos y puede representarse por:

x1 + x2 + x3 + ........ + xn ∑ xi
X= =
N N

Donde: N = número de medidas


X = Media
∑ = suma de varios números
xi = valor observado o medido

48  
Mediana. Es el valor del cual se distribuyen los datos
repetidos. La mitad de los datos tiene un valor mayor que la
media y la otra mitad un valor menor que la media. En un
conjunto impar de datos se puede evaluar directamente, para
un conjunto par es el promedio del par central.

Desviación estándar (σ). Para una serie que consiste en


una serie de resultados y cuando el valor verdadero se
conoce, se obtiene:

∑ (xi – xt)2
σ =
√ n–1

49  
Cuando xt se desconoce, como es lo común en el
laboratorio y el número de resultados es pequeño se
convierte en (s) y su formula es:

∑ d i2
s=
√ n–1

donde di = xi - X

Varianza. Es el cuadrado de s y es una cantidad estadística


muy importante. Su importancia se pone de manifiesto
cuando se realiza un análisis de propagación de errores

varianza = s2

50  
Desviación estándar relativa. es una estimación del error
dividida por una estimación del valor absoluto de la
cantidad medida. Se puede calcular en porcentaje según:
s
sr = x 100
X

Ejemplo:
En el análisis de una muestra de sal de playa se obtuvieron
los siguientes resultados por método gravimétrico:
% Na: 55,67; 54,99; 55,68; 55,60; 54,98; 55,63; 56,59
a) Determine la Media y la Mediana
b) Determine s
c) Desviación estándar relativa

51  
2. Diez analistas obtuvieron los siguientes resultados en la
determinación de calcio con (NH4)2C2O4 y que se calcino
a 500°C, los resultados fueron:

Analista WMuestra WResiduo % CaO Analista WMuestra WResiduo % CaO


1 0,5020 0,2438 6 0,5060 0,2629
2 0,5000 0,2551 7 0,4995 0,2408
3 0,5088 0,2386 8 0,5005 0,2517
4 O4990 0,2389 9 0,4985 0,2453
5 0,5010 0,2615 10 0,5028 0,2280

Determine el % Cao, la media, la mediana, la desviación


estándar, varianza y el rango

52  
3. Se obtuvieron los siguientes datos del contenido de plomo
en agua de río.

Analista ppm Pb Analista ppm Pb

1 15,4 5 17,6
2 16,6 6 16,9
3 14,7 7 15,9
4 14,2 8 14,9

Determine la media, mediana, rango, desviación estándar,


varianza y desviación estándar relativo.

53  
POBLACIÓN.

Población o universo se denomina al número ilimitado


teórico de datos. Por esto es necesario que las leyes de la
estadística deban modificarse cuando se aplican a muestras
pequeñas, ya que un número menor de datos puede no ser
representativo de la población.

Resultados de 50 determinaciones [NO3-] en µg/mL

24   54
Si reunimos los datos en una tabla de frecuencia tendremos
lo siguiente:

[NO3-] µg/mL (Serie 1) Frecuencia (Serie 2)


0.46 1
0.47 3
0.48 5
0.49 10
0.50 10
0.51 13
0.52 5
0.53 3
25   55
Histograma de frecuencia de la tabla anterior:

14

12

10
Frecuencia

8
Serie1
6 Serie2
4

0
1 2 3 4 5 6 7 8
Conc. Nitratos

56
26  
Distribución Normal o Gausiana
Es un modelo matemático descrita por la ecuación:
1
y= exp {-(x - µ)2/2σ2}
σ √ 2π
Donde: σ = desviación estándar población
µ = media de la población

No es necesario recordar, esta formula tan complicada,


aunque algunas de sus propiedades son importantes.

27  
57
La curva es simétrica respecto a µ y cuanto mayor sea el
valor de σ, mayor es la variabilidad de la curva. Un análisis
mas detallado demuestra que cualquiera que sea los
valores µ y σ la distribución tiene las siguientes
propiedades

28  
58
En una distribución normal con
media µ y desviación estándar σ,
aproximadamente, el 68% de los
valores de la población caen
dentro de ± 1σ de la media caen
en el intervalo (0,483 – 0,517),
aproximadamente el 95% de los
valores cae dentro de ± 2σ de la
media caen en el intervalo (0,467 –
0,533) y aproximadamente el
99,7% de los valores caen dentro
de ± 3σ de la media caen en el
intervalo de ( 0,450 – 0,550) .
33 datos caen dentro 66%
49 datos caen dentro 98%
Todos en el 99,7%

29   59
En una distribución normal con media conocida, µ y
desviación estándar, σ, la proporción exacta de valores que
caen dentro de un intervalo cualquiera puede encontrarse a
partir de las tablas, con tal que los valores se hayan
estandarizado, de manera que proporciones valores z. esto
se realiza expresando un valor de x en términos de su
desviación de la media en unidades de la desviación
estándar, σ, es decir:
(x – µ)
Variable normal estandarizada z =
σ
La distribución no solo se aplica cuando se toman medidas
repetidas de un mismo ejemplar. A menudo los resultados
obtenidos se adaptan a la distribución normal cuando se
mide la misma magnitud para diferentes materiales.
60
30  
Muestra en el lenguaje estadístico se denomina a un
número finito de observaciones experimentales y se define
como una pequeña fracción de un número infinito de
observaciones que, en principio, podrían realizarse
también en un tiempo infinito.

Grados de libertad. Indica el número de datos


independientes introducidos en el cálculo de la desviación
estándar. Cuando no se conoce µ, los valores X y s se
deben obtener de una serie de datos repetidos. Por
consiguiente solo n – 1 desviaciones dan una medida
independiente de la precisión de la serie.

Rango (R). Es la diferencia entre el resultado mayor


menos el menor.
31   61
Distribución de Student o T de Student.

Hemos visto que, dadas xt o µ y σ para la distribución normal


de una población infinita, se puede establecer un enunciado
preciso a pesar de la desigualdad que existe al obtener de la
población una observación que cae fuera de ciertos límites.

Como en la práctica trabajamos con número finito de datos, y


no conocemos xt o µ ni σ sino el X y s, ya que estos
estimados están sujetos a la incertidumbre. W. S. Gosset,
químico inglés que escribía bajo el seudónimo de Student,
estudió el problema de hacer predicciones basándose en una
muestra finita sacada de una población desconocida y publicó
una solución en 1908.

32  
62
La teoría del trabajo de Student la podemos utilizar por tener
bases sólidas en la estadística de resultados de química. La
cantidad “t” (que con frecuencia se denomina t de Student)
se define por la expresión:

√n
± t = (X – µ)
s
Las tablas de valores “t” relacionados con diversas
desviaciones o niveles de probabilidad para diferentes
grados de libertad se anexan. En esta relación los grados de
liberta son uno menos que “n” que es el número de
observaciones. Los valores de “t” se calculan tomando en
cuenta que los valores x t y X no son los mismos, para
compensar la inexactitud de utilizar “s” como un estimado
de σ.

33   63
Límites de confianza.
Con la ecuación anterior que defina “t”, obtenemos el
intervalo de confianza de la media mas conocido como
límites de confianza.
t.s
µ= X ±
√n

Podemos utilizar este intervalo de confianza para estimar la


probabilidad de que la media de la población µ, este dentro
de cierta región centrada en X, la media experimental de
nuestras mediciones. Sin embargo, al tratar datos analíticos
es más usual adoptar una probabilidad aceptable y luego
encontrar los límites de cualquiera de los dos lados de X
hasta los que debemos para asegurarnos que hemos
abarcado µ.
64
34  
Criterios para descartar una observación.

Es probable que cuando sé esta realizando una serie de


mediciones repetidas, aparezca un resultado que parece
estar fuera del grupo, por lo que es necesario decidir, si se
descarta o no este resultado.
Si el número de resultados obtenidos es grande, el
problema de descartar un valor no es importante:

1º Un solo valor tendrá un efecto pequeño sobre la media

2º Las consideraciones estadísticas dan una respuesta


clara, considerando la probabilidad de que el resultado
sospechoso es miembro de la misma población.

65
35  
Por otro lado, cuando el número repetido es pequeño
surge un verdadero dilema:
1º El resultado divergente ejerce un efecto significativo
sobre la media.
2º Existen datos insuficientes para permitir un análisis
estadístico real de la posición relativa del resultado
sospechoso.

Existen varios métodos por medio de los cuales se podría


descartar un valor sospechoso.
1. Se puede eliminar de inmediato si se descubre un error
determinado.
2.  Simplemente por no ser grato.
3.  La prueba-Q. Es estadísticamente correcta y es muy
fácil de aplicar.

36   66
Cuando la prueba-Q exige que se descarte un resultado,
existe una confianza elevada (90%) de que el resultado
sospechoso estuvo sujeto a error.
Se aplica siguiendo los pasos:

a) Calcular el rango de los resultados.


b) Encontrar la diferencia entre el resultado sospechoso y
su vecino más cercano.
c) Dividir la diferencia obtenida en (b) entre el rango de (a)
para obtener el cociente de descartación Q.
d) Consultar la tabla de valores Q. Si el valor calculado
Qexp. > que el valor de la tabla Qt, el resultado se puede
descartar.

37   67
Algunas veces se recomienda un arreglo entre la
exclusión sin reserva o la retención de un valor
sospechoso, el cual es reportar la mediana de todos los
resultados en lugar de la media, con o sin el valor
desviado. La mediana esta influida por la existencia de
un resultado discordante, pero no es afectada por el
grado en que difieren los resultados uno de otros.

Para una muestra de tres a cinco valores, se


recomienda comprobar el valor sospechoso con la
prueba Q y desecharlo, si ésta lo permite, si no indicar
la mediana en lugar de la media.

38  
68
Diagramas de control.
Se desarrollo originalmente para mantener la calidad durante
las operaciones de manufactura a gran escala. También se
ha comprobado que el método del diagrama de control es útil
para detectar el funcionamiento de los métodos analíticos en
los laboratorios donde se analiza el mismo tipo de muestra
día tras día, durante largos periodos de tiempo. Ejemplo.

69
39  
Comprobación y mejora de la veracidad de un análisis.
Existen diversos métodos prácticos para mejorar y
comprobar la veracidad de un análisis.
1. El valor medio de varios análisis repetidos es más veraz
que uno o unos pocos análisis. A medida que “n” se
acerca al infinito, el valor del error del valor medio se
aproxima a cero.
2. La magnitud del error de la media baja con mucha rapidez
con unos pocos análisis, de forma que se mejora poco el
resultado con la realización de muchas medidas.
3.  En el análisis completo de todos los constituyentes de una
muestra, se pueden comprobar la exactitud de los %
obtenidos sumando todos ellos.
4. Se utilizan determinaciones en blanco, en todas las
condiciones, prácticamente idénticas a las utilizadas en el
análisis, para obtener correcciones que se aplican
después a las medidas efectuadas. 40   70
5. Análisis de control. Que consiste en llevar a cabo las
mismas operaciones analíticas que se realizan con la
muestra objeto de nuestro análisis. Específicamente sobre
una muestra que contiene una cantidad conocida del
constituyente buscado. Son las conocidas muestras patrón.
Es muy poco probable que métodos diferentes de análisis
den lugar a errores de la misma magnitud y signo
6. Cálculos. La veracidad de las operaciones analíticas forma
parte de esta comprobación, pues dichas operaciones están
implicadas en la obtención de un resultado, es decir, de un
número que representa la cantidad de constituyente en la
muestra analizada. El resultado calculado no puede implicar
una veracidad mayor que la que corresponde a las medidas
de que deriva y evidentemente, la veracidad no debe
disminuir como consecuencia de los cálculos realizados a
partir de los datos experimentales.
41   71
TABLA DE VALORES “t” PARA VARIOS NIVELES DE PROBABILIDAD(4)

Niveles de probabilidad (%)


Grados de

libertad 80 90 95 99

1 3,078 6,314 12,706 63,657

2 1,886 2,920 4,303 9,925

3 1,638 2,353 3,182 5,841

4 1,533 2.132 2,776 4,604

5 1,476 2,015 2,571 4,032

6 1,440 1,943 2,447 3,707

7 1,415 1,895 2,365 3,499

8 1,397 1,860 2,306 3,355

9 1,383 1,833 2,262 3,250

10 1,370 1,812 2,228 3,169

11 1,363 1,796 2,201 3,106

12 1,356 1,782 2,179 3,055

13 1,350 1,771 2,160 3,012

14 1,345 1,761 2,145 2,977

15 1,341 1,753 2,131 2,947

16 1,337 1,746 2,120 2,921

17 1,333 1,740 2,110 2,898

18 1,330 1,734 2,101 2,878

19 1,328 1,729 2,093 2,861

20 1,325 1,725 2,086 2,845

∞ 1,282 1,645 1,960 2,576


72  
42   42
VALORES CRITICOS PARA EL COCIENTE DE RECHAZO Q(1)

% de Confianza Qcriit.
Número de

Observaciones 90 95 99

3 0,941 0,970 0,994


4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568

43  
73
1. Se tiene una muestra que contiene calcio con una
humedad de 3,05% los resultados en muestras secas
fueron las siguientes
1ra
45,42 45,50 45,52 45,48 45,46 46,28
Serie %
2da.
45,49 45,55 45,29 45,38 45,60 45,40 45,39 45,50
Serie %

¿Cuáles son los límites de confiabilidad de las 2 series de


datos a un 90 y 95%. ¿Se consideran todos los datos?
¿Realizo la prueba de rechazo de datos.? ¿cuál fue el
resultado de esta prueba?
¿Cuál de ellos obtuvo mejor límite de confianza?
Fundamente.
44   74
2. En el análisis de una anhidrita se obtuvieron los siguientes
resultados por métodos diferentes

% SO42- 69,45 69,95 69,66 68,77 69,81 69,88 69,73

% CaO 29,16 29,36 29,24 28,86 29,30 29,33 29,27

Determine la media, s, el limite de confianza al 95% de


probabilidad ¿Cuál es el % de error si se sabe que la
muestra tiene 99,5% de pureza, para ambos métodos?

45   75