Beruflich Dokumente
Kultur Dokumente
1 2
Introduccin ......................................................................................... 2 Estimacin de parmetros en observaciones completas........................ 3 2.1 2.2 Estimacin puntual. Mtodo de Mxima Verosimilitud. .......................... 3 Estimacin por intervalos. ................................................................ 6
Estimacin de parmetros en observaciones censuradas ...................... 7 3.1 3.2 Estimacin puntual. Caso exponencial. ............................................... 8 Estimacin por intervalos. Caso exponencial...................................... 10
Introduccin
En el tema anterior se describi un mtodo grfico que serva para tratar de ajustar la distribucin emprica de los tiempos de fallo mediante alguna distribucin terica conocida (Weibull, exponencial, log-normal, gamma, etc.). Como ya se coment entonces, en aquellos casos en que sea posible realizar dicho ajuste, se proceder a realizar un anlisis paramtrico de los datos (i.e.: ser posible analizar los datos suponiendo que stos se comportan de acuerdo a alguna distribucin terica determinada). Si, por el contrario, no ha sido posible hallar ninguna distribucin terica que se ajuste correctamente a las observaciones, slo ser posible utilizar tcnicas no paramtricas (i.e.: aquellas que no presuponen nada sobre la distribucin que siguen los datos). En resumen, cuando se logre ajustar las observaciones mediante alguna
distribucin terica, los siguientes pasos a dar sern: 1. Estimar el valor de los parmetros que caracterizan dicha distribucin. En concreto, el objetivo ser hallar tanto estimadores puntuales como por intervalos para dichos parmetros. A la hora de aplicar los mtodos estadsticos de estimacin, ser necesario considerar si las observaciones son completas o censuradas. 2. Realizar un anlisis descriptivo de los tiempos de fallo (media, mediana, percentiles, etc.), usando para ello la distribucin terica ajustada (es lo que se conoce propiamente con el nombre de anlisis paramtrico).
2 de 20
2.1
La estimacin puntual consiste en obtener, a partir de las observaciones, un valor que se aproxime al verdadero valor (desconocido) del parmetro de inters. Si bien hay otros mtodos para determinar el estimador (como, por ejemplo, el Mtodo de Mnimos Cuadrados), el ms utilizado en la prctica es el llamado Mtodo de la Mxima Verosimilitud, cuya idea general se explica a continuacin: Mtodo de Mxima Verosimilitud (para observaciones completas)
Sea
dispositivo, el cual sigue una distribucin terica conocida cuya funcin de densidad de probabilidad viene dada por
desconoce. Supngase que se dispone de una muestra completa (i.e., sin observaciones censuradas) formada por n observaciones independientes de la variable T , las cuales se representarn por t1 , t2 ,..., tn .
L( ) como:
L( ) L ( t1 , t2 ,..., tn , ) = f ( t1 , ) f ( t2 , ) ... f ( tn , )
La funcin de verosimilitud L( ) se puede interpretar como una medida de lo probable que son las observaciones registradas bajo el supuesto de que stas provienen de la distribucin terica especificada. As, los valores de
para los
cuales L( ) es relativamente grande sern ms probables que los valores de para los cuales la probabilidad de las observaciones es relativamente pequea.
Se tratar pues de hallar (si existe) un estimador de mxima verosimilitud, i.e., un valor del parmetro
3 de 20
1. Cuando el valor
es mximo local de
L( ) , entonces:
dL( ) =0 d
3. En ocasiones, en lugar de hallar directamente los mximos locales de la funcin de verosimilitud, resultar ms sencillo hallar los de la funcin logartmica de verosimilitud, ( ) = ln L( ) . Se verifica que, en caso de existir, el mximo global de una es el mismo que el de la otra.
Dadas n observaciones independientes, t1 , t2 ,..., tn , de una variable aleatoria se distribuye segn una exponencial de media de mxima verosimilitud para
T que
=
siendo L =
L n
t
i =1
observaciones.
Demostracin La f.d.p. asociada a una distribucin exponencial viene dada por la expresin siguiente:
4 de 20
f (t , ) =
exp { t }
donde
>0
L( ) =
exp { t1 }
exp { t2 } ...
exp { tn } =
1 n exp ti n i =1 1
n ti = 0
i =1
t
i =1
tiempo sigue una distribucin de Poisson de parmetro = 1 (siendo la tasa de fallos, supuesta constante a lo largo del tiempo). As, el estimador de mxima verosimilitud para ser:
1 n = L
5 de 20
siendo
En el caso de distribuciones con ms de un parmetro (la Weibull, por ejemplo), la aplicacin del mtodo de la Mxima Verosimilitud se complica (ello es debido, en primer lugar, al hecho de que en la bsqueda de los mximos locales se deben considerar derivadas parciales con respecto a cada variable y, adems, a que el sistema resultante de igualar las derivadas parciales a cero no es trivial, siendo necesario utilizar mtodos numricos en su resolucin). En tales casos, pues, recurriremos estimadores. al uso de software estadstico para la obtencin de dichos
2.2
A diferencia de lo que ocurre con la estimacin puntual, la estimacin por intervalos ofrece informacin sobre la exactitud de la estimacin (i.e., sobre la diferencia entre el valor real y el estimado). Ello es debido a que este tipo de estimacin proporciona un intervalo dentro del cual hay una alta probabilidad (nivel de confianza) de que est contenido el verdadero valor del parmetro.
2L 2L 2 (2n) (2n)
2 1 2 2
donde
dispositivos considerados, y
es el percentil de orden
p en una distribucin
6 de 20
2
con
(Chi-cuadrado) con
Siguiendo el razonamiento iniciado en la observacin anterior, queda claro que un intervalo de confianza para = 1 vendr dado por:
2 (2n) 2
2L
n
2 (2n)
1 2
2L
donde
Para obtener observaciones sobre los tiempos de fallo de un dispositivo, se suelen llevar a cabo tests de vida. Realizar un test de vida sobre un tipo de dispositivo concreto consiste en estudiar la evolucin temporal -bajo unas determinadas condiciones de funcionamiento- de una muestra de dichos dispositivos, registrando el instante en que falla cada uno de los componentes de la muestra. En general, hay dos tipos de tests de vida, los tests con re-emplazamiento i.e.: aquellos en los que, de forma inmediata, los componentes que fallan son reemplazados -, y los tests sin re-emplazamiento. Al realizar un test de vida de duracin determinada, es frecuente que ste finalice sin que hallan fallado todos los dispositivos de la muestra, lo que dar lugar a la aparicin de observaciones censuradas. En fiabilidad, el tipo de censura ms habitual es censura a la derecha, por lo que la discusin terica del tema se centrar en este tipo de censura. En presencia de observaciones censuradas, una explicacin detallada de los mtodos de estimacin, tanto puntual como por intervalos, queda fuera de los
A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006 7 de 20
objetivos de este curso. Por dicho motivo, nos limitaremos aqu a presentar el caso de la distribucin exponencial. En el resto de los casos, haremos uso de software estadstico para obtener los estimadores correspondientes.
3.1
Proposicin: Estimador MV para la exponencial (observaciones censuradas) Supngase que se inicia un test de vida sobre n dispositivos idnticos y que la variable aleatoria exponencial de
desconocida,
verosimilitud para
es:
L r
siendo r el nmero de fallos observados en el test y L el tiempo total de funcionamiento acumulado, el cual vendr dado por:
r -sima observacin
es de tipo II, siendo tr una variable aleatoria que representa el instante en que falla la r -sima observacin
8 de 20
Ejemplo 1: Estimacin MV para la exponencial (obs. censuradas) Se inicia un test de vida sobre diez dispositivos idnticos, cuyos tiempos de fallo siguen una distribucin exp( ) . El test finaliza en el instante t0 = 850 horas. Al finalizar el test, se observa que ocho dispositivos han fallado, siendo los tiempos de fallo respectivos: 183, 318, 412, 432, 553, 680, 689 y 748. Se desea obtener el estimador MV para (tiempo medio hasta el fallo) en cada una de las siguientes circunstancias: a) b) c) d) En el supuesto de que los dispositivos son inmediatamente reemplazados cuando fallan En el supuesto de que los dispositivos no son reemplazados al fallar Cuando el test finaliza tras el fallo del octavo dispositivo y se cumple (a) Cuando el test finaliza tras el fallo del octavo dispositivo y se cumple (b)
En el caso (a) estamos ante un test de tipo I con re-emplazamiento. Por tanto,
9 de 20
3.2
En el apartado anterior se coment, cuando los tiempos de fallo se distribuyen segn una exp( ) , el estimador MV para el parmetro (tiempo medio de vida)
En el caso de censura de tipo II (por nmero de fallos), es posible probar que la cantidad
2L
(Chi-cuadrado) con
2r grados de
libertad, lo que permite obtener los correspondientes intervalos de confianza. En efecto, segn lo dicho:
2 2L 2 (2r ) = 1 Pr (2r ) 1 2 2
i.e.:
2L 2L 2 = 1 Pr 2 (2r ) (2r ) 2 1 2
con lo que el intervalo buscado para dado por:
2L 2L 2 (2r ) (2r )
2 1 2 2
Observacin: Observaciones completas y censura de tipo II El intervalo anterior es una generalizacin del visto para el caso de observaciones completas. Ello no es de extraar si se tiene en cuenta que las observaciones completas se pueden interpretar como un caso particular de observaciones
10 de 20
En el caso de censura de tipo I (por tiempo), se suele utilizar el siguiente intervalo de confianza para
:
2L 2L 2 (2r + 2) (2r )
2 1 2 2
Ejemplo 2: Estimacin por intervalos para la exponencial (obs. censuradas) Se inicia un test de vida sobre veinticinco dispositivos idnticos, cuyos tiempos de fallo se distribuyen segn una exp( ) . El test es con re-emplazamiento, tiene una duracin de 500 horas y los tiempos de fallo registrados son los ocho siguientes: 75, 115, 192, 258, 312, 389, 410 y 496 horas. Encuentra el intervalo de confianza, con un nivel del 90%, para (tiempo medio hasta el fallo).
En este caso, se trata de un test con re-emplazamiento y con censura de tipo I (por tiempo). Por tanto, el tiempo total acumulado es: L = n t0 = 25 x 500 = 12500 horas. El intervalo de confianza para , a un nivel de confianza del 90% ser:
y, puesto que
(865.95, 3140.70)
11 de 20
Una vez se ha logrado identificar (usando las tcnicas grficas explicadas en el tema anterior) alguna distribucin terica que se ajuste bien a las observaciones, es posible utilizar las opciones que ofrece MINITAB (Reliability/Survival > Distribution Analysis > Parametric Distribution Analysis...) para obtener un anlisis paramtrico bastante completo de los tiempos de fallo. Al realizar un anlisis paramtrico de los datos, se le deben indicar al programa los inputs siguientes: Columna que contiene las observaciones Tipo de censura: a derecha o arbitraria (de cualquier tipo) Distribucin elegida para ajustar a las observaciones Mtodo estadstico (mxima verosimilitud o mnimos cuadrados) que se desea emplear para realizar las estimaciones de los parmetros caractersticos de la distribucin seleccionada Nivel de confianza para la estimacin, por intervalos, de los parmetros caractersticos de la distribucin seleccionada Otros inputs opcionales (porcentajes para los que se desea hallar percentiles de la distribucin, instantes temporales para los que se desea estimar la fiabilidad, grficos de probabilidad o de supervivencia, etc.) Por su parte, el programa ofrece los outputs siguientes: Informacin sobre las observaciones (nmero de observaciones completas y censuradas, tipo de censura, distribucin seleccionada para realizar el ajuste y mtodo de estimacin elegido) Estimaciones, puntuales y por intervalos, para los parmetros caractersticos de la distribucin seleccionada para ajustar los datos. Se incluye tambin un estadstico que permite medir la bondad del ajuste Estadsticos descriptivos de la distribucin concreta seleccionada (usando como parmetros de la misma los estimadores obtenidos) Tabla de percentiles: en ella se muestran estimaciones para los tiempos de fallo asociados a distintos porcentajes de dispositivos Tabla de supervivencia: en ella se muestran las probabilidades de supervivencia para distintos instantes temporales
A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006 12 de 20
Ejemplo 3: Anlisis paramtrico con MINITAB (obs. con censura a derecha) Continuando con el ejemplo de la compaa que fabrica cubiertas para motores, el cual fue introducido en el captulo anterior, vamos a realizar ahora el anlisis paramtrico de los datos con ayuda de MINITAB. En primer lugar, puesto que se trata de observaciones censuradas a derecha, elegimos la opcin Reliability/Survival > Distribution Anlisis (Right Censoring) > Parametric Distribution Analysis... y especificamos las columnas que contienen los datos (tiempos de fallo observados para ambos grupos y calificadores de censura respectivos) as como la distribucin seleccionada para el ajuste (ya vimos en el captulo anterior que la log-normal era la que mejor pareca ajustar las observaciones de este ejemplo):
13 de 20
A continuacin, especificamos el mtodo de estimacin que deseamos utilizar (mxima verosimilitud en este caso), el nivel de confianza para la estimacin por intervalos (usaremos un nivel del 95%), aquellos porcentajes para los cuales deseamos obtener percentiles (se desea obtener el instante temporal en que habrn fallado el 63,2% de los dispositivos) y la probabilidad de supervivencia en un instante concreto (se desea estimar, en este caso, la probabilidad de que este tipo de dispositivos sobreviva un mnimo de 70 meses):
14 de 20
Finalmente, optaremos tambin por solicitar dos grficos, uno de probabilidad y otro que muestre la funcin de supervivencia:
El programa ofrece un output para cada una de las variables consideradas (tiempo
15 de 20
de fallo de los cubiertas a 80C y tiempo de fallo de las cubiertas a 100C). A continuacin, analizaremos la informacin que se nos ofrece sobre las cubiertas a 80C (la informacin que se ofrece sobre las cubiertas a 100C se puede analizar de forma anloga): En primer lugar, el programa proporciona el nmero de observaciones completas y censuradas, el valor que indica la existencia de censura (sta viene indicada por un valor 0 en la columna Comp80), el mtodo de estimacin empleado (Mxima Verosimilitud), la distribucin elegida para el ajuste (log-normal), los estimadores (puntuales y por intervalos) obtenidos para los parmetros que caracterizan a la distribucin (en este caso estamos ante una LogNormal (4.0927,0.4862) , as como una medida de la bondad del ajuste (estimador Anderson-Darling, el cual representa una medida de la distancia existente entre la distribucin ajustada y la emprica).
16 de 20
El output ofrece tambin los estadsticos descriptivos asociados a la distribucin de ajuste obtenida, as como una tabla de percentiles (en la que se observa, por ejemplo, que un 9% de los dispositivos habrn fallado tras 31.2 meses de funcionamiento y que un 20% habrn fallado tras 39.8 meses).
El programa ofrece tambin una tabla de probabilidades de supervivencia. En este caso, nos dice (en respuesta a la solicitud formulada en la fase de inputs) que la probabilidad de que un dispositivo de este tipo sobreviva tras 70 meses de funcionamiento es de 0.3743.
17 de 20
Finalmente, obtenemos los grficos solicitados, que permiten comparar visualmente el comportamiento de los dos grupos considerados (cubiertas a 80C y cubiertas a 100C):
18 de 20
En el grfico de supervivencia, se observa claramente como el factor temperatura afecta significativamente al tiempo de vida de las cubiertas (la funcin de supervivencia desciende ms rpidamente en el caso de las cubiertas a 100C que
19 de 20
20 de 20