Sie sind auf Seite 1von 20

Ingeniera en Organizacin Industrial

Asignatura: Ingeniera Industrial

Anlisis Paramtrico de los datos


ndice de Contenidos

1 2

Introduccin ......................................................................................... 2 Estimacin de parmetros en observaciones completas........................ 3 2.1 2.2 Estimacin puntual. Mtodo de Mxima Verosimilitud. .......................... 3 Estimacin por intervalos. ................................................................ 6

Estimacin de parmetros en observaciones censuradas ...................... 7 3.1 3.2 Estimacin puntual. Caso exponencial. ............................................... 8 Estimacin por intervalos. Caso exponencial...................................... 10

Anlisis paramtrico con MINITAB...................................................... 12

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

Anlisis Paramtrico de los datos

Introduccin

En el tema anterior se describi un mtodo grfico que serva para tratar de ajustar la distribucin emprica de los tiempos de fallo mediante alguna distribucin terica conocida (Weibull, exponencial, log-normal, gamma, etc.). Como ya se coment entonces, en aquellos casos en que sea posible realizar dicho ajuste, se proceder a realizar un anlisis paramtrico de los datos (i.e.: ser posible analizar los datos suponiendo que stos se comportan de acuerdo a alguna distribucin terica determinada). Si, por el contrario, no ha sido posible hallar ninguna distribucin terica que se ajuste correctamente a las observaciones, slo ser posible utilizar tcnicas no paramtricas (i.e.: aquellas que no presuponen nada sobre la distribucin que siguen los datos). En resumen, cuando se logre ajustar las observaciones mediante alguna

distribucin terica, los siguientes pasos a dar sern: 1. Estimar el valor de los parmetros que caracterizan dicha distribucin. En concreto, el objetivo ser hallar tanto estimadores puntuales como por intervalos para dichos parmetros. A la hora de aplicar los mtodos estadsticos de estimacin, ser necesario considerar si las observaciones son completas o censuradas. 2. Realizar un anlisis descriptivo de los tiempos de fallo (media, mediana, percentiles, etc.), usando para ello la distribucin terica ajustada (es lo que se conoce propiamente con el nombre de anlisis paramtrico).

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

2 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

Estimacin de parmetros en observaciones completas

2.1

Estimacin puntual. Mtodo de Mxima Verosimilitud.

La estimacin puntual consiste en obtener, a partir de las observaciones, un valor que se aproxime al verdadero valor (desconocido) del parmetro de inters. Si bien hay otros mtodos para determinar el estimador (como, por ejemplo, el Mtodo de Mnimos Cuadrados), el ms utilizado en la prctica es el llamado Mtodo de la Mxima Verosimilitud, cuya idea general se explica a continuacin: Mtodo de Mxima Verosimilitud (para observaciones completas)

Sea

T la variable aleatoria que representa el tiempo de fallo de un determinado


f ( t , ) , siendo un parmetro cuyo valor se

dispositivo, el cual sigue una distribucin terica conocida cuya funcin de densidad de probabilidad viene dada por

desconoce. Supngase que se dispone de una muestra completa (i.e., sin observaciones censuradas) formada por n observaciones independientes de la variable T , las cuales se representarn por t1 , t2 ,..., tn .

Asociada a la muestra anterior, se define la funcin de verosimilitud

L( ) como:

L( ) L ( t1 , t2 ,..., tn , ) = f ( t1 , ) f ( t2 , ) ... f ( tn , )
La funcin de verosimilitud L( ) se puede interpretar como una medida de lo probable que son las observaciones registradas bajo el supuesto de que stas provienen de la distribucin terica especificada. As, los valores de

para los

cuales L( ) es relativamente grande sern ms probables que los valores de para los cuales la probabilidad de las observaciones es relativamente pequea.

Se tratar pues de hallar (si existe) un estimador de mxima verosimilitud, i.e., un valor del parmetro

que maximice la funcin L( ) .

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

3 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

Observaciones (Mtodo de Mxima Verosimilitud)

1. Cuando el valor

que maximiza la funcin L( ) existe y es nico, ste se

suele denotar por


2. Para hallar el mximo global de L( ) , conviene empezar hallando los mximos locales de dicha funcin. Recordar que si

es mximo local de

L( ) , entonces:
dL( ) =0 d
3. En ocasiones, en lugar de hallar directamente los mximos locales de la funcin de verosimilitud, resultar ms sencillo hallar los de la funcin logartmica de verosimilitud, ( ) = ln L( ) . Se verifica que, en caso de existir, el mximo global de una es el mismo que el de la otra.

Proposicin: Estimador MV para la exponencial (observaciones completas)

Dadas n observaciones independientes, t1 , t2 ,..., tn , de una variable aleatoria se distribuye segn una exponencial de media de mxima verosimilitud para

T que

desconocida, exp( ) , el estimador

es, precisamente, la media muestral, i.e.:

=
siendo L =

L n

t
i =1

el tiempo total de funcionamiento acumulado para las n

observaciones.

Demostracin La f.d.p. asociada a una distribucin exponencial viene dada por la expresin siguiente:

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

4 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

f (t , ) =

exp { t }

donde

>0

(scale) es el parmetro que define la distribucin. En este caso, la

funcin de mxima verosimilitud viene dada por:

L( ) =

exp { t1 }

exp { t2 } ...

exp { tn } =

1 n exp ti n i =1 1

Consideraremos la funcin logartmica de verosimilitud, cuya derivada ser ms sencilla de calcular:


n 1 1 n d ln L( ) = n ti ln L( ) = n ln ti d i =1 i =1

Por tanto, hemos de resolver la ecuacin:

n ti = 0
i =1

de donde se obtiene que:

t
i =1

Observacin: Estimador MV para la Poisson (observaciones completas)

Segn vimos, si la variable aleatoria

T = tiempo entre dos fallos consecutivos X = nmero de fallos por unidad de

sigue una exp( ) , la variable aleatoria

tiempo sigue una distribucin de Poisson de parmetro = 1 (siendo la tasa de fallos, supuesta constante a lo largo del tiempo). As, el estimador de mxima verosimilitud para ser:

1 n = L

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

5 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

siendo

L = ti el tiempo total de funcionamiento observado.


i =1

En el caso de distribuciones con ms de un parmetro (la Weibull, por ejemplo), la aplicacin del mtodo de la Mxima Verosimilitud se complica (ello es debido, en primer lugar, al hecho de que en la bsqueda de los mximos locales se deben considerar derivadas parciales con respecto a cada variable y, adems, a que el sistema resultante de igualar las derivadas parciales a cero no es trivial, siendo necesario utilizar mtodos numricos en su resolucin). En tales casos, pues, recurriremos estimadores. al uso de software estadstico para la obtencin de dichos

2.2

Estimacin por intervalos.

A diferencia de lo que ocurre con la estimacin puntual, la estimacin por intervalos ofrece informacin sobre la exactitud de la estimacin (i.e., sobre la diferencia entre el valor real y el estimado). Ello es debido a que este tipo de estimacin proporciona un intervalo dentro del cual hay una alta probabilidad (nivel de confianza) de que est contenido el verdadero valor del parmetro.

Proposicin: Intervalo de confianza para

en una exponencial (obs. completas)

Dadas n observaciones independientes,

t1 , t2 ,..., tn , de una variable aleatoria T que

se distribuye segn una exponencial de media

desconocida, exp( ) , un intervalo

de confianza, a nivel de confianza (1 )% , para

viene dado por:

2L 2L 2 (2n) (2n)
2 1 2 2

donde

L = ti es el tiempo total de funcionamiento observado para los n


i =1
2 p (g)

dispositivos considerados, y

es el percentil de orden

p en una distribucin

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

6 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

2
con

(Chi-cuadrado) con

g grados de libertad (i.e., es aquel valor que, en una 2

g grados de libertad, deja a su izquierda un rea p ).

Observacin: Intervalo de confianza para

en una Poisson (obs. completas)

Siguiendo el razonamiento iniciado en la observacin anterior, queda claro que un intervalo de confianza para = 1 vendr dado por:
2 (2n) 2

2L
n

2 (2n)
1 2

2L

donde

L = ti es el tiempo total de funcionamiento observado.


i =1

Estimacin de parmetros en observaciones censuradas

Para obtener observaciones sobre los tiempos de fallo de un dispositivo, se suelen llevar a cabo tests de vida. Realizar un test de vida sobre un tipo de dispositivo concreto consiste en estudiar la evolucin temporal -bajo unas determinadas condiciones de funcionamiento- de una muestra de dichos dispositivos, registrando el instante en que falla cada uno de los componentes de la muestra. En general, hay dos tipos de tests de vida, los tests con re-emplazamiento i.e.: aquellos en los que, de forma inmediata, los componentes que fallan son reemplazados -, y los tests sin re-emplazamiento. Al realizar un test de vida de duracin determinada, es frecuente que ste finalice sin que hallan fallado todos los dispositivos de la muestra, lo que dar lugar a la aparicin de observaciones censuradas. En fiabilidad, el tipo de censura ms habitual es censura a la derecha, por lo que la discusin terica del tema se centrar en este tipo de censura. En presencia de observaciones censuradas, una explicacin detallada de los mtodos de estimacin, tanto puntual como por intervalos, queda fuera de los
A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006 7 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

objetivos de este curso. Por dicho motivo, nos limitaremos aqu a presentar el caso de la distribucin exponencial. En el resto de los casos, haremos uso de software estadstico para obtener los estimadores correspondientes.

3.1

Estimacin puntual. Caso exponencial.

Proposicin: Estimador MV para la exponencial (observaciones censuradas) Supngase que se inicia un test de vida sobre n dispositivos idnticos y que la variable aleatoria exponencial de

T (tiempo de vida hasta el fallo) se distribuye segn una


media

desconocida,

exp( ) . El estimador de mxima

verosimilitud para

es:

L r

siendo r el nmero de fallos observados en el test y L el tiempo total de funcionamiento acumulado, el cual vendr dado por:

L = n t0 si se trata de un test con re-emplazamiento y la censura es de tipo


I (i.e., por tiempo), siendo t0 el instante en que finaliza el test

L = ti + (n r ) t0 si se trata de un test sin re-emplazamiento y la censura


i =1

es de tipo I, siendo t0 el instante en que finaliza el test

L = n tr si se trata de un test con re-emplazamiento y la censura es de tipo


II (i.e., por nmero de errores), siendo tr una variable aleatoria que representa el instante en que falla la
r

r -sima observacin

L = ti + (n r ) tr si se trata de un test sin re-emplazamiento y la censura


i =1

es de tipo II, siendo tr una variable aleatoria que representa el instante en que falla la r -sima observacin

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

8 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

Ejemplo 1: Estimacin MV para la exponencial (obs. censuradas) Se inicia un test de vida sobre diez dispositivos idnticos, cuyos tiempos de fallo siguen una distribucin exp( ) . El test finaliza en el instante t0 = 850 horas. Al finalizar el test, se observa que ocho dispositivos han fallado, siendo los tiempos de fallo respectivos: 183, 318, 412, 432, 553, 680, 689 y 748. Se desea obtener el estimador MV para (tiempo medio hasta el fallo) en cada una de las siguientes circunstancias: a) b) c) d) En el supuesto de que los dispositivos son inmediatamente reemplazados cuando fallan En el supuesto de que los dispositivos no son reemplazados al fallar Cuando el test finaliza tras el fallo del octavo dispositivo y se cumple (a) Cuando el test finaliza tras el fallo del octavo dispositivo y se cumple (b)

En el caso (a) estamos ante un test de tipo I con re-emplazamiento. Por tanto,

L = n t0 = 10 x 850 = 8500 h es la duracin total del test.


As pues, se tendr que: del dispositivo. En el caso (b) estamos ante un test de tipo I sin re-emplazamiento. Por tanto,

L = 8500 / 8 = 1062.5 h es la vida media estimada r

= L = 5715 / 8 = 714.4 h. L = ti + (n r ) t0 = 4015 + (10 8)850 = 5715 h y r i =1


En el caso (c) estamos ante un test de tipo II (el fallo se produce en el instante

= L= t8 =748) con re-emplazamiento. Por tanto, L = n tr = 10 x 748 = 7480 h y r


7480 / 8 = 935 h. En el caso (d) estamos ante un test de tipo II sin re-emplazamiento. Por tanto,
r = L = 5511 / 8 = 688.8 h. L = ti + (n r ) tr = 4015 + (10 8)748 = 5511 h y r i =1

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

9 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

3.2

Estimacin por intervalos. Caso exponencial.

En el apartado anterior se coment, cuando los tiempos de fallo se distribuyen segn una exp( ) , el estimador MV para el parmetro (tiempo medio de vida)

viene dado por

L , donde r es el nmero de fallos observados en el test y L r

es el tiempo total de funcionamiento durante el test.

Proposicin: Intervalo de confianza para

en una exponencial con censura tipo II

En el caso de censura de tipo II (por nmero de fallos), es posible probar que la cantidad

2L

se distribuye segn una

(Chi-cuadrado) con

2r grados de

libertad, lo que permite obtener los correspondientes intervalos de confianza. En efecto, segn lo dicho:

2 2L 2 (2r ) = 1 Pr (2r ) 1 2 2
i.e.:

2L 2L 2 = 1 Pr 2 (2r ) (2r ) 2 1 2
con lo que el intervalo buscado para dado por:

a un nivel de confianza (1 )% , viene

2L 2L 2 (2r ) (2r )
2 1 2 2

Observacin: Observaciones completas y censura de tipo II El intervalo anterior es una generalizacin del visto para el caso de observaciones completas. Ello no es de extraar si se tiene en cuenta que las observaciones completas se pueden interpretar como un caso particular de observaciones

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

10 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

censuradas de tipo II (en concreto, cuando n = r ).

Proposicin: Intervalo de confianza para

en una exponencial con censura tipo I

En el caso de censura de tipo I (por tiempo), se suele utilizar el siguiente intervalo de confianza para

:
2L 2L 2 (2r + 2) (2r )
2 1 2 2

Ejemplo 2: Estimacin por intervalos para la exponencial (obs. censuradas) Se inicia un test de vida sobre veinticinco dispositivos idnticos, cuyos tiempos de fallo se distribuyen segn una exp( ) . El test es con re-emplazamiento, tiene una duracin de 500 horas y los tiempos de fallo registrados son los ocho siguientes: 75, 115, 192, 258, 312, 389, 410 y 496 horas. Encuentra el intervalo de confianza, con un nivel del 90%, para (tiempo medio hasta el fallo).

En este caso, se trata de un test con re-emplazamiento y con censura de tipo I (por tiempo). Por tanto, el tiempo total acumulado es: L = n t0 = 25 x 500 = 12500 horas. El intervalo de confianza para , a un nivel de confianza del 90% ser:

2 12500 2 12500 2 (2 8 + 2) 0.05 (2 8)


2 0.95

y, puesto que

2 0.05 (16) = 7.96

2 0.95 (18) = 28.87 , se llega al siguiente intervalo:

(865.95, 3140.70)

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

11 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

Anlisis paramtrico con MINITAB

Una vez se ha logrado identificar (usando las tcnicas grficas explicadas en el tema anterior) alguna distribucin terica que se ajuste bien a las observaciones, es posible utilizar las opciones que ofrece MINITAB (Reliability/Survival > Distribution Analysis > Parametric Distribution Analysis...) para obtener un anlisis paramtrico bastante completo de los tiempos de fallo. Al realizar un anlisis paramtrico de los datos, se le deben indicar al programa los inputs siguientes: Columna que contiene las observaciones Tipo de censura: a derecha o arbitraria (de cualquier tipo) Distribucin elegida para ajustar a las observaciones Mtodo estadstico (mxima verosimilitud o mnimos cuadrados) que se desea emplear para realizar las estimaciones de los parmetros caractersticos de la distribucin seleccionada Nivel de confianza para la estimacin, por intervalos, de los parmetros caractersticos de la distribucin seleccionada Otros inputs opcionales (porcentajes para los que se desea hallar percentiles de la distribucin, instantes temporales para los que se desea estimar la fiabilidad, grficos de probabilidad o de supervivencia, etc.) Por su parte, el programa ofrece los outputs siguientes: Informacin sobre las observaciones (nmero de observaciones completas y censuradas, tipo de censura, distribucin seleccionada para realizar el ajuste y mtodo de estimacin elegido) Estimaciones, puntuales y por intervalos, para los parmetros caractersticos de la distribucin seleccionada para ajustar los datos. Se incluye tambin un estadstico que permite medir la bondad del ajuste Estadsticos descriptivos de la distribucin concreta seleccionada (usando como parmetros de la misma los estimadores obtenidos) Tabla de percentiles: en ella se muestran estimaciones para los tiempos de fallo asociados a distintos porcentajes de dispositivos Tabla de supervivencia: en ella se muestran las probabilidades de supervivencia para distintos instantes temporales
A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006 12 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

Opcionalmente, los porcentajes, instantes temporales y grficos solicitados

Ejemplo 3: Anlisis paramtrico con MINITAB (obs. con censura a derecha) Continuando con el ejemplo de la compaa que fabrica cubiertas para motores, el cual fue introducido en el captulo anterior, vamos a realizar ahora el anlisis paramtrico de los datos con ayuda de MINITAB. En primer lugar, puesto que se trata de observaciones censuradas a derecha, elegimos la opcin Reliability/Survival > Distribution Anlisis (Right Censoring) > Parametric Distribution Analysis... y especificamos las columnas que contienen los datos (tiempos de fallo observados para ambos grupos y calificadores de censura respectivos) as como la distribucin seleccionada para el ajuste (ya vimos en el captulo anterior que la log-normal era la que mejor pareca ajustar las observaciones de este ejemplo):

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

13 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

A continuacin, especificamos el mtodo de estimacin que deseamos utilizar (mxima verosimilitud en este caso), el nivel de confianza para la estimacin por intervalos (usaremos un nivel del 95%), aquellos porcentajes para los cuales deseamos obtener percentiles (se desea obtener el instante temporal en que habrn fallado el 63,2% de los dispositivos) y la probabilidad de supervivencia en un instante concreto (se desea estimar, en este caso, la probabilidad de que este tipo de dispositivos sobreviva un mnimo de 70 meses):

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

14 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

Finalmente, optaremos tambin por solicitar dos grficos, uno de probabilidad y otro que muestre la funcin de supervivencia:

El programa ofrece un output para cada una de las variables consideradas (tiempo

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

15 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

de fallo de los cubiertas a 80C y tiempo de fallo de las cubiertas a 100C). A continuacin, analizaremos la informacin que se nos ofrece sobre las cubiertas a 80C (la informacin que se ofrece sobre las cubiertas a 100C se puede analizar de forma anloga): En primer lugar, el programa proporciona el nmero de observaciones completas y censuradas, el valor que indica la existencia de censura (sta viene indicada por un valor 0 en la columna Comp80), el mtodo de estimacin empleado (Mxima Verosimilitud), la distribucin elegida para el ajuste (log-normal), los estimadores (puntuales y por intervalos) obtenidos para los parmetros que caracterizan a la distribucin (en este caso estamos ante una LogNormal (4.0927,0.4862) , as como una medida de la bondad del ajuste (estimador Anderson-Darling, el cual representa una medida de la distancia existente entre la distribucin ajustada y la emprica).

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

16 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

El output ofrece tambin los estadsticos descriptivos asociados a la distribucin de ajuste obtenida, as como una tabla de percentiles (en la que se observa, por ejemplo, que un 9% de los dispositivos habrn fallado tras 31.2 meses de funcionamiento y que un 20% habrn fallado tras 39.8 meses).

El programa ofrece tambin una tabla de probabilidades de supervivencia. En este caso, nos dice (en respuesta a la solicitud formulada en la fase de inputs) que la probabilidad de que un dispositivo de este tipo sobreviva tras 70 meses de funcionamiento es de 0.3743.

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

17 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

Finalmente, obtenemos los grficos solicitados, que permiten comparar visualmente el comportamiento de los dos grupos considerados (cubiertas a 80C y cubiertas a 100C):

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

18 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

En el grfico de supervivencia, se observa claramente como el factor temperatura afecta significativamente al tiempo de vida de las cubiertas (la funcin de supervivencia desciende ms rpidamente en el caso de las cubiertas a 100C que

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

19 de 20

Asignatura: Ingeniera Industrial Anlisis paramtrico de los datos

Ingeniera en Organizacin Industrial

en el caso de las cubiertas a 80C).

A. JUAN & C. SERRAT - UNIVERSITAT POLITCNICA DE CATALUNYA, 2006

20 de 20

Das könnte Ihnen auch gefallen