1996 3er. Lugar

Un Modelo Bayesiano para el Clculo de Reservas de Siniestros Ocurridos y No Reportados
Trabajo presentado para el III Premio de Investigacin sobre Seguros y Fianzas, 1996. Lic. Miguel A. Jurez Hermosillo
III
Premio de Investigacin sobre Seguros y Fianzas 1996 Tercer Lugar
NDICE
Pgina
1 2
Resea ................................................................................................................. Introduccin......................................................................................................... Capitulo 1: Antecedentes.
I.1: Siniestros Ocurridos Pero No Reportados....................................................... 5 I.2: Mtodos No - Estocsticos .......................................................................... 6 I.2.1: Mtodo Chain Ladder..................................................................... 6 I.2.1.1: Variantes del Mtodo Chain Ladder .................................... 9 I.2.2: Mtodo de Crecimiento .................................................................. 10 I.2.3: Mtodo de la Razn ....................................................................... 11 I.2.4: Mtodo de Separacin ................................................................... 11 I.2.4.1: Separacin Aritmtica ...................................................... 12 I.2.4.2: Separacin Geomtrica .................................................... 13 I.2.5: Mtodo de Mnimos Cuadrados de de Vylder ..................................... 13 I.3: Mtodos Estocsticos ................................................................................. 14 I.3.1: El Modelo de Regresin .................................................................. 14 I.3.2: Mtodo de Credibilidad de de Vylder.- .............................................. 16 I.3.3: Mtodo de Mack............................................................................ 18 Capitulo II: El Modelo Bayesiano II.1: Inferencia Bayesiana ................................................................................ 20 II.2: Modelo Bayesiano para SOPNR ................................................................... 25 II.2.1: El Proceso Discreto ...................................................................... 25 II.2.2: El Proceso Continuo .................................................................... 27 Capitulo III: Aplicaciones III.1: Ejemplo del Seguro de Automvil .............................................................. 31 III.2: Ejemplo del Seguro de Gastos Mdicos Mayores .......................................... 35 III.3: Relajamiento de Supuestos....................................................................... 41 Conclusiones ......................................................................................................... 45 Bibliografa............................................................................................................ 47
Resea
Por lo general las compaas de seguros en nuestro pas, como instituciones financieras, cierran un periodo contable cada ao por lo que, al trmino de este periodo, tendrn que presentar sus informes contables a sus inversionistas y a las autoridades correspondientes. En uno de tales informes, el estado de resultados tcnico, uno de los rubros que constituyen el rengln de pasivos es el de la reserva. Esto quiere decir que para cada periodo contable la compaa de seguros tendr que tener una estimacin precisa de las reservas para no incurrir en errores en su resultado tcnico y tener una clara idea de la magnitud de sus pasivos, de lo contrario podra incurrir en la sobreestimacin o subestimacin de su resultado que pudiera tener impacto en la tarificacin y eventualmente acarrear problemas de solvencia. Las reservas tcnicas de una compaa de seguros pueden ser catalogadas en seis rubros, a saber: Reserva de Primas no Devengadas, Reserva de Riesgos en Curso, Reserva de Obligaciones Pendiente de Cumplir por Siniestros Ocurridos, Reserva de Siniestros Ocurridos y No Reportados, Reserva Catastrfica y Reserva de Previsin. Cada una de stas cumple un papel distinto dentro de los pasivos de la compaa. Existen ocasiones en que, o bien los siniestros no son reportados en el mismo periodo de su ocurrencia, o al trmino del periodo no han sido totalmente cubiertos. Estos siniestros son conocidos como Siniestros Ocurridos Pero No Reportados (SOPNR). Estas demoras pueden ser causadas tanto por la naturaleza del siniestro, procesos legales, as como por cuestiones administrativas. Este tipo de siniestros se pueden a su vez subdividir en Siniestros Ocurridos Pero An No Reportados (SOPANR), que son tos siniestros que ya han ocurrido pero que la compaa todava desconoce y los Siniestros Ocurridos Pero No Totalmente Reportados (SOPNTR), que son de los que la compaa ya tiene conocimiento pero que no se han cubierto totalmente. Un ejemplo del primero puede ser el fallecimiento de un asegurado que por alguna causa no se ha reclamado, el segundo tipo lo podramos ejemplificar con una cobertura de gastos mdicos mayores, en la que se tiene conocimiento del evento pero no de cundo se terminar de cubrir. Para tratar con el problema de crear provisiones para este tipo de siniestros se han desarrollado una gran cantidad de mtodos, algunos con buen fundamento terico. La desventaja que estos mtodos conllevan es la necesidad de una cantidad importante de informacin histrica, no siempre disponible. El presente trabajo presenta un modelo bayesiano para estimar reservas tanto para SOPANR como para SOPNTR; el cual necesita de poca informacin pasada y es capaz de producir la distribucin completa del pronstico, dando mayores herramientas para la estimacin de la reserva.
Introduccin
El Seguro es un contrato mediante el cual el poseedor de algn bien, capaz de ser valuado en trminos econmicos, transfiere el riesgo que ste pudiera tener, mediante el pago de una prima, a una institucin -compaa de seguros-. Esta asume la responsabilidad de resarcir el dao o una parte de l, con un pago monetario, dada la ocurrencia de algn evento determinado dentro de un plazo especificado en el contrato. Dado que la prima est basada en un principio de mutualidad, es decir que varias personas que poseen bienes semejantes participan en el pago de sta de modo que el riesgo que tuviera cada uno de estos bienes se "reparta" entre todos los participantes, es necesario que su determinacin sea lo ms exacta posible. Entre los factores principales en la determinacin de una prima se encuentran la posibilidad de que el siniestro ocurra y el impacto econmico que ste acarreara. Estos dos factores juntos es lo que se conoce en el medio asegurador como siniestralidad. As, la compaa de seguros reserva una parte de la prima para hacer frente a los probables siniestros basada en la siniestralidad que pueda tener un grupo de bienes en particular. De este modo la tarificacin de primas esta directamente ligada tanto a la siniestralidad como a la correcta estimacin de las reservas correspondientes. Este punto, la correcta tarificacin de las primas, es por dems importante para una compaa de seguros puesto que de ella depende tanto la salud financiera de la institucin como el puntual cumplimiento de las obligaciones contradas con los asegurados. Por lo general las compaas de seguros en nuestro pas, cierran un periodo contable cada ano por lo que, al trmino de este periodo, tendrn que presentar sus informes contables a sus inversionistas y a las autoridades correspondientes. En uno de tales informes, el estado de resultados tcnico, uno de los rubros que constituyen el rengln de pasivos es el del incremento en la reserva. Esto quiere decir que para cada periodo contable la compaa de seguros tendr que tener una estimacin precisa de las reservas para no incurrir en errores en su resultado tcnico y tener una clara idea de la magnitud de sus pasivos, de lo contrario podra incurrir en la sobreestimacin o subestimacin de su resultado que pudiera tener impacto en la tarificacin y eventualmente acarrear problemas de solvencia. Las reservas tcnicas de una compaa de seguros pueden ser catalogadas en seis rubros, a saber: Reserva de Primas no Devengadas, Reserva de Riesgos en Curso, Reserva de Obligaciones Pendiente de Cumplir por Siniestros Ocurridos, Reserva de Siniestros Ocurridos y No Reportados, Reserva Catastrfica y Reserva de Previsin. Cada una de estas cumple un papel distinto dentro de los pasivos de la compaa. A lo largo de esta tesis, cada vez que hablemos de reservas, nos estaremos refiriendo a la de Sinistros Ocurridos y No Reportados.
Existen ocasiones en que, o bien los siniestros no son reportados en el mismo periodo de su ocurrencia, o al termino del periodo no han sido totalmente cubiertos. Estos siniestros son conocidos como siniestros Ocurridos Pero No Reportados (SOPNR). Estas demoras pueden ser causadas tanto por la naturaleza del siniestro, procesos legales, as como por cuestiones administrativas.
Reportados (SOPNR). Estas demoras pueden ser causadas tanto por la naturaleza del siniestro, procesos legales, as corno por cuestiones administrativas.
Este tipo de siniestros se pueden a su vez subdividir en Siniestros Ocurridos Pero An No Reportados (SOPANR), que son los siniestros que ya han ocurrido pero que la compaa todava desconoce y los Siniestros Ocurridos Pero No Totalmente Reportados (SOPNTR), que son de los que la compaa ya tiene conocimiento pero que no se han cubierto totalmente. Un ejemplo del primero puede ser el fallecimiento de un asegurado que por alguna causa no se ha reclamado el segundo tipo lo podramos ejemplificar con una cobertura de gastos mdicos mayores, en la que se tiene conocimiento del evento pero no de cuando se terminar de cubrir. Los pasivos para este tipo de eventos deben de ser constituidos con las primas de ese periodo en particular pero si estos eventos no han sido tomados en cuenta para la constitucin de reservas en su periodo de ocurrencia, es probable que la compaa tenga que hacer uso de otro tipo de reservas con el fin de pagarlos y tal vez enfrente problemas de solvencia. Como resultado de la incertidumbre acerca del momento en que una compaa de seguros deber hacer frente a estas responsabilidades se han creado varios tipos de reserva, entre ellas la de Obligaciones Pendientes de Cumplir, dentro de la cual se encuentra la de Siniestros Ocurridos Pero No Reportados. No obstante que desde 1981 la ley en materia de seguros tena contemplada la constitucin de esta reserva, hasta hace poco no exista un reglamento para su constitucin, dado que comnmente se pensaba que su funcin estaba cubierta por la Reserva de Previsin, sin embargo es conveniente sealar que el fin de esta reserva es el de cubrir posibles desviaciones en la siniestralidad y al estar usndola para pagar siniestros ocurridos y no reportados, precisamente se esta incurriendo en una sub-estimacin de la siniestralidad, que puede, como ya se menciono arriba, desembocar en una tarificacin incorrecta y por ende en una falta de solvencia. No obstante que la Comisin Nacional de Seguros y Fianzas ha creado, para algunos ramos, un formato en el cual las compaas de seguros reportan trimestralmente el desarrollo de los siniestros, tomando en cuenta el ao y trimestre en el que ocurri el siniestro y el desarrollo de los pagos efectuados a causa de este, con el fin de reunir estadsticas suficientes para la implementacin de metodologas capaces de estimar las reservas necesarias, algunas de estas necesitan de una cantidad considerable de informacin pasada. As, es conveniente la construccin de una herramienta capaz de cumplir esta funcin que, utilizando un mnimo de informacin, estime la reserva necesaria lo ms exactamente posible. Aunque existe una variada gama de mtodos para calcular los SOPNR, las tcnicas descritas en este documento son relativamente nuevas y han sido desarrollados bajo distintos enfoques. La manera en que el presente documento visualiza el problema de estimar los SOPNR tiene que ver con la forma en que se presenta comnmente, el triangulo de desarrollo, que veremos mas adelante. Esta representacin sugiere que, para cada periodo en que se originan los siniestros, tenemos informacin acerca de los reportes parciales que de estos se han hecho en los distintos periodos de desarrollo; as podemos pensar que el problema se puede parafrasear diciendo que hay que pronosticar la demanda total para un periodo de ocurrencia teniendo como informacin las demandas parciales en los distintos periodos de desarrollo. Lo anterior es el motivo principal por el cual la presente tesis propone un modelo de pronstico con el fin de estimar finalmente la reserva. El enfoque bayesiano del modelo que estudiaremos aqu
permite, a diferencia de muchos de los mtodos desarrollados hasta ahora, obtener la distribucin completa de la variable involucrada en el pronstico y de esta manera ser capaces de dar tanto estimaciones puntuales corno por intervalo. Bajo este esquema, la presente tesis se dividir en cuatro captulos. En el primero se presentar una breve sinopsis de los mtodos desarrollados hasta ahora, en el segundo se presentar el modelo propuesto y los supuestos que involucra. El tercer capitulo contiene la aplicacin del modelo propuesto y la comparacin de los resultados arrojados por l con los obtenidos con otros modelos. Las conclusiones que se obtengan despus de este anlisis se recopilaran en el ltimo capitulo.
CAPTULO I 1.1 Siniestros Ocurridos y No Reportados.
La metodologa para tratar estos siniestros es relativamente nueva, de hecho la primera idea de la representacin ms comn de ellos (el triangulo de desarrollo) y el primer mtodo fueron desarrollados por Verbeek (1972). pero a pesar de esta novedad se han producido una gran cantidad de mtodos para enfrentar el problema. Para el anlisis de los SOPNR la informacin disponible generalmente se presenta en el llamado triangulo de desarrollo (Tabla 1.1) que representa el desarrollo del reporte de los siniestros para los distintos aos de ocurrencia, as utilizaremos para representar los siniestros acumulados ocurridos en el periodo i y reportados j periodos despus y a Yij para los siniestros no acumulados, es decir que:
Por lo general la literatura al respecto toma estos periodos anuales, pero no existe ninguna diferencia esencial si estos son meses, trimestres o semestres, etc. y no necesariamente tiene que coincidir la periodicidad en los renglones y en las columnas. A pesar de la relativa novedad en el tratamiento de los Siniestros Ocurridos Pero No Reportados se han desarrollado una buena cantidad de mtodos, unos ms sofisticados que otros, para tratar de estimar la reserva correspondiente. Para presentarlos en esta tesis utilizaremos la divisin mas conocida, propuesta originalmente por Taylor (1986), que separa estos mtodos en Estocsticos y No- Estocsticos. El primer grupo engloba aquellos mtodos que utilizan algn supuesto probabilstico en el transcurso de la estimacin de la reserva, el otro grupo, obviamente, engloba a los mtodos que no lo hacen. An a pesar de esta diferenciacin existen algunos mtodos no-estocsticos que se les puede dar una interpretacin estadstica. La gran mayora de los mtodos desarrollados hasta ahora toman en cuenta variables explicativas tales como: volumen de expuestos por ao de origen, tiempo de desarrollo, alguna medida de riesgo como el tamao promedio de las reclamaciones, tiempo en que se finiquitan los siniestros y el crecimiento en el monto de los siniestros, causado probablemente por la inflacin, la cual se puede tomar ya sea como variable exgena o endgena. Es importante hacer notar que la gran mayora de estos mtodos estn enfocados a estimar el total de siniestros acumulados para algn o algunos aos de ocurrencia dado que, a partir de la determinacin de este monto, solo es necesario restarle el total de siniestros reportados hasta ese momento para obtener la reserva de siniestros ocurridos y no reportados. La gran diferencia en los resultados que se obtienen a partir de mtodos para los dos grupos es la de obtener, por un lado, solo una estimacin puntual, sin que se nos ofrezca alguna idea del posible error cometido al hacerlo; en cambio, la introduccin de tcnicas estadsticas en el calculo de la reserva necesaria nos permite estimar el error cometido y en algunos casos de hecho conocer la distribucin entera de nuestro estimador. Es importante hacer notar que an a pesar de esta informacin adicional que nos ofrecen algunos mtodos estocsticos, en nuestro pas todava su uso no es una prctica generalizada, tal vez por la complejidad en el tratamiento de los datos que los mtodos con un grado mayor de sofisticacin presentan o por la necesidad de una cantidad considerable de informacin que dichos mtodos
necesitan. Asi, la presente tesis trata de introducir un mtodo que ofrezca la mayor cantidad de informacin posible con respecto a la estimacin de la reserva y a la vez su clculo sea sencillo, rpido y requiera la menor cantidad de informacin.
A continuacin se presenta una breve recopilacin de los mtodos, tanto estocsticos como noestocsticos, con mayor difusin en el clculo de las reservas para Siniestros Ocurridos Pero No Reportados.
1.2
Mtodos No-Estocsticos
Como se mencion anteriormente, estos mtodos no utilizan explcitamente ningn supuesto probabilstico para el clculo de la reserva, sin embargo, por la relativa, facilidad en su aplicacin, son bastante utilizados por las compaas de seguros y reaseguradoras tanto en nuestro pas como en el extranjero.
1.2.1 Mtodo Chain-Ladder

En general el mtodo Chain-Ladder utiliza un factor para "suavizar" los datos y con base en estos datos suavizados realizar interpolaciones para estimar los siniestros agregados para cada ao de ocurrencia y posteriormente la reserva correspondiente. El supuesto bsico de este mtodo es que las columnas en el tringulo de desarrollo son proporcionales, es decir que, independientemente del ao de origen, cada periodo de desarrollo." se
reporta una proporcin constante de siniestros con respecto al total, que depende nicamente de j. La sustentacin del supuesto depende en buena medida, tanto del tipo de negocio que se trate, Como de la homogeneidad y tamao de la cartera. En particular, en negocios como vida individual, gastos mdicos, responsabilidad civil, etc., la evolucin del reporte de los siniestros es estacional. El factor de proporcionalidad entre la columna s y la s+1 esta dado por:
Tambin se define como la proporcin de los reclamos realizados durante los primeros t aos con respecto al total e independiente del ao de origen. De esta manera el triangulo de desarrollo puede ser completado a un rectngulo haciendo:
donde se supone que , m, el monto total acumulado de siniestros reportados para el ao 1, es de alguna manera conocido o que t es lo suficientemente grande come, para que o, en ltima instancia, se da un margen de seguridad, por ejemplo , con el cual se ajustan por este factor los siniestros del triangulo, con el fin de representar el desarrollo completo del proceso. Este margen, aunque aqu es arbitrario, debe de ser cuidadosamente determinado para que el mtodo sea confiable. Finalmente el mtodo completa el rectngulo de desarrollo con los valores extrapolados.
Varios refinamientos a este mtodo han sido propuestos pero la tcnica permanece esencialmente igual, o sea, el supuesto principal sigue siendo el mismo y habr que constatar su validez para cada caso. En seguida se presentan algunas de las variaciones propuestas, que son calculadas a partir de un nuevo tringulo de desarrollo, que se obtiene al calcular Donde el ao de ocurrencia se obtiene de la suma de los siniestros promedio para para
y los periodos de desarrollo
(Tabla 1.2), con e=nmero de expuestos en ese periodo. De hecho, estos valores pueden ser considerados como la siniestralidad acumulada para cada ao de ocurrencia y periodo de
desarrollo
Como se hizo en el mtodo original aqu tambin se supone que los cocientes
se mantienen constantes para cada periodo de desarrollo Aunque este supuesto fuera tericamente real tericamente real, los datos muy probablemente no produciran esta mima proporcin para cada ao de desarrollo. As, el problema de estimar las D's, X's , Y's puede ser tratado por una variedad de mtodos; en particular Van Eeghen (1981) describe los siguientes:
Algunos autores dividen los siniestros acumulados por las primas de los contratos expuestos en el periodo correspondiente para obtener las . En el primer caso obtendremos un monto promedio de siniestros en el segundo la siniestralidad. Tambin es conveniente notar que, como la sima se realice sobre los periodos de . desarrollo, estas cantidades se anulan al hacer la divisin para obtener las
I.2.1.1 Variantes del Mtodo Chain Ladder
I.- Se supone que existe una tendencia lineal dentro de las columnas del triangulo modificado (Tabla 1.2), as que se ajusta una lnea de mnimos cuadrados en cada columna, excepto para las ltimas dos, donde se toman los promedios de los valores correspondientes. Es decir que sern las estimaciones de los factores de crecimiento para estos dos periodos de desarrollo, para las otras columnas el resultado es idntico al mtodo original dado que el modelo es y al ajustar la lnea de mnimos cuadrados
obtenemos que II.-Esta variacin considera un promedio ponderado de las , digamos
donde las ws son ponderaciones que sirven para dar mayor peso a algunos aos de origen y/o periodos de desarrollo en particular, concretamente, si hacemos replicamos exactamente el mtodo original de Chain-Ladder. La solucin de esta variante es anloga a la de Chain-Ladder original, expuesta anteriormente. III.- Esta vez se ajusta una curva exponencial a cada columna del tringulo original de la donde K y , son siguiente forma constantes a ser determinadas para cada periodo de desarrollo. Lo que este modelo sugiere es la introduccin de un factor de inflacin, , para cada ao de desarrollo. Esto se pude resolver como un modelo lineal tomando logaritmos en cada una de las columnas, excepto la ltima donde solo se toma con el fin de obtener un modelo lineal. Una vez que las ajustan los siniestros a costos actuales haciendo modificacin anterior son obtenidas se
y transformando los valores
para posteriormente tomar los promedios ponderados, como en la
que se suponen otra vez constantes para cada columna. De esta manera se es capaz de resolver el problema igual que en el mtodo original y calcular la reserva correspondiente.
IV.- Esta variante torna en cuenta que en el mtodo anterior, despus de haber calculado las con = 1; sea possible dar un peso distinto a cada ao de origen, haciendo los factores haciendo los factores
donde es posible dar pesos distintos al crecimiento -1. e. inflacin- de algunos periodos en particular; resolvindolo finalmente como el anterior, va que se tienen las V.- Es la misma idea que el mtodo IV pero ahora se ajusta una curva exponencial a las columnas del tringulo de desarrollo d- I, que es el tringulo-d menos uno de cada entrada2.
con y como podemos ver, si se utilizan El modelo es los mtodos III y IV encontraremos las estimaciones necesarias para calcular los factores de siniestralidad que multiplicaremos por los siniestros acumulados para encontrar la reserva correspondiente, es decir VI.- De nuevo se repite el mtodo IV pero los valores son calculados a partir de las cifras en el tringulo que contiene los siniestros originales, es decir
y la estimacin del total de siniestros ser
I.2.2 Mtodo de Crecimiento

En este mtodo se utiliza el tringulo de desarrollo de los siniestros acumulados, obteniendo la proporcin acumulada de siniestros para cada periodo de desarrollo con respecto al total reportado, para cada ao de origen. As se genera un nuevo tringulo con el valor con .
A continuacin se incluye el supuesto que de alguna manera se conoce la proporcin y de siniestros que se han reportado hasta el momento, as se multiplica el primer rengln del tringulo por este factor de ajuste es decir que Para los siguientes aos se ajustan los porcentajes calculados con el promedio obtenido en la columna correspondiente al
2
Este mtodo reduce la dimensin del tringulo de desarrollo en una unidad, tanto para el ao de ocurrencia como para el periodo de desarrollo.
10
periodo de desarrollo, es decir . Para encontrar la estimacin final de los siniestros se dividen los valores la diagonal inferior del tringulo original por los factores resultantes con. Por ltimo se restan estos montos a los reportados acumulados para cada ao de origen con el fin de obtener la estimacin de la reserva correspondiente.
I.2.3 Mtodo de la razn

Este mtodo parte igualmente del triangulo de siniestros acumulados y obtiene los porcentajes de crecimiento, de un periodo de desarrollo a otro, para un ao de origen dado* , es decir
calcula
En seguida se calculan los promedios para estas tasas de
para =0,...,t-1. Al crecimiento para cada periodo de desarrollo igual que el mtodo anterior este hace el supuesto que de algn modo se conoce o se puede estimar la porcin y de siniestros que faltan por reportar, as se ajusta el ultimo promedio con el factor correspondiente haciendo promedios multiplicndolos ya con el factor de ajuste, manera los factores estimados con los cuales y en consecuencia la reserva. se Posteriormente se acumulan estos calculan obtenindose de esta los siniestros totales
I.2.4 Mtodo de Separacin3

Este mtodo considera que los siniestros representados en el triangulo de desarrollo estn formados por dos vectores de parmetros r y , que juntos definen el desarrollo de los siniestros (Tabla 1.3), es decir que Xi,j=rji+j-1. Donde rj puede interpretarse como la proporcin de siniestros que se han reportado hasta el periodo j con respecto al total y k describe la evolucin de los siniestros -e.g. inflacin-.
Este mtodo reduce la dimensin del tringulo de desarrollo en unit unidad, tanto para el ao de ocurrencia como para el periodo de desarrollo.
11
Entonces, se tiene que resolver el sistema para los dos vectores
para lo cual se emplea
Si se usa la primera una restriccin; definida por el modelo; ya sea restriccin el mtodo es llamado Mtodo de Separacin Aritmtica, la segunda opcin produce el llamado Mtodo de Separacin Geomtrica. A continuacin se presenta la solucin para ambos mtodos,
I.2.4.1 Mtodo de Separacin Aritmtica
Del supuesto mencionado obtener el primer valor valores de los parmetros
obtendremos que
de donde
podemos
. Si seguimos este procedimiento obtendremos lo siguientes ahora haciendo para obtener
y de esta manera calcular los parmetros necesarios.
12
I.2.4.2 Mtodo de Separacin Geomtrica

Al igual que en el mtodo de separacin aritmtica, utilizamos la restriccin que introdujimos
calculando . El esquema se completa utilizando estos valores ya calculados para obtener, cada vez los siguientes parmetros necesarios
. Para ambos mtodos, estimaciones de los valores para tendrn que ser calculados, ya sea extrapolando la serie de stos o introduciendo estimaciones exgenas. Una vez estimados los parmetros del modelo, se calculan los montos finales haciendo
I.2.5. Mtodo de Mnimos Cuadrados de de Vylder.

Este mtodo supone que la fraccin de siniestros reportados hasta el periodo es
como varios de los mtodos anteriores, de esta independiente del ao de ocurrencia manera se puede usar un modelo multiplicativo para la representacin de las reclamaciones. As se supone que donde es la proporcin de siniestros reportados hasta el periodo de desarrollo con respecto al total del ao correspondiente, Y, es el monto reportado correspondiente al ao de ocurrencia y periodo de desarrollo y X es el monto de siniestros reportados acumulado correspondiente al ao de ocurrencia , es decir que como se ha definido anteriormente. Adicionalmente se supone t lo suficientemente grande como para que sea Ahora se sigue el determinar los valores de los parmetros x y v tales que mnima, donde la suma se realiza sobre el conjunto de subndices en el que se tenga informacin. Al realizar esta operacin se obtiene el siguiente sistema de ecuaciones
El sistema se resuelve iterativamente partiendo de algn valor arbitrario. e.g. v1 = v2= = vt = 1/t.
13
Una vez que la convergencia ocurre, los valores del vector v son reescalados de manera que su suma sea uno; entonces, los valores del vector x son calculados. La estimacin final de los siniestros tiene la forma
I.3
Mtodos Estocsticos
Como se mencion arriba, la desventaja principal de los mtodos no-estocsticos es la de no dar limites de confianza para la estimacin de la reserva correspondiente. A raz de esto se introducen tcnicas estadsticas en el desarrollo de los mtodos con el fin de obtener este tipo de estimacin por intervalos y eventualmente la distribucin completa de nuestro estimador. De nuevo presentaremos una breve recopilacin de estos mtodos, tratndolos de la manera. ms general posible.
I.3.1 El Modelo de Regresin

Tomemos en cuenta la conceptualizacin de los siniestros presentada en el mtodo separacin Si tomamos logaritmos en ambos lados de la expresin obtendremos que de
para modelo lineal se denota de la siguiente manera:
el cual es lineal en los parmetros. El
Donde
contiene los algoritmos de los valores
observados agrupados por ao de
accidente es el vector de errores. La matriz de diseo v de tamao la siguiente forma:
tiene
14
Con este modelo, dado que la matriz es singular, hay que hacer la misma consideracin que en mtodo de separacin e introducir la restriccin y de esta manera definir obteniendo el
omitiendo la primera columna en la matriz de diseo y el primer elemento de
sistema lineal con el cual claramente podemos utilizar las tcnicas de regresin ya sea bayesiana mnimos cuadrados, etc. y obtener . Para calcular los pronsticos de la parte propiedades estadsticas del vector de parmetros inferior del tringulo_ se tiene que invertir la transformacin logaritmo; entonces, si se supone que los errores en el modelo lineal tienen una distribucin normal, las distribucin lognormal por lo que el estimador del pronstico tienen 'lna la tiene la forma
donde regresin y
es el vector de valores ajustados por la
es la matriz de varianza-covarianza de la regresin.
Otra forma de visualizar el problema es expuesta por Elizondo y Guerrero (1994) en donde se propone estimar la siniestralidad total para cada ano de ocurrencia por medio de una regresin lineal simple, la formula general de pronstico es, en este caso
donde
Caso donde, es el pronstico de la siniestralidad total para el ao de ocurrencia t con la informacin de k periodos de desarrollo, ,St,k es la siniestralidad acumulada para el ao de ocurrencia t hasta periodo de desarrollo k y i,j ,i=0,1 son los parmetros involucrados en la regresin. Ahora, haciendo uso de los supuestos clsicos de regresin, se utiliza la tcnica de mnimos cuadrados ordinarios para estimar los parmetros necesarios para cada ano de ocurrencia. Finalmente se resta la siniestralidad acumulada hasta el momento al pronstico y se multiplica esta diferencia por el monto de primas para ese ano para obtener la reserva correspondiente. Para la implementacin de ambos mtodos es evidente que los supuestos involucrados debern ser validados con los datos observados. En principio el supuesto de independencia entre las observaciones parece consistente en el sentido de que el desarrollo en el reporte de un siniestro en particular no tiene relacin directa con algn otro. El supuesto de homoscedasticidad tal vez no sea tan sencillo de validar estructuralmente como el anterior, pero con una cartera formada por riesgos homogneos la validacin de este supuesto ser menos difcil.
15
I.3.2 Mtodo de Credibilidad de de Vylder.

El mtodo parte de que el vector de siniestros X depende nicamente del parmetro , para los aos de ocurrencia = 1,...,t que se interpreta como la realizacin de una variable estructural fuera de esta diferencia, todos los aos son iguales.
Este mtodo necesita de cuatro supuestos principales, a saber: i). Los vectores ocurrencia, son independientes. son independientes, es decir que los aos de
una
ii). la variable
donde
es un vector aleatorio desconocido
funcin escalar de
ambas independientes entre s.
iii).
es tal que
es independiente de j; resultando entonces que en donde es un
promedio, el patrn de desarrollo es el mismo. Ms aun escalar desconocido independiente de j, ocurrencia de j e
es un peso desconocido para el ao de
es la matriz identidad de I x I.
iv). Las variables estructurales
son independientes e idnticamente distribuidas.
denota el Para el anlisis se utiliza nicamente el conjunto de variables observadas. As, si conjunto de periodos de desarrollo para los cuales existen observaciones pertenecientes al ao de ocurrencia J, se define a esperados con ndices en como el vector que tiene como componentes a los valores . De esta definicin se desprende que difiere de
nicamente por el conjunto de elementos que son observados de Como podemos ver a partir del supuesto ii) el modelo detrs del mtodo es el de una regresin lineal, con la consideracin de utilizar un estimador de credibilidad se obtiene, utilizando los supuestos anteriores, de la siguiente manera: para que
16
adicionalmente
los
parmetros
estructurales
estn
dados
por
. Luego entonces se tiene aun el problema de estimar stos.
As si suponemos que
es decir que
un estimador
insesgado de
es
este supuesto nos dice que en promedio estamos viendo el lo que parece
desarrollo de los siniestros y que stos no estn siendo escalados por bastante lgico. Adems si se define a entonces
como el nmero de elementos en Tj y m=(tj-1),
son estimadores insesgados S2. Finalmente un estimulador insesgado para est dado por el cual tiene que ser calculado iterativamente, ya que Zj, contiene a .
17
I.3.3 Mtodo de Mack.

Este mtodo pretende generalizar el Mtodo de Credibilidad de de Vylder reemplazando el
, donde, para =2 se supuesto referente a la varianza haciendo obtiene el modelo de de Vylder y para =0,1, el de Mack. Esto nos da los siguientes supuestos: i) Los vectores son independientes, es decir que los aos de estructurales son
ocurrencia son independientes y las variables independientes e idnticamente distribuidas.
ii)
y definimos a
iii) para i=1,,t.
donde
es una matriz diagonal con elementos
, Con estos supuestos y los parmetros estructurales es posible obtener los siguientes estimadores de credibilidad:
Adems, estimador insesgado para y est dado por
para el parmetro estructural
es
un
estimador
insesgado
donde
finalmente
es un estimador insesgado de a
18
donde Estos dos modelos, una vez que se han estimado los parmetros involucrados, cumplen con las condiciones necesarias para aplicar un modelo de regresin a los datos, en particular Hachemeister (1975) ha desarrollado un modelo de regresin til bajo estas condiciones. Estos mtodos, aunque representan un enfoque estadstico hacia la solucin del problema, tienen la desventaja de necesitar una cantidad importante de informacin para producir estimaciones relativamente confiables, lo cual, actualmente, no es factible en la mayor parte de las aseguradoras de nuestro pas. Aunado a esta desventaja est el hecho de que estos mtodos (plug-in-methods) no toman siempre en cuenta la variabilidad en que se incurre al estimar los parmetros involucrados y la del modelo propuesto. Esto es, estiman los parmetros y al hacer el pronstico, simplemente los "enchufan" en el modelo seleccionado como si stos fueran sus verdaderos valores. Como podemos observar, aunque aqu solamente se haya presentado una breve descripcin, existen una gran variedad de mtodos estadsticos aplicables a este problema, aunque la gran mayora utilizan la tcnica de regresin para darle solucin, listo implica la necesidad de contar con una cantidad importante de datos, que no siempre estn disponibles. Con esta idea, en el siguiente capitulo presentaremos un modelo bayesiano que sea capaz de dar una estimacin adecuada y a la vez utilice una cantidad de informacin pequea al mismo tiempo que reconozca toda la variabilidad implcita en el resultado Final.
19
Captulo II II.1 Inferencia Bayesiana

La teora de decisin, como su nombre lo indica, sc relaciona con el problema de tomar decisiones. La teora de decisin estadstica se refiere entonces a la torna de decisiones en presencia de conocimiento estadstico_ que ayude en el problema de decisin bajo condiciones de incertidumbre. Esta incertidumbre supondremos que la podernos pensar en trminos de cantidades desconocidas, que usualmente llamaremos parmetros y denotaremos generalmente como y que podr tomar valores en el espacio
La estadstica clsica se dirige directamente al uso de datos muestrales para hacer inferencia acerca de , sin tomar en cuenta que generalmente se tiene otras dos fuentes de informacin relevante en la mayora de los problemas. La primera es el conocimiento de las posibles consecuencias de nuestras decisiones, que puede ser cuantificado determinando la prdida en que se incurrir para cada decisin posible Una motivacin importante junto con los posibles valores de acerca del uso de este tipo de informacin es el hecho de que_ en muchos problemas inferenciales, la sobreestimacin del parmetro nos puede llevar a incurrir en decisiones ms costosas que la subestimacin de ste o viceversa. En general, podemos pensar en la prdida incurrida como una funcin de la distancia, digamos del parmetro La segunda fuente es lo que llamamos informacin previa. Esta informacin acerca del parmetro es tpicamente obtenida por mtodos no estadsticos, generalmente por experiencia pasada de fenmenos similares involucrando a informacin previa acerca de Una manera muy til de pensar la sobre que existe entre la estimacin que utilicemos y el verdadero valor
es en trminos de una distribucin de probabilidad
el conjunto de los posibles valores del parmetro; dado que generalmente sta no es muy precisa y resulta. muy natural expresar el grado de posibilidad que creemos tenga un valor particular del parmetro en trminos de probabilidad. Aqu es importante recalcar que no existe nada aleatorio acerca del verdadero valor de si no que estamos expresando nuestra
percepcin acerca del conocimiento que poseemos del parmetro con La aproximacin que trata de utilizar formalmente estos tres aspectos en el proceso inferencial estadstico es llamada estadstica bayesiana, en honor a Thomas Bayes. Como hemos visto, en estadstica bayesiana el proceso inferencial es visto como un problema de decisin. Como consecuencia de esto se calcula una funcin que modele la prdida (utilidad) en la que el tomador de decisiones (investigador) incurre al seleccionar una estimacin para el parmetro de estudio, en relacin principalmente con la lejana o cercana a su valor real. Dado
20
este enfoque resulta coherente seleccionar una estimacin
ptima en el sentido que
en que se incurre. Como se mencion anteriormente, estamos minimice la prdida frente al problema de toma de decisiones en un ambiente de incertidumbre, as que el verdadero valor de la perdida no lo podremos conocer con certeza al momento de tomar la decisin -i.e. seleccionar una estimacin-. Una manera natural de proceder bajo incertidumbre es la de tomar la perdida esperada y podramos entonces tomar una decisin optima acerca de este promedio, como funcin del estimador. Tambin resulta muy directo pensar que como es desconocida al momento de tomar la decisin y ya que hemos mencionado que es posible tratar a como una cantidad aleatoria definiremos la perdida esperada bayesiana al estimar a con
^
como la esperanza de
con respecto a la distribucin
es decir
Este criterio de estimacin, maximizar la utilidad esperada, es ptimo en el sentido del cuerpo axiomtico de coherencia que fundamenta la teora de decisin, de hecho existen varios sistemas aunque el espritu de ellos es el mismo: una recopilacin de estos puede ser vista en De Groot (1970). Resulta lgico pensar que nuestro grado de conocimiento acerca de cambie si sucede algn evento relevante que involucre al parmetro, en investigacin estadstica estos sucesos se presentan tpicamente como muestras de la forma X=(x,...,s.f.). Entonces necesitamos una manera de procesar esta informacin adicional e incorporarla al estudio. Con este fin es conveniente presentar el siguiente:
Teorema de Bayes
Para cualquier particin finita del espacio de posibles eventos y para un evento
Una interpretacin posible de este teorema es pensar que nosotros actualizamos nuestro nivel actual de incertidumbre acerca del evento descrito por momento de recibir en donde este se ve
informacin de la realizacin de algn otro suceso, digamos involucrado y que ahora es descrito por informacin adicional
nuestro nivel de incertidumbre posterior a la
Por otro lado, si no tenemos observaciones disponibles,
actuaremos acorde a nuestra informacin previa, nicamente; si, en cambio, contamos con informacin adicional, actualizaremos nuestras creencias hncales con la distribucin
21
posterior . Desde otro punto de vista se puede argir que el teorema de Bayes es un procesador de informacin ptimo. Una forma muy til de escribir el teorema de Bayes es
donde el factor de proporcionalidad es obviamente
Si ahora utilizamos una notacin ms apropiada para e] problema podemos ver que
En estadstica bayesiana
la distribucin a-priori, representa la informacin previa que
tenemos acerca del parmetro en nuestro modelo. Esta informacin previa puede consistir, como se mencion arriba, de informacin pasada acerca de la caracterstica que estudiamos o simplemente de conocimiento experto de algn especialista en la materia. Es importante hacer notar que la seleccin de esta distribucin a-priori es responsabilidad del investigador y que selecciones distintas en la distribucin conducirn a resultado distintos, es la
distribucin conjunta de la muestra condicionada verosimilitud; y es la distribucin posterior de
que comnmente coincide con la
una vez que se ha incluido informacin adicional.
Es conveniente recordar que la inferencia cientfica es y ha sido en buena parte subjetiva ya que, cuando un investigador realiza algn experimento es evidente que ha concebido ideas previas acerca del resultado que posiblemente obtenga; a la formulacin de estas ideas previas acerca del resultado, en el mtodo cientfico se le llama formulacin de hiptesis, al experimento se le denomina confirmatorio en el sentido de que el investigador est tratando de corroborar o negar alguna de estas hiptesis en particular. Eventualmente, una vez que el experimento se ha llevado a cabo, el investigador dejar fuera del anlisis algunos datos por razones puramente subjetivas -e.g. pensar que ocurri un error o que no son de inters para el anlisis-, siendo tal vez que esos datos deberan de incluirse aun a pesar de que esto signifique que el modelo en cuestin sea ms complejo. En el caso de que alguna hiptesis deba ser probada, el investigador elegir, de nuevo subjetivamente, el nivel de significancia de la prueba, por ejemplo si decide utilizar un nivel de 5% tal vez rechazar la hiptesis, mientras que si utiliza un nivel de 1% no tendr evidencia para hacerlo. De hecho, si el observador tiene una fuerte inclinacin a priori hacia alguna hiptesis en particular, estar tal vez inclinado a utilizar un nivel que la confirme.
22
Esto significa que, en inferencia bayesiana, el hecho de que el observador realmente influya en las hiptesis y el modelo seleccionado se hace explcito y que esta informacin previa con la que cuenta el investigador se incluye formalmente en el transcurso de la solucin del problema. En un anlisis final, esto se puede reducir a un problema de tamao de muestra ya que, si la muestra es grande. el papel de la informacin previa (distribucin inicial) es pequeo en comparacin con los datos; de este modo, es en problemas con tamaos de muestra pequeos donde el papel del experto juega un papel determinante y as debe ser, ya que por lo general es l quien posee una mayor y mejor informacin acerca del fenmeno y casi siempre estaremos dispuestos a aceptar sus puntos de vista como los ms acertados. Una, vez seleccionada la distribucin que describa nuestro conocimiento previo del Parmetro y dadas las observaciones obviamente el teorema de Bayes obtendremos la densidad posterior utilizando,
de variables est dado, entonces es una constante, por lo que una, y como el vector vez seleccionada la distribucin que describa nuestro conocimiento previo del Parmetro y dadas las observaciones obviamente, el teorema de Bayes obtendremos la densidad posterior utilizando
Y como el vector
de variables est dado, entonces
es una constante, por lo que
Ose a que,
donde
es la funcin de verosimilitud de dada la muestra.
Esta densidad final contiene toda la informacin que disponemos acerca del parmetro, ya que
23
contiene la informacin muestral y nuestra informacin previa. De este modo actualizamos, como nos muestra el teorema de Bayes, nuestro conocimiento previo acerca del parmetro con la informacin muestral, provista por los datos. En el caso de no poseer ningn tipo de informacin previa, o cuando la informacin con la que contamos no fuera confiable, o simplemente no estamos dispuestos a decir nada acerca del parmetro, se utiliza comnmente lo que llamamos una distribucin previa difusa o mnimo informativa, que refleja precisamente esta situacin. Existen tres mtodos bastante difundidos para calcular estas funciones, a saber: mtodo de Jeffreys, previas como limite de conjugadas y anlisis de referencia. Este tema ha sido ampliamente tratado por varios autores, en particular en Bernardo y Smith (1994) podemos encontrar una extensa discusin del tema. Describiremos rpidamente la regla de Jeffreys (1961) para el calculo de previas mnimo informativas que dice que esta debe ser proporcional a la raz cuadrada de la informacin de Fisher, es decir que
Una propiedad importante de este mtodo es su invarianza ante transformaciones del parmetro, es decir que si es una funcin uno-a-uno del parmetro,
entonces
Entonces, el siguiente paso crucial es utilizar una funcin de prdida
donde
es la
dado el vector de observaciones, que mide la prdida que tenemos al estimacin puntual de utilizar ese estimador en particular. Lo que evidentemente deseamos es hacer esta prdida lo mas pequea posible, de esta manera lo consecuente es minimizar la prdida esperada bajo esta funcin, es decir, queremos encontrar
En
particular
si
tomamos
una
funcin
de
prdida
cuadrtica,
de
la
forma
donde C es una matriz positiva definida, obtendremos que el valor que minimiza la prdida esperada es la esperanza de la distribucin posterior para . Esto es
Otra fcil de ver si recordamos que el valor que minimiza la expresin funcin de prdida bastante difundida en inferencia bayesiana es la funcin de prdida lineal, que se define como:
24
en donde el valor que minimiza la prdida esperada
Es el percentil correspondiente Tambin es posible calcular la densidad predictiva, es decir la densidad de una futura observacin, digamos dada la informacin provista por la muestra original de tamao n. sta se calcula si observamos que
osea que
Como podemos ver, la funcin de densidad predictiva depende nicamente de las observaciones, es decir, no contiene parmetros desconocidos. La idea relevante involucrada es que, generalmente al momento de realizar las estimaciones, no tendremos la oportunidad de observar el valor verdadero del parmetro. De hecho 'filosficamente esto significa que en el campo de a estadstica deberamos enfocar nuestra atencin en las observaciones y por esto, usar distribuciones predictivas tan frecuentemente como sea posible."*
II.2 Modelo Bayesiano para SOPNR

A continuacin presentaremos el modelo propuesto para la estimacin de los siniestros OPNR, el cual ser dividido en dos, uno para el proceso discreto i.e. nmero de siniestros, y el segundo para el proceso continuo, i.e. el momo de los siniestros. Los supuestos principales que involucra el modelo se refieren al desarrollo de los siniestros a travs del tiempo, que se supone estacional y estable, y la independencia del proceso para distintos aos de origen. Como se menciono en el Capitulo I, estos supuestos son consistentes con el problema en prcticamente todos los negocios de una compaa de seguros.
II.2.1 El Proceso Discreto

Como se describi anteriormente, tenemos un conjunto de observaciones con i = 1,,k y, j =1. ,,s, adems sea in = nmero de periodos de origen para los cuales tenemos la informacin completa; por lo general los mtodos mencionados utilizan in = 1 y s = k, pero con nuestro procedimiento es posible incorporar la informacin disponible al respecto.
25
Sea
total de siniestros para el ao de origen 1, esto es
y supongamos
que el nmero de siniestros del k-simo ao de desarrollo tiene una distribucin Ahora, condicionando en y suponiendo independencia entre ellos, el vector
se distribuye con Karlin (1969). Ahora estamos interesados en estimar N,,Nt , los totales para cada ao de origen, utilizando la informacin que tenemos disponible. De las propiedades de la distribucin multinomial se sigue que para a < s
para ejemplificar tomemos i = 2, de esta maicera tendramos la densidad conjunta para
Press 1 Bayesian Statistics Principles, Models, and Applications, 1989 pp. 57-58
Dados
que llamaremos
nuestra informacin disponible, sta es la Si suponemos independencia entre estos dos
funcin de verosimilitud para podremos calcular la previa de Jeffreys para
y tomando en cuenta que N2 > 0, de Alba y Mendoza (1995), usamos la previa difusa mnimo informativa
Es importante tener en cuenta que el parmetro de inters es n2 y es en este sentido que p*a es un parmetro de ruido; es por esta razn que se intenta calcular una distribucin
26
(n2, p*a ,), tal que sea mnimo informativa para n2 combinando la verosimilitud con las previas podemos obtener las marginales posteriores tanto para p*a como para N2:
En el primer caso tenemos una Beta (,) con La marginal posterior de N2 es una Beta-Pascal (,n,x*2), Raiffa y Schlaiter (1961) con n = +, as la media y varianza posterior estn dados por
Si tomamos nuestra funcin de perdida de la forma cuadrtica, sabemos que este es nuestro estimador para el total de siniestros ocurridos en el ao 2. Para obtener la estimacin de la reserva simplemente le restamos el nmero de siniestros reportados hasta el momento a nuestro pronostico. La generalizacin a ms de dos aos de origen es sencilla si suponemos, como lo hemos hecho, independencia entre los distintos anos de origen.
II.2.2 El Proceso Continuo

Esta variante del modelo toma en cuenta variables continuas, en particular para esta aplicacin nos referiremos a los montos reclamados. Sea Xij 0 el monto de siniestros reclamados acumulados hasta el periodo de desarrollo j=1,,s para el ao de origen i=1,,t y sea Yij el monto de siniestros ocurridos en el ao i=1,,t y reclamados en el periodo de desarrollo j = 1,...,s. donde Y son variables i.i.d. e De esta manera pensemos que independientes de Nt. Supongamos que el nmero de reclamos en cada ao de desarrollo se distribuye Po(t), por lo que el proceso de siniestros acumulados sigue una distribucin Poisson compuesta, para el ao de origen i y Entonces es el total de siniestros ocurridos
es el total acumulado para el ano de origen i hasta el
27
10
periodo de desarrollo . Es posible demostrar que que la funcin generadora de momentos (f.g.m.) para supone independencia; la f.g.m. de sta es
y que es producto
dado y como se individuales
el
de
las
con de una distribucin Poisson compuesta con parmetro
que corresponde a la f.g.m.
Al igual que en el proceso discreto estamos interesados en estimar el monto total de siniestros el para el ao de ocurrencia i, dada la informacin disponible. Sea g parte del ao, para monto de siniestros de la se unda i = 2,, k y a = k - r' + 1, el total de los siniestros acumulados que se desean estimar para el ao de ocurrencia i. Para hacer evidente los supuestos de estabilidad y estacionalidad utilizaremos una aproximacin gama al proceso, basado en los dos primeros momentos. Entonces, si sabemos que donde
resolviendo para obtenemos que . As el supuesto mencionado puede verse de la suficiente manera, si tomamos el cociente
sabemos que por lo tanto el cual claramente no depende del ao de origen sino solamente del periodo de desarrollo en que se encuentre el proceso. Adems podemos notar que la proporcin de siniestros reportados hasta el periodo de desarrollo a. Si llamamos Xi- al total del proceso pare el ao de origen i y obtenemos que
una
gama
generalizada
con
xi
xia.
Los
dos
primeros
momentos
son
. De la independencia entre Wia y Xi- tenemos que
Entonces,
donde
representa
28
el cociente de momios de los ltimos k-a aos de desarrollo con respecto a los primeros a. As puede aproximarse suponiendo que . Esta expresin de la distribucin condicional de xi- tiene la ventaja de contener como parmetros slo cantidades conocidas, por lo que el modelo que usaremos es la forma, de Alba y Jurez (1995) tal que
, El patrn estacional estable se puede ver dado que el valor esperado de la razn de los siniestros agregados en los ltimos k-a arios de desarrollo con respecto a los primeros, depende nicamente de a. De esta manera tenemos; para que que coincide con la funcin de verosimilitud para y usando la
distribucin previa no-informativa
obtenemos la distribucin posterior de la
forma
Por lo tanto si
representa el total del proceso para el ao de origen 2 y hasta el
periodo de desarrollo a y 1 represente la informacin disponible, la densidad predictiva para el total del proceso para el ao de ocurrencia 2 es
una densidad Beta-2-inversa en
Raiffa y Schlaifer (1961). Una vez que bajo una su varianza
identificada esta distribucin podemos encontrar su media funcin de prdida cuadrtica ser nuestro estimador
puntual
29
Si en vez de utilizar una previa difusa, utilizamos la conjugada la esperanza de la predicativa es si x1 y x* son grandes. que claramente no difiere de la anterior
Estas formulas son de fcil aplicacin para el i-simo ao de ocurrencia si hacemos a=k-(i-1), .As el estimador correspondiente del total de siniestros para el ao de ocurrencia j es con varianza . Por lo tanto el
estimador del total de siniestros para todos los aos de ocurrencia es , al que solo tenemos que restar el monto total de siniestros reportados hasta el momento para obtener la reserva necesaria estimada, y utilizando el supuesto de independencia entre los aos de ocurrencia, la varianza estimada para la reserva ser
30
CAPITULO III
En este captulo se presentan algunos ejemplos del clculo de la reserva de SOPNR con el modelo propuesto, comparndolo con los mtodos expuestos en el primero.
III.1 Ejemplo de Seguros de Automvil

En este punto trataremos un ejemplo presentado en Goovaerts M. J., et. al. (1990). donde podremos comparar los resultados obtenidos por varios mtodos compra el aqu propuesto. Los datos que se presentan (Tabla 3.1) corresponden a as reclamaciones hechas a diez compaas Belgas acerca de la cobertura de responsabilidad civil en seguros de automviles. Este tipo de coberturas tienen un periodo de espera largo entre el reporte del siniestro y el pago final de este. Adicionalmente el grupo de asegurados en este ejemplo es relativamente grande, por lo que la evolucin de los siniestros es suficientemente estable.
Tabla 3,1 Tringulo de desarrollo, cobertura de responsabilidad civil.
En primera instancia, reduciremos el tringulo omitiendo la diagonal inferior (en itlicas), es decir los siniestros reportados en el ao 87, con el fin de verificar a calidad de ajuste de los distintos modelos, al comparar posteriormente los datos reales contra los estimados. Para pronosticar esta ltima diagonal con el modelo Bayesiano, suponemos que el proceso termina en el ao 864 y entonces, para cada ao de ocurrencia posterior, tendremos un ao completo ms de informacin con un periodo de desarrollo menos. As, estimaremos el total acumulado correspondiente de la siguiente manera:
Obviamente el monto de siniestros que ocurrieron en 1987 y se reportaron en ese ao no es posible pronosticarlo.
31
Tabla 3.1.1. parmetros de las distribuciones predicativas.
Donde las tres primeras columnas fueron calculadas con las frmulas expuestas al final del capitulo anterior y las columnas Acumulado y Varianza corresponden a la media y varianza de la densidad predictva para ese ao de ocurrencia. Los resultados de este ejercicio, comparados con los modelos listados a continuacin, se presentan en la Tabla 3.1.2, donde la columna %DEV se obtiene al dividir la diferencia entre la columna TOTAL y el valor verdadero entre 4033, que es la suma de la diagonal inferior, excepto el correspondiente al de origen 87 y periodo de desarrollo O. Los mtodos presentados para este ejemplo son los siguientes5: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 I5 Modelo Bayesiano Chain-Ladder Chain-Ladder variante I Chain-Ladder variante II Chain-Ladder variante III Chain-Ladder variante IV Chain-Ladder variante V Chain-Ladder variante VI Mtodo de separacin aritmtica, extrapolacin lineal Mtodo de separacin aritmtica, extrapolacin exponencial Mtodo de separacin geomtrica, extrapolacin lineal Mtodo de separacin geomtrica, extrapolacin exponencial Mtodo de mnimos cuadrados de De Vylder Mtodo de Mack, proceso iterativo, 3 iteraciones Mtodo de credibilidad de De Vylder, proceso iterativo. 2 iteraciones
El mtodo propuesto por Elizondo y Guerrero no se incluye por no contar con datos suficientes.
32
Como podemos ver, el modelo Bayesiano ajusta tan bien los datos como el mejor de los modelos presentados, con la ventaja de conocer completamente la distribucin predictiva y de esta manera poder hacer, por ejemplo, pronsticos por intervalos, con intervalos de probabilidad.
33
Ahora estimaremos los totales para cada ao de ocurrencia y compararemos los resultados de los mtodos enumerados anteriormente, estos resultados son presentados en la Tabla 3.1.3. Asimismo, como tenemos la distribucin predictiva completa, es posible calcular la varianza y por lo tanto la desviacin estndar de sta, ya sea para cada ao de ocurrencia como para el total (Tabla 3.1.4). En este caso, como slo tenemos realmente un ao completo de informacin, nicamente utilizaremos ste para calcular la densidad predictiva de cada ano de ocurrencia, como se muestra en la Tabla 3.1.4.
34
III.2 Ejemplo de Seguro de Gastos Mdicos Mayores

Este ejemplo considera el desarrollo de los SOPNR para la cobertura de gastos mdicos mayores de una compaa Mexicana de seguros, de hecho tambin se incluir el tringulo de desarrollo correspondiente al nmero de siniestros. Este segundo tringulo nos servir, tanto para ejemplificar la aplicacin del modelo con datos discretos, como para sealar la diferencia entre los SOPANR y los SOPNTR, es decir, mientras que el tringulo de desarrollo que contiene los montos describe el desarrollo del siniestro que ya ha sido reportado y que an no se ha terminado de pagar -i.e. SOPNTR-. el que contiene el nmero de siniestros representa los siniestros que han ocurrido y que han tenido un retraso en su reporte -i.e. SOPANR-. El monto de los siniestros se encuentra en la Tabla 3.2.1 y el desarrollo del nmero de siniestros en la Tabla 3.2.2. En este caso compararemos los resultados obtenidos para los montos con mtodo ChainLadder, que fue el que realmente utiliz la aseguradora para estimar la reserva, y el modelo Bayesiano. Podemos observar en la. Tabla 3.2.3 cmo se completa el tringulo utilizando el mtodo ChainLadder, las cifras en itlicas, debajo de la diagonal principal, son los montos acumulados estimados, que se obtienen multiplicando la columna correspondiente al trimestre de desarrollo k-I por la cifra que se encuentra en el rengln Factores, correspondiente al periodo de desarrollo k.
35
36
Las tres primeras columnas de la Tabla 3.2.4 corresponden a los parmetros de la densidad predictva para cada trimestre de ocurrencia utilizando el modelo Bayesiano. La cuarta corresponde a la media de la densidad, que es la estimacin del total utilizando funcin de prdida cuadrtica; la reserva es nicamente a resta del total reportado hasta el momento y el pronstico; adems se presenta tanto la varianza como la desviacin estndar de la densidad predictiva, que nos habla acerca de la dispersin del pronstico. La ltima columna es el coeficiente de variacin de la distribucin.
37
38
39
Por ltimo en la Taba 3.2.56 se encuentra una comparacin de los resultados obtenidos por cada mtodo, por ao de ocurrencia. Como sabemos, con el mtodo Chain-Ladder original solamente se es capaz de dar estimaciones puntuales de la reserva, en cambio, con el mtodo Bayesiano se conoce de hecho la distribucin predictiva completa y de esta forma se pueden obtener medidas de localizacin distintas a la media como la mediana, la moda, cuantiles, etc. En particular, para este ejemplo, podemos ver que la estimacin por Chain-Ladder de la reserva total. dista aproximadamente en tres desviaciones estndar de la media de a distribucin predictiva que, por utilizar funcin de prdida cuadrtica es nuestra estimacin puntual de la reserva. Como se explic en el captulo anterior, la varianza de la distribucin predctiva para la reserva coincide con la de la predictiva para el total del proceso, as las ltimas tres columnas contienen a varianza, desviacin estndar y coeficiente de variacin de la distribucin predictva de la reserva.
Ahora Utilizaremos el desarrollo del nmero de siniestros reportados de la Tabla 3.2.2 para ejemplificar el uso del modelo para datos discretos. En primera instancia podemos notar que los siniestros estn reportados mensualmente y que en realidad no es un tringulo sino un trapecio, esto no es relevante en la estructura del modelo y de hecho podemos utilizar los meses completos de informacin que tenemos para la estimacin del total, como se describi al final del captulo II. De igual modo podemos ver que el proceso de reporte del nmero de siniestros es mucho ms acelerado que el de reporte de montos, es por este hecho que el desarrollo del nmero de siniestros abarca apenas un arco. De esta manera tenemos entonces nueve meses completos de informacin que servirn de base para la estimacin. Los parmetros de la distribucin posterior marginal del total de siniestros para cada mes de origen se presentan en la Tabla 3.2.6. De nuevo, si asumimos una funcin de prdida cuadrtica, la estimacin del total de siniestros corresponde con la columna que contiene la media de la distribucin, entonces la estimacin del nmero de siniestros que faltan por reportarse es la diferencia entre la estimacin del total y los reportados hasta la fecha, que aparece en la columna Por reportar.
Es conveniente notar que el pronstico para 1995 slo cubre el primer semestre del ao
40
III.3 Relajamiento de los Supuestos

En esta seccin trataremos un ejemplo que aparece en Mack. T. (1994), donde los montos que aparecen en el tringulo de desarrollo (Tabla 3.3. l) corresponden a datos histricos, publicados por la Reinsurance Association of America, del seguro de responsabilidad civil en Estados Unidos. Lo primero que notamos es que estos montos no son necesariamente positivos, sino que, debido a la recuperacin de siniestros por medio del reaseguro, es posible que aparezcan, eventualmente, cantidades negativas. Asimismo, podemos ver que el desarrollo de los siniestros no es estacional, es decir que a proporcin de siniestros reportados en un periodo de desarrollo dado no es el mismo para dos aos de ocurrencia distintos.
41
En el caso de querer utilizar algn modelo que transforme los datos con logaritmos, como el mtodo de regresin presentado en el capitulo II, deberemos imponer algn cambio artificial o simplemente dejarlo fuera del anlisis con el fin de evitar este monto negativo. Con esta idea Mack propone cinco opciones7 que son:
Con estas restricciones se utiliza un modelo de regresin corno el del capitulo anterior, donde los montos acumulados tienen una distribucin lognormal y por lo tanto usaremos mnimos cuadrados para estimar los parmetros. Asimismo, en la Tabla 3.3.2 se compararn los resultados obtenidos con este modelo Loglineal contra los obtenidos con Chain-Ladder y el modelo Bayesiano.
Como podemos observar, el modelo Loglineal es bastante inestable ante este relajamiento en los supuestos, incluso con las modificaciones introducidas; en cambio el modelo Chain-Ladder parece estable ante este hecho, y el Bayesiano presenta variaciones mnimas, con la ventaja de conocer la distribucin completa con ste. Otra observacin importante es la distancia entre ambas estimaciones, que en los ejemplos anteriores es muy pequea y que en este parece acrecentarse; con el fin de cerciorarnos de la forma de la distribucin predictiva para el total del proceso, simulamos sta y la comparamos con los resultados obtenidos en el ejemplo.
Tambin podemos notar que este tipo de restricciones no son necesarias. por ejemplo, en los mtodos Bayesiano y ChainLadder dado que estos trabajan con los montos acumulados y estos necesariamente son positivos.
42
Como se puede ver, la simulacin sugiere una gran concentracin de los datos alrededor de la media, que prcticamente coincide con el pronstico calculado utilizando funcin de prdida cuadrtica, y el valor de la varianza es tambin prcticamente el mismo. De hecho se presentan en la Tabla 3.3.3 las estadsticas descriptivas de dos simulaciones distintas, una hecha con 2000 y la otra con 5000 datos y en la Tabla 3.3.4 los diagramas de frecuencia para cada una de ellas. Para llevar a cabo esta simulacin tomamos en cuenta la relacin que existe entre las densidades Beta-2-inversa y Beta, Raiffa y Schlafer (1961).
Utilizando el supuesto de independencia entre los distintos aos de origen, se generaron nmeros aleatorios , para cada ao de ocurrencia i con distribucin y
posteriormente se transformaron para obtener la distribucin deseada haciendo
donde b es el total del primer ao y enseguida se sumaron estos valores para generar generar una observacin de la distribucin predictiva. Este procedimiento se repiti el nmero de veces mencionado arriba para cada simulacin para as obtener el perfil de la distribucin posterior presentada. Es posible obtener la distribucin predictiva para el total de la reserva, calculando la distribucin de la suma de las predictivas para todos los aos de ocurrencia, este procedimiento aunque es exacto puede resultar complejo en los clculos, es por esto que el proceso de simulacin nos sirve para obtener el perfil de la distribucin y constatar en primera instancia nuestros resultados.
SIMULACIN 1 M edia Error Estndar M ediana. Desviacin Estndar Varianza Kurtosis Asim etra Rango M nim o M xim o Sum a N 41,620,50 5.77 41,6I7,28 257.99 66,557.60 0.13 0.02 1,737.89 40,745,39 42,483.27 83,240,998 2 SIMULACIN 2 Media Error Estndar Mediana Desyiacin Estndar Varianza Kurtosis Asim etra Rango Mnim o o Mxim Sum a N 41,617.15 3.65 41,618 10 258.33 66,734_53 (0,03) 0.01 1,979_89 40,62 3,58 42,603 47 208,085,753 5,000
Tabla 3.3.3, Estadsticas descriptivas para la simulacin del total.
43
44
45
Conclusiones
Como liemos visto existe una amplia gama de aproximaciones para tratar de estimar los SOPNR. Aun a pesar de la cantidad de mtodos desarrollados, en varios pases del mundo, algunos con una gran tradicin aseguradora, todava se utilizan mtodos de los que hemos denominado no-estocsticos, probablemente por la facilidad que representa su implementacin. Pero esta facilidad trae consigo el costo de no aportar informacin adicional acerca de la estimacin que se realiza; de hecho este criterio parece ser el nico en el proceso de seleccin entre alguno de estos mtodos, dejando sin posibilidad al analista de encontrar un mtodo ptimo para el tipo de datos que est manejando. As, a pesar de la extensa difusin de este tipo de mtodos, parece no existir un criterio categrico u objetivo que permita discriminar entre stos para la eleccin del ms adecuado. Por otra parte tenemos el problema de escoger entre un conjunto basto de mtodos con suficientes fundamentos estadsticos que nos permiten, en primera instancia, hacer una particin entre los apropiados para el problema por resolver, validando los supuestos, y los que no nos sern tiles. Una vez salvada esta instancia todava existe el problema de contar con una cantidad suficiente de informacin, situacin hasta ahora poco comn y determinante en el caso mexicano ya que, dada a reciente reglamentacin que al respecto ha emitido la Comisin Nacional de Seguros y Fianzas, las compaas de seguros en nuestro pas han tenido que elegir un mtodo para el clculo de las reservas de SOPNR y, en muchos casos, por no contar con un acervo suficiente de informacin histrica al respecto, seguramente se han visto inclinadas a seleccionar un mtodo que no lo exija, por lo ms comn un mtodo noestocstico. Aunada a esta situacin existe un punto por lo ms importante para las compaas de seguros: la facilidad. Como hemos visto existen mtodos que ofrecen una alternativa estadsticamente atractiva, como los mtodos Y basados en la teora de credibilidad, pero es evidente que el tratamiento de dichos modelos no es sencillo para un analista y de hecho implicara un considerable esfuerzo hasta para un especialista que no haya tenido mucho contacto con esta teora, aparte de necesitar clculos que no realizan por lo general los paquetes estadsticos comunes en el mercado. De las consideraciones anteriores surge la necesidad de desarrollar mtodos que: i) necesiten de la menor cantidad de informacin posible. ii) utilicen pocos supuestos y que estos sean fcilmente sustentables, iii) que los clculos sean sencillos y iv) que estn fundamentados en la teora estadstica. Como se ha visto a lo largo de las aplicaciones desarrolladas en la presente tesis, el Modelo Bayesiano que se presenta aqu funciona razonablemente bien en varas ramas de la operacin aseguradora (vida, gastos mdicos mayores, responsabilidad civil, etc.) y con una cartera con buena seleccin y homognea (es decir que los riesgos sean parecidos) se puede lograr el cumplimiento de los supuestos principales. De igual modo hemos visto, en un pequeo ejemplo, el comportamiento del pronstico con el Modelo Bayesiano al relajar los supuestos y hemos verificado que, para este ejemplo en particular, sugiere una estabilidad en el resultado. Sin embargo, la distancia entre el resultado obtenido con este mtodo y los que fueron utilizados para la comparacin, nos llev a realizar una simulacin del proceso para constatar el comportamiento distribucional de la estimacin. Los resultados de las simulaciones parecen alentadores dado que presentan un comportamiento simtrico, en distribucin, que prcticamente puede ser aproximado mediante una densidad normal. Este hecho, de ser constatado, puede representar un resultado interesante y muy prctico en el tratamiento del pronstico.
46
Por otra parte existe an la perspectiva, en un futuro no muy lejano, de contar con una mayor cantidad de informacin y experiencia con la cual tratar de mejorar nuestras estimaciones, al incluirla en el modelo en la forma de distribuciones previas informativas. Ms aun, queda el hecho de especificar una funcin que refleje la utilidad o prdida de cada individuo -i.e. compaa de seguros- en particular. En esta tesis hemos utilizado una funcin de la forma cuadrtica que supone una prdida igual si se sobre-estima o sub-estima la reserva en la misma magnitud: este hecho deber ser evaluado por cada compaa, que decidir si este modelo se ajusta a su operacin. Finalmente la seleccin del modelo a usar en el tratamiento de cualquier problema es una decisin subjetiva, la cual debera ser hecha por el investigador contando con la mayor cantidad y mejor calidad de informacin, aunque como nos hemos dado cuenta en los ejemplos que hemos presentado, muchas veces la mayor cantidad de informacin no siempre es suficiente. As, el propsito de esta tesis es presentar un modelo que sea til en estas circunstancias para las compaas de seguros en el clculo de las reservas y en consecuencia de la correcta tarificacin en sus operaciones, con el fin de conservar la equidad en el contrato de seguro.
47
Bibliografa Benjamn. B. General Insurance. Heinemann, I977. Berger J., Statistical Decision Theory and Bayesian Analysis, Springer, 1985. Bernardo J.M. y Smith F, M., Bayesian Theory. John Wiley & Sons, 1994. Bowers N. L., Gerber H., Hickman J., Jones D., Nesbitt C., Actuarial Mathematics, Society of Actuaries, 1986. Box, G.E.P., Tiao G., Bayesian Inference in Statistical Analysis, Addison-Wesley, 1973. de Alba E., Pronstico Bayesiano de Agregados en Procesos Estacionales Estables, Revista de Estadstica, Vol II(4), 1988. de Alba E. y Mendoza M., A Discrete Model for Bayesian Forecasting with Stable Seasonal Patterns, Advances in Econometrics, Vol. 1 I B, 267-281. de Alba E. y Juarez M. A., Bayesian Forecasting : An Application to IBNR Reserves, Proceedings of the ISBA 3,1995. De Groot M., Optimal Statistical Decisions. McGraw-Hill, 1970. De Vylder F., Estimations of IBNR claims by Credibility Theory, insurance: Mathematics and Economics Vol 1, 35-40, 1982. Elizondo A. y Guerrero V., 11/Mtodos de Pronstico de Siniestralidad Ocurrencia Pero no Reporiada, Documentos de Trabajo. ITAM. 1995. Esteva E., Reserva de Siniestros Ocurridos Pero No Reportados, Serie de Documentos de Trabajo 36, C.N.S.F., 1994. Goovaerts M. J.. Kaas R., Van Heerwaarden A. E., Bauwelinckx T.. Effective Actuarial Methods, North-Holland, 1990. Karlin S, A First Course in Stochastic Processes, Academic Press, 1969. Mack T., Which stochastic model is Underlying the Cahin-Ladder method?, Insurance: Mathematics and Economics, Vol 15 133-138, 1994. Press J., Bavesian Statistics: Principles, Models and Applications, John Wiley & Sons, 1989. Raiffa H. & Schlaifer R., Applied Statistical Decision Theory, The M.I.T. Press, 1961. Verrall R. J., Bayesian Linear Models and the Claims Run-Off Triangle, Actuarial Research Paper N 7, City University, London, 1988.
48

1996 3er. Lugar

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

1996 3er. Lugar

Hochgeladen von

Copyright:

Verfügbare Formate

Un Modelo Bayesiano para el Clculo de Reservas de Siniestros Ocurridos y No Reportados

Premio de Investigacin sobre Seguros y Fianzas 1996 Tercer Lugar

Resea ................................................................................................................. Introduccin......................................................................................................... Capitulo 1: Antecedentes.

CAPTULO I 1.1 Siniestros Ocurridos y No Reportados.

1.2.1 Mtodo Chain-Ladder

y los periodos de desarrollo

I.2.1.1 Variantes del Mtodo Chain Ladder

obtenemos que II.-Esta variacin considera un promedio ponderado de las , digamos

y transformando los valores

para posteriormente tomar los promedios ponderados, como en la

y la estimacin del total de siniestros ser

I.2.2 Mtodo de Crecimiento

I.2.3 Mtodo de la razn

En seguida se calculan los promedios para estas tasas de

I.2.4 Mtodo de Separacin3

Entonces, se tiene que resolver el sistema para los dos vectores

para lo cual se emplea

I.2.4.1 Mtodo de Separacin Aritmtica

Del supuesto mencionado obtener el primer valor valores de los parmetros

. Si seguimos este procedimiento obtendremos lo siguientes ahora haciendo para obtener

y de esta manera calcular los parmetros necesarios.

I.2.4.2 Mtodo de Separacin Geomtrica

I.2.5. Mtodo de Mnimos Cuadrados de de Vylder.

I.3.1 El Modelo de Regresin

para modelo lineal se denota de la siguiente manera:

el cual es lineal en los parmetros. El

contiene los algoritmos de los valores

observados agrupados por ao de

accidente es el vector de errores. La matriz de diseo v de tamao la siguiente forma:

omitiendo la primera columna en la matriz de diseo y el primer elemento de

es el vector de valores ajustados por la

es la matriz de varianza-covarianza de la regresin.

I.3.2 Mtodo de Credibilidad de de Vylder.

es un vector aleatorio desconocido

ambas independientes entre s.

es independiente de j; resultando entonces que en donde es un

promedio, el patrn de desarrollo es el mismo. Ms aun escalar desconocido independiente de j, ocurrencia de j e

es un peso desconocido para el ao de

iv). Las variables estructurales

son independientes e idnticamente distribuidas.

. Luego entonces se tiene aun el problema de estimar stos.

como el nmero de elementos en Tj y m=(tj-1),

I.3.3 Mtodo de Mack.

ocurrencia son independientes y las variables independientes e idnticamente distribuidas.

iii) para i=1,,t.

es una matriz diagonal con elementos

Adems, estimador insesgado para y est dado por

para el parmetro estructural

Captulo II II.1 Inferencia Bayesiana

es en trminos de una distribucin de probabilidad

este enfoque resulta coherente seleccionar una estimacin

ptima en el sentido que

con respecto a la distribucin

nuestro nivel de incertidumbre posterior a la

Por otro lado, si no tenemos observaciones disponibles,

donde el factor de proporcionalidad es obviamente

la distribucin a-priori, representa la informacin previa que

distribucin conjunta de la muestra condicionada verosimilitud; y es la distribucin posterior de

que comnmente coincide con la

una vez que se ha incluido informacin adicional.

de variables est dado, entonces

es una constante, por lo que

es la funcin de verosimilitud de dada la muestra.