Le modèle de Cox, une solution au risque de modèle en présence d'hétérogénéité

[latexpage]

Les modèles de valorisation économique (calculs de MCEV, best estimate Solvabilité 2) nécessitent de recourir à des hypothèses (loi de mortalité, d’incidence, de rachats etc.) best estimate. Les différentes lois de sorties sont expliquées par un nombre de variables discriminantes potentiellement important. Dans ce cadre :

  • une approche globale pour l’ensemble du portefeuille devient inadaptée dès lors que le portefeuille se déforme dans le temps,

mais une trop forte segmentation fait apparaître un risque de modèle et un risque d’estimation.

Modèle de Cox

Un modèle de référence permettant de prendre en compte l’hétérogénéité du portefeuille sans étudier la loi de sortie spécifique à chaque maille est introduit par David Cox [1972]. Il s’agit d’un modèle semi-paramétrique faisant intervenir des variables explicatives (exogènes). Le modèle définit chaque fonction de risque instantané par :

\begin{equation} h(x|z;\theta)=exp(-z’\theta)h_{0}(x), \end{equation}

où,

  • $z$ est le vecteur de variables explicatives (exemple : âge, sexe, CSP, etc.),
  • $\theta$ le vecteur de paramètres (inconnus) du modèle,
  • $h_{0}$ la fonction de risque instantané de base,
  • et $h$ la fonction de risque instantané associée au groupe étudié.

Le modèle ne s’intéresse qu’à la mesure de l’effet des covariables et pas nécessairement à la spécification de la fonction de base. En d’autres termes, il s’intéresse au positionnement de différentes populations les unes par rapport aux autres sans considération du niveau absolu de risque.

Une fois la fonction de risque instantané $h$ déterminée, le lien avec les taux discret est immédiat (sous hypothèse de constance de taux de risque instantané entre deux âges entiers) :

\begin{equation} q(x|z;\theta) = 1-(1-q_{0}(x))^{exp(-z’\theta)} \approx q_{0}(x)exp(-z’\theta), \end{equation}

l’approximation étant valide pour des taux de sortie faibles.

Limites et tests des hypothèses

  1. Le modèle de Cox est un modèle de régression dont les coefficients sont déterminés par maximum de vraisemblance (partielle). Il est ensuite nécessaire de tester leur non nullité via des tests statistiques adaptés (cf. ouvrages de Hill et al. [1990], Therneau et Grambsch [2000], Martinussen et Scheike [2006]).
  2. Le modèle de Cox est dit « à hasard proportionnel », i.e. que pour deux sujets présentant les caractéristiques $z_{i}$ et $z_{j}$, le rapport des fonctions de risque instantané est constant :

\begin{equation}\frac{h_{i}(x|z_{i},\theta)} {h_{j}(x|z_{j},\theta)} = exp((z_{i}-z_{j})’ \theta) = K. \end{equation}

Les fonctions de risque sont proportionnelles les unes par rapport aux autres et leur rapport ne dépend pas de $x$. En pratique, cette hypothèse de proportionnalité est forte et mérite donc d’être vérifiée.

Dans le cas où les hypothèses du modèle de Cox ne seraient pas vérifiées, il est possible de se tourner vers d’autres modèles composites tels que les modèles additifs (cf. Aalen [1978]) ou les modèles de fragilité (cf. Vaupel et al. [1979] et Barbi et al. [2003]) par exemple.

Références
Aalen O. (1978), « Non parametric inference for a family of counting processes », Ann. Stat. 6, 710-726.
Barbi E., Caselli G., Vallin J. (2003), « Hétérogénéité des générations et âge extrême de la vie », Institut National d’Etudes Démographiques / Population, Vol. 58, No 2006-1.
Cox D. R. (1972), « Regression Models and Life tables », Journal of the Royal Society. Series B (Methodological), Vol. 34, No. 2.
Hill C., Com-Nougoué C., Kramar A., Moreau T., O’Quigley J., Senoussi R., Chastang C. (1990), « Analyse statistique des données de survie », Inserm, Médecines-Sciences, Flammarion,

Planchet F., Thérond P. (2011) Modélisation statistique des phénomènes de durée – Applications actuarielles, Economica,
Vaupel J. W., Manton K. G., Stanllard E. (1979), « The impact of heterogeneity in individual frailty on the dynamics of mortality », Demography, Vol. 16, No. 3.