Modeling lapse rates using machine learning: a comparison between Survival Forests and Cox Proportional Hazards techniques

MODELING LAPSE RATES USING MACHINE LEARNING: A COMPARISON BETWEEN SURVIVAL FORESTS AND COX PROPORTIONAL HAZARDS TECHNIQUES

MODELIZACIÓN DE TASAS DE CAÍDAS UTILIZANDO MACHINE LEARNING: COMPARACIÓN ENTRE LAS TÉCNICAS DE SURVIVAL FOREST Y COX PROPOTIONAL HAZARDS

Jorge Luis Andrade, José Luis Valencia

Facultad de Estudios Estadísticos. Universidad Complutense de Madrid
Avenida Puerta de Hierro s/n Ciudad Universitaria 28040. Madrid

Fecha de recepción: 13/04/2021

Fecha de aceptación: 14/07/2021

Abstract

This study undertakes a comparative analysis of the performance of machine learning and traditional survival analysis techniques in the insurance industry. The techniques compared are the traditional Cox Proportional Hazards (CPH), Random Survival Forests (RSF) and Conditional Inference Forests (CIF) machine learning models. These techniques are applied in a case study of insurance portfolio of one of Ecuador’s largest insurer. This study demonstrates how machine learning techniques perform better in predicting survival function measured by the C-index and Brier Score. It also demonstrates that the predictive contribution of covariates in the RSF model is consistent with the traditional CPH model.

Keywords: análisis de supervivencia, machine learning, tasas de caídas, random survival forest.

Resumen

Este estudio realiza un análisis comparativo del rendimiento de las técnicas de machine learning y tradicionales de análisis de supervivencia. Las técnicas comparadas son el tradicional modelo de Cox Proportional Hazards (CPH) y las técnicas de machine learning Random Survival Forest (RSF) y Conditional Inference Forest (CIF). Estas técnicas se aplican para el estudio de una cartera de seguros de una de las Compañías más grandes de Seguros de Ecuador. Este estudio demuestra un mejor rendimiento de las técnicas de machine learning en la predicción de la función de supervivencia medidos a través del C-index y el Brier Score. También se demuestra que la aportación predictiva de las covariables en el modelo RSF es consistente con el modelo tradicional CPH.

Palabras Clave: análisis de supervivencia, machine learning, tasas de caídas, random survival forest.

ARTICULO

Revista Anales del Instituto de Actuarios Españoles 2021 – 4ª época – Número 27 – Año 2021
Deposito Legal M-3160-1961 – ISSN 0534-3232 – eISSN 2531-2308

Licencia de Creative Commons

Este obra está bajo una licencia de Creative Commons Reconocimiento 4.0 Internacional.