Regresión cuantílica como punto de partida en los modelos predictivos para el riesgo

QUANTILE REGRESSION AS A STARTING POINT IN PREDICTIVE RISK MODELS
REGRESIÓN CUANTÍLICA COMO PUNTO DE PARTIDA EN LOS MODELOS PREDICTIVOS PARA EL RIESGO

Albert Pitarque, Ana María Pérez-Marín1, Montserrat Guillen

Dept. Econometría, Riskcenter-IREA, Universidad de Barcelona

Fecha de recepción: 1 de agosto de 2019
Fecha de aceptación: 23 de octubre de 2019

Abstract

Given a risk level or tolerance, quantile regression is a predictive model that fits the corresponding percentile of the continuous response variable. Given a fixed percentage value, we identify the effect of each predictor variable in the cumulative distribution up to that level of the dependent variable. In this article, we show how this methodology can be used in motor insurance data analysis and we propose an extension of quantile regression inspired by the need to predict the expectation of the conditional tail. To this end, specific R routines have been developed and a resampling procedure has been implemented to approximate standard errors. The main conclusion is that this type of models allows us to analyze which factors affect accident risk and can be used to mitigate or to evaluate risk in the insurance field.

Keywords: predictive modelling, value-at-risk, tail value at-risk, optimization, resampling

Resumen

Dado un nivel o tolerancia de riesgo, la regresión cuantílica es un modelo predictivo que ajusta el correspondiente percentil de la variable respuesta continua. Fijado un determinado valor porcentual, se identifica el efecto de cada variable predictora en la distribución acumulada hasta ese nivel de la variable dependiente. En este artículo mostramos cómo puede utilizarse esta metodología en el análisis de datos en el seguro de automóvil y proponemos una extensión de la regresión cuantílica inspirada en la necesidad de predecir la esperanza de la cola condicional. Para ello se han desarrollado rutinas específicas en R y se ha implementado un procedimiento de remuestreo para la aproximación de los errores estándar. La principal conclusión es que este tipo de modelos permite analizar qué factores inciden en el riesgo de accidente y pueden ser utilizados para mitigarlo o para valorarlo en el ámbito asegurador.

Palabras clave: modelización predictiva, valor en riesgo, valor en riesgo de la cola, optimización, remuestreo

 

ARTICULO

 

Se agradece la financiación recibida del proyecto del Ministerio de Economía y Competitividad y FEDER, ECO2016-76203-C2-2-P del programa ICREA Academia y de las ayudas Fundación BBVA para equipos de investigación en big data.

Revista Anales del Instituto de Actuarios Españoles 2019 – 4ª época – Número 25 – Año 2019
Deposito Legal M-3160-1961 – ISSN 0534-3232 – eISSN 2531-2308

Licencia de Creative Commons

Este obra está bajo una licencia de Creative Commons Reconocimiento 4.0 Inter