原报告《机器学习在保险行业的应用实践》作者彭勇,计算机应用海归博士,曾就职于国内知名互联网和保险公司,具有多年互联网、保险行业数据应用和团队管理从业经历,目前就职于国内某著名互联网保险公司。
本文在原报告基础上加以解读,重点说明如何将机器学习应用到保险行业中,同时,对一些重点场景进行举例,旨在帮助保险方面的从业者进行产业的智能化升级。
一、保险行业发展现状
中国自年恢复国内保险业务以来,保险行业得到了迅速的发展,保费从年的4.6亿元攀升至年的3.1万亿元,增长了倍,保费规模跃居全球第二。今年1-5月,保险业继续保持良好发展势头,保费超过2万亿元,同比增长26%。
总体来看发展可人,但其实,保险业大而不强。从发展水平看,我国保费占GDP比重为4.2%、人均保费为美元,低于发达国家平均8%、美元的水平,也低于全球平均6.2%、美元的水平。从竞争能力看,全球强中有家金融机构,其中银行54家、保险公司56家,其中我国的银行10家、保险公司5家。
那么,保险行业哪些方面存在问题呢?
痛点一:业务模式无变化
互联网时代和人工智能时代下,各行各业一直在寻求变革和突破,而保险行业似乎只是在喊口号,多年来,其业务模式似乎一直没有多少变化:过于依赖线下渠道;纸质式承保和理赔、行业信息化程度较低;流程冗长、繁琐;产品、业务同质化严重;距离客户遥远、互动较少。
痛点二:精算无重大突破
精算指的是对风险进行评估、定价,它要考虑风险发生的概率是多大,根据风险发生的概率去定价、收取保费。另外,保险公司在经营中,要考虑自己承保的风险范围以及应该把风险控制在多大程度之内。
精算对于保险公司来说,其重要程度毋庸置疑,然而在实际的运作中,精算方式却没有重大突破,诸多缺点一直没有得到优化,主要表现在以下方面:精算因子沿用多年,没有按实际需求进行增减;定价方法无法走出GLM;大数法则缺乏公平和个性化;定价不透明,体系较为封闭,缺乏与外界沟通。
痛点三:理赔无变化
保险理赔是直接体现保险职能和履行保险责任的工作,这一环节的好坏甚至在很大程度上会影响到用户的口碑,近年来,用户对保险行业的种种“吐糟”也大多集中于此。人工干预过多,技术含量较低,理赔缺少与承保的联动等等都反映出了这一环节的弊端。
痛点四:组织架构不够灵活
提到保险,首先想到的一定是遍地的保险推销员,对于这样劳动密集型的产业,能否用科技手段减少人员成本应当是公司高层们思考的重要问题。此外,多层级组织是否真的能够为公司带来工作效率的提升?
我们将存在以上痛点的保险称为传统保险,而新生的保险公司多为互联网保险。从图中可以看出,近年来保险科技创业公司的数量逐年增加,且融资金额节节攀升。中国的众安保险融资金额高达9.31亿美元,占全球保险企业融资金额之首。此外,美国公司几乎囊括了国际保险公司融资榜单的前20。
二、BAT布局保险会带来哪些变革?
近年来,BAT三大巨头不断地进行业务扩张,涨势迅猛的保险业自然也被划进了他们的版图中:
年11月,阿里、腾讯、平安三家联合出资成立国内首家互联网保险公司——众安保险;
年11月,百度与安联保险、高瓴资本联合宣布,三方将发起成立一家互联网保险公司——百安保险公司;
年7月,蚂蚁金服收购外资财险公司国泰,持有其51%的股份,并拿到信美相互人寿保险牌照;
年5月,腾讯则联手中信国安成立互联网寿险公司”和泰人寿“,并在山东济南开业……
互联网巨头的加入,将给保险带来哪些变革呢?
从市场特征上看,传统商业产业结构稳定、技术要求不高、用户需求可控、竞争态势可预见,而在数字化时代,行业边界模糊、新技术迅速发展、用户偏好变化快、跨界竞争形势严峻。
从内涵式发展来看,传统商业时代下保险行业的运营以“规范管理、优化流程、降低成本、技术研发”为核心,而数理化时代,这一核心则演变为“提升体验、快速响应、模式创新、科技创新”。
从外延式发展来看,传统商业时代以资金收购和规模扩张为重点,而在数字化时代,商务理念发生了较大的转变,公司间形成了以“互补合作、跨界经营、平台共赢”为基本要求的生态模式。
而这三个方面的变化,促进了保险行业在15个方向上的变革:
商品相关保险创新:为客户购买的产品提供实时保险或保障服务,比如退货险、延保、正品保障等;
P2P保险:群体之间共担风险,共同支付保费;
汽车保险:主要涉及分销、UBI和理赔三个方向,比如按照里程定价;
健康、旅行、财产保险创新:提供健康、旅行、财产等商业非车相关保险创新服务或产品,比如健康险直销平台;
场景化保险和指数类保险创新:直面生活场景的微保险产品和指数类保险创新和分发,与传统保险产品互补,比如温度指数保险;
共享经济相关保险:基于碎片化场景为共享经济提供保险保障,比如共享单车骑行意外保险;
创投、资讯或培训:保险科技创投公司或者保险资讯或培训平台,比如保险师;
比价、中介服务和后市场:第三方保险销售、比价平台和后市场服务;
IT建设和服务:为保险公司提供IT和云服务等服务,比如核心系统;
员工保险和鼓励管理:SaaS服务或者工具用于帮助员工管理福利或提供退休养老金购买方案;
保单管理:让客户管理保单的工具或让保险公司自动化各种保单管理流程的软件;
营销管理:帮助保险公司管理销售线索或获客的平台,比如营销管理平台;
理赔管理:简化理赔流程的工具,比如在车险理赔现场通过移动工具进行一键理赔,比如涉及保险欺诈检测的ShiftTechnology;
基于物联网保险创新:基于可穿戴设备、智能家居等智能设备提供实时保险服务;
大数据和人工智能:利用大数据和人工智能为保险赋能。
三、机器学习关键技术介绍
随着更多的数据和经验的出现,机器学习技术可以迭代排列,以便获得在只有拥有更多的申请者之后才能看到数据点之间的微妙模式和关系。它可以超越人的分析去发现大多数人会忽略掉的错综复杂的细节。这种基于机器的过程,具有高度的准确性,可以快速的提供保险范围决策,并提供更具竞争力的定价,从而降低风险。
那么该如何进行机器学习呢?
首先需要对目标进行特征提取,包括数据的获取和分析、变量预处理、特征工程、特征变换、特征挑选、混合建模等方面。数据变量预处理过程较为复杂,分为数据清洗——缺失值处理——异常值处理——分类变量降维四个步骤,预处理的好坏直接影响到后续模型的构建。
其次,要围绕以上各指标对目标进行建模,可以是单一模型也可以是混合模型。单一模型可以根据目标类别判断采用线性或者非线性的方式进行构建,线性方式简单、处理特征量大、稳定性好,但是需要借助交叉特征来实现;而非线性方式能够计算复杂的模型,但是所用时间也随难度而增加。混合建模的方法要求基础模型差异性越大越好,但是其性能要相似。
最后,要对模型进行评估和自动化地部署。在整个机器学习的过程中,对业务的理解贯穿始终。特征提取时需要知道哪些是主要指标哪些是次要指标,建模时需要依靠对业务的理解判断其实际可行性。真正做到用科技解放人力,而不是为了科技而使用科技。
四、机器学习在保险行业应用实践
保险数据化或者科技化的目标是什么?
以美国车险发展史为例。年前美国车险是代理模式,即汽车保险为代理商销售,这导致汽车保险价格里很大一部分是佣金;美国车险的第二个阶段是经济人模式:StateFarm和Allstate采用这种模式有效地降低了成本;第三个是直销模式,GEICO和Progressive向客户直销保险,进一步降低成本;最后一个阶段即当前的保险新模式,可以进一步降低成本,比如UBI、P2P等。
由此可以看出,保险模式不断寻求创新的核心目标,是要“降低成本、提升效率、让利客户、提升客户粘性”,于此对应的,金融服务的对象也在发生变化,传统金融以头部客户为主,忽略了占比较多的小微企业和普通个体,而互联网金融的核心将向长尾用户倾斜,减少对于头部客户的成本投入。
如何进行大数据定价
曾有报告显示,人工智能最先落地的领域就是金融,对于处理大量复杂繁琐的数据,计算机的确最适合不过。大数据能够实现商业价值,就是要通过数据、算法和技术找到能够创造出客户价值的关键点,其方法有二:
方法一:大量从人、车、环境中提取样本,获得其特征数据,例如人的收入、车的安全评分、当天的天气状况等,再通过机器学习和线性处理构建混合模型。这种方法能够有效提升模型区分度,提升定价精准度,为最大化让利给客户提供支持。
方法二:直接预测赔款金额——预测出险次数和案均金额,然后两者相乘,最后得出赔款金额——结合统计学和机器学习理论,比如使用统计学方法假设出险次数和案均赔款的分布。
这里用电销名单优选来举例。假设我们的目标是为两年及以上车OB名单建立优选机制,很容易想到,我们需要将容易成交名单筛选出来优先拨打,减少人为干预,以便提升名单利用率,那么如何进行筛选呢?
首先,要基于现有客户的基本属性信息、车辆信息等等,利用数据分析的方法判断有价值的分析指标,那么什么样的情况才是有价值的呢?这里列举一些例子,例如:上年平均通话时长在秒以上的成功率较高;车龄是2、3年的车主成功率较高等等。
接下来要对客户进行精准画像,需要对车和用户进行双向考虑。例如,大众是北京高知中产这一类人喜欢的汽车品牌,这类人群收入水平中等、教育水平较高、职业广泛、