您的位置:首页> 科技> 保险大模型哪家强?

保险大模型哪家强?

来源:中国银行保险报时间:2023-10-24 07:25

□记者 谭乐之

2022年以来,以ChatGPT为代表的AI大模型横空出世,大幅提升了AI尤其是自然语言处理技术解决实际问题的能力,在全球范围内引起极大关注。各行业都在尝试探索大模型应用落地的路径,其中也包括保险行业。然而,AI大模型在大众领域体现的出色能力,能为具备相当专业门槛的保险行业所用吗?AI大模型又能给保险行业带来哪些具体的业务价值?

近期,《中国银行保险报》记者获悉,国内保险科技平台元保联合保险科技研究机构分子实验室,共同发布了《人工智能大模型保险行业应用评测报告》(以下简称《报告》)。《报告》立足国内保险行业实际需求,以应用场景的视角和维度进行评测,通过设置保险知识、法律知识、医疗知识等行业常规知识问题,测试大模型的保险行业基础能力;同时针对性设置了保险业务场景问题,以测试大模型的保险行业实际应用能力。

国产大模型不输GPT-4

在测评对象层面,《报告》对市场上十大主流的大模型进行了系统性测评,包括ChatGPT-3.5、ChatGPT-4、清华智谱ChatGLM-130B、百度文心一言、科大讯飞星火、360智脑、昆仑万维天工等。

在测评维度层面,《报告》从常用的保险业务场景中抽离出三大能力,即专业知识问答能力、营销服务应用能力、合规风控应用能力,基本上涵盖大模型在保险领域的主要应用方向。在每个应用能力之下,又细分出多个能力测试维度,如专业知识问答能力下,涵盖介绍和了解产品所需的保险常识、法律知识、医疗知识三方面;在营销服务应用能力下,涵盖代理人展业过程中所需的营销素材设计、营销话术优化、客服话术推荐、综合规划配置方面的模型能力;在合规风控方面,主要关注保险服务过程中的智能核保、智能理赔、实时质检方面的大模型应用能力。

综合各问题回答表现的平均分,10个主流大模型在医疗知识、保险常识、保险法律知识领域表现普遍较好,在智能核保、智能理赔、话术优化上表现不尽如人意,在营销服务应用能力上表现参差不齐。

具体而言,由于国内大模型厂商在中文数据语料上更加丰富,因此国内头部大模型在回答专业领域的基础知识问询时,对国内情况更加了解,回答的表现也比国外大模型更加出色。文心一言与清华智谱在保险常识、法律知识问答上均进入前两名,得分强于GPT-4。在医疗知识回答上,文心一言亦在受测大模型中表现最优,科大讯飞星火也同样获得较高得分,表现均强于GPT-4。头部大模型在专业知识问答上已有较强应用能力,可直接使用程度很高。

《报告》认为,目前大模型非常适合作为智能机器人用以服务客户,回答客户关于保险、医疗等方面问询,同时也可以赋能保险代理人,成为保险代理人的展业工具之一,提升代理人服务客户的能力。

在营销与服务应用上,10个大模型整体表现参差不齐,有较大分化。整体而言,得益于突出的自然语言处理能力、丰富的知识图谱和语料库以及较强的推理和逻辑能力,ChatGPT和通义千问在四项具体能力上均有相对较好的得分。如当客户反馈保险产品价格较高、影响了自己的购买意愿时,通义千问、GPT-4均能指出价格只是产品的一个方面,其他如保障项目、理赔率、服务能力等,也是保险选购过程中客户需重点考虑的因素。不过,在营销话术上,大模型能给出的对策却没有很强创新性,给出的答案也与常见的代理人回答雷同。

合规风控应用方面,GPT-4表现一骑绝尘,在核保、理赔质检方面均得到了最高分。例如在回答具体的理赔案例时,GPT-4根据理赔条件和具体问题,给出了较为准确的理赔建议。例如在询问“因突发脑梗摔伤,意外险能否理赔”时,GPT-4对产品条款进行了多种假设,并依据不同假设给出了正确的理赔建议。由此可见,GPT-4已具备较强的逻辑推理能力,可根据逻辑规则以及具体情况进行推理。而国内大模型目前更擅长信息的检索,类似于知识图谱的能力,在逻辑推理方面还需进一步提升。

《报告》指出,当下国内外大模型在保险行业的能力,有些已可直接应用,有些还有漫长的提升之路要走。然而,技术是不断进步的,特别是AI在跨越了智慧的奇点后,将会飞速发展,值得期待。

大模型深度赋能潜力已显现

从本次《报告》评测呈现的结果看,AIGC在保险行业应用层面的表现尚未成熟,但AIGC为保险业务场景深度赋能的潜力已然显现。《报告》指出,保险行业作为数据密集型行业,具备数据优势,在政策支持与自身强智能化意愿下,是AI大模型的最佳应用领域之一。

清华大学金融科技研究院副院长、中国保险与养老金研究中心主任魏晨阳表示,对大模型的评测工作,在全球范围都是一个意义重大的事情。结合金融领域一个重要板块(保险)的大模型评测,更具有特殊意义。包括AI在内的科技赋能,核心在于结合具体应用场景时,模型是否在实操层面、核心业务的前沿,真正有实用价值。

中央财经大学保险学院院长、中国精算研究院院长周桦表示,国内的大模型平台在追击国外先进大模型的过程中取得了不错的成绩,希望在这项基础设施建设中,国内大模型能持续前进,成为国际AIGC领域的重要力量。同时也希望国内保险公司和科技力量能整合资源、联合研发,在中文保险领域大模型开发中实现质的突破。