平安集团首席科学家肖京:平安集团大模型能力建设与应用实践探索

来源 | 深圳香蜜湖国际金融科技研究院
作者 | 平安集团首席科学家肖京

图片

尊敬的肖钢主席、王洪章董事长、于学军主席、各位领导,各位专家,大家好!

非常荣幸参加今天的交流。听了前面很多业务专家和领导的介绍,我学到了很多知识,接下来我就从技术角度讲一下平安集团在数字金融方面的一些实践以及支持绿色金融的一些具体进展。

首先,我们对人工智能发展阶段的理解。

我们认为现在已经进入新一代人工智能的发展阶段,形成了基于可信AI的“感知-学习-记忆-思考”四步完整闭环:①感知,通过与环境交互,感知各类大数据;②学习,通过机器学习数据分析,建立模型并学习知识;③记忆,通过知识表达,实现对知识的记忆及传承;④思考,通过知识推理与数据建模的融合,思考演化。通过这样的一个闭环,人工智能系统可以自学习、自成长,只要我们不断地让它去学习。

上一代人工智能绝大部分的应用都属于这四步中的第一步和第二步,只会学习解决单一问题。上一代人工智能都是针对某个问题获得大量数据,然后学习一个模型来解决这个问题,泛化能力差,一个模型只能解决一个问题,比如人脸识别的模型就只能做人脸识别,语音识别的模型就只能做语音识别,下围棋的模型不会下象棋等,我们认为这种能力只会计算不会算计。我们把人工智能比喻成两种鸟,一种鸟是鹦鹉,鹦鹉会计算,不断给它重复消化,它会记住,但是它不会算计,不会举一反三和触类旁通。比如鹦鹉打篮球,可以教会它打篮球,但是它不会踢足球;另外一种鸟是乌鸦,乌鸦是会算计的鸟,会算计就不是靠大数据学出来,会举一反三和触类旁通。我们希望人工智能是会算计,不只会计算。

人工智能是从大模型技术开始进入第二个阶段的,通过“预训练大模型”实现一定程度的记忆能力。大模型的全称叫预训练大模型,为什么有个“预”字呢?“预”的意思是解决任何问题之前,先训练一个模型,所以大模型本身就具备了泛化能力,一个模型可以解决很多问题,比第一阶段的传统人工智能有了很大的进步。

虽然大模型技术是在2018年发布的,但是谷歌在2017年就提出了Transformer技术,在此基础上发展出预训练大模型,大模型有两条发展路径:一是判别式大模型,BERT系列的模型是这类模型的典型代表;二是深层次大模型,2022年底发布的ChatGPT是这类模型的典型代表,标志着人工智能进入第二个阶段,这类模型具备预训练能力,即记忆能力,可以博学强记和泛化,一个模型就可以解决很多问题,但还不会思考,所以不可控,经常出现幻觉,而且不可解释,出了错误你也不知道错了,即使你知道它出错误了,你也不知道它为什么会出错,导致你不知道怎么解决,所以很难用。

我们认为DeepSeek类大模型的出现标志着全球人工智能进入第三个发展阶段,能力升维,能学习强思考、可信可控、具备更广泛的应用前景。这个阶段的模型不仅能够学习,还能够记忆、思考、触类旁通和可解释。你问它任何问题,它会告诉你答案怎么来的,如果你知道它哪一步错了,你就可以去修改,这样人工智能就可以得到更广泛的应用。

第二,我们认为第三个阶段的、初步具备思考能力的新一代人工智能会给包括金融行业在内的各行各业带来三个大的变化。

第一个变化,客户在变。客户有两个大的变化,①知识平权,我们的客户现在具备非常强的知识,比如现在很多业务部门向监管汇报时都先问一下大模型,“针对这个材料监管可能会问什么问题?”然后进行准备,后来发现80%的问题都是匹配的,医院、理财或者保险都是同样的情况。以前靠知识差和经验差提供服务的领域未来会有很大的挑战,因为客户的水平大幅提升,如果你的水平不跟着提升,客户就不用你了;②客户更加相信AI的结果,更愿意接受AI的服务。

第二个变化,模式在变。因为客户在变,所以我们的业务模式在未来也会发生很大变化,未来的金融或者医疗等知识、经验服务型的行业,所有的岗位都可能会变成由少数或者极少数大专家指挥和调教下的一对一的机器人服务。

第三个变化,生态在变。如果业务模式发生了很大变化,整个产业链生态都会发生很大变化,我们有很大的机会能够在变化中拥有非常好的市场竞争力。

DeepSeek算法创新的两大特点,使得各行各业能够站在巨人肩膀上,在垂域上做深做强,推动行业整体向智能化转型升级。

第一个特点,更强的开源模型,通过监督微调和强化学习方法实现更优R1及蒸馏版。DeepSeek是一个非常强大的开源模型,但是只开源了输入输出两端的模型参数,中间的算法代码和数据都是没开源的。如果一个机构具备了中间的能力,就可以不断形成垂域的壁垒,模型也越来越强,这是我们的机会,但这个机会的条件就是我们需要有中间的能力。

第二个特点:强化学习尺度法则(RL Scawling law),训练轮次越多,思考能力越强。

DeepSeek这两个特点告诉我们,不断的积累自己的专业数据,具备专业领域训练垂域模型的能力,我们的模型就会越来越强,方案就会越来越强,在市场上的竞争越来越强。如果一家公司只是用开源模型,所有的应用和能力都是同质化的,是没有市场竞争力的,未来就没有机会。

未来我们会通过做以下三个重点工作来颠覆现有的流程模式和生态:

一是做深做强垂域模型,夯实标准化高效训练、推理、蒸馏模型平台及灵活编排的智能体平台,完善快慢思考结合的模型体系。这里主要是技术上的准备,把数据、标准化的训练工具、训练能力、蒸馏和推理能力准备好,然后在这个基础上不断迭代保险、银行、投资、医疗、养老等垂域模型,不断变强,形成快慢思考(即大小模型)结合的模型体系,然后通过智能平台的能力让所有的人可以标准化、规模化地去应用这些模型能力。

二是完善存量、新增、AI原生三大应用场景,实现业务价值最大化。我们董事长提到现在我们是AI in all,把所有场景用AI重新做一遍,平安做智能化也有十年了,过去有很多存量场景,我们全部重新检查了一遍,有些东西是不需要变的,因为已经很好了,效率也很高,也做得很准,但有一些场景通过新模型可以得到提高。

三是重视防范AI安全风险,深化AI伦理治理。AI可以用来做好事,也可以用来做坏事,我们要警惕。

第三,平安集团的人工智能底座。

“平安脑”智能引擎深度赋能“综合金融+医疗养老”两大主业。我们构建了“平安脑”智能引擎作为人工智能底座,一共分为三层:第一层是算力;第二层是数据,数据是集中的;第三层是数据之上的包括了模型层的算法平台。

算法平台又可以分为四个层次:第一个层次是通用模型、垂域模型和专属模型。这些模型在不断地迭代升级,我们的要求是市场上的任何模型,五天之内一定通过所有的测试,包括安全测试、性能测试、所有测试,然后进入平台,在这基础上开始用自己数据进行训练,垂域模型在各个不同的垂域去做,比如DeepSeek是大年二十八发布的,初八上班那天我们全集团就已经在用了;第二个层次是小模型,比如语音语义、智能图像、微表情、隐私计算和数字大脑等;第三个层次是训练推理管理工具,要求投产是最优的,调度是最优的,所有的训练推理都是标准化的,通过这个平台可以实现标准化开发,不需要投入任何额外的人力;第四个层次是智能体平台,主要有两个功能,一是集团总部和各公司总部大系统的快速建设;二是个人构建的每个工作岗位的标准化助手。

算法平台可以支持综合金融、医疗养老、集团管理和行业赋能等所有业务场景,体现提效果、提效率、提用户体验、降风险、降成本的业务价值,这是我们整个数字金融的基础架构。

算法平台统一提供规模化、规范化、标准化通用技术能力,构建高效智能体生产服务生态。看、听、说、读等人工智能技术是实现数字化的基础,我们的模型能力基本上是行业领先的,平台已经完全实现了标准化建设,上线了各种标准化的模型工具,比如通过绘画工具的一些简单勾勒就可以生成山水画、油画等非常高质量的画作;只要通过几个照片就可以生成数字人形象,打造自己的直播数字人;智能体的训练推理也完全标准化,不用写任何代码就可以快速构建自己的智能体,全集团已经构建了55000个智能体,其中千次调用以上的智能体有1100多个,已经覆盖11万员工,小的岗位场景不可能让集团的大团队开发,所以只有通过算法平台,不用写任何代码就能构建AI应用,才能真正让所有场景都百花齐放。目前,我们的营销、风控、运营、服务和经营管理“五个智能化”已经全面落地。

第四,AI-ESG保障可持续发展。

针对绿色金融、可持续发展,打造ESG体系。我们从2018年开始建立完整的指标体系,有了指标以后,通过AI获取大量数据,通过建模自动给每一个企业打上相应的分数,有了模型标签和分数就可以建立管理体系。

管理体系主要有两个功能:一是看自己,看什么地方做的不好导致自己的ESG评级不理想,管理系统在2019年上线,我们当时的MSCI评级是“BB”, 一年半就升到“A”,现在已经升到“AA”,但是与兴业银行相比仍有差距,我们也在努力,三年内争取升到“AAA”;二是看别人,建立评价模型,提供投资数据和工具,资管、基金、银行、信托全面落地责任投资,目前已经有二十几个投资机构在使用我们这个ESG系统来看投资标的。

ESG评价数据产品广泛应用于绿色投资、绿色信贷及碳金融等领域绿色投资应用方面,主要包括面向指数公司、投资机构的ESG投资策略研究、ESG宽基指数开发、ESG被动投资产品,目前我们已经发布了四项ESG宽基指数产品和平安新启航绿债理财产品,与富时罗素、新华财经一起构建ESG指数,基于智能体平台开发了ESG问答系统、ESG助手等工具,帮助每个员工更好了解ESG和业绩投资,BlackRock的ESG投研应用也使用了我们的算法;绿色信贷应用方面,主要包括面向银行等金融机构的高碳排企业转型融资、清洁能源项目融资和企业ESG表现融资,为绿色信贷产品匹配合适的绿色标的和绿色企业,目前已经落地了10亿元的碳挂钩银团贷款、首单煤炭低碳转型公司债和首例可持续挂钩公司债券,同时进行绿色指标评估和贷后监控;碳金融应用方面,主要包括面向监管、保险、金融机构的资产组合碳盘查、金融机构气候风险管控和碳汇资产金融服务,碳核算法已经通过碳核算金融联盟PCAF的最高标准,在“双碳”领域实现了广泛的应用,目前对平安集团万亿级资产完成了首轮碳盘查,正在对照国际国内最新规范进一步迭代完善,并推进平安保险碳中和产品保险和碳资产交易保险服务。

AI赋能ESG管理,MSCI获评“AA”,位列综合保险经纪行业亚太第一。①MSCI ESG评级已经获评“AA”,今年有些指数已经达到“AAA”的标准;②在保险经济领域,连续三年在亚太地区排名第一;③入选可持续发展年鉴(中国版),也是内地唯一入选的保险企业;④绿色金融系统在社会责任、负责任投资场景有很广泛的应用,以“鹰眼”风险减量服务平台为例,提供了15种灾害预警,截至2025年上半年,累计预警25.9万场灾害,发出预警信息42.6亿次,覆盖6,402万企业和个人客户。

“1+5+3”体系保障金融业务数字化高质量发展的可持续性。在AI安全方面,大模型应用有十道防线,可以避免包括幻觉问题在内的很多问题;在AI伦理方面,我们构建了“1+5+3”体系,“1”是一个伦理委员会,集团CEO是主任,“5”是人类自治、安全可控、可靠可信、公开透明和公平公正五大原则,“3”是三项实践:在研究上,政策、行业、技术的研究全面展开;在宣导上,面向员工和面向公众的宣导;在治理检视上,自上而下、责任到人的抽查检视和自下而上的自查,把数据全流程、模型全链路以及应用系统的风险责任统一管理起来。

以上是汇报内容,谢谢大家!

版权声明及安全提醒:本文转自网络平台,文章仅代表作者观点,不代表「金融文库」立场。相关版权归原作者所有,「金融文库」仅提供免费交流与学习,相关内容与材料请勿用于商业。我们感谢每一位原创作者的辛苦付出与创作,如本转载内容涉及版权及侵权问题,请及时联系我们客服处理(微信号:RyanLin007),谢谢!

(0)
上一篇 2025年10月1日 上午7:55
下一篇 2025年10月18日 下午11:00

相关推荐