百川智能发布金融大模型Baichuan4-Finance,准确率领先GPT-4o近20%
新浪科技讯 12月23日下午消息,百川智能宣布发布全链路领域增强大模型Baichuan4-Finance。据悉,在高质量金融数据的基础上,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。其金融专业能力和场景应用能力均领先GPT-4o。
在中国人民大学财政金融学院新近发布的评测体系FLAME评测中,该模型登上榜首。具体来看,FLAME由两个方向的评测基准组成:一,FLAME-Cer主要面向模型的专业金融能力评测,覆盖了CPA、CFA、FRM等14类权威金融资格认证;二,FLAME-Sce则侧重模型的场景应用能力,包含10个一级核心金融业务场景,21个二级细分金融业务场景,近百个三级金融应用任务。
在FLAME-Cer评测中,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。GPT-4o是金融领域公认的综合实力最强的通用模型之一,而XuanYuan3-70B-Chat则是国内首个开源中文金融大模型。
在FLAME-Sce评测中,Baichuan4-Finance一级核心金融业务场景的整体可用率达84.15%,其金融数据计算、金融知识理论等场景的可用率更是超过90%,实际应用场景中的表现非常优秀。
此外,为让模型在提升专业能力的同时不损失通用能力,该模型还打造了一套全链路领域增强方案,覆盖高质量数据集构建、模型预训练、微调、强化学习等从模型研发到场景应用的全流程,实现了模型专项能力和通用能力同步提升,提升了模型多元场景可用性。(文猛)
版权声明:[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:seo998@gmail.com,我们会予以删除相关文章,保证您的权利。