Redian新闻
>
彭博推出BloombergGPT——专为金融行业从头打造的500亿参数大语言模型

彭博推出BloombergGPT——专为金融行业从头打造的500亿参数大语言模型

财经


BloombergGPT在金融领域NLP任务上的表现明显优于其他类似规模的开放模型,在一般LLM基准上亦有不俗表现


2023年3月30日 — 彭博今日发布一篇关于BloombergGPT开发情况的研究论文,文章详细介绍了这一全新的大规模生成式人工智能(AI)模型。该大语言模型(LLM)专门针对各类金融数据进行训练,以全方位支持金融领域的自然语言处理(NLP)任务。


基于LLM的人工智能(AI)已经在许多领域都展示出令人兴奋的新应用。然而,由于金融行业的复杂性并且含有大量金融术语,我们需要一个专攻金融专业的模型。BloombergGPT的推出意味着这项新技术在金融领域的发展和应用已经迈出了第一步。该模型将帮助彭博改进现有的金融NLP任务,如市场情绪分析、命名实体识别、新闻分类和问题回答等。此外,BloombergGPT还将释放更多新机遇,调动彭博终端上的海量数据,将人工智能蕴藏的全部潜力带到金融领域。


过去十几年来,彭博一直都是在金融领域应用人工智能、机器学习和NLP的开拓者。今天,彭博能够支持各类型NLP任务,得益于全新的金融感知语言模型。彭博的研究人员开创了一种混合训练法,将金融数据与通用数据集结合起来训练模型,以达到在金融基准上取得最佳结果,同时在通用LLM基准上也保持足够的竞争力。


为实现这项里程碑,彭博的机器学习产品和研究小组和人工智能工程团队合作,利用彭博在数据创建、收集和整理方面的资源,构建了迄今为止规模最大的专业领域数据集之一。作为一家金融数据公司,彭博的数据分析师在四十多年的时间里收集和维护了充斥大量金融用语的文档。开发团队从这个由海量英文金融文档组成的档案库中提取并创建了一个包含3,630亿词例(token)的金融数据集。


这批数据又与另一个包含3,450亿词例的公共数据集叠加,成为了包含超7,000亿词例的大型训练语料库。彭博的研究团队利用该语料库的一部分内容,训练了纯解码器(decoder-only)因果语言模型,包含500亿个参数。团队还对训练出的模型进行了基准测试。金融领域的NLP任务采用了一套彭博的自有基准,各类通用NLP任务则采用市面上流行的基准,如BIG-bench Hard、 Knowledge Assessments、Reading Comprehension以及Linguistic Tasks。值得注意的是,BloombergGPT模型在金融任务上的表现远超类似规模的开放模型,而在一般NLP基准上的表现也达到甚至超过了平均水平。


表1. BloombergGPT在两大类NLP任务中的表现:金融专业任务和一般任务。


彭博首席技术官Shawn Edwards表示:

“生成式LLM模型的小样本学习、文本生成、对话系统等都是让它如此迷人的原因,而我们也看到开发出首个专注金融领域的LLM模型有着巨大的价值。BloombergGPT将使我们能够处理许多新型的应用,不仅比定制化模型的表现更好,而且开箱即用,能够大大缩短上线时间。”


彭博的机器学习产品和研究团队负责人Gideon Mann表示:

“机器学习和NLP模型的质量归结于投喂的数据如何。得益于彭博四十多年来收集整理的金融文档,我们才能精心创建这样一个干净的大型金融专业数据集,来训练最适合金融行业用户使用的LLM模型。我们很高兴能用BloombergGPT来改进现有的NLP工作流程,同时也在想象这个模型还有哪些新的使用方式来造福我们的客户。”


关于彭博

彭博是全球领先的商业和金融信息提供商,通过提供值得信赖的数据、新闻和洞察,为市场带来透明度、效率和公平。彭博通过可靠的技术解决方案帮助连接全球金融生态系统中的具有影响力的社区,使我们的客户能够做出更明智的决策,并促进合作。


点击 “阅读原文” ,阅读arXiv上的论文了解有关BloombergGPT开发的更多详情。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
四位“Bloomberg Greener绿金行者”分享为行业可持续发展所做出的贡献山情水趣话旅游(38):加拿大之行(2)7 Papers & Radios | Meta「分割一切」AI模型;从T5到GPT-4盘点大语言模型Stable Diffusion公司重磅开源大语言模型StableLM,又爆火了!1个月上岸!恭喜NUS学员斩获Bloomberg(SG) Full-time Offer中国的历史太捅肺参数是ChaGPT的近6倍!英特尔公布AI大模型Aurora genAI,具备1万亿参数性能超越GPT-4!谷歌推出大语言模型PaLM 2,全面升级Bard反击ChatGPT|环球科学要闻GPT-3解数学题准确率升至92.5%!微软提出MathPrompter,无需微调即可打造「理科」语言模型无需豪掷数亿购买硬件,用笔记本就能运行650亿参数大模型:这位程序员仅用一晚上就做到了叫板ChatGPT?Stability AI 开源语言大模型 StableLM,参数仅为GPT-3百分之四,却能实现超高性能岗位播报 | Bloomberg开放金融中后台全职网申,要求研究生参数是 ChatGPT 的近 6 倍!英特尔公布 AI 大模型 Aurora genAI,具备 1 万亿参数金融领域FinBERT、BloombergGPT以及法律领域微调模型LawGPT_zhMeta最新语言模型LLaMA论文研读:小参数+大数据的开放、高效基础语言模型阅读笔记又一国产大模型来了,超对称联合复旦大学发布 120 亿参数语言模型 BBT-2, 已开源大羊驼LLaMa竞品来了:AI画图最火公司开源语言模型,最小30亿参数300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了刚刚!商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此Bloomberg上线金融版“ChatGPT”,华尔街Banker恐慌…(附使用手册)Gelsenkirchen(3):一出动物歌剧大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4ToolsHuggingChat叫板ChatGPT!300亿参数大模型免费用,网友:真香Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMA千亿参数开源大模型 BLOOM 背后的技术谷歌报复性砸出5620亿参数大模型!比ChatGPT更恐怖,机器人都能用,学术圈已刷屏刺激!Bloomberg重磅发布金融版“ChatGPT”,华尔街Banker慌了…NLP大规模语言模型推理实战:大语言模型BLOOM推理工具测试实践与效果分析实录1个月被怒撕2次Offer,最后竟215K极限上岸Bloomberg?这位Newgrad经历有些特别...金融圈注意了!BloombergGPT来了恭喜DBC职梦UCL学员拿下Bloomberg (UK) Spring Week Offer!Gelsenkirchen(2):一座现代剧场彭博推出金融版ChatGPT!AI的火终于烧到华尔街了?商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此Make sense 和泡坛子
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。