Redian新闻
>
金融圈的GPT来了

金融圈的GPT来了

公众号新闻

1. BloombergGPT的核心突破在于构建超3,000亿词例的金融训练数据集

2. BloombergGPT的开发对于所有垂直领域都有重要意义

文:白话华尔街丨ID:WallstreetTalk
字数:1268字,阅读时长:3分钟

图:Bloomberg
近日,由ChatGPT引发的生成式AI热潮也蔓延到了金融行业。3月30日,全球商业、金融信息和财经资讯领域的供应商彭博(Bloomberg)发布了一篇关于BloombergGPT发开情况的研究论文,详细介绍了这一专注于金融领域的大规模生成式人工智能模型。
和OpenAI的ChatGPT将从根本上颠覆书面交流一样,BloombergGPT也将彻底改变金融行业。
“核心突破在于构建了超3,000亿词例的金融训练数据集”
根据Bloomberg的公告,BloombergGPT大语言模型(LLM)专门针对各类金融数据进行训练,从而全方位地支持金融领域的各种自然语言处理(NLP)任务。这些任务可能包括但不限于快速地分析财务数据、协助进行风险评估,以及自动执行会计和审计任务等。
该模型将帮助彭博改进现有的金融NLP任务,如市场情绪分析、实名实体识别、新闻分类和问题回答等。除此之外,BloombergGPT还可以调动彭博终端(Bloomberg Terminal)上的海量数据,将人工智能的全部潜力应用到金融领域。
BloombergGPT基于彭博研究人员开创的混合训练法,通过将金融数据与通用数据集结合起来训练模型,既可以在金融基准上取得最佳结果,同时也可以在通用LLM基准上保持足够的竞争力。
坐拥彭博在数据创建、收集和整理方面的资源,BloombergGPT是迄今为止规模最大的专业领域数据集之一。
在过去的40多年里,彭博积累了充斥大量金融用语的文档,其开发团队从这个由大量英文金融文档组成的数据库中提取并创建了一个包含3,630亿词例(token)的金融数据集。该数据集又与另外一个包含3,450亿词例的公共数据集叠加,形成一个包含超7,000亿词例的大型训练语料库。
彭博的研究团队利用该语料库的一部分内容训练了纯解码器(decoder-only)因果语言模型,包含500亿个参数,并对训练出的模型进行了基准测试。
金融领域的NLP任务采用了彭博的自有基准,各类通用NLP任务则采用了市面上流行的基准,如BIG-bench Hard、 Knowledge Assessments、Reading Comprehension以及Linguistic Tasks。
测试结果显示,BloombergGPT在金融任务上的表现远超类似规模的开发模型,而在一般NLP基准上的表现也达到甚至超过了平均水平。
BloombergGPT在金融NLP和一般NLP任务中的表现 图:Bloomberg
“所有垂直领域都将受益”
彭博在公告中表示,基于LLM的人工智能在许多领域都已经展示出了应用潜力,然而金融领域的复杂性和独特的术语意味着需要有一个专攻金融专业的模型。BloombergGPT的推出意味着,金融行业在基于LLM的人工智能开发和应用方面已经迈出了第一步。
彭博首席技术官Shawn Edwards表示,小样本学习、文本生成和对话系统等,都是生成式LLM模型如此迷人的原因,而首个专注于金融领域的LLM模型将具有巨大价值。BloombergGPT能帮助人们处理许多新型的应用,不仅比定制化模型的表现好,而且即开即用,能够大大缩短上线时间。
关于BloombergGPT的发布,彭博研究团队在论文中表示,虽然业内无法对未公开的模型进行全面评估,但发布模型很可能会导致不良用途。特别是像BloombergGPT这样的接受了大量新闻稿、媒体报道和其他文件训练的模型,发布以后将面临很高的被模仿滥用的风险,而且很容易受到数据泄漏攻击。出于这些原因,彭博研究团队宁可谨慎行事,并遵循其他一些LLM开发人员的做法,不发布BloombergGPT。
尽管如此,彭博在训练和评估BloombergGPT方面的见解和经验将有助于加深人们对LLM模型的理解,对那些希望构建某一领域特定模型的从业者起到借鉴作用。
参考资料
1.Bloomberg, Introducing BloombergGPT, Bloomberg’s 50-billion parameter large language model, purpose-built from scratch for finance
2.Bloomberg, BloombergGPT: A Large Language Model for Finance
3.Fox Business, Bloomberg unveils finance-focused AI model Bloomberg GPT
BloombergGPT论文阅读原文  https://arxiv.org/pdf/2303.17564.pdf

相关阅读

比尔·盖茨:人工智能时代已来

无所不能的ChatGPT背后,藏着微软的野心

风投涌入生成式AI

太空竞赛重启,美国一路领先

ChatGPT推动AI股票大涨

【免责声明】

海投全球及旗下各自媒体账号对所分享内容观点保持中立,不对其准确性提供任何明示或暗示的保证,仅供读者学习参考之用,禁止用于商业用途,且无投资指导意义。本声明适用于海投全球全部原创与转载文章,声明的最终解释权归海投全球所有。谢谢!

点击“阅读原文”,查看更多研究



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
来暑期金融线下营,听哈佛客座教授讲授进入美国金融圈的道与术!第一次去海南中国版ChatGPT来了,三月份公测!比尔·盖茨:人工智能将是今年最热门的话题!金融GPT来了:500亿参数,但用来投资还是跑不赢大盘ChatGPT来了!史上最快破亿使用者的聊天机器人 能撰文、创作、运算、协助医学、解答神学问题chatGPT来了,很多职业将要失业,请慎重考虑孩子的将来首个中文版ChatGPT来了:大模型的中国元“Yuan”OpenAI的GPT-4和 GPT-5,会是怎么样?Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMA复旦放大招:国内首个类ChatGPT来了,名字叫“MOSS”!视觉ChatGPT来了,微软发布,代码已开源EC评估的基本原则开源版ChatGPT来了?多数任务效果超越GPT3,已开源!可怕,一个颠覆性新科技ChatGPT来了!十类人要失业了……复旦放大招:国内首个类ChatGPT来了,名字叫“MOSS”!邀公众参与内测【初次】看巨石强森第一次“拔火罐”​GPT充当大脑,指挥多个模型协作完成各类任务,通用系统AutoML-GPT来了岁末游拉美 - 七、世界独一无二的旅游亮点 - 哥伦比亚小镇瓜塔佩中国版ChatGPT来了!4000亿巨头也被爆炒,股价直线拉升15%!李蓓最新观点出圈,权益资产大幅减仓微软多模态ChatGPT来了?16亿参数搞定看图答题、智商测验等任务马斯克着手开发TruthGPT来最大限度寻找真相,以对抗ChatGPT|环球科学要闻ChatGPT来了,美国高校如临大敌,教育界坐不住了?“最强AI”ChatGPT来了,最先被取代的会是......立即体验!直接可用的中文版ChatGPT来了开源中文医疗大模型华佗GPT来了,真人医生盲测效果优于ChatGPT渔歌子(2):争游夕照忘归家暴跌!市值蒸发500亿!接连2则减持公告…近万亿赛道股莫名拉升,金融GPT来了…见证历史!特朗普预自首微软多模态ChatGPT来了?搞定看图答题、智商测验等任务!网文版ChatGPT来了:大模型辅助写作,澜舟和中文在线联手出品Chatgpt来了当个废物挺好的金融民工会因为ChatGPT下岗吗?刚刚,我问了ChatGPT 24个金融圈灵魂问题突发利空,中移动减持!复旦放大招:中国版ChatGPT来了,名字叫"MOSS"!大利好,私募基金可投住宅!河南人口负增长ChatGPT来了,我们都要失业了吗?让三家AI分别写了侦探小说……金融圈注意了!BloombergGPT来了ChatGPT来了,professional service行业会被取代吗?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。