张晓燕:金融领域正迎来大语言模型的巨大机遇
大语言模型技术带来了全球经济生产效率的提升。
文 | 张艺伟 殷子涵 高翔 来源 | 清华五道口 <<<
9月26日,2023中国普惠金融国际论坛暨数字经济开放研究平台学术峰会在北京召开,清华大学五道口金融学院副院长、金融学讲席教授张晓燕受邀参加,并发表了“人工智能在金融领域的应用与挑战——以大语言模型为例”的主题演讲。演讲中,张晓燕认为大语言模型在自然语言处理领域已经表现出令人惊喜的技术突破,大语言模型在数据分析和决策支持等方面的出众能力将促进全球生产效率的提升。她还结合案例总结了大语言模型在金融领域的应用与挑战。
大语言模型是一种用于处理自然语言信息的大型人工智能模型。大语言模型在大规模文本数据上进行训练,学习语言中的语法、语义和上下文信息,使它们能够理解和生成人类语言并执行多种任务,主要应用场景有知识问答、情感分析、本文生成、知识抽取、摘要总结等。模型参数量大是大语言模型的显著特点,国际上Open AI的GPT3.5模型参数量达到1750亿,而GPT4预计其参数量达到1万亿;国内上海AI实验室的书生·浦语(InternLM)闭源版本有1040亿参数,是在包含1.8万亿 token 的语料上训练而成。大语言模型的大参数特点带来了各项能力的突破,Zhong et al.(2023)研究表明大语言模型在很多考试方面的能力已经接近并超过人类水平。这些考试包括美国高中毕业生学术能力水平考试(SAT)、美国研究生入学考试(GRE)、高考(China College Entrance Exam)、律师资格考试和国家公务员考试。
图为论坛现场
张晓燕表示,大语言模型技术带来了全球经济生产效率的提升。第一,2023年麦肯锡发布的一份调查问卷表明,大语言模型已经被很多行业应用,提高行业效率。所有行业中,金融服务业和科技行业的受访者使用生成式AI的频率最多;企业不同的部门中,市场营销、客服管理、研发和软件开发的受访者使用生成式AI的频率最多。第二,大语言模型将助力经济增长,其在各行业的广泛应用将带来全社会生产效率的提高。第三,大语言模型推动就业市场更迭,它能够替代部分简单文本处理职位,同时也将提供全新的就业岗位。国家对于大语言模型等人工智能技术保持积极鼓励的态度,行业处于市场有序发展、监管不断完善的新局面。
张晓燕认为,大语言模型对于金融行业产生的潜在影响可能更大。大语言模型在投资场景中可用于投资决策、风险评估、市场分析、文档处理、自动化客户服务和舆情分析等。比如,在宏观经济分析中,可以基于大语言模型来分析美国央行对于货币政策的态度。在银行理财业务中,生成式AI的应用场景贯穿银行全产业链的各环节。相比于其他行业,金融行业需要处理包括新闻、分析师研究报告政府政策等多种信息,大语言模型可以更便捷地提取和分析海量文本。其次,金融信息的时效性需要分析师快速做出决策,大型语言模型可以在秒级内分析市场并提出建议。此外,大量的金融服务都需要语言沟通,未来大语言模型可能可以回答客户查询,提供投资建议,甚至部分替代人工客服和投资顾问。
在快速发展的同时,大语言模型应用于金融领域也面临一些技术挑战。一是金融专业领域知识的匮乏性(即大语言模型在金融领域语料不足);二是大语言模型训练的成本问题,训练大语言模型所需算力的成本高昂;三是金融信息有及时性需求,大语言模型的训练语料可能存在滞后性问题;四是金融决策的精确性要求;五是金融领域的高动态性问题,例如金融领域的专业词汇在动态增加,同样的术语在不同时间可能含义有所变化。
一些解决方案可以应对当前的难题。一是重新基于金融语料预训练金融领域大语言模型;二是基于某个开源大语言模型,通过不同的微调技术,将大语言模型的能力与人类的需求对齐,再打造一个符合特定场景的金融大语言模型;三是结合词向量数据库与Langchain技术,通过及时更新词向量数据库,来让大语言模型拥有最新的准确信息。
最后,张晓燕进行了总结和展望,她认为大语言模型虽然出现的时间较短,但是正在对全球和中国经济产生积极的影响,金融行业的众多业务场景非常适合大语言模型的应用和落地。在未来,应用金融行业大语言模型落地同样面临诸多挑战,为了规范大语言模型在金融领域健康有序的发展,相关监管部门需要及时制定规章制度,指引行业健康发展。
REVIEW
微信扫码关注该文公众号作者