Redian新闻
>
澜舟科技周明:大模型未来研究的9个关键问题丨GTIC 2023

澜舟科技周明:大模型未来研究的9个关键问题丨GTIC 2023

科技

破解ChatGPT/Matter如何驱动家居智能化升级!GTIC 2023全球AIoT智能家居峰会4月28日在AWE同期举行,欢迎报名。

大模型带来了认知智能技术跨越式发展、个人和企业工作的新范式,带动从AI 1.0到AI 2.0,不断走向AGI。
编辑 |  GTIC
智东西4月18日报道,在刚刚落幕的GTIC 2023中国AIGC创新峰会上,澜舟科技创始人兼CEO、中国计算机学会CCF副理事长、创新工场首席科学家周明以《大模型带来的新范式》为题发表了主题演讲。
作为微软走出的技术专家,周明非常认可微软联合创始人比尔·盖茨关于“要把自然语言理解做好了,基本上可以重塑一个微软”的评价。
在他看来,大模型正带来认知智能的崛起。大模型尤其是ChatGPT代表着语言理解、多轮对话、问题求解进入了一个可实用的时代。同时,大模型有效解决NLP任务碎片化问题,大幅度提高研发效率,标志着NLP进入工业化实施阶段。AI 2.0时代将首先革新创作内容、办公方式、搜索引擎、人机交互界面、金融场景任务等领域。
创立于2021年6月的澜舟科技已推出了多个大模型对外产品服务,目前已落地孟子大模型、AIGC(智能创作)平台、机器翻译平台、金融NLP平台等多款技术及产品,落地同花顺、华夏基金等企业。结合类ChatGPT技术,澜舟科技推出了对话机器人MChat,能够通过智能对话帮助用户完成特定场景中的多种工作任务。
谈及对产业未来方向的展望,周明坦言,当下类ChatGPT技术在推理、逻辑、数学和算术、事实性错误等方面仍有所欠缺。未来,大模型相关的九大问题尤其值得关注,涉及推理能力、事实正确性、中文处理能力等方面。
以下为周明的演讲实录:
今天给大家介绍我们对大模型的一些新思考,我的演讲分三部分:一是我们对大模型的理解,它带来哪些新的范式变化;二是澜舟科技在这个领域所做的一些努力;三是未来大模型的发展。

01.
大模型标志着NLP进入工业化实施阶段


我先谈谈大模型的一些背景。此前十余年人工智能在感知智能方面进展迅速。大模型带来认知智能的崛起,大家都知道2017年谷歌提出了Transformer技术,随后预训练模型BERT、GPT等一系列技术出现,NLP能力在各项任务上大幅度提升,最近ChatGPT带动了NLP发展热潮。
我们今天看到的一个明显趋势是AI正在大模型驱动下快速实现认知智能。认知智能包含语言理解,就跟我们的大脑一样,理解后要回答、解决问题,对业务做出预测。它有很多广泛的应用,从翻译、问答、交互、搜索、推荐、写作、专家系统等等,你能想到的跟人的智能有关的应用,几乎都是认知智能。
它对企业非常重要,原来企业讲大数据,现在智能平台可以把企业的很多业务进行升级,甚至可以提供一些企业洞见,发现数据之间规律。
大规模预训练模型简单来说就是几件事:1、海量文本数据,比如互联网数据;2、超大规模算力3、超大规模预训练语言模型,要么针对不同任务进行微调(BERT/GPT),要么连微调都不做(GPT-3,ChatGPT);4、一个模型解决N个任务
大家最近很熟悉的是ChatGPT,其实大模型有很多流派,像BERT是encoder这边,GPT是decoder这边,T5既有encoder又有decoder,它适合不同的场合。BERT类似的东西一般适合于文本分析、信息抽取,GPT更多适用于文本生成,T5更多被用于机器翻译。
当前在预训练模型领域较受关注的研究重点包括:第一,怎么把大模型做到更好,把它的能力做到更强?第二,预训练大模型代价太大,怎么降下来?第三,我自己有行业数据、有知识图谱,怎么融入进去?第四,做下游任务时,能不能少标点数据,少样本学习或者无样本学习?
我这里有两句话,希望大家能有点印象:第一,大模型尤其是ChatGPTGPT-4,代表着语言理解、多轮对话和问题求解,进入了一个可实用的时代;第二,大模型有效解决了NLP任务碎片化问题,大幅度提高研发效率,标志着NLP进入工业化实施阶段
传统NLP开发存在任务碎片化严重的问题,每一个NLP小任务比如分词、语义理解、机器理解都是从头开始开发,每个企业的数据又不一样。其他问题还有要做很多数据标注、开发周期长、支付成本高、维护代价高。
有了大模型,用微调(Fine-tune)或者提示(Prompt)技术,一下子就把碎片化解决得很好;再加上一点零样本技术或Prompt技术,减少了数据标注问题;再有一些轻量化训练方法或部署方法,减少了客户代价;还可以帮助客户自行快速建模,以便快速验证业务流程;最后可以通过本地部署或SaaS提供服务,减少用户的开发代价和维护代价。
我原来也是微软的,我一直受到比尔·盖茨的感召,他曾经跟我们在review的时候说过一句话:“你们要把自然语言理解做好了,基本上可以重塑一个微软。”我们这些天看到的微软和ChatGPT和OpenAI的合作中,几乎微软所有的业务都受到了一些新的革命性的影响。
ChatGPT有对话、语言理解、改写、翻译、写作、解题等能力,具体来讲,有几件事印象深刻:比如in-context learning,不需要改变大模型参数,用Prompt技术一个模型解决N多问题;还有Instruct-learning、涌现能力、复杂query理解、多轮对话、推理、逻辑、NL2Code、与人类价值观对齐等等。
过去几十年来,NLP也好,AI也好,以前都是一个模型解决一个任务,要针对每一个具体任务,设计规则(规则系统)、设计特征(统计系统)、针对大模型微调(大模型早期),开发周期长,而且不能复用。训练出来的模型,只具备这个能力,不具备其他的能力,而且设计的能力水平不会因模型架构修改或数据增加出现跃升。
这样的AI系统,我管它叫AI 1.0系统。有点类比于比较本分的小孩子,你告诉他做什么,他做什么,不会举一反三,不会触类旁通,他练习增加,能力可慢慢增长,但是不能顿悟。在GPT3.0,GPT3.5和ChatGPT之前,我们就简单地说ChatGPT之前是AI 1.0时代。
现在ChatGPT带来了一个所谓的AI 2.0或者NLP 2.0时代,用一个模型解决N个功能,再加新的功能,就用Prompt技术把它的能力带动起来。再往前走,我们可以设想这样的能力一点点增强,一点点走到所谓的通用人工智能(AGI)。


02.
大模型改变工作范式:激发创意、
高效办公、革新搜索、重塑人机交互


AI 2.0时代会带来哪些影响呢?
第一个影响是ChatGPT以及大模型,很好解决了创意问题,以前想一个营销文案半天想不明白,现在跟它交互几次,它可以提供很多新的创意。解决了这个问题,就可以大批量生产很多内容。这已经影响到大文娱、影视传媒等很多产业。
第二是办公自动化的问题,生成式AI让用户更加专注自己的业务领域,把繁琐的生成工作交给AI,让工作成果展现更加高效。像微软Office加上了Copilot,邮件、文章、PPT等办公工作的生产过程更加智能化、更加快速。
第三是对搜索引擎的影响。原来一个query得到10个Boolean,现在搜索引擎基于大模型的理解,可以做复杂query理解,可以做语义层面的query和文档的匹配;以前搜索就是看数据,看不到数据内部的规律,现在除了看数据,可以形成总结、形成观点洞见,对数据可以有深度的洞察;最后是整个搜索改变了,原来就是搜索,现在把搜索、了解内容、了解规律、形成洞见、写出文章及发表,都可以一条龙提供服务。
除了微软提供的通用搜索服务,我们也可以设想在某些专用领域,把这样一些事情,比如解决金融领域的投研分析、投研报告问题,对各行各业都有非常大的影响。
第四是对用户语言的理解增强,你可以用自然语言与几乎所有的应用、所有的设备对话,你也可以把很多第三方的东西通过插件的方式联系到你的系统里,就像我们所看到的OpenAI通过发布了一些插件的方式,实际上用AI连接一切。我认为这是未来非常大的一个趋势。

03.
澜舟科技大模型已落地金融场景
具备百亿级类ChatGPT能力


有了大模型,怎么改变行业?
我们要做金融,拿金融的数据继续训练,得到一个金融大模型,再支持金融中几乎所有的业务,这就是我们大模型落地方面所做的一些努力。

在智能客服场景,我们有上下文理解、多轮对话的能力,会对现在的客服、基于FAQ的客服产生碾压式的影响。
在营销文案生成场景,跟聊天机器人对话,可以激发新的灵感,最后得到不错的营销文案;可以生成各种各样的风控报告,基于信息抽取能力得到一些干货,包括保函审查、搜索问答场景等。
接下来介绍一下澜舟科技做了哪些工作,以及我们站在从业人员的视角,看类ChatGPT未来的发展趋势是什么。
澜舟科技成立于2021年,一直做大模型,我们的大模型获得了HICOOL 2021全球创业大赛一等奖,得到时任北京市长陈吉宁先生的接见。
我们已经推出一系列大模型的服务,像AIGC(智能创作)平台、机器翻译平台、孟子大模型、金融NLP平台等等。这些底层都是大模型,上层针对行业特点做继续训练,或者针对任务特点做监督学习,把大模型和体系发布出来,通过SaaS或者本地部署来提供服务。

孟子大模型有很多应用案例:比如跟同花顺做大模型在金融领域的落地,用于问答、对话、信息抽取等场景;跟传神做大模型在多种语言翻译和多种垂直领域翻译的应用;跟华夏基金做舆情分析平台;跟数说故事合作做AIGC营销文案写作。
澜舟科技把类ChatGPT做出来了,加上以前做的很多功能,如何用类ChatGPT把原来的功能串通起来,来解决行业的落地问题。比如调用类ChatGPT的能力,让它介绍一下爱因斯坦,回答如何发现相对论的、推荐北京的5个著名景点、续写小说、写一个口红的营销文案、作为工具处理一些金融场景任务等等。

目前我们开发的是百亿级的类ChatGPT能力,有一定的对话、理解、问答各种方面的能力。我们花了很多工夫去整理中文数据,增强中文对话能力。我们也可以让类ChatGPT调用一些已有的引擎,比如可能企业自己原来就开发出很好的翻译、写作等引擎,可能有第三方引擎,如何跟类ChatGPT联系起来。

04.
未来大模型研究方向,9个问题待解


再花5分钟的时间,讲讲未来的研究方向。我们先问一下ChatGPT:我是做自然语言研究的,没有很多块GPU,能做什么样的研究?
我昨天到学校去演示,很多同学也问了这样的问题,ChatGPT告诉你,第一,你可以做模型压缩;第二,你可以做迁移学习;第三,你可以做多语言学习;第四,你可以做领域有关的模型,或者说做小规模试验环境下的创新算法
我觉得它讲得都挺好的,虽然大家都很喜欢、很追捧ChatGPT,但是它还有很多问题。我们要做未来的研究,一定要知己知彼,知道它的问题在哪里,才能有的放矢,进行改进。
第一,ChatGPT在推理、逻辑、数学和算数、事实性错误、偏见和歧视、写代码、抽象理解等方面还有很多欠缺。
比如问鲁迅和周树人是一个人吗?它说不是一个人,讲了半天理由;问父亲和母亲可以结婚吗?它回答说不可以结婚。这就说明ChatGPT在常识、事实性方面的理解和推理能力还有问题。
网上最近热传的画一幅唐伯虎点秋香的图,结果AI画成了一只老虎正在点香,实际上是因为它不理解中国的文化,可能是把中文翻译成英文,调用了Stable Diffusion,Stable Diffusion是针对英文的特点做的数据清洗和训练,所以拿它做翻译肯定会有很多的问题。实际上,要从根上来做,需对数据清洗做出中文标记,不能仅仅依靠英文标记,有很多的功夫要做。
信息抽取也有很多挑战,比如对话式抽取的意图理解欠佳,领域知识不足,缺乏专业度。Prompt这件事既好又坏:好的Prompt能够把它的能力带出来,可是如果不会写Prompt,它的能力放在那儿也用不起来。
还有涌现,大家整天讨论涌现,涌现到底是什么?什么时候能出现涌现?模型做到多大才能出现涌现?模型小一点的时候,能不能用什么招把数据弄好,把算法弄好,让涌现早点出现,别等到搞到万亿模型才出现涌现?

以及如何建立大模型的评测体系?有没有一个比较客观的自动化较强的体系来测大模型的能力?虽然我们看到学术界有些分任务做了一些标准测试集,但是很多新的大模型的能力是没办法测试的。所以我们呼唤产业界、学术界把大模型的评测体系好好地建立起来。
总结一下未来大模型方向的9个问题:
1、如何增强模型的推理能力,能理解复杂任务,如解数学题、逻辑推理。
2、如何提高生成内容的事实正确性,保证生成内容安全可靠。
3、如何最小化代价建立实时学习模型,能基于新产生的知识去生成答案,保证内容的时效性
4、提升中文的处理能力,如中文处理的成语、比喻、跨模态的语义对齐等。
5、如何增强领域知识、跨语言知识、更好注入特定任务知识等。
6、如何更加交互地、灵活地、智能地提升提示(Prompt)能力
7、更好理解涌现能力。到底是什么能力?怎么激发出来的?能不能更有效地,而不是单纯靠模型规模急剧增加,而得到涌现能力?
8、如何做好模型轻量化
9、如何高效构建更全面的模型评测体系,以建立更加安全、可控、无偏见的模型?

05.
结语:在大模型带动下
迈向通用人工智能


最后总结一下:
第一,大模型带来了认知智能技术跨越式发展。
1、从AI大模型1.0到2.0,从简单能力+针对具体任务的专用模型,到复杂能力+面向泛任务的通用模型,推动着语言理解、多轮对话、问题求解进入了基本可用时代。
2、有效解决NLP任务碎片化问题,大幅度提高研发效率,标志着NLP进入工业化可实施阶段。
第二,大模型带来了个人和企业工作的新范式。
1、个人:从内容创作、办公、搜索和人机交互,都将被深深变革。
2、金融领域:智能客服、营销、风控、投研、推荐等各个方面将本增效。
3、企业服务:提升人力、财务、营销、获客、调研、报告生成等方面生产率,有效改善客户满意度,实现智能决策,提高工作效率,提升企业形象和市场竞争力。
第三,未来在大模型带动下,从AI 1.0AI 2.0,将不断走向AGI
1、实现负责任的、安全可控的、功能强大的通用大模型和功能引擎。
2、知识、常识、可解释、自学习、动态接入各类动态和静态数据。
3、成为认知智能的基础模型,通过云计算、本地部署和端,成为各项服务的内在中枢和各类计算机软硬件系统的泛在人机接口。
今天我的演讲就到这里,谢谢大家!
以上是周明演讲内容的完整整理。
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

GTIC峰会预告


破解ChatGPT/Matter如何驱动家居智能化升级!GTIC 2023全球AloT智能家居峰会4月28日在AWE同期举行,欢迎报名。



  


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
未来一段时间,这9个资本市场关键问题值得重视!2022&2023 Subaru Outback 和 2023 Honda CRV Hybrid二选一实现AGI之前,全球AI大佬在这4个关键问题上吵起来了|甲子光年澜舟科技创始人兼CEO周明:大模型带来的新范式|GTIC 2023演讲预告对话李志飞:大模型的关键在于如何把大模型用起来|年度AI对话IRS向国会提交直接报税报告;财政部指示试点评估关键问题事关“美台21世纪贸易倡议”, 商务部: 坚决反对;南宁市市长鞠躬道歉!官方回应停车贵等问题丨早报李彦宏:大模型即将改变世界,百度要第一个把全部产品用大模型重做一遍新时期我国集成电路产业高质量发展亟待突破的关键问题研究陆奇说,大模型未来会让很多很多人会失业。。。刘亦菲豁出去了,就靠一块“三角布“遮羞,分手了“玉女“形象4.25移民局会议,EB-5两大关键问题避而不谈魏杰:中国经济的关键问题Agustín Hernández:中美洲建筑背景下的未来主义巨构阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-OwlEruope 2023一个幸福家庭是怎样破碎的信息爆炸的 10 篇 AGI 访谈,我们从中整理了 14 个关键问题|GGView性生活时间是越长越好?关于“时长”,女生有话要说2023 春 祝姐妹们周末快乐!关于颈动脉斑块,您必须了解的十大关键问题Nature: 电子科技大学镍基超导研究的新突破:H元素的关键作用“新冠溯源研究”发布会:沈洪兵等专家对关键问题释疑只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型Google内部文件首次泄漏:ChatGPT 没有护城河,开源才是大模型未来美国大峡谷,自然奇迹澜舟科技周明:大模型正在催生新AI中台 | 中国AIGC产业峰会转:2023 回国探亲(5)国际要闻简报,轻松了解天下事(03伟伟道来 | 第366天,俄乌冲突一周年,99个关键节点和醒目瞬间初创公司规模持续扩大时,如何解决好组织和人的关键问题? |【亿万本周动态】澜舟科技招聘:社招全职与实习,NLP算法(预训练/信息抽取/机器翻译)等方向启明创投周志峰:大模型中国创业机会很多,过度依赖API会失去竞争力丨GTIC 2023张柏芝18岁与王菲18岁,看完照片,网友:谢霆锋才是人生赢家一览科技CTO陈锡言:大模型阴影下的技术创业机会——链接大模型与用户|量子位·视点分享回顾9 个关键问题,快速读懂做抖音必备的营销科学完成Pre-A+轮融资,语言大模型企业「澜舟科技」推出孟子MChat可控大模型|36氪首发大兴调查研究的关键是什么?20年前朱镕基给出了答案9个关键点,摸清IPO上市审核的细节申请香港永居关键问题,如何理解“通常性居住”?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。