AI巨头重大宣布:明年上半年对标GPT-4!华为助攻公众号新闻2023-10-24 08:10中国基金报记者 冯尧 星火大模型进化至V3.0版、与华为联手推出算力底座平台、明年对标GPT-4、人形机器人…… 10月24日,科大讯飞在2023全球1024开发者节上对外释放一系列重大动作。其中星火大模型V3.0如期而至,在指标上已经全面超越ChatGPT(GPT3.5)。 更为重要的是,科大讯飞与华为的联手更进一步。此次活动中,双方基于华为昇腾生态的“飞星一号”算力底座平台发布,科大讯飞明年上半年能够对标GPT-4的星火大模型V4.0将在这一自主可控的平台上完成训练。 如期发布 星火大模型进阶 在2023全球1024开发者节上,科大讯飞董事长刘庆峰宣布,星火认知大模型V3.0正式发布,实现全面对标GPT3.5。用刘庆峰的话说便是,“中文超越、英文相当”。刘庆峰对星火大模型有着更高期待,即不仅能回答问题,还要能提出问题,不仅要有知识,还要有个性。 在中文方面,科大讯飞对星火大模型V3.0注入了“个性”,即AI人设。在现场演示中,星火大模型V3.0被要求“以孔夫子的人设写一篇演讲稿”,星火大模型最终以文言文形式呈现演讲稿,并植入多个孔子经典名言语录。刘庆峰透露,AI人设涉及特定知识学习、大模型人格以及对话记忆学习。 据刘庆峰介绍,星火大模型V3.0已实现从多轮对话、主动对话再到启发探究式对话的跨越。 而在英文方面,根据OpenAI在官网发布的英文任务测试集,在10月16日至20日的测试中,星火V3.0的英文能力对标GPT3.5的48项任务结果相当,二者得分分别为85.1%(星火V3.0)和84.3%。不过刘庆峰坦言,星火大模型在英文开放式问答方面还弱于GPT3.5。“跟GPT-4相比,还有更大的学习空间”。 据记者现场了解,综合来看,在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力七个维度上,星火大模型V3.0较V2.0版本能力提升3-9个百分点之间。 另外根据《通用认知智能大模型评测体系》在10月16日-20日的测试,对比GPT3.5,星火大模型在上述七大维度中的六方面:文本生成、语言理解、知识问答、逻辑推理、数学能力和代码能力实现全面超越。 尤其是在代码能力方面,据刘庆峰透露,科大讯飞内部近期完成了Windows到Linux的跨平台移植,其中涉及20万行代码,正常需要3个月时间完成这项工作,但用基于星火大模型的智能编程助手iFlyCode,整个过程只用了1个月时间。据悉,iFlyCode自8月15日发布以来,已与京东云、软通动力等107家机构实现深度对接应用。 不过,刘庆峰也表示,和GPT4相比,科大讯飞代码能力“还有一个学习的过程”。联手华为 明年对标GPT-4 在此次活动中,另一大关注焦点在于科大讯飞与华为两大巨头的联手。据记者了解,华为轮值董事长徐直军也参与此次活动。在活动中,科大讯飞方面对外发布联合华为打造、基于昇腾生态的自主可控大模型算力底座“飞星一号”平台。 实际上,科大讯飞与华为之间在AI领域的联手日益紧密。“被列入实体清单后,我首先想到向华为请教如何应对,”刘庆峰在会上坦言。 事实上,在星火大模型V2.0发布同时,科大讯飞便联合华为推出to B市场的讯飞星火一体机,以便企业在国产自主创新平台上自主可控地进行大模型私有化部署。 民生证券在一份研报中分析,星火一体机基于昇腾芯片,或代表国内最强AI一体机水平,昇腾AI芯片为核心提供2.5PFLOPS,通过算力软硬件协同优化 构建了算力集中、性能优越、供给稳定、数据安全的大模型训练集群。其具有130/650/1750 亿的模型参数可选,做到开箱即用、安全可控。 科大讯飞在近期的机构调研中也曾介绍,讯飞星火一体机在性能方面已经可以对标A100平台水平。太平洋证券认为,AI大模型在数据安全与数据要素驱动下,将会带来央国企与政府大模型本地化部署刚需。该机构预计,2027年G端AI一体机市场规模超4500亿元。 而徐直军也在此次活动中介绍,目前华为在全球所有智能终端的语音技术,都是来自于科大讯飞。他同时表示,星火大模型V3.0是双方合作的一个案例,为更为强大的星火大模型V4.0提供支撑。 据了解,科大讯飞将开启星火大模型V4.0版本训练,将2024年上半年实现对标GPT-4,而训练所用的平台正是算力底座“飞星一号”。 刘庆峰在会上也正视了与GPT-4的差距。在他看来,国内现有大模型与GPT4相比还有差距,尤其是在复杂知识推理,小样本快速学习,超长文本处理,跨模态统一处理领域。“核心技术还需要持续进步,但这不是某一家公司或者某一家科研机构单独来做的事情。” 商用落地 赋能人形机器人 记者在现场观察到,星火大模型多个领域的商用落地正处于加速中,包括医疗、教育以及科研文献等领域。 在此次活动中,讯飞星火医疗大模型也正式发布。据刘庆峰介绍,GPT-4在国外已经在医疗领域大展拳脚。而通过上线实际使用数据抽查12万例并通过第三方测试数据显示,讯飞星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。 与此同时,科大讯飞在活动中还宣布,即将发布12个行业大模型,覆盖金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等行业。 此外,刘庆峰还透露了科大讯飞在机器人方面的布局。在去年的1024开发者日上,科大讯飞曾展示了自研AI机器人,并发布了讯飞机器人超脑平台AIBOT平台,希望赋予实体机器人智能,通过云端协调、软硬结合的方式,推动AI机器人的发展。 刘庆峰此次表示,星火大模型将让AIBOT赋能机器人发展进入到一个全新阶段,人形机器人对复杂任务的拆解、开放场景的物体寻找明显提升,在强化学习泛化抓取、仿人行走的复杂地形运动能力上都比主流系统有一个非常大提升。 “下一步我们将以人形机器人为牵引,来推动‘视觉-语言-动作’多模态具身大模型,能够更好地赋能人形机器人,”刘庆峰表示。编辑:小茉审核:许闻 版权声明《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。授权转载合作联系人:于先生(电话:0755-82468670)万亿巨头:紧急报警!微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章