Redian新闻
>
真的强?国产百度文心大模型 3.5 爆分了!

真的强?国产百度文心大模型 3.5 爆分了!

公众号新闻

自从 2023 年初 ChatGPT 爆火之后,国内也迅速掀起了前所未有的“百模大战”。在国内,百度最早发布知识增强大语言模型文心一言,作为一家在人工智能坚持投入十余年的公司,百度的技术沉淀和数据沉淀都是其它厂商无可比拟的,不过相对而言,国内大模型发展方面晚于国外厂商,几个月前的效果都在追赶国外厂商。

最近,全球领先的IT市场研究和咨询公司 IDC 发布了一份国内厂商大模型的全方面评测比较报告——《AI大模型技术能力评估报告,2023》,这是一份纳入了百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家国内厂商模型的评测报告,在这份报告中 IDC 通过设计多个维度的基准测试对各大模型进行了深入评测,它的评测结果可以说是代表了现阶段国内大模型的最新成绩,通过这份报告我们可以马上了解到国内大模型到底孰强孰弱。

1. IDC大模型报告

IDC 在这份报告中为所有大模型设计了十二个维度进行评测比较,经过几个月的迭代,升级之后文心大模型3.5可谓进步速度神速,在十二项评测结果中文心大模型夺得了七项满分:


这里要给大家普及一个基础知识,就是文心大模型是文心一言背后的底层预训练大模型,文心一言是大语言模型,作为一个底层通用模型,文心大模型的行业应用场景十分丰富。

此次 IDC 的评测报告主体也是比较各厂商的通用大模型,只有通用大模型够强,在此基础上的各种通用人工智能产品才会有更好的表现效果。

在本次评测中,由于文心大模型3.5珠玉在前,其它国产大语言模型就有点相形见拙,几乎各个方面都被超越:


最终在这份报告中,我们看到了一个全新升级的文心大模型3.5,它在这份评测报告中夺得了三个第一:

  1. 总分第一。
  2. 行业覆盖第一。
  3. 算法模型第一,也是所有选手中的唯一算法模型满分。

IDC 评估报告围绕产品技术、服务生态以及行业应用三大维度,考察大模型的10余项指标,其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。

算法模型指标体现了技术积累的深度与广度,也可以说是决定了未来技术耕耘的上限。

只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,才能使各行各业充分享受技术突破带来的红利,破解 AI 落地门槛高的困境,这次文心大模型取得满分得成绩代表其在算法模型方面已经达到了国产第一。

行业覆盖指标则是决定了大模型目前所可能覆盖到的行业前景,以及其应用前景。

通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现,而文心大模型行业覆盖第一的成绩代表其也在行业覆盖方面也达到了国产第一。

IDC 的本轮评测报告完全体现了百度文心大模型的基础技术深度和产业应用覆盖广度,可以说,文心大模型已经全面领先友商,更是领先于国外的 ChatGPT3.5,处在国产大模型榜首的位置。

2. 文心大模型3.5

从4年前文心大模型1.0发布到如今的无冕之王,文心大模型发展速度可谓惊人,而文心大模型的重大进步还要从文心大模型3.5的问世说起。

百度其实从 2019 年就已经开始深耕预训练模型研发,在 2019 年 3 月发布了文心大模型 1. 0,从此便开始了文心大模型得演变历程:


今年五月,历经四年技术深耕和研发迭代之后,百度正式发布文心大模型 3.5,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等,新版本在效果、功能、性能全面提升:

  1. 所有推理功能效率提升50%,内容安全性方面大升级。
  2. 训练速度提升2倍,推理速度提高30倍。
  3. 新增插件机制,大大扩展了模型边界,联合百度开发者生态激发更大可能性。

同时多个公开测评显示,文心大模型3.5版加持下的文心一言中文能力突出,甚至有超出GPT-4 的表现,综合能力超过ChatGPT3.5,遥遥领先于其他大模型。

文心大模型能取得如此成绩,我觉得有几个方面不得不提一下:

2.1 四层技术栈

第一方面是百度“芯片-框架-模型-应用”四层技术栈的全面积累,尤其是框架层的飞桨和模型层的文心的联合优化。

很多朋友可能不太了解飞桨是什么,但是许多开发者朋友,尤其是机器学习相关的开发者,应该经常接触或者经常使用飞桨深度学习平台。

飞桨是中国第一个,也是百度自研且开源开放的深度学习平台,致力于让深度学习技术的创新与应用更简单。同时飞桨平台开源了大量训练好的模型免费提供给广大开发者使用,哪怕是在 Github 这个聚集了全世界开发者的平台,飞桨项目也是机器学习领域比较知名的那个。

飞桨提供了最先进的大模型训练和推理部署平台帮助文心大模型实现了快速迭代,加上百度本身多年积累的 5500 亿知识图谱,以及最大的中文搜索引擎和数据处理技术,这些都为文心大模型的快速发展起到了不可磨灭的作用。

2.2 并行训练

在模型训练上,依托飞桨的自适应混合并行训练技术及混合精度计算策略,并采用多种策略优化数据源和数据分布,使得预训练大模型的训练效率和效果都得到了显著提升。

进而采用多类型多阶段有监督精调,多层次多粒度奖励模型,多损失函数混合优化策略,以及双飞轮结合的模型优化等等,大大提升了文心大模型训练的效果。

2.3 核心技术创新

在模型推理方面,百度创新了大规模逻辑数据构建技术、逻辑知识建模技术、粗粒度与细粒度语义知识组合技术以及符号神经网络技术,使得推理的效果和效率都得到了很大的提升。

在知识增强和检索增强基础上,百度进一步创新了知识点增强技术,使得模型能够更好地利用精细的知识点来提升模型的理解生成等方面的能力。

而这些技术创新,都是依托百度在自然语言处理领域的早早布局与多年的积累深耕达成的。

所有的开花结果,背后都是无数的前瞻布局与大量投入,文心大模型3.5的成功,不仅仅是一个模型的成功,更是一个生态的成功。

在文心大模型的官网上,可以看到基于文心大模型的一整套生态产品:


如今文心大模型3.5的全面升级,带动的还有这些相关产品的全面升级:

  1. NLP 模型的升级可以让机器更好的理解人类语言,机器对话、搜索、信息拾取更加智能化。
  2. CV 模型的升级可以为企业和开发者提供更强大的视觉基础模型,以及一整套视觉任务定制与应用能力。
  3. 跨模态模型的升级可以大大提高文字工作者、内容创作者的生产力。
  4. 生物计算模型的升级可以在生物预测领域做出更多的成果。

除此之外,百度文心已形成企业、教育、社区三位一体的生态体系,百度有超过750万开发者基础,20万企业生态基础,多层次开展大模型人才培训、企业赋能、开发者运营,百度还设立了10亿创投基金鼓励大模型创意、繁荣大模型生态。

3. 行业大模型

在大模型的应用前景上,大家了解的更多的可能是大语言模型。就如ChatGPT背后的GPT技术有GPT3.5、GPT4等不同阶段的模型支持,文心大模型亦如此。当然文心大模型可以做到的不仅仅是对话,写诗等,更是可以参与到各行各业中去。

百度 CTO 王海峰博士曾表示:面对大模型产业化挑战,可以借鉴类似芯片代工厂模式,大模型企业可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为各行各业提供大模型服务。

目前,这一产业化路径已在文心大模型产业实践中得到验证,百度与各行业头部企业机构在文心大模型的基础上,共建了包括能源、金融、航天、制造、传媒、城市、社科以及影视等十来个行业大模型:


以能源电力为例,全球最大的公用事业企业——国家电网与百度文心联合发布了知识增强的电力行业大模型,面向复杂电网的专业场景,建设更适配电力行业场景的AI基础设施,降低数据标注成本,提升细分场景模型效果。

在电网设备、客服等实际业务场景进行试点验证,显著增强了电网运营的精细化、自动化、智能化水平。

百度文心也和深圳燃气联合发布了燃气行业大模型,破解燃气企业运营场景繁杂、安全风险识别困难等难题。

同时,正如 IDC 报告所言那样,大模型应用方面,文心大模型已经拥有中国最大的产业应用规模,目前有15万家企业申请接入文心一言测试,百度智能云与300多家生态伙伴,在超过400个场景中已取得相当不错的测试效果。

4. 结束语

我相信,未来大模型一定会像电力与云计算一样,成为我们生活中无处不在的基础设施

未来所有的企业都会强依赖大模型,所有的产品都会基于大模型来开发,百度文心大模型将持续发挥算法模型基础技术优势,助力千行百业中国企业将大模型内化为自身的生产力工具,走上智能化转型升级的快车道,构建面向全球的强大竞争力。

最后,我还是要再次恭喜百度文心大模型在 IDC 评测中取得了三个绝对第一,向全世界宣告了我们的国产大模型水准已走在世界前列。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
从百度「文心杯」比赛,透视国内大模型创业赛道冰岛Kirkjufellsfoss,热点风景总分第一,算法模型第一,行业覆盖第一!国际权威测评文心大模型3.5一举得魁,独占鳌头早鸟报|视频号小店推出运费险服务;拼多多Temu即将上线日本版;首个百度文心千帆大模型平台成立...来了!百度文心一言全面开放:所有人免费用李彦宏:文心大模型4.0版本年底发布百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会早鸟报|百度文心一言向全社会全面开放;快手电商将逐步开放“0元开店”;茅台与瑞幸将推出联名款咖啡...微信迎来大更新 / 百度文心一言向全社会开放 / 小红书回应「旅游搭子内容被指涉黄」据称百度文心大模型内测多项得分超ChatGPT;OpenAI等将向英国政府开放模型 | 环球科学要闻文心大模型3.5勇夺三个冠军领跑,中文完爆GPT-4!国际权威报告7项满分「全班第一」文心大模型升级3.5版本,有多强?我们帮你试了试百度文心一言App上架苹果AppStore,4月份曾否认GPT4、百度文心一言、讯飞星火、360智脑:谁更懂数据分析?“可怕”的14岁现象,男孩女孩都会有:父母要心大、心大、再心大!微信新版语音消息可显示时长 / 华为 Mate60 手机标准版预售 / 百度文心一言向全社会开放希腊游记:中学老师讲错了吗深圳内推 | 百度文心ERNIE团队招聘NLP数据科学算法实习生深圳内推 | 百度文心ERNIE团队招聘NLP大模型算法实习生「苹果 GPT」首次曝光/百度称文心大模型3.5能力已超GPT-3.5/《奥本海默》确定引进国内大模型北京占一半;李开复大模型创企官宣;文心一言App上架苹果应用商店丨AIGC大事日报手机也能用文心一言了!百度文心一言 App 正式上架 iOS 平台GPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火国产百亿大模型再增一员!400亿参数孟子GPT发布,各项任务平均提升10-15%文革 - 血色,但不浪漫百度设10亿规模文心投资基金 大模型时代李彦宏给出建议百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报世界唯一、日本第一的高尔夫观音菩萨咀外文嚼汉字(241)“借金渍”,日本借钱谚语微信否认文件传输助手是真人,川渝贵部分高铁刷证即走,百度文心3.5已支持插件,马斯克选定格斗冠军陪练,这就是今天的其他大新闻!百度文心大模型3.5杀疯了!拿下7个第一!海底捞回应给顾客洗头 / 百度文心一言登顶App Store / 当代职场人认为休假是最高福利百度高管解读财报:智能云单季营收45亿 继续投资文心大模型一周资讯|百度文心一言向全社会全面开放;东方甄选淘宝首播全场带货额1.75亿元;滴滴出行与小鹏汽车将达成战略合作...百度:首个文心千帆大模型创新中心落户无锡
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。