Redian新闻
>
百度LLM,三项第一,杀疯了!

百度LLM,三项第一,杀疯了!

公众号新闻

今年,科技圈的“顶流”,非大语言模型莫属。

科技部新一代人工智能发展研究中心,5 月 28 日发布的《中国人工智能大模型地图研究报告》显示,我国 10 亿参数规模以上的大模型,已经发布了 79 个,几乎进入了百“模”大战。

如今时间来到了 7 月底,有能力继续投入、继续角逐的一定会越来越少。

毕竟这东西,是真烧钱。光训练的机器成本就上千万了,再考虑到人工、高质量数据的成本,能坚持做下去的,又能有几家公司呢?

百“模”大战是技术储备,也是生态对抗,谁拿下了前几名,谁就掌握了发展的生态。

这就好像多年以前的外卖大战,各家疯狂发红包优惠券,抢占外卖市场,主打一个经济实惠。胜利者拿下了外卖生态,大家都习惯了用它点外卖。

百“模”大战,竞争更是激烈,不过与以往不同的是,这次烧钱不是在用户侧,而在服务自身。

毕竟现在的竞争点还是效果优先,对于用户来讲,当然是谁的效果更好才用谁的。那究竟谁更强呢?

根据全球领先的 IT 市场研究和咨询公司 IDC 最新发布的《AI大模型技术能力评估报告,2023》显示。

百度文心大模型 3.5 拿下 12 项指标的 7 个满分,并以综合评分、算法模型和行业覆盖三个绝对第一体现了百度文心大模型的基础技术深度和产业应用覆盖广度。

这里简单介绍下百度文心大模型 3.5,它是目前的最新版本,目前,百度文心大模型 3.5,不仅能够生成图文,也能生成视频!

AI 大模型技术能力评估报告,就是在百度文心大模型 3.5 基础上评估的。

考量大模型的能力,现在必须要考量两个方面:技术要牛、落地要快。

技术要牛,才能不断优化迭代,保持领先;落地要快,才能快速占领应用市场,实现盈利。

百度自 2019 年就开始深耕预训练模型,先后发布了知识增强文心系列模型,又有自研的飞浆深度学习框架,训练速度也是经过专门优化的,技术积累扎实。

此外,百度智能云也积累多年,为 300 多家生态伙伴提供云 AI 服务,技术通路全打通,可实现快速落地。

IDC 的主要考核也是围绕产品技术、服务生态以及行业应用三大维度,考察大模型的 10 余项指标,其中“算法模型”和“行业覆盖”成为衡量大模型能力极其重要的两个指标。

这两个指标,就是技术要牛和落地要快的指标体现。

本次评估中,百度文心大模型这两项指标在众多厂商中均获得唯一满分,充分展现了文心大模型的行业领先性。

这是 IDC 首次提出 AI 大模型技术能力评估框架,国内主流大模型,包括百度、阿里、腾讯、华为、科大讯飞、360、商汤等 14 家厂商参与了本次评估。

结果显示,百度 AI 大模型整体竞争力位于领先水平,是这场大模型技术突破者和应用引领者。百度文心在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。

文心大模型取得 “第一” 得益于百度 “芯片 - 框架 - 模型 - 应用” 四层技术栈优势、知识增强的核心特色和繁荣的大模型生态三大优势。

据报道,百度拥有自研的深度学习平台飞桨有力支撑了大模型的高效训练和推理。飞桨与文心的协同优化,让文心大模型 3.5 最新版本的模型效果提升 50%,训练速度提升 2 倍,推理速度提升 30 倍。知识增强作为文心大模型的核心特色之一,实现了更高的效率、更好的效果、更强的可解释性。

在大模型生态方面,百度文心已形成企业、教育、社区三位一体的生态体系。最新数据显示,百度有超过 750 万开发者基础,20 万企业生态基础,多层次开展大模型人才培训、企业赋能、开发者运营。百度还设立了 10 亿创投基金鼓励大模型创意、繁荣大模型生态。

此外,文心大模型已经拥有中国最大的产业应用规模,目前有15万家企业申请接入文心一言测试。百度智能云与300多家生态伙伴,在超过400个场景中已取得相当不错的测试效果。

AI大模型已经从拼参数发展到拼应用,进入大规模可复制的产业落地阶段。

最后,你觉得这次国内的百“模”大战,谁最有希望获得最终的胜利呢?

·················END·················

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
BELLE-7B-1M逻辑推理超预期?10B量级开源中文对话LLM,谁最「懂」逻辑推理?11个LLM一起上,性能爆炸提升!AI2联合USC开源LLM-Blender集成学习框架:先排序再融合|ACL 2023H100推理飙升8倍!英伟达官宣开源TensorRT-LLM,支持10+模型中国动力电池,杀疯了LLM-Pruner: 剪枝+少量数据+少量训练 = 高效的LLM压缩Bloomberg,杀疯了世界唯一、日本第一的高尔夫观音菩萨10B量级开源中文对话LLM,谁最「懂」人话?票房破11亿!孤注一掷,杀疯了马斯克等人热捧:高薪缺人,但要懂全栈懂LLM,一个全新职业正在兴起!咀外文嚼汉字(241)“借金渍”,日本借钱谚语LLM 全景图 (The Landscape of LLM)马斯克等人热捧:高薪缺人,但要懂全栈懂 LLM,一个全新职业正在兴起!GPT-4,Llama2,ChatGLM2,PaLM2共聚一堂 | LLM Day @KDD 2023中国第一周刊,杀疯了GPT-4、ChatGLM2、Llama2、PaLM2在KDD LLM Day上一起开了个会百度文心大模型3.5杀疯了!拿下7个第一!瑞幸,杀疯了...贴点花,看花吧RLHF中的「RL」是必需的吗?有人用二进制交叉熵直接微调LLM,效果更好韩剧又捧出一个女变态,杀疯了孤注一掷,杀疯了贵圈第一毒瘤复出,杀疯了不用LLM,遗传编程可控Python代码!谷歌DeepMind等提出全新ARZ框架|IROS 2023希腊游记:中学老师讲错了吗攻陷LLM,奖金3万刀!CAIS等举办NeurIPS 2023攻击赛,让大模型制定毁灭人类计划以 LLM 为核心 LLM@Core:程序员的大语言模型技术指南咀外文嚼汉字(240)“悟留谱”Meta发布首个开源可商用LLM,硬刚OpenAI和谷歌两大巨头下一代语言模型范式LAM崛起!AutoGPT模式席卷LLM,三大组件全面综述:规划、记忆和工具斯坦福最新LLM排行榜发布!自家Alpaca垫底,华人团队WizardLM开源第一,GPT-4、Claude稳居前二刀郎新歌,杀疯了?BELLE-7B-1M逆袭ChatGLM?10B量级开源中文对话LLM,谁成常识问答任务的黑马?总分第一,算法模型第一,行业覆盖第一!国际权威测评文心大模型3.5一举得魁,独占鳌头LLM综述全新出炉:51页论文带你盘点LLM领域专业化技术
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。