Redian新闻
>
OPPO 推出自主训练大模型 AndesGPT,初衷是智能助手的技术升级

OPPO 推出自主训练大模型 AndesGPT,初衷是智能助手的技术升级

公众号新闻

作者 | 罗燕珊

11 月 16 日,在 2023 OPPO 开发者大会上,OPPO 正式推出了自主训练的大模型 AndesGPT。

据介绍,AndesGPT 拥有对话增强、个性专属和端云协同 三大技术特征,对于大模型带来的变革,OPPO 认为体现在四个方面:知识、 记忆、工具和创作

  • 在知识能力方面,AndesGPT 融合了知识图谱及通用搜索能力,为用户提供更专业的问答。通过知识增强技术,将外部知识与模型融合生成结果,降低幻觉。

  • 在记忆能力方面,AndesGPT 实现长期记忆机制,以支持无限长度的上下文和有状态服务。而长期记忆带来首字推理延迟这个技术挑战。为了解决该难题,OPPO 研发了一种注意力算 法命名为 SwappedAttention。SwappedAttention 能够在多轮长上下文对话中,有效降低每个 query 的首字推理时长。其核心技术原理是,通过外部存储和 KV 压缩的方式实现会话级 KV 缓存。结合 PagedAttention 算法一起使用,能够带来 50% 的首字延迟降低,以及 30% 的推理吞吐提升。

  • 工具使用也是 AndesGPT 一项核心能力,更好的理解设备控制与服务 API,端到端生成可执行指令。目前 AndesGPT 已支持使用系统设置、一方应用、三方服务、代码解释器等各类工具。

  • 在创作方面,AndesGPT 已全面支持文生图与图生图场景。

AndesGPT 主要训练三种参数规格的模型——AndesGPT-Tiny、AndesGPT-Turbo 和 AndesGPT-Titan,可根据不同场景灵活选择。AndesGPT 使用行业主流的网络结构,主要做了两个组合优化:

  1. RoPE 位置编码探索了 base 的最优值,结合 log-scale 和 attention 加 bias,扩展外推能力;

  2. GQA 结合复杂移动窗口(Dilated Attention)加速了训练和推理,实现了 O(Nd)的线性复杂度。

OPPO 数智工程事业部总裁刘海锋在接受 InfoQ 采访时表示,OPPO 做大模型的一个最基本的初衷就是升级智能助手产品,让小布助手变得更有用更智能。“对于手机厂商或者智能终端厂商、本来就有智能助手的团队来说,这个事儿是非常自然且水到渠成的,因为我们有现实的用户的需求,有数据的积累,也有一些 knowhow 积累,那么我们肯定要做技术升级。”

除了落地应用,OPPO 还在推进产学研联合促进前沿技术研究。去年 OPPO 联合中国科学技术大学成立的智能计算联合实验室,已将大模型技术作为核心研究方向。此外,OPPO 还和国内外超过 45 所重点院校建立了 AI 相关的合作。未来,AndesGPT 还将面向开发者开放核心的智能体开发平台。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

突发!“ChatGPT 之父”Sam Altman 被开除,与董事会矛盾早有端倪?

好莱坞大导预测成真,Meta 让 AI “一句话生成一部电影” 不再是梦
ClickHouse 彪悍发言:云数仓死贵死贵的,Snowflake 这种就不应该成为当前主流!
“谷歌有谷歌的规矩”

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
腾讯混元大模型落地QQ浏览器;DeepMind去年利润大跌40%;OPPO新小布AI助手公测丨AIGC大事日报OPPO发布AndesGPT,率先卷到了大模型竞争下半场AI与诗词创作咏球道珊瑚树用FP8训练大模型有多香?微软:比BF16快64%,省42%内存免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!微软推出“智能副驾”(Copilot),您的人工智能日常助手OpenAI推出在线商店GPT Store;百川智能发布角色大模型;王慧文参投老友AI公司|AIGC周观察第三十期AndesGPT加潘塔纳尔:生成式AI端侧落地,OPPO给了我们答案「Meta版ChatGPT」背后的技术:想让基础LLM更好地处理长上下文,只需持续预训练各路大神献出自定义 GPT,24 小时 Top 9 名单在这最新综述!预训练大模型用于医疗健康领域的全面调研AI早知道|OPPO正式成立AI中心;阿里推文生3D数字人项目;大众汽车宣布将ChatGPT与IDA语音助手结合王者GPT-4已来,32k上下文!OpenAI首届开发者大会最新爆料,全新UI可定制GPT,xAI大模型大范围可用台积电南京厂将获美国豁免:为期一年,不得进行技术升级!苹果正开发自研高性能电池 / OpenAI 推出自定义版 ChatGPT / 李开复 AI 公司首发大模型GPT又迎重磅升级!万物皆可大模型(赠大模型系列课程+书籍)AI早知道|Stability AI正在考虑出售;魅族发布智能助手Aicy;亚马逊发布Titan图像生成器原华为机器视觉总裁加入依图;月之暗面推出首款智能助手;微软GitHub Copilot每月倒贴用户20美元丨AIGC大事日报《九月,2023》《September, 2023》小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大「固源医疗」获数千万元Pre-A轮融资,加速医用新材料技术升级|36氪首发各路大神献出自定义GPT,24小时Top 9名单在这【天与湖】 一组小诗AI早知道|自定义ChatGPT商店下周上线;腾讯推出语音识别大模型;美图大模型上线智驾感知迈入新时代,谁在引领摄像头的技术升级?OpenAI史诗级更新:人人都可定制GPT,GPT商店上线,模型价格打骨折新MacBook Air或明年春季推出/Google发布Gemini大模型,多领域超越GPT-4/微软Copilot重磅升级娄岩一周诗词五首北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型站上大模型制高点:我们给不输GPT-4的文心大模型4.0,来了一场技术揭秘用暂停token重新训练大模型,AI学会三思而后行大模型时代下的技术变革:训练、负载、部署、效率、安全……都遇到了新挑战?MetaMath:新数学推理语言模型,训练大模型的逆向思维AI早知道|OpenAI推出自定义GPT商店;荣耀发布魔法大模型;Quora融资7.5亿美元
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。