Redian新闻
>
首款生成式AI移动芯片天玑9300:能跑330亿参数大模型

首款生成式AI移动芯片天玑9300:能跑330亿参数大模型

科技

机器之心报道

作者:泽南

AI 画图一秒生成,大语言模型一秒 20 token。

2023 年是生成式 AI 的元年,我们手上的移动设备也在加速进入大模型时代。


11 月 6 日晚,联发科(MediaTek)正式发布了年度旗舰 SoC 天玑 9300,这款芯片通过 4+4 全大核的设计,在性能与能耗等方面,全面超越了安卓和苹果竞品。


更为值得关注的是,今年的旗舰芯片被定义为 5G 生成式 AI 移动芯片,提供了远超以往的高智能、高性能、高能效、低功耗卓越特性。



天玑 9300 采用台积电新一代 4nm 工艺,拥有 227 亿个晶体管。为了提供生成式 AI 时代的算力需求,天玑 9300 上开创性地使用了「全大核」CPU 架构,包含 4 个 Cortex-X4 超大核,最高频率可达 3.25GHz,以及 4 个主频为 2.0GHz 的 Cortex-A720 大核,其峰值性能相较上一代提升 40%,同性能情况下功耗节省 33%。



这种架构在保证了工作速度快、效率高的同时具有省电的特性,无论在轻载还是重载应用场景中,都能降低功耗、延长续航时间。联发科表示,天玑 9300 面向目前常用的视频、直播、游戏等常见任务需求进行了优化,相比以往也更加适应折叠屏手机的多任务模式。


随着芯片制程提升,晶体管正在不断小型化,各种漏电问题成为摩尔定律发展的重大障碍。漏电意味着能量消耗的大幅增加,芯片也会面临过热甚至失效的问题。在这种情况下,小核心的功耗与大核心差距已越来越小。


据介绍,早在三年前联发科就开始了全大核芯片形式的探索。现在,让大核快速处理任务后进行较长时间的休眠,我们可以让大核处理器反直觉地相比小核同类产品更加省电。另一方面,联发科也加入了乱序执行(out-of-order)策略,进一步增加了应用执行的效率。


联发科认为到明年,全大核的设计将成为业内的共识。

常规能力之外,联发科本次着重升级了芯片的 AI 性能。天玑 9300 集成了 MediaTek 第七代 AI 处理器 APU 790,专为生成式 AI 而设计,其性能和能效相较上一代得到显著提升,整数运算和浮点运算的性能是前一代的两倍,功耗降低了 45%。



APU 790 内置了硬件级的生成式 AI 引擎,可实现更加高速且安全的边缘 AI 计算,相比上代,它专门针对目前大语言模型常用的 Transformer 进行算子加速,大模型的处理速度是上一代的 8 倍。


当代流行的大语言模型(LLM),其主要核心网络架构大多是由 transformer Block 组成的。相较于计算机视觉常见的 CNN 网络,transformer 网络以 Softmax+LayerNorm 算子作为核心,卷积算子较少,因此原先 AI 核心的加速机制并不适用。在第七代 APU 处理器上,联发科着重优化 Softmax+LayerNorm 算子,提升了算力。


量化是目前优化 AI 推理的有效方式之一。基于亿级参数大语言模型特性,联发科开发了混合精度 INT4 量化技术,结合其特有的内存硬件压缩技术 NeuroPilot Compression,可以更高效地利用内存带宽,大幅减少 AI 大模型对终端内存的占用。


联发科的工程师表示,虽然大模型可以带来更好的生产力,但本地运行 13B 的体量就意味着需要占用约 13GB 的内存,再加上安卓本身的 4GB,其他 APP 的 6GB,已经超过了大多数手机 16G 的内存容量。天玑 9300 使用的内存硬件压缩技术,通过量化和压缩把大模型的内存占用降低到了 5GB,只有这样才能让大多数用户在日常跑得起大模型应用。


APU 790 还支持生成式 AI 模型端侧「技能扩充」技术 NeuroPilot Fusion,可以基于基础大模型持续在端侧进行低秩自适应(LoRA,Low-Rank Adaptation)融合,进而赋予基础大模型更加全面的能力。 


基于这样的硬件和优化,天玑 9300 在苏黎世联邦理工提出的 AI Benchmark 最新版本上可以达到 2019 分,是移动芯片的新高。



使用天玑 9300,端侧的 AI 图片生成如 Stable Diffusion 可以做到一秒以内出图,70 亿参数大语言模型的端侧推理可以做到每秒 20token。


联发科表示在与 vivo 的合作中,基于天玑 9300 已经率先实现了 7B 和 13B 大模型在移动端的推理,预计不久之后在终端就可以看到这样的产品推向市场。另外在更极限的情况下,联发科还跑通了高达 33B 的大模型。


在发布之前的沟通会和现场,联发科展示了使用天玑 9300 工程机实现的 LoRA 文生图、大模型生成文字等能力。


我们可以预见,在最新一代旗舰手机上,我们可以用上更聪明的智能助手,根据大模型给出的建议快速回复聊天和右键,用 AI 生成的表情包斗图……



马上就会推出且人人都可以体验到的,就是 vivo X100 系列手机上 OriginOS 4 系统里的 AI 助理蓝心小 V。



本月初,vivo 刚在开发者大会上介绍了蓝心大模型及其应用,这一系列能力显然是面向手机的。在大模型的加持下,蓝心小 V 拥有行业领先的智慧,它可以通过语音、文字、文件拖拽等方式接收信息进行处理。如果遇到简单的问题,小 V 会以文字或图片进行回复。面对复杂的问题,它还可以通过 SWOT 模型或思维导图的形式输出回答。


此外,天玑 9300 的 AI 能力还覆盖从搜索到拍摄。


联发科表示,其 AI 开发平台 NeuroPilot 已经对安卓、LIama 2、文心一言、百川大模型等前沿主流 AI 大模型进行了深度适配和优化,更多应用也在路上。



GPU 方面,天玑 9300 采用了 12 核心的 Immortalis-G720。与上代相比峰值性能提升 46%,相同性能下功耗可节省 40%。天玑 9300 搭载 MediaTek 第二代硬件光线追踪引擎,支持 60FPS 高流畅度的光线追踪,并带来游戏主机级的全局光照特效。



此外,MediaTek 特有的 MAGT 游戏自适应调控技术升级为「星速引擎」,不仅与游戏应用广泛合作,还将拓展更多类型应用的生态合作。在活动中,联发科宣布天玑 9300 平台将首发《仙剑世界》光追版,同时也将在手游《暗区突围》上实现稳定 60 帧光追的体验。


目前根据很多第三方评测,天玑 9300 工程机的 CPU、GPU 绝对性能和功耗比均超过了骁龙 8Gen3 与 A17Pro,看起来使用全大核的策略是成功的。


图片来源:极客湾 Geekerwan


在其他方面,天玑 9300 也进行了全面升级,其 ISP 升级到了 Imagiq 990,支持 AI 语意分割视频引擎、16 层图像语意分割、景深和光斑双引擎、全像素对焦叠加 2 倍无损变焦、OIS 光学防抖专核、3 麦克风高动态录音降噪,可过滤 25km/h 风速的 99% 以上风噪。


天玑 9300 还配备了新的安全启动芯片、隔离的安全计算环境和 Armv9 的内存标记扩展,可帮助开发人员避免内存漏洞利用。


网络方面,天玑 9300 集成了 5G 调制解调器支持 Sub-6GHz 四载波聚合(4CC-CA)和多制式双卡双通,也通过 AI 算法提升信号,支持 5G 情境感知功能。天玑 9300 支持 Wi-Fi 7 和 5G sub-6GHz 频段,下行链路速率达到 7Gbps。在蓝牙连接方面,天玑 9300 支持 3 个蓝牙天线、特有双路蓝牙闪连技术,可以带来超低时延的蓝牙音频体验。



据介绍,首款采用天玑 9300 芯片的手机包含 vivo、OPPO、小米、传音等。在联发科的发布活动后,vivo 已宣布即将在 11 月 13 日发布的 X100 系列中率先搭载新旗舰芯片,并第一个实现 LPDDR5T-9600 内存的落地。



我们期待新一代产品的问世。




© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AMD王宏强:700亿参数大模型单个GPU部署,做好AI软件和生态实现“开箱即用”丨GACS 2023极致性能还是平衡功耗 骁龙8Gen3再提频,天玑9300单核略差?红色日记 九大召开 4.1-30苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型《有你真好》&《千年一梦》8张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍李开复发布零一万物首款340亿参数大模型Yi;摩尔线程设立AISG和MCSG战略部门丨AIGC日报开源大模型FLM-101B:训练成本最低的超100B参数大模型图文并茂,三步速出「原神」文稿!首个70亿参数图文混合创作大模型正式开源,一键生成神作浪潮信息发布“源 2.0”,千亿参数大模型开源可商用携帯失而复得目标:燃烧 23333333 大卡!🤜🤛昆仑万维开源130亿参数大模型!0门槛商用、多榜超Llama 2,预训练数据也开源少林方丈释永信谈AI与禅;天玑9300正式发布;黄仁勋希望由成龙扮演自己李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型一百二十六 父亲来校720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑OpenAI忙着“宫斗”,手握2.2万块H100的竞争对手趁机发布新款大模型:1750亿参数,性能仅次于GPT-4高通甩出最强芯片三件套!手机跑100亿参数大模型,PC芯片逆袭苹果英特尔11人狂训2个月,马斯克精准狙击OpenAI!xAI首个大模型Grok炸场,330亿参数每月16刀手机能跑百亿参数大模型,骁龙8Gen3来了,自研PC架构上线联发科天玑9300发布:首个全大核设计,颠覆式创新1800亿参数,性能碾压Llama 2,世界最强开源大模型Falcon 180B发布天玑9300拿下生成式AI最强移动芯,端侧支持330亿大模型,1秒内AI画图,全新全大核架构做底座中文最强开源大模型来了!130亿参数,0门槛商用,来自昆仑万维全球最强CPU一夜易主,130亿参数大模型被塞进PC,没网也能生成邮件周报PPT打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训英伟达英特尔推改良版芯片重回中国市场?产业链人士称属实;阿里巴巴CEO吴泳铭:即将开源国内最大的720亿参数大模型丨AIGC日报AI早知道|微软Copilot将可免费使用GPT-4Turbo; 国产670亿参数大模型DeepSeek亮相曝摩尔线程人员优化/意大利电信接受220亿欧元出售固话网络/联发科天玑9300来了|AIoT情报正面硬刚GPT-4V!浙大校友开源多模态大模型LLaVA-1.5,130亿参数8个A100一天训完最强移动芯片一夜易主,蓝厂联发科杀疯了!一百二十五 退学智源:70万预算从头开发千亿参数大模型,挑战成功破旧立新,联发科天玑9300的“全大核”成了旗舰芯新方向
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。