手机能跑百亿参数大模型,骁龙8Gen3来了,自研PC架构上线
机器之心报道
编辑:杜伟、泽南
高通骁龙 8 Gen3 的出现,让生成式 AI 在智能终端无处不在了。
安卓旗舰手机的芯片,今天迎来了换新。
一年一度的高通骁龙峰会在 10 月 24 日拉开序幕,今年举办地点来到了夏威夷毛伊岛。
会上,高通宣布推出最新一代旗舰移动平台骁龙 8 Gen3,并表示其在终端侧 AI 能力、性能和能效等多个方面都有显著提升。
简单总结一波,骁龙 8 Gen3 采用台积电 4nm 制程工艺打造(可能是 N4P)。CPU 采用全新 1+5+2 架构,包括 1 个 X4 超大核、3 个 A720 大核 3.15GHz、2 个 A720 大核 2.96GHz 以及 2 个 A520 小核 2.27GHz。相较于骁龙 8 Gen2,CPU 整体性能提升 30%,能效提升 20%。整体 SoC 节能 10%。
高通表示,新一代的 Adreno 750 GPU 相比上代有 25% 的性能提升和 25% 的能效提升,通过图像运动引擎 2.0 (Adreno Frame Motion Engine 2.0) 帧生成算法,支持了 240FPS 高帧率,有望将大众游戏的流畅效果提升到新高度。
由于上一代 8 Gen2 已经 shixian 了 GPU 性能超越同时代苹果 A 系列芯片的巨大成功,所以本次看来较小的提升仍然比较可观。
但需要注意的是,这首先需要手机屏幕将刷新率提高到 240Hz,考虑到能耗,估计只有游戏手机才会提供此类硬件。
面向更广泛的手机用户,高通在 8Gen3 上提供了原生 1Hz 刷新率的支持,有助于静态显示时的省电。
在图像技术方面,8Gen3 宣布支持虚幻 5 引擎的 Lumen 光照系统,带来了类似硬件光线追踪技术的视觉效果,而且处理速度更快(但仅限虚幻 5 引擎)。结合此前已支持的硬件光线追踪技术,第三代骁龙 8 为下一代手机游戏做好了准备,之后就是游戏厂商的事了。
此次,骁龙 8Gen3 的亮点在于强大的终端侧 AI 及生成式 AI 性能。
NPU 方面,AI 算力超过 73TOPS,能效还降低了 40%。高通表示,此次 8Gen3 的 AI 性能提升了 98%,高通 AI 引擎实现了终端设备上世界首次支持运行 100 亿参数的模型,并且针对 70 亿参数 LLM 每秒能够生成 20 个 token。这意味着,各类虚拟助手、GPT 聊天机器人、Stable Diffusion 等 LLM 等都可以在手机等终端正常运行。
另外针对音频、动作传感器这种需要长时间待机的 AI 使用场景,8Gen3 专门提供了 2 个低功耗的 NPU 单元。8Gen3 还在内存和 NPU 之间建立了直连通道,进一步提高运算效率。
可以说,对于搭载骁龙 8 Gen3 的智能手机,它们的内容创作、影像、游戏、音频和连接体验因 AI 能力得到了极大的增强,比如手机端支持图像 AI 填充扩展。不知道手机硬件能力到位以后,会不会出现生成式 AI 的爆款应用?
通信方面,8Gen3 集成了 Snapdragon X75 5G 调制解调器,支持 5G 毫米波、LPDDR5X RAM、UFS 4.0、Wi-Fi 7、蓝牙 5.4。最高支持 4k 60Hz 或 144Hz Quad HD+ 屏幕显示。影像方面最高支持 200MP 照片拍摄、120fps 4K 视频拍摄。
有关高通旗舰的首发机型悬念依然不大。高通的发布会上,小米集团合伙人卢伟冰提前拿出了用上骁龙 8 Gen3 的小米 14,明天晚上就是小米的发布会了,雷军也在微博上表示小米 14 将全球首发第三代骁龙 8 移动平台。
此外一加 12、iQOO 12 系列、中兴 x 努比亚将首批搭载骁龙 8 Gen3, OPPO Find X7 系列、真我 GT5 Pro 也在前期搭载的行列中。
除了移动平台的骁龙 8 Gen3,高通推出了专为生成式 AI 打造的全新 PC 平台骁龙 X Elite。据介绍,骁龙 X Elite 在众多支持 Windows 11 的 PC 平台中具备了一流的 CPU 性能和能耗。
还是先来简单看下它的规格。CPU 方面采用自研的 Oryon 架构 ,4nm 工艺,12 大核,最高频率 3.8、支持双核睿频至 4.3 GHz、内存带宽支持 LPDD5x 8533、缓存总数 42 MB。此外支持了 WiFi7、蓝牙 5.4、X65 基带、PCIe 4.0 NVMe、M.2 Wi-Fi 扩展等。现场与基于 ARM 内核的 M2 比较,多核 CPU 性能提升 50%。
GPU 采用 Qualcomm Adreno,算力为 4.6 TFLOPS。ISO 功率下比竞品性能提升高达 80%,功耗降低 80%。
NPU 方面,AI 算力达到了 45TOPS。自 2017 年以来,AI 性能提升了 100 倍,远超竞品 PC 平台。
骁龙 X Elite 号称专为 AI 打造,能够以 30token 每秒的速度运行 Meta 著名的大语言模型 Llama 2。此外进一步支持在终端侧运行超过 130 亿参数的生成式 AI 模型,实现了比竞品快 4.5 倍的 AI 处理速度。
高通表示,OEM 厂商预计将于 2024 年中推出搭载骁龙 X Elite 的 PC。更多细节详见下图。
今年的骁龙旗舰芯片,相比往年又更加提前了一些,但面对 4 大核的联发科天玑 9300,制程工艺不变的 8 Gen3 能否保持住旗舰芯片的领先位置?它会是新的 888,还是新的 8 Gen2 呢?
我们很快就会知道了。
参考链接:
https://www.theverge.com/2023/10/24/23928867/qualcomm-snapdragon-8-gen-3-on-device-ai-meta-llama-2
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:[email protected]
微信扫码关注该文公众号作者