Redian新闻
>
路径“另类”,苹果大模型蓄势待发

路径“另类”,苹果大模型蓄势待发

科技
近期,苹果悄悄放出一条不起眼的消息:其研发部门发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文。冗长的标题下,掩藏着大模型落地端侧的技术亮点。业内人士纷纷猜测:在“AIGC元年”里始终保持着沉默的苹果,是否终于要在大模型领域出手了?
“浮出水面”?
近年来,在新技术方面的“后发先至”已经成为了苹果身上的独特标签:不是行业首发,却能凭借更加优越的技术能力、设计理念与生态体系重新定义产品甚至整个产业生态。这一特质早在iPhone、Macbook等系列产品上就有所显现,去年6月发布的MR头显初次进入人们视野之时,更被认为是苹果“后发制人”的高光时刻。
基于此,虽然苹果始终对百舸争流的大模型保持缄默,业内却认为苹果在暗自“憋大招”。多位业内专家对《中国电子报》记者表示,在大模型领域,苹果手握“门票”却迟迟没有“入场”,或许也是其“后发制人”风格的延续。
这也解释了为何苹果在大模型方面的任何风吹草动,都格外引人注目。去年7月,首次传出苹果暗中测试大模型工具“Ajax”,并推出代号为“Apple GPT”的内部聊天机器人的消息。人们纷纷猜测,“Apple GPT”将为苹果的人工智能助手Siri带来革命性的升级。然而,这一猜测迄今尚未成为现实,“Apple GPT”最广为大众接受的解释落定为“工作人员在开发层面开始使用能够适配苹果系统的人工智能工具”。
去年11月,踏着“AIGC元年”的尾声,苹果悄然推出一款名为Ferret的开源多模态大语言模型。据了解,这款大模型拥有70亿和130亿两个参数版本,从测试结果上看,其图像处理技术走在行业前列。然而,这款大模型由于仅面向研究机构开放,最终并没有走入大众视野。
苹果发布Ferret大模型,图像处理能力优越
去年12月,随着上述论文的发布,“苹果大模型”再次被推上风口浪尖。略过晦涩的文字表述和复杂的技术原理,论文的结论是:大参数模型,终于有望在“内存有限”的端侧设备中落地了。
另辟蹊径
大语言模型要实现普及,落地智能手机是一条必经之路。当下,荣耀、vivo、OPPO、小米、华为等智能手机厂商纷纷推出“大模型手机”,大模型在手机终端的适配与落地已成大势所趋。
vivo在发布会上宣布其新款智能手机将搭载自研大模型
然而,训练参数大、体量庞大、难以部署在端侧离线使用,是大模型“走入用户掌心”的一大难题。记者了解到,在当下主流智能手机市场,16GB运存是较为广泛的终端配置,这样的运存处理手机日常运行绰绰有余,但要实现模型的加载与数据分析,就显得捉襟见肘。
为此,谷歌、Meta、微软等头部企业均选择了“让模型适应终端”的路线,纷纷推出了训练参数更少、体量更小的“小模型”。以微软为例,去年12月,微软正式发布了参数规模仅有27亿的“小模型”Phi-2,并宣称该模型性能够“吊打”体量在其25倍以上的大模型。
微软CEO Satya Nadella在微软Ignite 2023现场发布Phi-2
而面对着这条“卷起来”的“小模型”之路,苹果却另辟蹊径,首次提出利用闪存技术创新来突破大模型端侧部署的难点的概念。苹果发布的论文指出,利用其创新的闪存技术,可以让模型的运行规模达到 iPhone 可用内存的两倍。在该技术的加持之下,大模型的推理速度在 Apple M1 Max CPU 上提高了 4-5 倍,在 GPU 上提高了 20-25 倍。“这一突破对于在资源有限的环境中部署先进的大语言模型至关重要,极大地扩展了它们的适用性和可访问性。”研究人员写道。
具体而言,论文中提到了两种关键技术:一是“窗口化”技术,允许模型重复使用部分已处理的数据,从而减少频繁读取内存的需要,提高大模型运行效率;二是“行-列捆绑”技术,通过对数据进行更有效的分组,令大模型能够更快地从闪存中读取数据,从而加速AI 理解和生成语言的能力。
图解两项核心技术
从论文内容看,大模型在端侧的部署难题似乎可以迎刃而解。但也有业内专家指出,闪存技术仍有“漏洞”,离实际应用尚有距离。专家表示,闪存技术可用的核心假设是大模型所处理的相邻数据前后具有相似性,但论文中苹果并未对这一必要条件展开论证。闪存技术能否成为大模型端侧部署的“转折点”,还有待验证。
蓄势待发
苹果公司CEO库克曾说过:“苹果有计划在更多产品中加入AI,但要‘深思熟虑’”。
过去一年,苹果虽未对“AI”大书特书,但却处处可见AI的影子。在2023苹果全球开发者大会上,库克始终强调ML(机器学习)概念,称无论是硬件领域还是软件领域,苹果都早已为ML做足了准备。一方面,苹果最新推出的M2 Ultra芯片可以负担大规模ML的性能需求,在某些场景和需求下甚至可以部分替代独立图形处理器;另一方面,从系统到软件,苹果将ML的应用重点放在提升用户体验上。比如iOS17输入法方面的更新,其本质就是大语言模型的应用。
苹果M2 Ultra芯片宣传图
在技术层面的准备之外,苹果在内容方面也逐渐开始了动作。去年12月,有消息传出,苹果正就“价值至少5000万美元的多年期合作协议”展开讨论,并与康泰纳仕、NBC新闻和IAC等媒体接洽,获取他们过往新闻文章的使用授权,以作大模型训练之用。相比同期微软、OpenAI被纽约时报因版权原因起诉的尴尬,苹果的这笔“版权投资”更显示了其在内容生成领域的计划性。
硬件准备方面,香港海通国际证券分析师Jeff Pu发布报告称, 2023年苹果可能已经建造了几百台AI服务器,而这个数量在2024年还将显著增加。他还指出,苹果计划最早于2024年末在iPhone和iPad上采用生成式AI技术。这意味着,如果该计划得以实现,用户有望在于2024年末发售的下一代的iPhone和iPad上亲身体验苹果大模型。
延伸阅读:
2023年我国“新三样”出口首次突破万亿元大关,同比增长29.9%
我国首次!星间激光超高速高分辨遥感影像传输成功


作者丨张琪玮
编辑丨赵晨
美编丨马利亚
监制丨连晓东
点个“在看”不失联

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
苹果大变天!16年垄断终结,但不包括中国用户……苹果多款新品春季待发布,iPad、MacBook你期待谁?AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布冲上热搜!苹果大降价!第113章 红袖招年底账单蜂拥而至,美国人居然开始这样“另类啃老”了长篇小说《谷雨立夏间》31 至忠堂大模型在金融领域找到“业技融合”的最佳路径了吗?DNF手游国服回归预约,库克回应苹果大中华区营收下降,三星3nm试产失败,Tiktok环球音乐谈判破裂,这就是今天的其他大新闻!Siri 将获大模型能力,已内置 AI 代码;马斯克回应研发支出低于苹果:效率不同;苹果推出贺岁片《小蒜头》|极客早知道中国已经有238个大模型了?李彦宏劝各位少做点大模型多搞搞应用吧微软苹果大战3万亿市值,伟大为啥不能被计划?【动脉严选新品鉴第37期】百度灵医大模型:国内首个产业级医疗大模型苹果大中华区营收突然下滑13%!iPhone不香了?苹果禁止摇一摇跳转,我国开通全球首条1.2T超高速互联网通路,苹果明年在欧盟或可侧载,传路特斯拟并购,这就是今天的其他大新闻!美国iOS三方支付苹果抽成27%,苹果向EPIC索要7340万美元律师费2023创业家年会关键词是“AI”;百度发布Q3财报;拼多多成立大模型团队;字节飞书接入大模型;比尔·盖茨最新分享“断崖式衰老”数列: 34岁 60岁 78岁 87岁 92岁 95岁 96岁 97岁 98岁免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型大模型时代,计算创新如何为应用性能提升开启新路径AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug微软市值一度超越苹果,苹果积极推进屏下摄像头技术,腾讯游戏回应全部断开,仰望U7官图发布,这就是今天的其他大新闻!重磅!全球资管巨头获准展业,联博基金蓄势待发免费《大模型应用实践》实训营第二周课程来啦!这次百度算法工程师团队手把手教你构建大模型应用,另有第一周干货回顾!传字节成立AI应用新部门Flow;淘天集团筹建大模型团队;浪潮信息开源千亿级大模型丨AIGC大事日报贝莱德收购GIP加注另类投资 | 另类投资世界第5期2024年,《颜心记》《大唐狄公案》等古装悬疑剧蓄势待发大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机华为P系列超大杯曝光!折叠屏蓄势待发Stability AI开年首个大模型:专写代码,支持18种编程语言,上下文100K,苹果笔记本离线就能跑非凡大师向前一步,“降维打击”蓄势待发把大模型塞进 iPhone,苹果的这篇论文给出了突破性方案瑶池仙境最佳披萨何处寻?众望所归纽黑文。
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。