Redian新闻
>
苹果搭载大模型的 Siri,可能和你想的不太一样

苹果搭载大模型的 Siri,可能和你想的不太一样

科技
苹果的
ChatGPT

苹果的 AI,虽迟但到。
根据华尔街日报消息,苹果正与百度商讨,关于国内市场的 iPhone 以及其他设备中整合生成式 AI 的业务。
尽管目前还没有得到官方的确认,不过有两件事至此可以确定:

iPhone 16、iOS 18 和 MacOS 将会搭载 AI 功能

iPhone 上的大模型,在国内外将由不同的厂商提供
比起早已搭载 AI 助手的国内品牌,苹果这回又不出意外地晚了大半年,慢人一步似乎一直都是苹果的标签,只是它们总能在稳步前行中带来一些惊喜。
然而,AI 大模型的进步速度正以周、甚至以天计数,苹果的迟到,究竟是再一次后发先至,还是在新时代掉队的开始。
略显妥协的方案,先上车才是重点
上个月的最后一天,苹果用 12 分钟的短会宣布:放弃造车,All in AI,汽车团队的众多成员将被调往 AI 部门。
蛰伏十年的泰坦计划,倒在了入局新能源汽车的最后一年,对于未来百家争鸣的汽车市场而言,会有些许遗憾,但从一家科技公司长远的发展来看,这莫过于一个长远且正确的选择。
AI 是基础性的应用,在所有大公司都主动或被动拥抱 AI 的当下,苹果的「断舍离」顺应着时代。
而如何拥抱 AI?怎样的人工智能才能在逐渐被瓜分的市场里占得一席之地?是它们最先要解决的难题。
针对国外市场,苹果正在与 Google 积极谈判,以便在 iOS 18 中加入 AI 大模型,实现其他品牌早就有的 AI 功能。
虽然目前「双方尚未决定人工智能协议的条款或品牌,也没有最终确定如何实施」,但在众多备选合作商(OpenAI 和 Anthropic)中,Google 和 Gemini,应该是最适合苹果和 iPhone 的那一个。
今年二月发售的三星 Galaxy S24 系列机型以 AI 功能出圈,通话翻译、创意写作等功能赶上了国内平均水平,即圈即搜缩短了搜索路径,也极有可能成为今后 AI 手机的主要发展路线。
海外版的 S24 系列,就是通过大模型 Gemini 支持,才得以完成上述功能。
从经验讲,Google 已在全球出货量最高的旗舰机型上,完成了初步尝试,相比于在 PC 或 Web 端大火的厂商,它们更知道手机大模型的操作习惯、使用场景、适配应用应该怎么做。
再者,Google 本身也更渴望得到苹果的项目。
根据国际数据公司 IDC 的统计,三星在 2023 年全球智能手机市场占有率达到了 19.4%,苹果则成功登顶达到了 20.1%。
若是拿下苹果,Gemini 在全球范围内手机终端的搭载率将达到 4 成,这对于一家面临激烈竞争的 AI 大模型公司,极为利好。
在梦里笑醒的除了 Google,还有苹果。
和其他强调「自研」的厂商不同,苹果在一开始就以合作来达成 AI 上机,也有其自身的考量。
首先,在本身起步晚进度慢的现状下,「拿来主义」是快速争夺市场的妙手,和 Google 的合作,在减小研发成本、收取高额坑位费的同时,还能缓解两家公司目前所面临的监管压力。
其次,AIGC 的技术很好,但在落地时却因道德、隐私等方面的缺陷被大量诟病,交给成熟的第三方,特别是已经在三星机型上试水成功的 Google,省力省心,且减小了舆论和责任风险。
这当中的另一道坎,是技术本地化。每个国家和地区对 AI 大模型的监管和相关法规都有着不同的要求,合法合规的落地才是争夺市场和发展技术的前提,因此才催生出了「国内+国际」双管齐下的路线。
按照三星与百度初见成效的合作,苹果才会选择这条已经被「验证为真」的路线。
国行版三星 S24 系列上的 AI 功能,实际上有多个厂家旗下的技术组成:即圈即搜功能由百度和京东提供;智能修图由美图秀秀的大模型 MiracleVision 完成;文章摘要、智能写作则采用了百度的文心一言大模型。
苹果是否也会与多家厂商合作,还要等待后续的消息,不过和百度的合作,已然板上钉钉。
最后,苹果要做的并非一个智能语音助手,而是整套 AI 终端。但根据 Macrumor 的爆料,以目前的自研进度和技术成果,苹果的大模型还远达不到 Google、OpenAI 等公司水准。
与其赶鸭子上架一个智能聊天机器人,不如先拿成熟的方案做过渡,为自研大模型争取更多的研究时间和进步空间。
当下的市场很重要,但未来的核心技术才是根本
合作,是苹果 AI 全球化的第一步,而最终的目标,是为了拥有全路自研的 AI 大模型。
这是一项烧钱且耗神的工程,别说退步,稍微进步的慢一点,都有可能在下周被淘汰。一个有竞争力的大模型,往往代表着今后在市场上的主导权与议价权。
库克认为:
生成式 AI 方面开辟新天地,我们相信这项技术可以重新定义未来。
而苹果对于大模型的探索,其实一直都在日程表上。
本月 15 日,苹果工程师悄悄发布的一篇研究论文,当中详细介绍了一种名为 MM1 的新型生成式 AI 模型的开发过程。
MM1 是一个具有最高 30B(300 亿)参数的多模态 LLM 系列,这是苹果在多模态大模型的最新研究成果。
总的来说,苹果的自研模型在测试效果上,与 Gemini 和 GPT4V 还有一定的差距,也没有在生成结果上表现出如 Sora 一样惊人的效果,更没有探索出一条全新的技术路线。
但是,它能通过控制各种数据变量,在对比中找出影响模型生成效果最关键的那几个因素,简单来说,它天生不强大,不过善于观察、实践和总结,在一次次的尝试中,也能取得不错的成绩。
MM1 由密集模型和 MoE(混合专家)变体组成,当指令进入 MoE 后,究竟应该去「东市买骏马」还是「西市买鞍鞯」,都会被这个指令中心安排的明明白白的。
问题被细化和分类的同时,也提升了计算效率,节约了运行能耗。
这篇论文,代表苹果在 AI 领域探索的阶段性成果,虽然 MM1 没有颠覆行业更没有惊艳世界,但在晦涩难懂的专业术语里还是能看出它们的进步:
我们的工作模式一直是先做工作,然后再谈论工作,而不是在自己面前出言不逊。—— Tim Cook
没有透露过多技术细节的苹果,其实还在盘算着另一步棋:端侧大模型。
早在去年底,苹果在名为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文中,就提出了大模型落地 iPhone 等「内存有限」设备的方法。
研究人员称,他们通过最新的闪存技术,在 iPhone 和其他内存受限的设备上成功部署了 LLM(大语言模型)。
这个项目被称为 Apple GPT,最大的作用是将 LLM 数据直接存储在闪存中,比如整合在 Siri 内部,相较于传统的运行方法,新技术使 CPU 和 GPU 的推理速度,最大提升了 5 倍和 25 倍。
研究人员称,开发的这些效率型方法使得 AI 模型能够在 iPhone 当前内存的两倍范围内运行。
也就是说,侧端搭载大模型有了可行性,通过减少闪存传输的数据量、提高每次传输的吞吐量,让 LLM 的数据直接储存在闪存中。
撇开技术,Siri 是我们和 AI 的桥梁
进度缓,消息少,布局大。这是苹果探索 AI 的概况。
每每看到苹果的某项技术落后于市场和竞争对手,都会给人一种「起步太晚」的错觉,实际上在翻看相关新闻和专利文件的时候,又会发现它往往是最早布局的那一批,甚至那一个。
截止到 2023 年,苹果总共收购了 32 家 AI 公司,位列科技巨头中收购榜第一。
而收购 Siri,应该可以算作苹果入局 AI 的开端。
2010 年的乔布斯打给「Siri 之父」Dag Kittlaus 的一通电话,让 Siri 以超过 2 亿美元的身价,加入苹果,走上 iPhone。
Siri 最初的定位是一个快速准确获取信息的助手,或是处理复杂任务的助理。
在最原始的版本里,Siri 可以与 42 个网络服务相连接——从餐馆点评网站 Yelp、售票网站 StubHub,到电影点评网站 Rotten Tomatoes 和数学计算网站 Wolfram Alpha。
根据提示,Siri 会将各种信息整合,并回复用户。无需打开其他的应用软件,Siri 就可以帮助用户买票、订餐馆或叫出租车。
这些如今被 AI Pin 和其他智慧助手大力宣扬的「AI 功能」,似乎只是十多年前 Siri 的「基础操作」。
但 Siri 的实际体验,已经在 AI 大模型爆炸式发展的当下,被拉开了不小差距。
智能助手,是对人的被动模仿,有问必答,有求必应。
而 AI 终端,则是对人的主动接近。根据用户的个人习惯、喜爱偏好,总结以往、推理以后,在不同的时间地点给予你最合适的建议和答案,并且能够不断地学习优化,成为「私人专属」。
图片来自:x.com
从整体上看,苹果的迟到只是相对的晚,因为 AI 手机,还处于发展的早期阶段。
的确,大部分国产品牌已经在 AI 终端的阶段发力,功能大体相同,特长各有侧重。
但各家大模型的可用性只能算达到及格线,除了像 OPPO 相册的 AI 消除、三星通话的实时翻译、小爱同学的 AI 通话等细分功能,大部分的体验目前还是与独立的 AI 应用有些差距。
这当中,除了厂家的技术突破,也和 App 开放的接口有关,比如不支持微信语音通话摘要的模型,在日常生活中,就少了一大块的应用空间。
因此,大模型和系统、App 的整合,以及对全新交互方式的探索,还有很长的路要走。在此之前,AI 功能还没能达到影响消费者购机决策的程度。
在 AI 上机的元年,Siri 的目标是和其他 AI 助手抹平这半年多的差距;而作为苹果布局未来的重要部分,我们更期待 6 月份的 Siri,会带来怎样的「One more thing」。

最美哈苏相机评测:除了仪式感,你还能收获这些


「麦门」又有新打卡点,这次是一个巨型「充电宝」| Feel Good 周报

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型你刚要笑,它就猜到了然后和你一起笑......这样的“好机友”你想拥有吗?从 Moonshot 崛起看中国大模型:资本其实没有大家想的那么急大模型应用成本卷到了千元级!云天励飞发布“深目”AI 模盒:搭载自研芯片,单手可托起ISSTA 2024 | 北大提出CoderUJB,面向代码大模型的可执行多任务代码评估基准揭示真实能力与局限AI早知道|马斯克Grok大模型开源;荣耀正式发布首款AI PC;苹果谷歌和OpenAI商谈iPhone大模型使用高开疯走的《欢乐颂5》,和我想的不一样马未都保持童心,避免大而空问题 法律是行为的底线,道德是内心的底线,一生要遵循 一开始不要指责,再分析国产算力训练大模型的经验与教训医生:孩子总生病,可能和这些坏习惯有关李丰对话连文昭:大模型的想象与泡沫,机器人的「不可能三角」与未来 | 峰瑞创投对话中科院,CMU,Meta等联合出品:去除LLM先验对多模态大模型的负面影响今日arXiv最热NLP大模型论文:一文读懂大模型的prompt技术冬樱 - 迟爱 三今日Arxiv最热NLP大模型论文:复旦大学最新研究,如何让大模型说出“我不知道”?墨大联合新华社等发布基准框架,全面评估大模型的新闻写作能力和安全依从性天道有常(19)大疆车载负责人沈劭劼:超20款搭载大疆智驾系统的车型,将在今年上市专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮同济校长郑庆华院士:大模型的四大缺陷叫板李彦宏、Llama 3 发布,大模型的开源闭源到底在争什么?对什么都淡淡地「算了」,可能和抑郁有关GPT-4级模型Grok开源可商用!卷底层大模型的公司危了张馨予8秒视频一夜刷屏!这次真相和我们想的不太一样……“Kimi概念”降温,长文本“担不起”大模型的下一步五光十色的多模态大模型:浅探视觉-语言大模型的关键模块设计日记今日arXiv最热NLP大模型论文:CMU最新综述:工具使用,大模型的神兵利器浙大等团队提出全新「自我对比」策略,有效提高大模型的反思效果懒倔混什么都是两面性 .离开跟不离开,只是每个人的选择. 合适自己最好.腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法预计容纳 35 万颗 H100!训练 Llama 大模型的基础设施是如何搭建的大模型开闭源争吵不休:开源落后闭源一年,决定模型能力的不是技术?开源大模型火了!(附99个大模型微调模型/数据/工具)!苹果iOS 18将搭载生成式AI;谷歌Bard最新排名超GPT-4;百川发超千亿参数大模型Baichuan 3丨AIGC大事日报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。