2024 开年,去年全球最畅销的智能手机 iPhone,在中国的销量就经历了罕见大跌。研究公司 Counterpoint 的数据显示,2024 年的前六周,苹果 iPhone 在中国的销量出现大幅下滑,同比下降 24%。华为的复苏是其中一个原因,华为同期的销量暴涨 64%。天风证券分析师郭明錤此前表示,苹果下调 2024 年 iPhone 出货预估量至约 2 亿部,较上一年下降了 15%,这可能是全球主要手机品牌中降幅最大的。郭明錤进一步预测,iPhone 15 系列与新款 iPhone 16 系列的出货量预计将分别在 2024 年上半年和 2024 年下半年同比降低 10-15%。他认为,iPhone「滞销」的原因可能与高端手机需求逐渐转向 AI 和折叠屏有关。郭明錤甚至认为,如果苹果今年无法推出超出预期的 GenAI服务,英伟达的市值很有可能超过苹果。前不久,苹果最强劲对手的三星,便是把 AI 功能作为全新旗舰 Galaxy S24 系列手机的最大卖点,兜售「AI 手机」概念。在此之前,Google、微软已高调宣布自己要在手机端部署 AI 大语言模型的计划,而华为、OPPO、vivo、小米等国产手机厂商也先后公布了自己 AI 化的战略,OPPO 更是直接宣布进入 AI 手机时代。手机厂商们在「AI 会给智能手机带来新鲜感」这个观点上达成了高度一致的共识,而上一次出现这样步伐一致的局面,可能要追溯到七年前的全面屏浪潮。不过到了 2024 年,苹果不打算再继续当「局外人」。最近,库克罕见地多次透露苹果在 AI 方面的雄心。库克表示,公司将在 2024年在生成式人工智能领域「开天辟地」我们坚信,这将为我们的用户带来革命性的机会。苹果决定取消长达十年的造车计划的同时,也将更多资源投入到 AI 项目,造车项目组里的部分员工将被调到由 John Giannandrea 领导的机器学习和 AI 部门,转向生成式 AI 项目。在这周发布新款 MacBook Air 的官方新闻稿,苹果更是直接用了「全球最佳的 AI 消费级笔记本电脑」(World’s Best Consumer Laptop for AI)这样的表述。结合此前彭博社记者 Mark Gurman 的爆料,苹果的 AIGC 新功能这很可能会出现在 6 月份公布的 iOS 18 上。并表示 iOS 18 很有可能会是 iPhone 历史上「最重磅」的软件更新。目前消费者对 AI 手机还没完全接受,小米品牌总经理卢伟冰最近还表示「AI 手机是噱头」,引发了不少讨论。可以肯定是,AIGC 与硬件设备的结合也会越来越快,智能手机这几年被认为只有挤牙膏式的微创新,未来几年内可能改变这一局面的变量,可能也只有 AI 了。iOS 18 要把 Siri 变成 ChatGPT?关于 iOS 18 的最有力的爆料并非出自我们熟悉的科技记者们,而是来自库克。在最近一次财报电话会议中,库克在接受采访时透露,苹果一直在密切关注生成性 AI 技术,并在团队内部进行了大量的探索与实践。他强调,苹果一贯的做法是先确保工作达到一定标准后,再公开讨论相关成果。库克还提到,苹果将在今年晚些时候分享一些让人兴奋的新进展。此前有报道指出,苹果正在自主研发大语言模型,并已在内部使用它作为人工智能助手进行回答。结合这些信息,苹果有可能会在 iOS 18 中集成大语言模型,以提升 Siri 的性能并引入新的功能。苹果的机器学习团队最近发表的一篇论文《LLM in a flash : Efficient Large Language Model Inference with Limited Memory》也在侧面印证了这个消息的真实性。。在这篇论文中,研究团队讨论了手机和平板等设备上内存限制对运行大型语言模型的影响,并提出了两种解决计算瓶颈的方法,为将来部署大型语言模型铺平了道路。继续翻阅这一年来苹果机器学习研究团队发表的论文,你会发现苹果团队尤其关注如何把大语言模型与自然语言处理结合。例如,一篇发表于 12 月的论文《Federated Learning for Speech Recognition: Revisiting Current Trends Towards Large-Scale ASR》指出,虽然大型语言模型在多项自然语言处理任务中表现出色,但在口语理解任务上的性能还依赖于准确的自动语音识别转录(ASR)或内置理解模块。因此,研究团队提出了新的解决方案,以提高模型在理解自然语言识别内容方面的准确性。而在另一篇论文《Leveraging Large Language Models for Exploiting ASR Uncertainty》中,苹果团队则在研究如何将大语言模型与网络搜索、机器翻译结合,以提高生成内容的准确性和质量。尽管这些研究成果不一定直接应用于产品设计中,但足以显示苹果在结合大型语言模型和 Siri 投入了大量精力。在 Siri 问世之前,iPhone 的人机交互主要依赖于触控操作。Siri 的加入为交互方式增加了新的维度,但精确的语音识别一直是个挑战。彼时,不够成熟的语音识别技术难以给用户带来自然流畅的交互体验,号称「革命性产品」的锤子 TNT 便是前车之鉴。现在,大语言模型的出现或许能解决掉一些「技术障碍」。也许你已经在社交平台上刷到过人与 ChatGPT 手机端 app 语音聊天的视频。在这些视频里,对答如流的 ChatGPT不仅显示出其强大的思考和回答能力,还能模仿人类语气和口音的能力,几乎可以通过图灵测试,展现了语音助手真正的潜力。ChatGPT 强大的理解能力给了人们进一步的想象空间。近期,北京交通大学和阿里巴巴的研究团队发表的论文《Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception》开始探讨使用 AI 实现手机操作的可能性。他们基于 GPT-4V 设计了一个名为 Mobile-Agent 的多模态代理,能够通过自然语言指令自动执行像搜索视频、评论,甚至斗地主等操作。Mobile-Agent 的操作依赖 GPT-4V 的视觉识别作定位,因此经常会有识别出错导致操作失败,如果把这个这个过程替换为自动化机制,成功率将大幅提升,而这正是苹果在研究的应用方向。据 Mark Gurman 透露,苹果正在考虑将 Siri 与快捷方式结合,以提供更灵活的自动化操作。这表明苹果不仅想要打造一个更智能的语音助手,而且可能改变语音交互模式,为用户带来全新的交互体验。如果以上爆料成真,那么 iOS 18 很可能就是苹果自 2018 年重组 Siri 团队以来一直在憋的大招。用 AI 再次改变改变人机交互再来看看对手,AI 优等生 Google 已经在一年时间内完成了在 Android 上的 AI 布局。自 Google 去年发布其自研大模型 Gemini 以来,他们就一直在想方设法把最新的 AI 技术应用到所有产品阵列上,手机自然也不例外。首个用上 Gemini 大模型的产品是亲儿子 Pixel 8 系列,基于 Gemini Nano 模型,Google 带来了许多创新功能。例如输入法可以根据当前对话内容的自动回复消息功能,或者能够实时转录录音为文字并自动总结录音内容的功能等等。最近,随着三星最新的旗舰手机 Galaxy S24 系列的发布,三星和 Google 宣布合作,共同打造 Galaxy AI 体验,再次展示了 Google 自研模型的强大。现在,这些功能不仅限于录音转文字,甚至在电话通话中的对话也能实时转换为文字,并进一步翻译。如果你在与外国人通话,系统还能将对话翻译成你所使用的语言。Google 擅长的 AI 图像编辑功能也被引入到三星设备中。当用户拍摄的图片需要重新构图时,AI 可以自动生成画面中未捕捉到的内容,提供一个全新的视角和比例,完善图片。你还可以抹去图片中的路人或重新调整物体的位置,AI 将根据选定的内容重新填充图片。Google 还推出了一个强大新功能「画圈搜索」。当你对图片中的某个物品或文本句子感兴趣时,只需长按 Home 键激活画圈界面,在图片上圈出物体,系统便会自动执行搜索,提供相关信息和购买链接。这彻底改变了以往繁琐的图像搜索和在线购物体验。搜索是 Google 的核心业务,而「画圈搜索」的引入实际上是 AI 能力和 Google 的搜索技术的结合,是一次自我革新的尝试。过去,搜索依赖于输入框,现在,用户可以通过简单地在手机屏幕上画一个圈来进行搜索,无需复杂的关键词输入和筛选过程。这不仅缩短了用户与服务体验之间的距离,而且标志着搜索领域的一次革命,并且这种革命是 AI 与设备硬件结合带来的,是互联网时代无法实现的。这同时也意味着,虽然现阶段 AI 能力可能仅被视为一个添头功能,但随着越来越多的应用程序对 AI 开放接口,结合 AI 的强大理解和图像识别能力,实现自动化操作,AI 很可能在未来某个时刻爆发,为人们带来创新的体验,实现更便捷、更快速的交互。这是手机上 AI 应用的真正潜力,也为 AI 时代提供了新的人机交互模式的思路。AI 终将成为智能手机的「新基建」AI 的突然爆火给了手机行业很大的想象空间,高通、联发科等硬件厂商将 AI 算力作为新的角力点,开始新的算力竞赛;软件开发商集思广益,争取复刻 ChatGPT 和妙鸭相机的破圈传播。2024 年,无疑会成为手机系统的大年。但回归「AI 到底能给用户带来什么」这个灵魂拷问上,少有厂商能给出让人信服的答案。用户真的需要在手机上每天跟机器人聊天、用 AI 生成不一样自拍照吗?把过往火爆经验硬套在手机圈的叙事模式上不一定行得通。苹果和 Google 给出的答案是回归用户体验,只有当 AI 手机让智能手机变得更好用,AI 的加入才有意义。在 ChatGPT 引领 AI 浪潮和各大手机制造商纷纷宣布 AI 战略之前,AI 技术已经悄无声息地融入到我们日常使用手机的各个方面。每当你解锁手机、使用人脸支付,甚至每次拿起手机拍照时,AI 技术都在其中发挥着作用。在华为 Mate 60 系列刚发布时,其可以直接刷码的智感支付功能在短视频平台上迅速走红,引起了用户之间的热烈分享。这一功能实际上是调用了华为麒麟芯片的 NPU 模块,通过专门用于识别物品并实现快速跳转。这种自发分享行为恰恰说明,用户更关注的是 AI 技术带来的直接体验提升,而非 AI 计算过程本身,AI 不仅背后的重点在于系统体验的潜在提升。随着手机制造商在屏幕和相机硬件上达到瓶颈,智能手机竞争很快将会从硬件层面转向系统层面,厂商们通过创新交互和提升用户体验作为其核心竞争力。智能手机在经历了智能化升级之后,下一步的体验革命可能会是更加人性化的升级。这种理解能力将与图形计算一样重要,并有望成为智能设备的新标配。而这一切的核心,可能正是我们目前正在经历的大语言模型的爆发。华为在 8 月宣布 HarmonyOS 4系统全面接入盘古大模型,两个月后,小米宣布澎湃 OS 接入「MiLM-6B」模型;vivo 宣布 vivo X100 内置蓝心大模型,OPPO 随后官宣 Find X7 系列内置 AndesGPT。过去,相册识图、抠图功能还是少数厂商的「独门绝技」,而现在有了大模型加持后,这类 AI 功能已经成了旗舰手机标配。而随着大模型应用的普及和深度整合,会促成更高效的计算硬件、优化的算法涌现,提高算力利用率和性能,从而降低单位计算成本。在接下来的时间里,高通、联发科等硬件厂商不断提高芯片算力,而手机厂商持续精进模型压缩和量化技术,以减少模型的大小和运行时资源需求。通过软硬件协同进化,手机端侧大模型有望突破智能拐点,实现算力爆发。届时,语音助手可能成为拟真人类助手,拍摄照片变成一键扫描 3D 空间映像,识图就能实现全网比价……AI 终将和移动通信、LBS 服务一样,成为我们生活不可割舍的一部分。AI 作为营销热词总有一天会冷却,但 AI 带来的体验革新,将会深刻改变人们使用手机的方式。