为什么乔布斯认为手机依然是最佳的 AI 硬件公众号新闻2024-01-25 10:01最合适的AI 终端硬件作者:李榜主 文章来源:Alhackathon2007 年 1 月乔布斯重新发明手机的时候,把 iPhone 跟其移动电话、智能手机区分的维度是,易用性和智能程度,iPhone 的易用性主要体现在多点触控,智能程度主要是操作系统。乔布斯分析手机的易用性和智能程度iPhone 发布 16 年后,ChatGPT 出现了,利用这个技术是否可以再次重新发明手机呢,我认为并不会,那 GPT 这个技术对手机的易用性、智能程度有没有改变呢,我认为是有的,而且很大。ChatGPT 从 2022 年 11 月发布,半年完成了爆发式增长,到 2023 年 6 月以后半年时间,基本一直保持 2.5 亿左右的 MAU,web 端 2 亿,移动端 5000 万,跟传统全民级应用差 5-8倍,本质原因是没有找到场景。AI Pin 作为 ChatGPT 的硬件版,ChatGPT 都没有找到场景,AI Pin 就有场景了,不存在的。乔布斯 2007.1 iPhone 发布会乔布斯 2007 年重新发明手机的时候,为什么把 iPhone 描述为宽屏触控 iPod、革命性手机、突破性互联网通讯器?我们从数据可以看出来乔布斯的想法。iPod 的销量从 2001 年 11 月发布到 2006 年均销量增长率为 251.28%。诺基亚代表了移动电话时代的缩影,1996 年诺基亚推出智能手机的概念机 NOKIA 9000,可以收发传真、电子邮件、手机短信、互联网接入功能起比苹果早了 11 年。诺基亚手机从 2000 年到 2006 年的手机销量增长率为 18.41%。浏览器的用户数量从 2000 年到 2006 年的用户增长率为 20.77%。数据来源:诺基亚官网、Apple官网、internet world stats移动电话、音乐播放器、浏览器这些产品的用户数量持续多年的高速增长,只说明一个问题,乔布斯真的只想重新发明手机(Apple reinvents the phone),把用户对听音乐、打移动电话、上网这几个确定性的高增长性的需求,以更好的体验、更智能的方式满足。不像大部分人所误解的那样,乔布斯创造了需求,乔布斯不是有现实扭曲力,乔布斯是有现实观察力。Rabbit 用了 LLM 的自然语言交互能力就需要一个新硬件?不需要的,Rabbit 有点硬套一个 LLM 自然语言交互的意思。把微信文件传输助手改为我的助手,给我的助手发一条语音说,帮我做一个春节全家人旅行的计划,然后我的助手根据我们家人群的聊天记录,做了一个全家人的旅行计划给我确认。这不比手上再拿一个红砖头按住来的更方便,更自然吗!iPhone 的多点触控是原来的移动电话硬件本身不支持,iPhone 所代表的这个钉子需要多点触控这个锤子来匹配。而自然语言交互的能力,本身智能手机终端是拥有的,而且很方便,并不需要一个新的硬件,只是现在智能手机的自然语言交互能力还不够智能,譬如 iPhone 的 Siri ,vivo 的小 v。有了 LLM 的自然语言交互能力,智能手机代表的这个钉子再一次被技术这个锤子满足了。LLM 的自然语言交互能力,可以把那些超过 3 步的功能,优化到 3 步以内,跟当年乔布斯的多点触控改变实体按键一样,会在易用性上带来革命性的变化,这是手机端侧模型最应该做的事,也是手机端用户体感最强烈的部分。譬如,现在智能手机的系统导航是用桌面的形式实现的,有了 LLM 以后这就不是最优解了。产品设计的本质是分类,用户按照产品经理预先设计的分类,导航到各个功能里去。做的好的产品,用户能用最少的步数按照分类导航过去,用多了还形成了习惯,做得不好的呢,用户走着走着就迷路。相信绝大部分人都遇到过,在桌面上滑来滑去好几回,也没找到想找的那个应用的情况吧,这就是桌面式导航的问题,系统越强大用户越困惑,而 LLM 的自然语言交互能力就能很好解决这个问题。领导 OpenAI 应用研究的 Lilian 在 2023年 7 月份提出了,她对 Agent 智能体的理解:Agent = LLM + 记忆 + 规划 + 工具,LLM 做为 Agent 的大脑负责提取记忆,做好任务规划,使用工具满足用户需求,在日日新的 AI 的时代,依然是最前沿有效的 Agent 指导思想,Agent 应该也是目前对人工智能终极的畅想。手机里的每一个 APP 就是个工具,这个工具用户预期是非常清晰,而且非常强大,GPTs 是没法比的。联系朋友打开微信,看短视频打开抖音,点外卖打开美团,买东西打开淘宝,打卡景点看小红书 等,工具的强大降低了 Agent 对 LLM 的要求,这一点很重要。智能手机终端本身就是个人信息最系统性的记忆体,系统性是指它掌握你的资料最全,最多、最隐私,如果能一生不换手机,手机几乎就是你一生的记忆。这些数据都只要你允许去访问就行,RPA + 视觉 手机上什么信息都能读,什么操作都能做,这也可能是打破各应用生态之间割裂现状的唯一办法。Agent 的规划其实跟产品设计是一样的,做的也是分类,一个更智能的分类。 Agent 能通过你说的话,你做的操作识别你的意图,然后帮你拆分任务,再帮你自动导航过去。就像你要上 8 楼,走楼梯要一步一步爬,坐电梯你只要走进电梯里按下 8 楼那个按键,自动帮你送到 8 楼,然后打开电梯门,坐过电梯的你,已经知道,你回不去从前了。来看几个在手机上通过 AI 做应用增强的效果:vivo 蓝心大模型 蓝心小V 消除路人甲,并自动配发朋友圈Google 魔术擦Google Gemini 圈搜一下手机依然是 AI 的最佳终端硬件。Apple Car 被迫降级,苹果为什么十年没造出一台车?国产手机,何以升杯减价?微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章