Redian新闻
>
解密PC的AI进化:AI大模型如何“压”进PC?

解密PC的AI进化:AI大模型如何“压”进PC?

公众号新闻


当地时间2024年1月9日,2024年国际消费电子展(CES 2024)在美国拉斯维加斯举办。AI for All成为CES大会的关键议题之一。在众多展品当中,被视作个人大模型普惠第一终端的AI PC吸引众多目光。全球最大的PC厂商联想集团更是推出了包括Yoga Pro 9i,ThinkBook Plus Gen 5 Hybrid、全球首款商务AI PC ThinkPad X1 Carbon AI、ThinkCentre neo Ultra在内的一众AI PC产品。那么这些初次登场的AI PC产品身上到底有什么黑科技呢?虎嗅与您一起走进2024CES,为您揭开AI PC神秘的面纱。


奔驰、宝马、大众纷纷把大语言模型接入车机系统,让人能跟汽车自然对话。


三星给冰箱装了个AI识别系统,可以识别食物品种和新鲜度。


LG推出了会问候早安、欢迎回家的家庭AI机器人。


在2024年的CES展上, AI热度仍在持续,各家厂商都在喊AI for All,All in AI之类的口号。


然而对于普通的消费电子用户来说,更关注的似乎还是停留在手边的设备,比如作为我们生产力工具的电脑。


AI PC是2024年CES展中最热的词之一,在数据中心业务上赚的盆满钵满的英伟达,也在本次展会上推出了多款聚焦个人、商用电脑的AI硬件产品和应用。包括RTX 4060 Super、RTX 4070 Ti Super 和 RTX 4080 Super三款GPU,将大语言模型(LLM)的处理速度提升了5倍,将AI视频生成速度提高了150%。


英伟达产品管理的高级总监Justin Walker在新闻发布会上强调:“我们已经销售了超过1亿块RTX GPU,这为运行AI应用的个人电脑提供了坚实的硬件基础。”


在PC终端方面,微软在CES大会之前,就宣布将在新款Windows 11电脑上配备Copilot按钮,这是一个专门用于调用现已融入其操作系统的人工智能聊天机器人的功能。配备Copilot按钮的首批设备预计将在本月完成上市。值得注意的是,Windows PC键盘布局上次的重大变革还是在30年前。


不过,在AI PC方面走的最靠前的当属联想。从2023年10月的全球TechWorld大会宣布了全线AI PC规划后,仅几个月时间,联想就带着多款AI Ready阶段的AI PC产品亮相CES展。包括赋能创作过程的Yoga Pro 9i,全球第一台可无缝切换笔记本电脑和平板电脑两种模式的ThinkBook Plus Gen 5 Hybrid、全球首款商务AI PC ThinkPad X1 Carbon AI、新一代超小型ThinkCentre neo Ultra等。


 

无论是AI技术发展,还是PC市场趋势,都预示着AI将会成为2024年的PC行业新的增长引擎。AI PC则成为了传统PC厂商的新增长机会,甚至有可能打破依靠供应链和渠道驱动的业务模式,创造出全新的PC市场趋势和发展模式。


技术大揭秘:把AI装进PC


大模型的通用性、泛化能力都是来自于模型的参数量,从AI大模型热潮爆发至今,模型的参数量不断扩大,对算力的需求也在直线上涨。由此AI需要云端算力,几乎成了业界共识,很多人认为脱离了云服务器的AI PC很难把模型的能力发挥好。

然而,对于个人和商业用户来说,纯粹的云端AI也并不是万能的。随着AI技术的发展和应用场景的多样化,依赖云端AI处理大量数据、提供服务的模式正逐步显现出局限性。

目前的AI云服务主要面临三个比较明显的挑战:成本、安全和响应速度。

而结合云端AI和AI PC类产品的优势,构建的云端+本地的AI模式,很可能会成为未来AI的发展趋势。通过这种模式,大型AI模型可以在云端进行复杂的数据分析和学习,而端侧AI则负责实时、低延迟的任务处理。这种协同工作模式不仅能够弥补单一模式的不足,还可以在保证处理效率的同时,确保用户数据的隐私和安全。


那么,要把云端那些需要英伟达A100、H100显卡才能跑起来的AI大模型,“拖到”小小的个人电脑中,应该怎么做呢?

联想的做法是对大模型进行“压缩”。

AI大模型通常涉及复杂的数据结构(如神经网络的权重矩阵)。这些结构需要频繁地在计算过程中修改和访问,所以在训练和推理过程中需要占用大量内存空间。

以GPT-3为例,它有1750亿个参数。通常情况下,这些参数以32位浮点数(即float32)的形式存储。在32位浮点数中,每个参数需要4字节的存储空间。换算成更常见的单位,这大概相当于700GB。

目前参数量较小的主流AI大模型多位70亿参数或130亿参数,这些“小”模型需要的存储空间,大约也要20GB以上。个人、办公电脑上要运行这些模型,相当困难。

“我们现在做的技术就是如何把这个存储的这些空间降低之后,还能保持原有的模型性能。”联想研究院研究员谢栋介绍说。

联想基于阿里通义千问的7B模型重新做了一个新的模型,在参数量不变的情况下对模型的“体积“进行了大幅度的压缩,谢栋告诉虎嗅:”可能原来一个参数用两个字节来存储,经过压缩,一个参数只有半个字节就可以存储。“

阿里通义千问7B模型的原始大小是14.4GB,在联想的Lenovo AI now中运行的模型则压缩到了4GB。由此,AI大模型+电脑本身的缓存,大概只要5-6G内存就能运行起来。而目前,联想的主流集成显卡笔记本电脑内存都在16G以上,独立显卡的游戏本、高性能本显存都在8G以上,可以轻松运行压缩后的通义千问7B模型。


现在的AI与传统的软件不一样,不是所有的芯片都能跑。AI与硬件之间还有一个中间层叫framework。目前,联想的AI PC正在做的事就是定制自己的framework。

“中间层是决定他能在这样的硬件基础上跑的,第一要能跑,第二还要跑得好”联想全球中小企业产品与解决方案总经理郑爱国告诉虎嗅,“目前我们的专家每天都在和AMD和Intel的专家沟通,对他们最新的平台和芯片一个一个地调优,是其能最大限度地适合AI PC的工作和任务。”

目前联想研究院在这个“中间层”的研发工作中担任重要角色,除此之外,联想对AI PC的研发采用了多元化布局。目前最主要的研发任务主要集中在中国和美国。在日本、巴西,以及印度也都有研发分布。联想集团董事长兼CEO杨元庆表示:“创新还有研发一直以来都是联想两个重要的核心能力之一。我们的研发经费在过去几年一直在提升,从不到3%到大概已经4%以上。”

如何用AI PC打出区隔


正在拉斯维加斯举办的2024 CES展上,联想展出了ThinkBook 16P、ThinkPad P1、ThinkPad P16、ThinkBook 13x等多款AI Ready的产品。这些产品的推出,不仅是技术进步的展示,也是联想在AI PC领域策略的体现。

联想集团执行副总裁兼中国区总裁刘军表示:“我们的AI PC目前处在AI Ready的阶段,在2024年4月的联想中国创新科技大会(TechWorld)上,我们将正式宣布我们的个人Agent。”这一声明表明,联想正将AI PC技术与个人助理功能结合,推动AI技术在个人电脑领域的深入应用。

在AI PC的硬件方面,联想计划推出CPU+GPU+NPU的混合AI模式,这种模式可以提高计算效率,优化AI应用的性能。NPU(神经网络计算单元)的引入是对传统CPU和GPU功能的补充,能够更加专注于处理AI相关的任务。这种混合硬件布局不仅适用于PC,也将应用于手机、平板等多种设备,甚至扩展到商业环境和AIOT(AI驱动的IoT)产品。

在软件生态方面,联想的战略是改变传统PC行业甚至是消费电子产品的交互逻辑,从应用交互转向意图交互。这一转变预示着未来的交互方式将更加直观和自然。用户不再需要通过复杂的菜单和步骤来执行任务,而是可以直接通过意图来与设备互动。这种基于意图的交互方式能够大大提高用户体验,使设备更加智能和易用。

在探索这些新领域的同时,对于其他厂商而言,如何在AI PC市场中寻找自己的定位和特色,是一个值得思考的问题。例如,其他厂商可能会在特定的垂直领域内进行深耕,如专注于创意工作的AI应用,或者在安全性、隐私保护方面进行创新。同时,不同厂商可能会选择不同的技术路径或合作伙伴,以寻找差异化的市场机会。

对于整个PC行业来说,AI PC的发展是一个多维度的过程,涉及硬件、软件、用户体验和生态系统等多个层面。联想作为先行者,在AI PC方向上自然会占据一定的先发优势,不过在创新产品的开发,以及AI技术的发展过程中,势必也会遇到各种不确定的问题。


从行业趋势来看,AI PC的未来可能不仅仅局限于个人电脑,而是会扩展到整个智能终端生态系统,包括智能家居、智能汽车等领域。这种趋势下,厂商之间的竞争将不仅仅是硬件和软件的竞争,更是对整个生态系统的理解和布局的竞争。

PC市场的拐点


IDC在2023年底发布的《全球季度个人计算设备跟踪报告》指出,鉴于当前的经济环境和市场状况,对全球PC市场的预测被下调。预计2023年的出货量将比2022年下降13.8%,而2022年的出货量则比上年下降了16.6%。这种连续两年的两位数同比下降在个人电脑市场是前所未有的。不过这种“衰退”趋势可能正在为市场的后续复苏铺平道路。

IDC认为,疫情期间售出的PC产品大多将在2024年面临Windows更新周期。此外,一些失去微软服务支持的旧版Windows系统,将面临2024年升级至Windows 11的压力。

这些因素在短期将会促进2024年PC市场的增长。而从长远来看,PC市场更大的增长动力则很可能源自AI PC带来的革命性升级。

联想智能设备集团执行副总裁兼总裁Luca Rossi在CES期间接受采访时表示:“2023年市场确实遭遇了一些压力。对于2024年全球市场的趋势我们保持谨慎乐观的态度,预见会有少量的增长。我们也乐观地认为,在2024年下半年和2025年,AI PC将在消费和商用市场掀起广泛的换机潮。人工智能电脑将成为转折点,加速更换周期。”

虽然目前全球PC市场中,仅有联想一家在大举落地AI PC,但其它PC行业巨头也都在对AI PC概念保持高度关注。HP和Dell的高管在近期的采访中都表示AI PC必将大幅提升PC的升级换代潜力表示肯定,HP Personal Systems部门总裁Alex Cho认为:AI PC或有望帮助PC行业增长率翻倍。

尽管面临短期挑战,IDC预计2024年及以后的市场将会出现反弹。预计2024年PC市场总量将比2023年增长3.4%,这得益于AI PC对市场升级起到的催化作用。初步针对企业PC市场的某些细分市场,随着用例的进一步发展和成本的降低,AI PC可能会推动更广泛的市场应用。

同时,IDC认为2024年将是PC市场的关键一年,为市场近期的挑战提供了喘息机会。预计2024年之后,出货量的增长将超过大流行前的水平,在2027年达到2.85亿台的峰值

(揭开《张闯是谁?》的神秘面纱)



特别策划

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
让AI像人一样开车,端到端模型如何解码自动驾驶?GPT又迎重磅升级!万物皆可大模型(赠大模型系列课程+书籍)英伟达也在下一盘AIPC的大棋三种8卡GPU评测Llama2:解密大模型训练、微调和推理运行时的性能问题【动脉严选新品鉴第37期】百度灵医大模型:国内首个产业级医疗大模型少样本轻量化:多个小模型互学习会比大模型好么?纯爱小说﹕ 风云赋 (53) 门当户对中国已经有238个大模型了?李彦宏劝各位少做点大模型多搞搞应用吧超88%的员工“压力山大”,如何做好压力管理?爱奇艺的再进化:好内容强化溢出效应,会员长期价值凸显传字节成立AI应用新部门Flow;淘天集团筹建大模型团队;浪潮信息开源千亿级大模型丨AIGC大事日报谎言2023创业家年会关键词是“AI”;百度发布Q3财报;拼多多成立大模型团队;字节飞书接入大模型;比尔·盖茨最新分享民國50年駐台美軍拍攝高雄街景的彩照苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型千元成本搞定专业大模型,系统优化+开源大模型是关键 | 潞晨卞正达@MEET2024共生与进化:四年金剧奖背后的短剧行业免费《大模型应用实践》实训营第二周课程来啦!这次百度算法工程师团队手把手教你构建大模型应用,另有第一周干货回顾!《幺妹和市场街》(3)免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!拿摄像机对自己一通拍,就能做出一个跟你自由对话的AI NPC?英伟达已经这么强了么面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了小模型如何进行上下文学习?字节跳动 & 华东师大联合提出自进化文本识别器工业界的AI变革:卡奥斯工业大模型如何成为最优工艺的探索者大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机打通大模型训练任督二脉!国内首个千亿参数、全面开源大模型来了,还联手开发者共训上班之后代入不了小说的原因...我们NPC的命也是命啊今日Arxiv最热NLP大模型论文:复旦大学最新研究,如何让大模型说出“我不知道”?AI早知道|百度推出视频生成模型UniVG;Soul APP上线自研语言大模型;清华大学首个大模型 Debug个性经济时代,MiniMax 语音大模型如何 To C?徒手搬螺丝,波士顿动力Atlas再进化:兄弟们,准备进厂了2024,万众瞩目的行业大模型如何落地?AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布一路走来(四十)AI何以重塑PC?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。