Redian新闻
>
端侧AI研究:2024 AI“下凡”

端侧AI研究:2024 AI“下凡”

公众号新闻

ChatGPT是由OpenAI于2022年12月推出的对话AI模型,一经面世便受到广泛关注。获得千亿、万亿级别参数的大语言模型需要超大规模AI服务器集群进行训练,且随着模型不断迭代,对云端算力的需求增加。

2023年以来,以英伟达为代表的AI芯片、通信网络和服务器产业链相关企业股价涨幅明显。

1)云侧AI数据云端汇集训练,模型通用性强。从终端采集和感知到的声音、视频等数据都通过网络传输到云中心侧进行后续处理,云侧的资源高度集中,存储和计算能力强,并且具有很高的通用性;

2)端侧AI终端设备上进行的轻型模型运用。越来越多的 AI计算和推理工作负载在手机、笔记本电脑、XR 显、汽车和其他边缘终端上运行,端侧硬件具备一定的计算能力,以及低延迟、个性化、隐私安全的特征。

端侧AI的四大优势:隐私和安全、低延时、可靠性、低成本。

隐私和安全:端侧AI从本质上有助于保护用户隐私,因为查询和个人信息完全保留在终端上。数据的存储计算等都在本地,避免了传到云端可能带来的数据安全问题。对于企业和工作场所等场景中使用端侧AI,这有助于解决保护公司保密信息的难题。例如,用于代码生成的编程助手应用可以在终端上运行,不向云端暴露保密信息。

低延时:当生成式AI查询对于云的需求达到高峰期时,会产生大量排队等待和高时延,甚至可能出现拒绝服务的情况数据的存储计算在本地处理、本地响应方面时间更短速度更快。

可靠性:与云端互联的网络可能不稳定、甚至断线。决策在本地大幅降低了数据经过更长的通路产生错误的几率。终端侧AI处理能够在云服务器和网络连接拥堵时,提供媲美云端甚至更佳的性能。如果所有的推理案例都在云服务器上进行,准确率是79.31%;如果49.88%的推理案例在移动端进行,其余在云端进行,仍可达到79.31%的云级准确率。

低成本:随着生成式AI模型使用量和复杂性的不断增长,仅在云端进行推理并不划算。将一些处理从云端转移到边缘终端可减轻云基础设施的压力并减少开支。此外与云端相比,端侧AI能够以很低的能耗运行生成式AI模型。


下载链接:
广西鲲鹏计算产业发展白皮书(2023年)
2023 OCP峰会—Server:Open Chiplet Economy
2023 OCP峰会:服务器DC-MHS合集
2023 OCP峰会:服务器技术合集
2023 OCP 峰会服务器专题技术合集
2023年服务器技术白皮书合集
高性能计算并行算法设计合集
《AI PC产业技术分析合集》
2023年个人电脑PC 行业词条报告
端侧AI深度报告:2024·AI“下凡
2023年AI现状报告
国内可穿戴市场:机遇与挑战并存
并行计算硬件结构基础合集
存储器:让数字世界拥有记忆(2023)
2023年计算机辅助工程(CAE)软件词条报告
2023 AI芯片行业发展简析报告
2023年AI基础设施技术词条报告

2023年算力技术词条报告



申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。

推荐阅读

更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”包含服务器基础知识全解(终极版)存储系统基础知识全解 pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价439元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
TNF研究:2023年已发1.6万篇SCI论文,大数据找到这些可持续的研究策略端侧AI推理,高效部署PyTorch模型:官方新工具开源,Meta已经用上了罗戈研究:2022-2023罗戈物流行业年报(简版)日娱惊现老年版“吴亦凡”:全国选妃性侵,后辈男艺人争先恐后上贡女孩给他...自噬研究:2023年发文近万篇,基金项目持续增长,涉及几乎所有疾病;大数据揭示追这个热点的高效方法罗戈研究:2022即时零售履约配送服务白皮书Strong start 2024莫谈国事720亿参数大模型都拿来开源了!通义千问开源全家桶,最小18亿模型端侧都能跑1/5国人都缺它!最新研究:补充维生素D,能使癌症风险降24%,痴呆风险和心血管事件也大幅下降!高通万卫星:生成式AI落地端侧,解密高通的软硬件AI大招丨GACS 20232024 rav4 油车 le四驱ChatGPT网页版出现重大Bug;传谷歌Gemini推迟至明年发;荣耀将推自研端侧大模型丨AIGC大事日报资讯:24fall研究生申请发第一波录取!2024QS可持续发展排名发布!只是贴上所写,很少回复,因为林彪的教导没忘:懂你的,何必回;不懂你的,回什么?——— 及其他王家卫的《繁花》,把她拍出下凡的美AndesGPT加潘塔纳尔:生成式AI端侧落地,OPPO给了我们答案对话: 再谈谷爱凌和洋五毛AVM赛道研究:预计2024年渗透率突破50%!下一个破局点在哪儿?未满10周岁慎“下腰”!“下腰瘫”等风险该如何规避?汽车之家研究院&新榜研究院:2023汽车厂商新媒体营销趋势洞察报告希拉里NOA赛道研究:预计2024年渗透率10%!中算力平台迎窗口期美妆巨头下凡,打出“安全牌”勤策消费研究:2023现制茶饮行业发展趋势报告天玑9300拿下生成式AI最强移动芯,端侧支持330亿大模型,1秒内AI画图,全新全大核架构做底座育娲人口研究:中国婚姻家庭报告2023版算力研究:计算、存储、网络(2023)中国服装科创研究院:2023-2024中国服装行业科技创新白皮书New Year's fireworks 2024 LIVE: NYC's Times Square ball drop罗戈研究:2022-2023罗戈物流行业年报米其林餐厅,集体下凡別讓我一個人醉2023骁龙峰会传递信号:AI逼近端侧AIGC 时代,如何提升端侧算力利用效率?|直播预约【美坛综艺秀假日篇】Best wishes for 2024!一刀一刀亲手砍到SK-II下凡来!这个价格你告诉我克制清醒还有什么用!性张力爆表,她下凡拯救国产剧类器官研究:打开脑与眼疾病研究的新篇章!一百四十九 家书
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。