Redian新闻
>
iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端?

iPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端?

公众号新闻


“大模界”是每日经济新闻推出一档专注生成式AI与大模型技术的前沿科技报道栏目。

在这里,我们将聚焦生成式AI技术浪潮,展现从文字、图像、音频、视频的大模型如何编织数字化世界。

在这里,我们将解码、评测国内外各类大模型,探究它们如何成为变革各行各业的重要力量。

在这里,我们将关注AIGC行业发展,联手行业领军人物和顶尖专家,共同揭示最新产品创新和技术突破,前瞻未来发展趋势。

欢迎关注“大模界”,您将见证AIGC如何重塑内容生态,如何以前沿之力推动社会进步。让我们共同开启一场关于AI新纪元的无限旅程!


当地时间4月23日,微软推出了开源轻量级AI模型Phi-3系列,宣称这是目前市面上性能最强、最具性价比的“小语言模型”。

该系列的最小版本Phi-3-mini虽然参数规模仅有38亿,但却展现了超越参数规模大一倍多的模型的性能,在多项基准测试中比Meta的Llama 3 8B更优异,而Phi-3-small和Phi-3-medium这两个版本甚至可以超越GPT-3.5 Turbo。

更令人瞩目的是,Phi-3-mini对内存的占用极少,可在iPhone 14搭载的A16 Bionic芯片上实现每秒12个token的生成速度,这意味着这款模型不用联网,可以直接在手机上运行。不仅如此,据透露,Phi-3的成本或只有同等性能模型的十分之一。

这样的模型对于网络资源受限或需要离线推理的场景来说,无疑是一大好消息。据微软介绍,印度企业已经开始用Phi-3模型来帮助资源紧缺的农民解决生产生活问题。但Phi-3系列并非没有缺点,其在事实性知识方面的表现并不理想,不过微软已经找到了相应的缓解之道。

手机上能跑的GPT-3.5级别模型


当地时间4月23日,微软推出了开源轻量级AI模型Phi-3-mini,这是其Phi家族的第4代模型。Phi-3-mini是Phi-3系列中最小的,参数只有38亿,未来几周内,微软还将推出该系列的另外两个版本Phi-3-small(70亿参数)和Phi-3-medium(140亿参数)。

“Phi-3模型是现有功能最强大、最具性价比的小语言模型(SLM),在各种语言、推理、编码和数学基准测试中,其性能优于相同大小和规模大一级的模型。”微软方面表示。

具体来看,Phi-3-mini采用了transformer架构,支持4K和128K上下文窗口,也是同类小模型中第一个支持128K的开源产品。

性能上,Phi-3-mini在多项基准测试中超过了参数规模大一倍多的Llama 3 8B(80亿参数),而Phi-3-small和Phi-3-medium超过了很多尺寸大得多的模型,如GPT-3.5 Turbo,而后者的参数规模高达1750亿。


图片来源:微软

由于Phi-3-mini对内存的占用极少,经过压缩后总体积可以大幅缩减至1.8GB,可在iPhone 14搭载的A16 Bionic芯片上实现每秒12个token的生成速度,意味着这款模型不用联网,可以直接在手机上运行。

Phi-3系列的惊艳表现来自于其训练方式。微软生成式AI研究院(GenAI Resaerch)副总裁Sébastien Bubeck表示,微软在开发Phi-3时力图确保输入的是高质量数据训练集。

微软技术报告显示,开发人员开发Phi-3时使用了3.3T tokens数据集,包括经过严格质量筛选的网络公开文档、精选的高质量教育数据和编程代码。此外,还有AI自己生成的“合成数据”,如数学、编码、常识推理、世界常识、心理科学等。高质量数据,再辅以独特的指令微调和RLHF训练,大幅提高了小语言模型的性能。

当然,Phi-3系列也有其缺点,这主要体现在事实性知识上,在相关的基准测试如TriviaQA上的表现就不如人意。不过,开发语言模型是性能和尺寸的平衡。微软透露,Phi-3模型本身参数中没能力存储太多事实和知识,这一缺点的缓解方式是联网接入搜索引擎增强。

可离线使用

成本只有类似性能模型的十分之一


传统观点认为,大语言模型的关键点就在于“大”,参数越大,训练数据体积越大,性能就更强。微软推出轻量级的小语言模型,用意何在呢?

据微软自己的说法,像Phi-3这样的小语言模型特别适合以下场景:网络资源受限,需要在终端设备上推理或者离线推理的场景;需要避免延迟,快速响应至关重要的场景;成本受限的场景,特别是那些较为简单的任务。

Phi-3能够在手机上离线运行,成本大幅降低,从而大大降低了AI的实际使用门槛。

微软高管Eric Boyd就表示,企业客户经常发现像Phi-3这样的小模型更适合他们的定制应用程序,因为企业的内部数据集本来就规模不大,而且小模型需要的算力更少,成本也更为便宜。

“Phi-3的价格不是稍微便宜一点,而是便宜得多,与具有类似功能的其他型号相比,成本差异可能是10倍的范围,”微软的Sébastien Bubeck对路透社表示。

微软已经在探索如何在资源有限的情况下应用Phi-3。据其介绍,总部位于印度的商业集团ITC,正在与微软合作将Phi-3用于农业领域,共同开发面向农民的应用程序Krishi Mitra,这一程序的覆盖范围达100万农民。

据悉,农民可以用当地语言向Krishi Mitra提问,该应用程序会立即以用户的本地语言提供详细的个性化响应,帮助他们解决农作物管理、病虫害控制、土壤健康、水资源保护、天气预报、市场联系和政府计划等相关问题。

记者|李孟林
编辑|何小桃 兰素英 盖源源
校对|卢祥勇
|每日经济新闻  nbdnews  原创文章|
未经许可禁止转载、摘编、复制及镜像等使用
如需转载请向本公众号后台申请并获得授权

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
微软发布Phi-3,性能超Llama-3,可手机端运行AI早知道|字节Coze海外版支持GPT-4o;文心一言上线新功能;微软开放Phi-3 轻量级AI模型IEEE HPCA 2024|LiteIO:高性能、轻量级的存储池化架构微软来大招:手机部署堪比GPT3.5高性能大模型!震撼!GPT-4 Turbo级国产大模型登场,周冠宇F1赛事数据秒分析惊呆国际大佬宗庆后他是好人;离婚了,就别再来找我;情感躺平,情感摆烂。端侧模型 OctopusV3 发布:手机上的超级助理,性能媲美 GPT-4V 和 GPT-4 的组合?千亿模型 Yi-Large 杠上万亿 GPT-4 Turbo,多项能力不输 OpenAI曝苹果与百度洽谈,iPhone或使用文心大模型/ 小米SU7第二批交付中心候选公布/微软推出首款 AI PC一款轻量级、高性能、功能强大的内网穿透代理服务器谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍小模型时代来了?微软最小参数AI模型发布,性能逼近 GPT-3.5最强中文大模型又易主了!击败GPT-4 Turbo,首款AI助手发布有多少学子遭到中共的残酷迫害?聊对题联微软秒删堪比GPT-4的开源大模型!研发总部还被爆在北京?官方:我们只是忘了测试CVPR 2024 | 微软新作StarNet:超强轻量级Backbone中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o苹果开源了!首次公开手机端侧大模型,AI iPhone 的细节就藏在里面GPT-4级模型Grok开源可商用!卷底层大模型的公司危了微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了AI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型微软发布Phi-3 Mini:3.8B参数小到能塞进手机,性能媲美GPT-3.5性能超越 GPT-4 Turbo!「商汤日日新」大升级,国产大模型超市开张了苹果智能背后模型公布:3B模型优于Gemma-7B,服务器模型媲美GPT-3.5-Turbo昨晚的月亮 甲辰元宵AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo闭源赶超GPT-4 Turbo、开源击败Llama-3-70B,歪果仁:这中国大模型真香超越Llama-2!微软新作Phi-3:手机上能跑的语言模型《不是孤雁》&《青梅竹马》每秒执行超40万亿次运算!微软推出内置GPT-4o的全新AI PC“硬刚”,苹果将会如何应对?PC市场是否将迎来换机潮?聊一款性能堪比游戏本的独显全能本小模型时代来了?微软推出其最小参数 AI 模型,性能逼近 GPT-3.5
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。