Redian新闻
>
小模型时代来了?微软推出其最小参数 AI 模型,性能逼近 GPT-3.5

小模型时代来了?微软推出其最小参数 AI 模型,性能逼近 GPT-3.5

公众号新闻

作者 | 冬梅

当地时间 4 月 23 日,微软宣布推出其轻量级人工智能模型 Phi-3 Mini 的下一版本,这是该公司计划发布的三个小型模型中的第一个。

Phi-3 Mini 可测量参数仅为 38 亿,并在相对于 GPT-4 等大型语言模型更小的数据集上进行训练。现已在 Azure、Hugging Face 和 Ollama 上可使用。另外,微软还计划发布 Phi-3 Small(7B 参数)和 Phi-3 Medium(14B 参数)两个版本。

微软在去年 12 月时发布了 Phi-2,其性能与 Llama 2 等更大的型号不相上下。微软表示,Phi-3 的性能比前一版本更好,其响应速度接近比它大 10 倍的模型

微软 Azure 人工智能平台公司副总裁埃里克· 博伊德(Eric Boyd)介绍说,Phi-3 Mini 的性能与 GPT-3.5 等 LLM 不相上下,"只是外形尺寸更小而已"。

与大型人工智能模型相比,小型人工智能模型通常运行成本更低,并且在手机和笔记本电脑等个人设备上表现更好。据外媒《The Information》今年早些时候报道称,微软正在组建一个专门专注于轻量级人工智能模型的团队。与 Phi 一起,该公司还构建了 Orca-Math,一个专注于解决数学问题的模型。

微软的竞争对手也在研发自己的小模型,其中大多数针对更简单的任务,例如文档摘要或编码辅助。其中最典型的就是 Google 的 Gemma 2B 和 7B,这两款模型更适合简单的聊天机器人和语言相关的工作。

此外,Anthropic 的 Claude 3 Haiku 可以阅读带有图表的密集研究论文并快速总结它们,而 Meta 最近发布的 Llama 3 8B 可以用于一些聊天机器人和编码辅助。

Boyd 表示,开发人员通过“课程”对 Phi-3 进行了训练。他们的灵感来自于孩子们如何从睡前故事、单词更简单的书籍以及谈论更大主题的句子结构中学习。

“市面上没有足够的儿童读物,因此我们列出了 3000 多个单词的清单,并要求大语言模型制作‘儿童读物’来教授 Phi,”Boyd 说。

他补充说,Phi-3 只是建立在之前迭代所学到的知识之上。Phi-1 专注于编程,Phi-2 开始学习推理,而 Phi-3 更擅长编程和推理。虽然 Phi-3 系列模型能够了解一些常识,但它无法在更大范围的应用场景中击败 GPT-4 或其他大语言模型。

Boyd 表示,公司经常发现像 Phi-3 这样的较小模型更适合他们的定制应用程序,因为对于许多公司来说,他们的内部数据集规模都比较小,而这些使用较少算力的小模型更具性价比。

参考链接

https://www.theverge.com/2024/4/23/24137534/microsoft-phi-3-launch-small-ai-language-model

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

德国再次拥抱Linux:数万系统从windows迁出,能否避开二十年前的“坑”?

谷歌大裁员引发元老集体抗议:领导脑袋空空,无能的中层管理团队不断扩大

系统 bug 致百人入狱,砸了 2.8 亿元仍上云失败!二十年了,这家大企业被日本软件坑惨了

Meta 疯狂卷!继 Llama 3 后,重磅发布MR界的“安卓”操作系统

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理微软推 AI 模型 MAI-1,与 OpenAI 竞争;问界正式回应山西追尾事故;美空军部长亲自体验 AI 战斗机|极客早知道华为重夺中国大陆智能手机市场第一/支付宝推出 AI 办事小助手/Altman 称 GPT-5 性能远超 GPT-4宇宙人(1506期)Yahsat和Bayanat创建Space42;Kimi访问量已超文心一言;微软推出Team Copilot5亿参数“小模型”如何超越千亿级参数大模型GPT-3.5?曝苹果与百度洽谈,iPhone或使用文心大模型/ 小米SU7第二批交付中心候选公布/微软推出首款 AI PCiPhone就能跑!微软推出轻量级模型Phi-3,性能堪比GPT-3.5 Turbo,AI的未来在手机端?国产端侧小模型超越 GPT-4V,「多模态」能力飞升小模型时代来了?微软最小参数AI模型发布,性能逼近 GPT-3.5每秒执行超40万亿次运算!微软推出内置GPT-4o的全新AI PC“硬刚”,苹果将会如何应对?PC市场是否将迎来换机潮?微软发布Phi-3 Mini:3.8B参数小到能塞进手机,性能媲美GPT-3.5小模型性能饱和、表现不佳,根源是因为Softmax?苹果微软两大巨头,扎堆儿发布小模型!真的终端智能快来了!微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了去年今日此门中----谷歌微软的神奇可怕记忆向Redis宣战?微软开源Garnet,性能提升几十倍!GPT-4o科幻级语音交互,人手一个「Moss」的时代来了 |【经纬低调分享】国内首个开源千亿参数MoE大模型来了!性能超Grok-1,单张GPU可跑苹果加入开源大战,官宣端侧小模型OpenELM!参数2.7亿到30亿一台M2 Mac可跑开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4《扎基拉姆》&《一生的梦》一块钱100万token,超强MoE模型开源,性能直逼GPT-4-Turbo最强开源大模型 Llama 3震撼发布!开源模型将追上GPT-4,4000亿参数模型也在路上Mac不香啦?微软发布第一款GPT-4o加持的WindowsAI早知道|商汤发布日日新5.0大模型;微软推出小语言模型Phi-3;腾讯旗下协作SaaS产品全面接入混元大模型凯特王妃曾递小纸条求救?!网友挖出其最后一次出现时的细节!伦敦煤气泄漏致数千人撤离......拜登祭出其最严移民令,或关闭庇护申请《疏影横斜水清浅》时隔一年Falcon回归!110亿参数5.5万亿token,性能超越Llama 3逼近GPT-4的新模型发布!「欧洲版OpenAI 」联手微软,却被质疑违背初心端侧模型 OctopusV3 发布:手机上的超级助理,性能媲美 GPT-4V 和 GPT-4 的组合?2024神奇魔幻哥伦比亚(一)波哥大:盐矿大教堂奥特曼昨晚放话也要把大模型价格打下来!微软一夜革新生产力:Copilot 贯穿全场、小模型持续炸街父亲与京华火腿GPTGPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。