Redian新闻
>
微软秘密开发首个千亿大模型,竟由OpenAI对手操刀!网友:你不要奥特曼了?

微软秘密开发首个千亿大模型,竟由OpenAI对手操刀!网友:你不要奥特曼了?

公众号新闻
整理 | 华卫

Phi-3 Mini 模型发布不到两周,微软又传出了自研千亿参数级别模型的消息。

自向 OpenAI 投资超 100 亿美元以换取重用其人工智能模型的权利以来,微软首次开始在内部自研全新且足够大的人工智能模型,或能与来自谷歌、Anthropic 和 OpenAI 的最先进模型相竞争。

这个新模型在内部被称为 MAI-1,由前谷歌人工智能领导者、 AI 初创公司 Inflection 的 CEO 穆斯塔法·苏莱曼 (Mustafa Suleyman) 负责监督。知情人士称,MAI-1 的参数规模将远远大于 Phi-3 等任何微软之前训练过的较小的开源模型。但这意味着,它将需要更多的计算能力和训练数据,因此成本会更高。

同时,微软此举表明,其现在正在人工智能领域追求“双重轨道”,目标是开发既可以廉价地构建到应用程序中又可以在移动设备上运行的“小语言模型”,以及更大、最先进的人工智能模型。苹果目前似乎也正在探索类似的路径,此前同样也发布了八款针对设备使用的小型 AI 语言模型。

5000 亿参数级别
最早或于本月亮相

据介绍,MAI-1 将有大约 5000 亿个参数或设置,可以调整这些参数或设置以确定模型在训练期间学习的内容。相比之下,OpenAI 的 GPT-4 有超过 1 万亿个参数,而 Meta 和 Mistral 等公司发布的小型开源模型有 700 亿个参数。

这表明,MAI-1 可以定位为 GPT-3 和 GPT-4 之间级别的一种模型,该模型将能够提供远远高于 Llama 和 Mistral 等开源模型、但或低于 OpenAI 旗舰版 LLM 的响应精度。

为了训练该模型,微软一直在分配大量配备 Nvidia GPU 的服务器,并编译各种来源的训练数据,包括 OpenAI 的 GPT-4 生成的文本和公共互联网数据,还可能会使用来自 Inflection 的训练数据和某些其他资产来支持 MAI-1。

目前,MAI-1 的确切用途尚未确定(即使在微软内部),其最理想的用途将取决于其性能。如果该模型确实具有 5000 亿个参数,那么在消费类设备上运行就太复杂了。这意味着,微软很可能会在其数据中心部署 MAI-1,在这里大语言模型可以集成到 Bing 和 Azure 等服务中。

微软可能最早在本月晚些时候的 Build 开发者大会上,根据未来几周取得的进展亮相 MAI-1。

MAI-1 的研发是基于 Inflection?

“尽管 MAI-1 是一种全新的、与 Inflection 之前发布的 Pi 分开的大型语言模型 ,但其可能建立在前 Inflection 员工带来的技术之上。”据两名了解情况的微软员工称。

从 OpenAI 官网的一份声明来看,Inflection 曾是 OpenAI 的竞争对手,但它现在把业务重点从聊天机器人 Pi 转向了向企业销售人工智能软件。曾担任过各种技术职务的肖恩·怀特 (Sean White) 已加入该公司,担任新任 CEO。

今年 3 月,微软以 6.5 亿美元收购了这家初创公司的大部分员工和知识产权,并聘请苏莱曼来领导一个新的消费者人工智能部门。该部门将面向消费者的产品(包括微软的 Copilot、Bing、Edge 和 GenAI)归入一个名为 Microsoft AI 的团队,而苏莱曼直接向 Microsoft 首席执行官萨蒂亚·纳德拉(Satya Nadella)汇报工作。

新部门标志着 Microsoft 的重大组织转变,其网络服务总裁 Mikhail Parakhin 将与他的整个团队一起向苏莱曼汇报工作。这也是微软利用生成人工智能热潮的最新举措之一。

纳德拉在一份声明中说:“我认识穆斯塔法已经好几年了,我非常钦佩他作为 DeepMind 和 Inflection 的创始人,以及一个有远见的产品制造商和追求大胆使命的开拓团队建设者。”

DeepMind 于 2010 年在英国成立,2014 年被谷歌以 5 亿美元收购,苏莱曼是该公司的三位创始人之一。在 DeepMind 就职时,苏莱曼曾因员工抱怨其咄咄逼人又过于激进的管理风格引发争议,于 2019 年被迫离开 DeepMind。之后谈到当时的员工投诉时,苏莱曼回应说:“我真的搞砸了。我要求很高,而且相当无情。我设定了一些相当不合理的期望,导致一些人的工作环境非常恶劣。我对此感到非常遗憾。”

几个月后,他转到谷歌总部,负责领导人工智能产品管理和政策。2022 年,他从谷歌离职,加入了硅谷风险投资公司 Greylock,并于当年晚些时候推出了 Inflection。

据悉,微软还将聘用 Inflection 的大部分员工,Inflection 的联合创始人兼首席科学家 Karén Simonyan 也将担任其 AI 团队的首席科学家。虽然微软没有明确调动的员工人数,但表示其中包括人工智能工程师、研究人员和大型语言模型构建者,他们设计并共同完成了“过去五年中为推动人工智能发展做出的许多最重要贡献”。

Inflection 的第三位联合创始人、LinkedIn 创始人兼执行主席 Reid Hoffman 将继续留在 Inflection 的董事会。

去年 6 月,Inflection 还完成 13 亿美元的一轮融资,由微软、英伟达和三位亿万富翁(Reid Hoffman、Bill Gates 和 Eric Schmidt)牵头投资。当时,微软首席技术官 Kevin Scott 还表示,“像 Inflection 这样雄心勃勃的人工智能公司,正在凭借易于使用并展示人工智能多种可能性的变革性产品引领行业发展。”

结束语

微软开发 MAI-1 大模型,也凸显了其试图独立于 OpenAI 等人工智能厂商去探索 AI 开发的意愿。

此前,微软一直致力于在其 Windows、Office 软件和网络安全工具等产品中推出人工智能助手,但多采取与外部企业合作的方式。

去年,微软向 ChatGPT 的制造商 OpenAI 投资了 130 亿美元,并将其技术快速集成到产品和数字体验中。目前,OpenAI 的技术为微软的许多生成式 AI 功能提供支持,包括 Azure、Copilot 和内置 Windows 的聊天机器人。

微软还投资了其他人工智能初创公司,包括向法国人工智能初创公司 Mistral AI 投资 20 亿欧元(约合 21 亿美元),将 Mistral AI 的大型语言模型(LLM)在 Azure 云计算平台上进行托管。

今后,这一切可能都会有所变化,微软或将开始推动自研大模型在各产品中的应用。据悉,苏莱曼领导的部门将接手把 AI 版本的 Copilot 集成到 Windows 操作系统中,以及开展增强生成式 AI 在其 Bing 搜索引擎中的使用等项目。

“微软正参与一场 AI 竞赛”,微软的一位 AI 工程师在前不久说,但在道德和保障方面,微软为速度走了捷径,匆忙推出产品而没有充分考虑接下来会发生什么。所有大型科技公司都可以访问大部分相同的数据,AI 领域没有真正的护城河。

参考链接:

https://tech.slashdot.org/story/24/05/06/1437231/microsoft-readies-new-ai-model-to-compete-with-google-openai

https://arstechnica.com/information-technology/2024/05/microsoft-developing-mai-1-language-model-that-may-compete-with-openai-report/

https://www.ft.com/content/5feedf3a-ff7a-4c89-9b1d-f9b48834ff4c

https://siliconangle.com/2024/05/06/microsoft-reportedly-developing-mai-1-llm-500b-parameters/

内容推荐

探索智能科技的新边疆,《2024 年第 1 季度中国大模型季度监测报告》正式发布!OpenAI Sora 大模型和 NVIDIA Project GR00T 的发布、人形机器人的突破以及编码智能体的到来,正开启 AI 大模型的新纪元。在开源与闭源并行的新趋势中,AIGC 写作和 PPT 制作工具的测评展示了 AI 在内容创作和视觉呈现上的巨大潜力。InfoQ 研究中心邀您一同见证 AI 浪潮如何塑造未来🚀。欢迎大家扫码关注「AI 前线」公众号,回复「季度报告」领取。

 活动推荐

AICon 全球人工智能开发与应用大会 暨 大模型应用生态展将于 5 月 17 日正式开幕,本次大会主题为「智能未来,探索 AI 无限可能」。如您感兴趣,可点击「阅读原文」查看更多详情。

会议即将开幕,购票或咨询其他问题请联系票务同学:13269078023,或扫描上方二维码添加大会福利官,可领取福利资料包。


今日荐文


26岁带着百人团队冲刺大模型,面壁智能天才CTO:高效比参数更重要


前 LangChain 员工爆料更强的 Devin 2.0 要来了?所以,“世界首个AI程序员”到底造假没?


李飞飞首次创业:瞄准空间智能;巴菲特股东大会谈AI:与核武器相似;69岁比尔·盖茨被曝主导微软OpenAI联姻 | AI 周报


你也「在看」吗?👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
奥特曼小作文否认OpenAI离职霸王条款,网友:他有前科奥特曼突然变身OpenAI “安全卫士”!网友:刚被实锤不关心安全还“心理虐待”,谁信啊那些花儿OpenAI首席科学家宣布离职,曾参与驱逐CEO奥特曼;马斯克称OpenAI最新模型“慢得离谱”丨AIGC日报天际婚姻与家庭的消亡OpenAI神秘gpt2正在A/B测试,奥特曼抢先剧透,网友已玩嗨这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单面对质疑,奥特曼终于公开了OpenAI 前沿大模型安全架构OpenAI神秘搞事,GPT-4.5默默上线?推理碾压GPT-4网友震惊,奥特曼笑而不语奥特曼在闭门会中说,OpenAI有责任创造更好一个的世界!背后却有大问题!成也奥特曼, 败也奥特曼的IPOOpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型神秘大模型一夜爆红!奥特曼亲自确认,疑似GPT-4.5发布OpenAI被曝帮苹果Siri换脑,微软急了:CEO约谈奥特曼32岁浙大医生潘博文猝死!死因为生病后打篮球,家人到球场送别!再回首 (十二)刚刚,微软掀起生产力革命!GPT-4o 重塑 Windows,奥特曼登场剧透新模型奥特曼28亿「投资帝国」曝光!不要OpenAI股份,当CEO最不赚钱老黄亲自上门送超算!OpenAI奥特曼签收后到斯坦福演讲GPT-5AI早知道|元象开源首个多模态大模型XVERSE-V;信通院发布国内首个汽车大模型标准宫西达也联名奥特曼——《我的爸爸是奥特曼》新书来啦!微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!Llama 3每秒输出800个token逼宫openAI!下周奥特曼生日或放出GPT-5?奥特曼重新加入 OpenAI 董事会;比特币突破 7 万美元大关;苹果中文官网出现 Vision Pro|极客早知道OpenAI陷史上最大危机!奥特曼否认霸王条款急推背锅侠,网友:他撒谎成性产能提高!这一技术在我国首个千亿方大气田成功应用神秘大模型一夜刷屏,能力太强被疑GPT-4.5,奥特曼避而不答打哑谜奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了拜登召集奥特曼和李飞飞等入AI安全委员会,没带马斯克!库克考虑将iPhone AI服务委托给OpenAI奥特曼昨晚放话也要把大模型价格打下来!微软一夜革新生产力:Copilot 贯穿全场、小模型持续炸街微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!定制Copilot十亿打工人狂欢微软颠覆生产力:Copilot推自定义版,AI PC原生支持PyTorch,奥特曼预告新模型微软加速AI生产力革命!GPT-4o 重塑 Windows,奥特曼“意外闪现”爆料下一个重要模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。