微软加速AI生产力革命!GPT-4o 重塑 Windows,奥特曼“意外闪现”爆料下一个重要模型
北京时间5月22日凌晨,微软 Build 2024 开发者大会在美国西雅图召开,首席执行官萨提亚·纳德拉高举高打地强调了微软半个世纪的两个梦想:
「三十多年来,微软对于计算机一直有两个梦想 —— 首先是让计算机理解我们,而不是我们去理解计算机;其次,在信息不断增加的世界中,让计算机帮助我们根据信息有效地进行推理、计划和行动。」
(图源网络)
纳德拉认为,这一波生成式人工智能就是实现梦想的答案。所以,今年的Build大会,微软一口气发布60种新产品和解决方案,且一切都与AI有关,涉及云基础设施、办公工具、操作系统、开源平台等,以及自研小语言模型Phi-3和芯片,并宣布多项合作。与其说这是微软的年度开发者大会,不如说,这是微软2024 年大型人工智能计划公布现场。
作为微软进入AI时代最重要的合作伙伴,OpenAI CEO SamAltman毫无意外地现身现场,奥特曼透露,OpenAI下一个模型关键在于新的模态和整体智能,并预计新模型将会变得更智能、更强大、更好用、更安全。
工信部工业文化发展中心工业强国“尚工”行动企业家培育第三期正在火热招募!将【走进小米与京东】,欢迎点击蓝字链接加入
走进北京标杆企业(京东、小米),探秘企业创新管理!工信部工业文化发展中心工业强国“尚工”行动企业家培育计划第三期正在火热招募
Windows史上最强版本
Copilot+ PC发布
这个PC具备许多独特功能。例如,通过即时Recall功能,可以轻松查找并记住PC中看到的所有内容;使用Cocreator可以实时生成和优化AI图像;通过实时字幕功能,能够将40多种语言的音频翻译成英语。
每台Copilot+ PC都配备了强大的AI Agent,只需轻点键盘上的Copilot按键即可快速交互。未来几周内,用户将获得包括OpenAI GPT-4o在内的最新模型,进行更自然的语音对话。
在Windows系统界面中,任何东西都可以拖动到Copilot窗口,让AI快速解释,如天气现象。控制面板里有Copilot帮你修改设置的按钮,图片文件的菜单里有一键修图功能。
打开Copilot玩《我的世界》,AI甚至能直接告诉你如何建设,怎么躲避僵尸,像老玩家一样手把手地教你。
微软的Copilot+ PC引入了全新的系统架构,将CPU、GPU和高性能神经处理单元(NPU)的强大功能结合在一起。通过连接Azure云中的大型语言模型(LLM)和小型语言模型(SLM),Copilot+ PC达到了前所未有的性能水平。
AI工作负载能力增强了20倍,效率提高了100倍。Copilot+ PC在多线程性能方面比Apple MacBook Air 15英寸高出58%,电池续航时间可达一整天。一次充电可支持22小时本地视频播放或15小时网页浏览。
凭借高通Arm处理器和GPT-4o模型,Copilot+ PC解锁了诸多新办公体验。其NPU处理速度为40+ TOPS,是MacBook Air和MacBook Pro的两倍性能。
Copilot+ PC利用强大处理器和多个先进AI模型,为用户带来全新体验,并可以本地运行,消除延迟、成本和隐私问题,提高工作效率、创造力和沟通效率。
(图源网络)
奥特曼站台,称新模型
关键在于新的模态和整体智能
微软CTO兼人工智能执行副总裁凯文·斯科特(Kevin Scott)则在演讲中宣布了微软与电商公司Etsy、AI公司Cognition、可汗学院(Khan Academy)等合作。
“我们正在经历一个非凡的平台浪潮,技术领域正在发生根本性的改变,就像我们经历PC革命时一样,摩尔定律推动了个人计算能力的惊人增长和成本的降低,使其变得无处不在,类似的事情也发生在互联网革命中。”斯科特表示,现在也正在经历一个重大的技术变革,AI能力正因更多的计算和更多的数据而惊人扩展。
同时,他认为,AI模型能力还远远没有达到效益递减点,因为计算规模还在增长,微软正在建立更大的超级计算机来训练新的大模型,并努力使当前一代模型更加高效。他提到,在GPT-4推出后不到一年半的时间里,调用GPT-4o比原始模型便宜12倍,速度则提高了6倍。
作为OpenAI最大的投资方,微软在2020年为其构建了第一个AI超级计算机,从而训练出GPT-3。“那个规模像鲨鱼一样大,然后我们在2022年交付的系统,规模上约像虎鲸,它训练了GPT-4。我们刚刚部署的系统,规模上是类似鲸鱼的超级计算机。”斯科特表示。
这款超级计算机将继续训练OpenAI的新模型。OpenAI首席执行官山姆·奥特曼也作出嘉宾出席,并与斯科特就GPT的发展和下一步计划进行了交流。
(图源网络)
奥特曼表示,数百万开发者是推动过去一年里世界巨变的核心,从未见过一项技术以如此有意义的方式迅速地被采纳,因此API很重要。“我们在考虑什么才是一个好的API,无论对任何产品,任何服务去添加智能,要让这变得非常容易。”奥特曼表示,未来的模型只会变得更智能、更强大、更有用、更安全。“这种惊人的涌现属性,将继续发生,而且每次智能的提升都会非常显著。”
他认为,在考虑下一个模型时,速度和成本很重要,新的模态也很重要,语音模式是一个真正的惊喜,但整体智能将是最重要的事情。“这听起来像是最无聊、最陈词滥调的事情,但我认为它实际上比听起来要深刻得多。”
对于AI系统安全,奥特曼提到,现在对GPT-4已经习以为常,但它远非完美,还有更多工作要做,不过它通常被认为足够鲁棒和安全,可以用于各种用途。
奥特曼在交流中强调了安全的重要性,认为大模型的对齐和安全必须建立不同团队,从研究和模型的创建到安全系统的构建,到弄清楚政策,到如何进行监控,是一项巨大的工作量,但这是能够部署和使用必须要做的事,并称对团队所做的工作感到非常自豪。
“随着模型变得更加强大,当我们朝着AGI前进时,我们将不得不弄清楚许多新事物,所需的新研究将会增加。”奥特曼表示,相信会做到,而且这是将大模型投入世界的一个门槛。
斯科特还让奥特曼对开发者和创业者提出建议。“这可能是最激动人心的时刻,去构建一个产品,去做一个创业公司。”奥特曼认为,这将是自从互联网以来,甚至可能是比互联网还要巨大的机会。
他表示,通过去构建新东西,有望真正地改变格局,现在看起来是一个真正的平台转变期。“这是一个特殊的时刻,几年内将会发生很多事情,很多伟大新事物将会开始。”
奥特曼提出的第二个建议是,AI本身作为新的推动者,它并不会自动打破商业规则,所以要利用它去做新的东西,但仍然需要弄清楚将如何在要做的任何事情中构建持久的价值。“在淘金热的兴奋中,很容易忽视这一点。”
地表最强模型GPT-4o加持,
新Phi-3-vision目标端侧
OpenAI的最强模型GPT-4o,被官宣可在Azure AI Studio中使用,也可作为API使用。
微软开发的AI小语言模型(SLMs)Phi-3 系列也发布了一款新的多模态模型——Phi-3-vision,并已可在 Azure 中使用。这是一款具有42亿参数的多模态小模型变种,能够支持通用视觉推理任务以及图表、图形和表格的推理。
随着AI技术的本地化部署趋势,开发者们正在寻求更高效、更小型的AI模型。市场上的选择日益丰富,除了微软的Phi-3,还有谷歌的Gemma 2和Hugging Face的Zephyr等。微软的Phi-3系列提供了三种不同规模的模型:Phi-3-mini(38亿参数)、Phi-3-small(70亿参数)和Phi-3-medium(140亿参数)。微软宣称,Phi-3的性能与OpenAI的GPT-3.5相当,但更为轻量级。
(图源网络)
Phi-3的发布时机恰逢AI个人电脑时代的到来,开发者们现在可以利用Phi-3的不同变体,将他们的AI产品带入笔记本电脑、移动设备和可穿戴设备,为用户带来更加丰富和便捷的智能体验。
开发者可在 Azure AI Playground 中体验这些最先进的前沿模型,并能在 Azure AI Studio 中开始构建和定制模型。
官宣AMD、英伟达合作
更多惊喜
1、Edge浏览器实时视频翻译功能
微软的 Edge 浏览器配备了人工智能驱动的实时视频翻译功能,可以为 YouTube、LinkedIn、Reuters和 Coursera 等网站的视频配音。该功能适用 于多种语言,提供从西班牙语到英语的翻译,反之亦然,或者从英语到德语、印地语、意大利语和俄语的翻译。微软表示该功能“即将推出”,未来将添加更多语言和视频平台。
2、在Teams中使用自己创造的Emoji
微软正在其 Teams 通信平台中添加一项新功能,使用户能够上传自己的自定义表情符号以在反应和消息中使用。微软在周二的 Build 开发者大会上宣布,新的自定义表情符号将于下个月通过 Teams 公共预览版提供试用,其目标是帮助 Teams 用户协作并“更有创意、更真实地”表达自己。
使用 Teams 的企业的 IT 管理员将能够限制哪些用户可以上传或删除自定义表情符号,或者他们可以完全关闭该功能。将自定义表情符号上传到 Teams 后,它们将仅在同一组织域中可见。微软表示,自定义表情符号预计将于今年 7 月的某个时候全面上市。
(图源网络)
3、高通版“Mac Mini”
高通公司刚刚推出了一款类似 Mac Mini 的盒子,表面上是专为开发人员设计的,售价 899.99 美元,配备了高通最强大的骁龙 X Elite 芯片系列(4.6 TFLOP GPU),以及 32GB 的 LPDDR5x RAM、512GB 的 NVMe 存储和大量端口,其体积与苹果的迷你台式机大致相同。
4、Windows 现在具有人工智能驱动的复制和粘贴功能
(图源网络)
微软正在为 Windows 11 的 PowerToys 添加AI粘贴功能,可以帮助人们通过复制一种语言的代码并将其粘贴到另一种语言中来加快工作流程。
Advanced Paste 包含在 PowerToys 版本 0.81 中,一旦启用,可以使用特殊的键命令激活:Windows 键 + Shift + V。这将打开一个高级粘贴文本窗口,提供粘贴转换选项,包括纯文本、markdown 和 JSON。
又是一个量大管饱的发布会,但是开发者和创业者如何才能从这些新技术、新产品、新服务中构建自己的价值,可能还是一个无比艰巨的任务。能否淘到“真金”,比拼的可不仅仅是胆识。
活动预告
微信扫码关注该文公众号作者