OpenAI 联创 Ilya 离职内幕曝光;微软中国AI团队集体打包去美国?最新回应;华为回应大模型发布会演示造假 | AI周报
整理 | 傅宇琪、褚杏娟
5 月 15 日,OpenAI 联合创始人 Ilya Sutskever( 伊利亚·苏茨基弗)在社交平台上发文表示,决定离开 OpneAI。几个小时后,OpenAI 超级对齐团队的负责人 Jan Leike(扬·莱克)也宣布离职。
值得注意的是,Jan 连发 13 条推文,自曝离职的真正原因,以及更多内幕。一来算力不够用,承诺给超级对齐团队的 20% 缺斤少两,导致团队逆流而行,但也越来越困难。二来安全不重视,对 AGI 的安全治理问题,优先级不如推出“闪亮的产品”。
还有更多的八卦被其他人挖出来,比如 OpenAI 离职成员都要签一份协议,保证离职后不在外说 OpenAI 坏话,不签的话视为自动放弃公司股份。但仍然有拒不签署的硬骨头出来放猛料,说核心领导层对安全问题优先级的分歧由来已久。去年宫斗至今,两派的观念冲突到达了临界点,这才看上去颇为体面地崩了。因此,尽管奥特曼已经派了联合创始人来接管超级对齐团队,仍旧不被外界看好。
据消息,近日微软总部下发邮件,通知中国区负责人工智能研究多个精英团队,如 C+AI 团队做 AI 平台的 Azure ML 团队等,整体搬迁至美国或澳大利亚,涉及员工或达数百人,收到邮件的员工需要在 6 月 7 日前做决定,也可选择拿离职补偿,选择搬移的员工可以带家人小孩,微软美国还可帮助解决家属签证。
不少微软员工发布动态称确实收到了邮件。有微软内部人士表示,“据了解是部分员工收到可选的内部调动机会,调整不影响在国内的运营。”该消息在员工内部引起广泛热议,有发帖找 C+AI 组对象的,有愁已经在国内安家的,也有认为是变相裁员的。曾经的微软中国,项目边缘化严重,很多员工吐槽自己是美国的外包。
对上述消息,微软中国区最新回应表示,微软亚太研发集团有一小部分员工得到可以选择国际轮岗的机会,员工可以选择接受轮岗,或者继续在现在的岗位工作。此前“打包赴美”传闻有夸张及不实之处。
值得注意的是,最近几年,微软大力投资人工智能的时候,在 AI 前沿技术领域,却对中国团队单独设置了限制。位于北京的微软亚洲研究院的微软员工,不能像微软在其它国家分部的同事那样能提前使用 OpenAI 的 ChatGPT4 的测试版和核心技术,不能接触量子计算、人脸识别、合成媒体等领域的关键技术。
网传图片显示,华为在 5 月 10 日举行一场发布会上展示大模型文生图能力时,演示过程中因为运行时按下 Ctrl-C 中断,显示出了一段“time.sleep (6)”代码。有人指出,这段代码意味着“人为控制从输入到输出,过程 6 秒钟”,也就是说“等待 6 秒之后输出一张本地图片”,因此有人怀疑其图文结果并非大模型生成。此话题一出,立刻激起了一场关于真实性和技术能力的讨论。
针对网传发布会演示造假一事,华为在昇腾社区发表了官方回应:现场图片为实时生成,调用的是开源大模型。代码中有 time.sleep (6) 等表述,是命令等待读取外部开源大模型实时生成的图片,并非调取预置图片。本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者使用并提出宝贵建议。
有部分观点认为,这是华为在高科技发布会上的造假行为,指责华为利用 time.sleep (6) 来模拟 AI 计算的过程,实际上是在展示预先准备好的结果。对此,技术专家提出了不同的看法。一些专家认为, time.sleep (6) 可能是为了确保程序在演示过程中不会出现意外情况,而预设的一个缓冲步骤。这样的做法在技术演示中并不少见,目的是为了展示过程的平稳和可控。也有专家指出,大模型的计算和生成过程确实需要时间,而 time.sleep (6) 可能是为了展示模型计算的实际耗时。
在用 AI 重构百度一年后,百度交出 2024 年第一季度业绩。财报显示,该季度百度总营收 315 亿元人民币,同比增长 1%,归属百度的净利润为 54.48 亿元,同比减少 6%。在非美国会计准则下归属百度的净利润 70.11 亿元,同比增长 22%。财报显示,百度核心收入为 238 亿元,同比增长 4%。其中核心的在线营销收为人民币 170 亿元,同比增长 3%;非在线营销收入为人民币 68 亿元,同比增长 6%,这主要由智能云业务带动。
在财报后的电话会议中,李彦宏透露百度智能云在本季度营收达 47 亿元,同比增长 12%,并持续实现盈利 (Non-GAAP)。同时,生成式 AI 贡献的收入比例达 6.9%,占比逐步扩大。李彦宏还强调,模型推理是最重要的长期机会之一,将成为云业务的关键驱动力。
围绕 AI 商业化落地,据他透露,继上季度与中国三星、荣耀合作后,本季度,小米、OPPO、vivo 等手机厂商均接入文心大模型 API。大模型的合作领域还在从手机向 PC 和电动汽车领域拓展,联想和蔚来汽车也在季度内与达成合作。李彦宏表示,向智能设备的拓展,为文心大模型被更大规模用户采用提供了充足机会。
同时,京东也发布了 2024 年第一季度财报。财报显示,一季度京东实现营收 2600 亿元,同比增长 7.0%;其中,商品收入中的日百品类在上季度的基础上恢复快速增长,收入同比增速达到 8.6%;服务收入达到 515 亿元,同比增长 8.8%;物流及其它服务收入同比增长 13.8%,继续保持强劲增长势头。截至一季度末,京东的供应链基础设施资产规模达到 1541 亿元,同比增长 12%。自 2017 年集团全面向技术转型以来,京东已经投入近 1300 亿元用于技术研发。
此外,阿里巴巴发布 2024 财年第四季度及全年财报。财报显示,阿里巴巴 2024 财年收入达 9411.68 亿元,经调整 EBITA 利润同比增长 12% 至 1650.28 亿元。四季度营收 2218.74 亿元,同比增长 7%;调整后净利润 244.2 亿元,同比下滑 11%。本季度,淘宝天猫 GMV 双位数增长,阿里云核心公共云产品收入双位数增长、AI 相关收入三位数增长,海外电商实现 45% 的同比强劲增长。
五一假期之后,理想内部正在进行新一轮全公司的人员优化,整体优化比例超过 18%。2023 年财报显示,理想汽车近 3.16 万人,同比增长 63%。按照优化比例来计算,这轮优化涉及超过 5600 人。具体而言,销售服务运营部门优化超过 400 人,招聘部会从原来的 200 多人缩减至 40-50 人,智驾团队会缩减至 1000 人以内。
亚马逊公司当地时间 5 月 14 日宣布,亚马逊云科技(AWS)首席执行官 Adam Selipsky(亚当·塞利普斯基)将于下个月离职。该公司表示,高级副总裁 Matt Garman(马特·加尔曼)将于 6 月 3 日起接替塞利普斯基在 AWS 的职位。加尔曼此前负责 AWS 全球销售、市场和服务业务。
在去年 12 月的 AWS reInvent 大会上,加尔曼在接受采访时表示,他对 AWS 近年来在中国取得的进展感到满意。加尔曼告诉记者:“中国是 AWS 非常重要的市场,我们不仅服务有出海需求的中国客户,以及在中国有业务的海外客户,同时也服务在中国开展业务的中国客户,这些客户对我们都同样重要。”
据悉,市场对塞利普斯基突然辞职的消息感到意外。在一封内部信中,塞利普斯基表示,他希望有更多时间陪伴家人,并称“AWS 的前景是光明的”。
5 月 14 日,据媒体报道,马斯克在上月底突然解雇了近 500 名超级充电站团队的员工。然而不久后,特斯拉便开始重新聘用这些员工,包括北美充电业务总监 Max de Zegher(马克斯·德泽格尔)在内的高管,目前尚不清楚具体复聘人数。
超级充电团队主要负责管理和维护特斯拉的充电站,此前马斯克裁掉这个团队让许多人感到意外,因为特斯拉的超级充电站是公司的“金字招牌”,2012 年,特斯拉就推出了第一批超级充电站。现在,特斯拉在全球有 6200 多个充电站,57000 多个充电头。数据显示,去年全球公共充电需求中有 8% 是由特斯拉提供的。
去年,特斯拉还努力推广了它的充电插头成为行业标准,并且与很多大的汽车制造商签订了协议,让更多的电动车可以使用特斯拉的充电网络。尽管如此,这个决定最初受到了很多批评,导致马斯克后来承诺将在今年投资超过 5 亿美元来扩展充电网络,并提高现有充电站的服务质量和运行时间。
此外,这并不是马斯克第一次撤回他的决定。在 2019 年,他曾宣布要关闭大多数特斯拉的实体店并转向在线销售,但因为房东们拒绝解除租约,特斯拉不得不取消这一计划,并且提高了车辆价格。2022 年底,马斯克在推特也有过类似的行为。他一开始解雇了大约一半的员工,然后不久又让一些人回来工作。
5 月 15 日消息,Meta 表示,随着公司将重点转向构建人工智能和元宇宙技术上,该公司将停止其面向工作场所的应用程序 Workplace。该公司表示,Workplace 将从 2026 年 6 月开始对客户停用,但 Meta 将继续将其用作其内部留言板,并补充道,用户可以继续访问该产品,直到 2025 年 8 月。
企业通信应用 Workplace 于 2016 年首次面向企业推出,其新功能包括多公司群组和共享空间,允许来自不同组织的员工一起工作。Workplace 目前为每个用户提供每月 4 美元的核心套餐,该套餐可以通过附加组件进行升级,每个用户每月 2 美元起。除非组织有固定的计划,否则其月度账单是根据可计费用户的数量计算的。
5 月 13 日消息,当当网原 CEO、联合创始人李国庆近日在直播前分享了一个自己享用美食的视频,并附言:“吃好喝好才有动力”,“努力工作快乐生活。”
视频显示,李国庆坐在一个包装箱上,手里拿着盒饭,面前的六个凳子上摆放着超过十种不同的菜肴。背景音乐是《像我这样的人》这首歌曲,歌词中提到“像我这样迷茫的人,像我这样寻找的人”。
网友对此纷纷发表评论:“一个人吃 10 个菜,还是你老李会享受啊!”、“老李,能不能低调一些,一个人吃这么多菜。”、“李总的架子不小,一个人坐着吃,其他人站着伺候。”、“他本意可能是想展示随性地吃盒饭,但菜太多了。”、“六把凳子上的 12 道菜,李总,现在谁才是真正迷茫的人呢?”还有网友质疑他是否在作秀:“旁边明明有桌子,为什么不使用呢?”
5 月 14 日,OpenAI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。GPT-4o 将免费提供给所有用户使用。
OpenAI 首席技术官 Muri Murati(穆里・穆拉蒂) 表示,GPT-4o 将提供与 GPT-4 同等水平的智能,但在文本、图像以及语音处理方面均取得了进一步提升。
“GPT-4o 可以综合利用语音、文本和视觉信息进行推理,”穆拉蒂在 OpenAI 公司总部举行的主题演讲中表示。GPT-4 是 OpenAI 此前的旗舰模型,可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务,GPT-4o 则在此基础上新增了语音处理能力。
GPT-4o 采用了全新的技术,让聊天机器人对话的响应速度大幅提升。发布会上 OpenAI 展示了使用 GPT-4o 进行语音对话的演示。演示者提问结束后,GPT-4o 几乎可以即时回应,并通过文本转语音功能进行朗读,让对话感觉更加自然逼真。
另一个演示展示了 GPT-4o 根据要求调整说话时语气,GPT-4o 可以根据指令改变声音,从夸张戏剧到冰冷机械,展现了出色的可塑性。最后,演示还展示了 GPT-4o 的唱歌功能。
以往,OpenAI 发布新版 ChatGPT 模型时,通常会将其置于付费墙之后。不过这次 GPT-4o 将免费提供给所有用户,付费用户则可以享受五倍的调用额度。
值得注意的是,之前 OpenAI 曾大张旗鼓给 SearchGPT 搜索引擎造势,域名、前端界面都准备就绪,甚至已经有用户收到灰度测试。路透社、彭博社等权威媒体也纷纷收到“消息人士”线报,结果刚把消息发出去,就被官方“打脸”。
知名 OpenAI 爆料者 Flowers from the future(花哥)透露,至少一位他和另一位爆料者 Jimmy Apples(苹果哥)的共同“线人”已经被开除了。许多网友到这里才恍然大悟,用抓内鬼的视角来看,之前的种种离谱突然就合理了起来。
延伸阅读:OpenAI 官宣旗舰模型 GPT-4o,完全免费、无障碍与人交谈!奥特曼:这是我们最好的模型
对此,猎豹移动董事长兼 CEO、猎户星空董事长傅盛发短视频评价道,“所有国内人工智能从业者都在熬夜等着大洋彼岸放核弹,但是没想到核弹没有放,却掏出了一堆摔炮。”
傅盛表示,这样的评论虽然是一句玩笑话,“但比较让人失望的是这次 OpenAI 没有发布 GPT-5.0,连 GPT-4.5 也没有看到,反而是发布了 GPT-4o,就是把一系列的引擎给结合在一起,比如图片、文字、声音,这样你就不需要来回去切换了。”
“OpenAI 这次为了能够让更多的用户使用它,可以说是卯足了劲,一系列的应用,API 降价,GPT 免费,我们当然希望 OpenAI 能够使得这个行业更好的发展,我们也能认真地去学习,这次的发布会真正告诉我们应用大有可为,所有人都应该努力。”傅盛表示。
此外,金沙江创业投资基金主管合伙人朱啸虎评价称,大模型技术迭代曲线明显放缓;开始卷免费,说明 GPT 用户和收入增长已经碰到瓶颈,不深度绑定大厂的模型公司基本已经出局。第三,应用会迅速爆发,推理成本再降一个数量级就会普及出现 AI 时代的国民应用。
北京时间 5 月 15 日凌晨,2024 年谷歌 I/O 开发者大会正式召开。面临来自 OpenAI 和其他竞争对手日益激烈的竞争,Alphabet CEO Sundar Pichai(桑达尔·皮查伊)在主题演讲中展示了谷歌各项业务中如何同 AI 结合在一起,包括增强的 Gemini 聊天机器人和搜索功能的改进。
皮查伊在主题演讲中表示,“AI Overviews”搜索经过长时间的测试,本周将向美国所有用户推出服务,后续会推广到更多国家和地区。AI Overviews 使用 Gemini 大模型来综合信息并回答更复杂的问题,这些问题常常在网络上没有简单的答案。皮查伊说:“我们正处于人工智能平台的非常早期阶段。我们看到创作者、开发者、初创公司都能借此获得很多机会,这就是 Gemini 的意义所在。”
Alphabet 公布了 Gemini Pro 1.5 模型的升级,将上下文窗口(人工智能模型可理解的信息量) 从当前 100 万 tokens 增加到 200 万。这意味着当在一个 prompt 中给出数千页文本或一个多小时的视频时,Gemini Pro 1.5 也能够进行理解,Gemini 1.5 Pro 将面向全球开发者开放。
Alphabet 还推出了 Gemini 1.5 Flash,该模型速度更快,体积更小,部署更加灵活,并支持多模态,旨在降低部署人工智能的成本并加快响应速度。与功能更强大的版本一样,Gemini 1.5 Flash 可以接收大量数据,同时针对聊天应用、视频和图像字幕进行了优化。
延伸阅读:谷歌这次又“杀疯了”!200 万 token 长文本能力问鼎全球最强,一场大会,AI 被提了 120 次
Hugging Face 宣布将提供价值 1000 万美元的免费共享 GPU 资源,旨在支持小型开发者、研究人员及初创公司。这一举措有助于打破大 AI 公司持续增长的市场“集中化”。Hugging Face 致力于创造公平的 AI 技术竞争环境,通过“ZeroGPU”项目向社区捐赠 GPU,以降低进入门槛。
抖音电商正在测试首款 C 端 AI 服务“AI 购物小助手”,由上海团队研发,目的是打造亿级用户的 AI 产品,优化购买体验与业务效率。该产品具有推荐算法,目前处于灰度测试阶段,与淘宝问问类似,提供消费决策辅助。AI 电商尚处初期,其成为购物主流还有待观察。
5 月 14 日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。升级后的混元文生图大模型采用了与 sora 一致的 DiT 架构,不仅可支持文生图,也可作为视频等多模态视觉生成的基础,支持中英文双语输入及理解,参数量 15 亿。这也是业内首个中文原生的 DiT 架构文生图开源模型。
AGI 概念引发热议。那么 AGI 究竟是什么?技术架构来看又包括哪些?AI Agent 如何助力人工智能走向 AGI 时代?现阶段营销、金融、教育、零售、企服等行业场景下,AGI 应用程度如何?有哪些典型应用案例了吗?以上问题的回答尽在《中国 AGI 市场发展研究报告 2024》,欢迎大家扫码关注「AI 前线」公众号,回复「AGI」领取。
今日荐文
26岁带着百人团队冲刺大模型,面壁智能天才CTO:高效比参数更重要
你也「在看」吗?👇
微信扫码关注该文公众号作者