Stability CEO自己跑路:没董事会控制权;月之暗面Kimi火爆至宕机,已扩容5次;王小川怼李彦宏:活在幻觉中|AI周报
整理 | 傅宇琪、褚杏娟
据报道,百度创始人李彦宏不止一次对外说过:百度的 AI 很牛。去年文心一言出来后,李彦宏还说过,文心一言和 ChatGPT 的差距可能在一到两个月左右,差距不大。对此,原搜狗创始人,现百川智能创始人王小川近日在接受采访时犀利吐槽:李彦宏很魔幻主义,去年 2 月就喊出比 OpenAI 只差两个月,已经够有幻觉了。有意思的是,这篇文章发出后不久就被修改,魔幻主义被改成了幻觉主义。
王小川认为,李彦宏不仅对 GPT 有误解,对自己的产品有误解,对国内模型也有误解,活在自己的幻觉中,并质疑李彦宏从团队接收的信息有问题。去年年初,在被问及怎么看待李彦宏说文心一言和 OpenAl 差距可能在两个月左右的问题时,王小川就表示:怎么可能只差两个月,李彦宏可能活在平行宇宙。
当地时间 3 月 19 日上午,针对有媒体援引黄仁勋关于英伟达最新一代 AI 芯片 Blackwell 的定价在 3 万至 4 万美元,黄仁勋表示:“我只是试图让大家对我们产品的定价有一定的感受,而并不打算给出具体的报价。因为根据每一个客户的需求,不同系统的价格差异是很大的,英伟达并不销售芯片,我们售卖的是数据中心。”
英伟达的市值从 1 万亿美元到 2 万亿美元仅仅用了 9 个月时间,对于市值在短期内的飙升是否合理,黄仁勋也作出回应。他表示:“全球数据中心的市场规模在去年就达到 2500 亿美元左右,并仍在以每年 20 % 至 25 % 的速度增长,这主要是由于 AI 方面的需求。英伟达会在这 2500 亿美元的市场中占据重要的份额,这也从一定程度上解释了为何我们的市值会在这么短的时间内从 1 万亿美元升至 2 万亿美元,我认为这是合理的。”
据最新消息,Stable Diffusion 核心研究团队已集体辞职。名单包括研究团队领导、论文一作 Robin Rombach (罗宾·隆巴赫),共同一作 Andreas Blattmann(安德烈亚斯·布拉特曼),以及另一位作者 Dominik Lorenz(多米尼克·洛伦茨)。尽管当事人尚未回应离职原因,但《福布斯》爆料:Stability AI 正因入不敷出且融不到新资金而陷入困境。
知情人士透露,离职消息由 Stability AI 首席执行官 Emad Mostaque(埃马德·莫斯塔克)在内部全体会议上亲自宣布。Stable Diffusion 项目最初来自慕尼黑大学和另一家 AI 创业公司 Runway 。Stability AI 是项目“金主”,为该项目提供了计算资源。2022 年,上述几位论文作者加入 Stability AI 。据悉,就在今年 2 月,Stability AI 还更新了 SD 的最新版本—— Stable Diffusion 3。
而就在周六上午,Stability AI 突然发布一项公告,宣布 CEO 莫斯塔克辞职。第一时间,莫斯塔克在社媒平台 X 上宣布,自己离职后将致力于去中心化人工智能(DecentralizedAI)。此外,莫斯塔克给出了一些解释:“他在 Stability AI 的股份占了公司的多数投票权,但董事会控制权又不在自己手中。AI 权力的集中对所有人来说都不好,因此自己决定辞职。”他还表示,随着人工智能变得越来越重要,我们应该对人工智能进行更加透明和分布式的治理。
看来,就像此前 OpenAI 赶走萨姆·奥特曼一样,这次又是董事会的锅?
延伸阅读:核心研发跑路、资金困难,估值 10 亿美元的 Stability AI 怎么了?
3 月 19 日下午,小米集团在港交所发布了 2023 年第四季度和全年的财报。这份财报显示,截至 2023 年 12 月 31 日,小米集团共有 33627 名全职员工,其中 31537 名位于国内,在北京总部和印度等地设有办事处。此外,小米研发人员总计达 17800 人,涉及多个部门。
薪酬方面,小米表示向员工提供了具有竞争力的薪资待遇。截至 2023 年 12 月 31 日,小米共向 11861 名员工支付了以股份为基础的奖励,并且其薪酬开支总额(包括以股份为基础的薪酬开支)为人民币 189 亿元,较 2022 年的 166 亿元增长了 14.1 %。如果上述开支仅包含正式员工的话,那么 2023 年小米正式员工的平均薪资高达 56.2 万元。
3 月 19 日,据媒体获悉,有字节员工已经收到飞书通知,要求对 2023 年年终奖金的发放方式做出确认,通知显示:员工可以选择三种奖金发放方式,奖金可以全现金、现金 + 期权 / RSU 、全期权 / RSU 形式发放。
今年 1 月 18 日,字节跳动曾发布全员邮件,更新绩效和激励政策。变化主要方向是:加快期权归属节奏,加大激励力度,让绩效好的员工获得更好的回报。字节跳动还宣布对薪酬结构进行调整,将原来年终奖月数大于 3 的薪酬方案统一调整为 3 个月。针对这部分员工:总包不变,月薪上升。
3 月 20 日消息,日前有 vivo 前员工在小红书平台发帖感谢 vivo 称,离职将近大半年,突然收到年终奖,还称相比去年有涨幅,此外,主动离职也给了 N+1 补偿。在小红书、微博平台上的相关评论区,有网友对此表示质疑,不过也有自称前 vivo 员工的网友表示属实。
部分网友表示自己公司年底前离职都没有年终奖,即使是央企离职年底也一分钱都没给。还有一些应该同样也是 vivo 的员工证实了该网友的说法。有人称自己校招试用期满工资,最后还能拿半年的年终奖。同时有网友也确认,只要从 vivo 离职,都能获得 N+1 的补贴。
3 月 18 日,通用人工智能创业公司——月之暗面(Moonshot AI)宣布在大模型长上下文窗口技术上取得新的突破,Kimi 智能助手已支持 200 万字超长无损上下文,并于即日起开启产品内测。据了解,Kimi 智能助手是月之暗面(Moonshot AI)基于自研千亿参数大模型打造的对话式 AI 助手产品,在 2023 年 10 月发布时支持约 20 万汉字无损上下文输入,创造了消费级 AI 产品所支持的上下文输入长度纪录。
3 月 21 日下午,月之暗面旗下大模型应用 kimi 的 APP 和小程序均无法正常使用。月之暗面宣布,自 20 日以来,Kimi 的系统流量持续异常增高,流量增加的趋势远超预期规划。这导致了从 2024.3.20 10:00:00 开始,有较多的 SaaS 客户持续的体验到 4 29:engine is overloaded 的异常问题,月之暗面对此表示深表抱歉。公司已经进行了 5 次扩容工作,推理资源会持续配合流量进行扩容,以尽量承载持续增长的用户量。
目前,业内也有众多企业传出与月之暗面进行合作,如:汉得信息表示关注到 Kimi 模型的最新进展,已经开启 AIGC 平台对接测试,目前在找一些场景探索落地的可行性;华策影视称公司与月之暗面保持着密切的沟通,但暂无任何书面协议落地;北信源表示公司 AI 能力平台正在和 Kimi 进行技术对接和测试。不过,也有企业对合作传言进行否认:掌阅科技回应暂未接入 AI 对话助手 Kimi,称公司会按照场景需要来选择支撑能力最强的AI大模型;中广天泽、海天瑞声等则直接表示未与月之暗面开展业务合作。
除月之暗面外,国内大模型也逐步升级长文本处理:3月22日,阿里通义千问升级,向所有人免费开放1000万字的长文档处理功能;百度文心一言下个月将进行版本升级,届时也将开放长文本能力,文字范围会在200万-500万;360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。
据媒体报道,在快手业绩电话会上,快手创始人兼 CEO 程一笑透露,2023 年公司启动 AI 战略后,一步步扎实推进自研大模型的研发训练。据介绍,继快意 130 亿和 660 亿模型后,快手在四季度重点研发训练了 1750 亿规模语言大模型。程一笑表示,“我们有信心在未来半年内,使大模型的综合性能达到 GPT4.0 的水平。”
快手也于 3 月 20 日发布了 2023 年第四季度及全年财报。财报显示,快手 2023 年营收 1134.7 亿元,同比增长 20.5 %;线上营销服务、直播和其他服务(含电商)对年收入的贡献占比分别为 53.1 %、 34.4 % 和 12.5 %,线上营销服务板块年收入同比增长 23 % 达 603 亿元。四季度营收 325.6 亿元,同比增长 15.1 %;其中线上营销业务收入创下单季历史新高,同比增长 20.6 % 至 182.03 亿元。四季度快手应用的平均日活跃用户和平均月活跃用户分别达到 3.83 亿和 7.00 亿,同比分别增长 4.5 % 和 9.4 %
3 月 19 日,OpenAI 联合创始人兼首席执行官萨姆·奥特曼,接受了著名媒体人莱克斯·弗里德曼的深度访谈。在这 1 小时 55 分钟的访谈中,奥特曼回应了几乎所有市面上关于 OpenAI 的流行话题:
奥特曼直言“不知道” GPT-5 会在什么时候发布,但提到,OpenAI 今年会发布一个令人惊叹的大模型,目前不知道该如何称呼它。同时,在接下来的几个月的时间,OpenAI 还会发布一系列产品,为正式发布 GPT-5 铺平道路。
GPT-5 的具体发布日期一直备受关注。就这次访谈发布的次日,就有消息称 OpenAI 有望在今年夏季推出 GPT-5,甚至部分企业客户已经提前收到了关于这一最新模型及其 ChatGPT 工具相关改进的演示,并有一位企业 CEO 观看了 GPT-5 演示后表示:“它的表现太棒了,带来了一种质的飞跃。”另一位消息人士透露,OpenAI 目前仍在对 GPT-5 进行训练,并计划在完成后进行内部安全测试和其他进一步的评估。这个过程可能会耗费一定的时间,并有可能导致发布日期的推迟。
对于 OpenAI 内部的神秘项目 Q*,奥特曼说它并不是“核武器” 。不过,奥特曼意味深长地补充了一句,“我们还没有准备好谈论 Q*。OpenAI 喜欢探索各种新东西,但目前还没有掌握解题密码。”
至于 Sora,奥特曼称其为一个“3D 世界模型”,不过目前在理解、功能、细节等方面还不够好,未来会不断优化,就像 OpenAI 的文生图产品 DALL·E 1、2 到 3 三代一样。
有关马斯克的起诉,奥特曼回顾了 OpenAI 的发展。他提到一开始并没有规划好 OpenAI 的产品,但随着不断的探索,摸清了方向,而这需要一大批资金支持,所以才商量改变 OpenAI 的整体架构,从公益实验转变成商业模式。目前,已经在官方博客列出了当年关于 OpenAI 转型、开源 / 闭源的所有事实证据。
最后,主持人问道“人类何时会开发出 AGI?如果开发出了 AGI,它会失控毁灭人类吗?”奥特曼对此的回答是,他估计未来 10 年内,或者更早的时间可以实现 AGI。而对于 AGI 是否会危及人类他并不担心,只是提到 AI 确实需要合理的安全监督框架。
延伸阅读:Sam Altman 亲自回应:不知 GPT-5 何时发布、Q* 不是“核武器”
苹果 CEO 蒂姆·库克日前在上海访问期间首次在中国谈论生成式 AI ,并预告今年晚些时候将有相关新闻公布。另据外媒爆料,苹果正在与谷歌谈判,希望将谷歌生成式 AI 大模型 Gemini 引入 iPhone 。此外,苹果自己的大语言模型也进入了测试阶段,内部代号为“ Ajax ”。
“高调营销”刺激中国销量的同时,摆在苹果面前的挑战却没有减少。3 月 21 日美股开盘后,苹果股价大跌近 3 %。消息面上,美国司法部当天就涉嫌垄断起诉苹果公司,这是拜登政府针对苹果发起的首个重大反垄断诉讼,指控其垄断智能手机市场。苹果针对诉讼回应称,美国司法部指控其非法垄断智能手机的诉讼“在事实和法律上都是错误的”,该诉讼威胁到公司的核心价值观,他们将坚决抗辩到底。
3 月 19 日消息,英伟达备受期待的 GTC 大会在美国圣何塞会议中心正式开幕,首席执行官黄仁勋在会上宣布推出采用 Blackwell 架构的 B200 系列和 GB200 芯片。
“Blackwell 将成为我们历史上最成功的产品发布,”黄仁勋说道。Blackwell 专为万亿参数生成人工智能模型而设计,它在推理方面击败了 Hopper:输出提高了 30 倍。老黄还表示,Blackwell 驱动的设备可以再次降低计算成本和能源需求。新芯片预计将于今年晚些时候上市,但价格不知。据悉,AWS、戴尔科技、谷歌、Meta、微软、OpenAI 和特斯拉计划使用 Blackwell GPU。
此外,英伟达还发布了 GB200 NVL72 液冷机架系统和一款名为 HGX B200 的服务器主板。推出了 Nvidia 推理微服务:NIM,可以将模型和依赖项整合到一个简洁的包中,根据用户的堆栈进行优化,并与易于使用的 API 连接。
延伸阅读:重磅!老黄带着他的最强 AI 芯片来了!性能提高 30 倍、可支持 10 万亿参数 AI 模型
3 月 21 日,马斯克的脑机接口公司 Neuralink 更新了首位大脑植入患者的情况,这位四肢瘫痪患者能够通过意念玩视频游戏和在线象棋。据悉,这位患者通过 Neuralink 的脑机接口技术,成功实现了大脑与外部设备的实时通讯。他不仅能够用意念操控鼠标和键盘,进行日常电脑操作,更能在虚拟世界中畅游,享受游戏带来的乐趣。
“ Open-Sora 1.0 ”全球首个类 Sora 视频生成模型全面开源,包括训练细节和模型权重,复现成本仅 1 万美元;模型采用 Diffusion Transformer 架构,优化空间 - 时间注意力机制,大幅降低训练和推理开销,提升视频生成质量;多阶段训练策略有效降低成本,提升视频内容生成的时长、分辨率和保真度,支持高效训练加持,进一步优化视频生成效果。
马斯克宣布开源 Grok 大模型,这是目前参数量最大的开源模型,拥有 3140 亿个参数。Grok 采用混合专家架构,支持 8 位数字精度量化,但不具备独立搜索网络能力。开源版本允许商业用途和修改分发,无需附加条款。尽管 Grok 在基准测试中未超越 GPT-4 等模型,但其开源策略可能旨在推动产业“螺旋式成长”,并为 Grok 在大模型市场中寻找新的发展路径。
内容推荐
InfoQ 独家邀请了潞晨科技创始人兼董事长尤洋,从技术原理、复现路径和实际应用成本考量三方面深入解读 Sora 技术和应用可行性。本次技术解读共包含Sora 的技术原理和关键组成、快速复现和集成 Sora 的指南、成本效益和实际应用考量三个核心要点,帮助大家理解 Sora 的核心技术、快速实现和集成 Sora 到自己的项目中,并提供考虑成本效益和实际应用的指导。关注「AI前线」,回复「Sora解读」获取解读视频及文字资料。
今日荐文
算数不行、还不懂中国文化,大模型现在抢不了设计师的饭碗! | AI 测评室
7人创业、1人投敌!Transformer 八子谷歌坐冷板凳5年再成老黄座上宾
“感觉GPT Store被放弃了!” 发布才2个月就被OpenAI搞成了烂尾项目?
重磅!老黄带着他的最强AI 芯片来了!性能提高30倍、可支持10 万亿参数 AI 模型
刚刚!马斯克履约开源Grok,超越Llama成全球最大开源模型,却被怀疑是作秀?!
微信扫码关注该文公众号作者