黄仁勋自曝英伟达最强Rubin架构；优必选人形机器人进入东风柳汽开展造车工作；马斯克称将购买30万块AI芯片丨AI情报局

2024-06-04 05:06

融资快报

Firefly.ai获2300万美元A轮融资：Firefly 开发了一个与 IaC 无关的代码生成引擎，利用AI技术来生成代码。本轮融资由祥峰投资Vertex、Hanaco Ventures、InMotion Ventures、Redseed、SoftBank软银投资。

AI模型推理部署解决方案公司清昴智能完成数千万元Pre-A+轮融资：清昴智能通过针对模型的推理和部署环节进行优化来降低AI模型的使用门槛。本轮融资由启赋资本、达晨财智领投，老股东奇绩创坛跟投。资金将主要用于人才梯队组建，产品研发和市场落地。

Exactly AI获430 万美元的种子轮资金：本轮融资由Speedinvest 领投，InReach Ventures、Cornerstone VC、GuruDev Capital 和一些天使投资人也参与其中。

来未来科技完成超亿元B+轮融资：此轮融资由阿里云、银杏谷资本、余杭国投等知名机构分期共同参与。资金将主要用于加大产品线研发投入（包括AI医疗大模型应用）、加速市场拓展步伐、深化渠道建设，以及构建更加智能化的医疗数字化产品体系。

业界动态

国内情报

斯坦福团队被曝抄袭面壁，已删库跑路，创始人回应称也算国际认可：

推特曝斯坦福 AI 团队抄袭中国公司开源成果，舆论发酵，引起圈内人士广泛讨论。斯坦福大学研究团队发布的“Llama3V”模型架构与代码和中国大模型公司的开源成果完全相同，被质疑抄袭，该团队却回复称只是使用了其 tokenizer。随后，面壁智能团队通过测试，发现Llama3V 与 MiniCPM-Llama3-V 2.5 在“胎记”般案例上的表现完全相同。

在斯坦福团队负责人回应道歉，又删文后，面壁智能CEO李大海也做了正式回应称一方面感概这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。

人形机器人“造车”，东风柳汽与优必选签署战略合作协议：

双方将推动人形机器人在汽车制造场景的应用。优必选 Walker S 将进入东风柳汽，开展一系列工作，还将和传统自动化设备协作，解决复杂场景的柔性无人化生产。

搭载星辰大模型，中国电信推出新型短消息服务“星辰慧答”：

星辰慧答通过短信通道提供大模型服务，用户无需下载 App、直接在短信界面即可体验，同时星辰慧答业务不新增任何功能费。

昆仑万维开源2千亿稀疏大模型天工MoE：

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型，也是首个支持用单台4090服务器推理的开源千亿MoE大模型。

更多国内情报：

科大讯飞首家线下旗舰店在上海开业，AI 大模型展示：店内有扫地机器人、无线耳机、录音笔、AI 鼠标等产品，还有讯飞星火大模型内容展示。

中国发布《生成式AI安全基本要求》，涵盖训练数据、生成内容等：意见稿分为标准文本、意见汇总处理表和编制说明三部分，标准文本涵盖训练数据安全要求、模型安全要求等，主要是为了加强生成式人工智能的开发、应用落地的安全性。

字节跳动旗下 AI 助手豆包推出PC客户端、浏览器插件版本：用户可以通过豆包实现快捷划词翻译、AI搜索、一键常驻桌面等功能，同时还支持网页与视频总结、写作和文本修改等功能。

国际情报：

英伟达重磅公布Rubin芯片,将在2026年问世：

英伟达 CEO 黄仁勋公布了下一代AI芯片架构 Rubin，作为今年3月刚刚发布的“Blackwell”架构的迭代。并推出了Rubin、Blackwell Ultra GPU 和最新的 Vera CPU。英伟达计划于 2025 年发布增强版 Blackwell Ultra GPU，2026 年上市下一代 Rubin GPU 和相应平台，2027 年推出 Rubin Ultra GPU 版本。

Stability AI将在6月12日开放Stable Diffusion3权重下载：

Stability AI联合 CEO Christian Laforte 宣布其最先进的文本生成图像模型 Stable Diffusion 3 Medium 即将上线，用户可以在6月12日的Hugging Face 上下载这些权重。SD3 Medium 是一个拥有 20 亿参数的 SD3 模型，专为解决之前模型的不足而设计，SD3 中等权重和代码仅供非商业用途。

谷歌视频生成模型Veo，支持从单个图像生成视频片段：

模型可以根据单个参考图像生成视频剪辑。用户通过输入文本提示来调整视频的视觉风格，使其与原始风格保持一致。该模型的应用还包括了新的实验性工具 VideoFX，用户可以加入等待名单，体验 Veo 模型的部分功能。

英伟达发布数字人AI技术NVIDIA ACE：

ACE 是提升游戏和虚拟角色互动体验的技术，它可以让游戏 NPC 具有 AI 对话功能，同时能直接生成数字人的语音和面部动画，具有灵活部署、高效低延迟的特点。

消息称微软下一代Xbox主机将聚焦AI，搭载高通 NPU：

据称下一代 Xbox 主机将配备神经处理单元，这款专门用于AI运算的芯片将由高通公司制造，该主机可能会原生支持微软的智能助理 Copilot。目前还不清楚Copilot在主机上的具体集成方式。

ControlNet作者推新项目Omos：

Omost是一个革新性的图像生成项目，通过简单的提示词就能生成详细且准确的图像，极大地简化了图像描述的过程。用户只需输入简单提示词，即可获得高质量、符合预期的图像。同时，Omost具有自动扩展提示词、高灵活性和图像位置编码等优点，为图像生成提供了强大的工具支持。

马斯克称将至少花费90亿美元购买30万块英伟达AI芯片：

马斯克宣布 xAI 明年夏天将推出配备 30 万块 B200 GPU 的数据中心，按照B200 GPU可能3万美元的最低价位计算，意味着xAI将斥资90亿美元购买约30万块B200 GPU。

微软将向瑞典投资32亿美元加强AI和云服务设施：

微软计划在瑞典投资 32 亿美元，用于 AI 和云服务设施，并承诺对 25 万人进行 AI 技能培训，称瑞典是最具创新力的国家之一，借助 AI 可以保持领先地位。

亚马逊利用生成式人工智能Project PI扫描包裹缺陷：

该 AI 模型名为 “Project PI”（私家侦探），能够在亚马逊的订单处理中心识别订单中的问题产品。具体来说，Project PI 能够找出有缺陷或损坏的产品，或者标记可能是错误尺寸或颜色的商品，而这些产品是在公司的成像隧道中进行扫描和评估的。损坏的商品会由亚马逊员工进行审核，然后确定是否可以在亚马逊的 “二手宝” 平台上以折扣价出售。

更多国际情报：

“AI 工厂”推动软件全栈重塑，英伟达提供Llama3 NIM容器供用户部署：官方制作了一个 llama3 大模型的 NIM 容器，现已上线英伟达官网，开放供全部用户下载并任意部署。

美国新闻媒体联盟要求调查谷歌在新闻领域的垄断行为：联盟致信美司法部和贸易委员会，要求调查谷歌垄断行为，并阻止其使用生成式 AI 进一步扩张。该联盟认为谷歌“AI Overviews”擅自利用出版商内容，破坏了数字新闻传播的基本完整性。

麦肯锡调查显示，生成式AI应用大中华区增长最快：生成式 AI 在大中华区和亚太地区发展迅速，65%的受访者经常使用并已产生商业价值。企业主要通过使用现成产品、合作微调模型或自主开发产品三种方式应用生成式 AI，应用场景主要包括文本、代码、音频、视频、图片等生成能力，多模态大模型的出现将进一步扩大应用场景。

AI明星产品

Product Hunt 热榜，你的智能烹饪助手OH, a potato

《OH, a potato!》是一款 Chat GPT 驱动的 iOS 应用，它可以帮助用户通过已有食材找到、保存和规划食谱，还提供共享购物清单和食谱功能。用户可以浏览和保存各种来源的食谱，根据已有食材找到食谱，还能将其添加到每周计划中。

🔗https://ohapotato.app/

GitHub Trending 热榜，开源卡通图像插值器 ToonCrafter

ToonCrafter 是一个开源项目，通过使用预训练的图像到视频扩散先验，实现两张卡通图像之间的高质量插值生成。用户可生成高达 512x320 分辨率、最多 16 帧的视频，并通过减少 DDIM 步数来缩短推理时间。项目展示了多种应用场景，如稀疏草图引导插值、卡通草图插值及基于参考图像的草图着色。项目提供详细的安装环境、推理及使用 Gradio 演示的指南，强调其为研究探索工具，非商业产品，提醒用户负责任地使用。

🔗https://github.com/ToonCrafter/ToonCrafter?tab=readme-ov-file

开发者推荐

1.PixVerse：视频创作平台，让静态图像动起来

PixVerse 是一个创新的视频创作平台，用户可以利用其独特的 "Magic Brush" 功能，通过在图像上标记区域和方向，使静态图像栩栩如生地动起来。用户还可以通过加入 PixVerse 的 Discord 社区，与其他创作者互动并获取更多支持。平台提供了详细的教程和官方展示，帮助用户更好地使用 Magic Brush 功能。PixVerse 上展示了各种创意视频作品，包括高清、升级版的鸟瞰视频、动物细节动画、奇幻场景等。

🔗https://app.pixverse.ai/

2.LLM 性能提升的秘密：FineWeb 数据集

FineWeb是一个庞大的预训练数据集，包含 15 万亿标记，占据 44TB 的磁盘空间，源自 96 个 CommonCrawl 快照。FineWeb 比其他开放式数据集带来了更出色的 LLM 性能。为了确保高质量，他们详细记录了 FineWeb 的设计选择，并深入研究了去重和筛选策略。

此外，报告中还介绍了FineWeb-Edu，这是 FineWeb 的一个子集，专注于教育内容，表现优于所有公开可访问的网络数据集。FineWeb-Edu 提供两种大小/过滤级别：1.3 万亿和 5.4 万亿标记，均使用 GPT2 分词器进行测量。数据集在宽松的 ODC-By 1.0 许可下发布。

🔗https://huggingface.co/spaces/HuggingFaceFW/blogpost-fineweb-v1

🔗https://huggingface.co/datasets/HuggingFaceFW/fineweb

3.Illuminate：AI 驱动的学术音频讨论平台

Illuminate 是 Google 推出的一项实验性技术，旨在利用 AI 技术将学术论文转化为音频讨论，以适应不同用户的学习偏好。这些讨论基于已发表的学术论文，旨在帮助用户更好地理解复杂的概念。

Illuminate 提供一个公共图书馆，包含多篇关于人工智能领域的重要研究论文，覆盖深度学习、自然语言处理、计算机视觉等广泛主题。生成的音频内容仅供参考，可能存在不准确或冒犯性的信息，因此建议用户在原始内容中独立验证事实。AI 语音功能目前处于私人测试阶段，用户可以加入等待列表来体验这项技术。

🔗https://illuminate.withgoogle.com/home

4. SynCHMR：从视频中同步重建摄像头轨迹和人体运动的技术

SynCHMR由卡内基梅隆大学和 Adobe Research 合作开发，旨在同步重建视频中的摄像头轨迹和人体运动。这项技术采用人体感知的度量 SLAM 来解决深度、尺度和动态模糊性问题，并通过场景感知的 SMPL 去噪方法确保空间和时间的一致性。SynCHMR 在处理动态场景时表现出色，定性结果显示其在 3DPW、EgoBody 和 DAVIS 数据集上的优势。预计将在 CVPR 2024 上发布。

今日热议

Reddit 关于 AI 应用方向的话题引发热议：“我希望 AI 能帮我洗衣服和洗碗，这样我就能进行艺术创作和写作，而不是让 AI 帮我进行艺术创作和写作，结果我要去洗衣服和洗碗。”

AI 应用方向：许多用户认为，AI 应该专注于取代那些人们普遍不喜欢的任务，比如税务工作，而不是取代那些给人带来乐趣和满足感的活动。大家希望 AI 能解放他们的时间，让他们专注于更有创造性和愉悦感的事情。

AI 在艺术和创作领域的角色：对于 AI 在艺术创作中的作用，用户们意见不一。一些人认为 AI 可以在艺术领域扮演辅助角色，帮助艺术家提高效率和灵感，而其他人则担心 AI 可能会取代专业艺术家，影响他们的生计。

税务自动化的现状和挑战：用户们还讨论了税务自动化的复杂性，特别是在美国。尽管自动化可以提高效率，但内务署（IRS）现代化进展缓慢，这给实现全面自动化带来了挑战。

AI 对就业的影响：一些用户担心，随着 AI 技术的进步，艺术家和作家的收入可能会下降，甚至面临失业的风险。

AI 在物理任务自动化中的挑战：尽管 AI 在处理数字任务方面取得了显著进展，但在自动化物理世界中的任务（如家务）方面仍然存在技术挑战。用户们希望未来能有更多的技术突破，让 AI 真正解放他们的双手。

加入讨论，分享你的观点

敬请期待明日的最新动态！

本文产品编辑 zhumaterialism 深耕于AIGC知识领域的应用研究，期待与同行及感兴趣的读者交流思想、分享见解。欢迎添加以便深入探讨，共同推动行业进步。欢迎开发者主动联系提交产品，一起探索AI在各领域的创新应用，携手前行。

更多内容，点击下方关注：

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章