“萝卜快跑”被曝是真人在屏幕前操作；阿里云宣布与月之暗面“联姻”；去哪儿宣布每周两天自选办公地｜AI 周报

2024-07-14 06:07

整理 | 褚杏娟、赵明华

网友称萝卜快跑其实有驾驶员人为干预；去哪儿员工每周两天可自主选择办公地点；阿里云宣布与月之暗面“联姻”；OpenAI 绝密项目「草莓」首次曝光；AMD 收购欧洲最大私人 AI 实验室 Silo AI。

行业热点

萝卜快跑订单疯涨，无人驾驶时代真的来了？

7 月 10 日，百度旗下自动驾驶出行服务平台“萝卜快跑”登上微博热搜榜首。据了解，萝卜快跑已在全国 11 个城市开放载人测试运营服务，在武汉、重庆、深圳、上海、北京等城市开展全无人自动驾驶出行服务与测试。

媒体报道称，随着百台无人车的投入运营，“萝卜快跑”在武汉市全无人订单量也迎来了爆发式增长，单日单车峰值超 20 单。数据显示，萝卜快跑 APP 用户满意度评价达 4.9 分，其中 5 分满分好评占比高达 94.19%。此外，网络传言称，萝卜快跑已在武汉投放 1000 辆无人车，进而引发对网约车司机、出租车司机就业市场的深刻担忧。

目前，萝卜快跑还面临着安全与技术等方面的问题。有武汉网友 7 月 7 日下午在短视频平台发布视频，称百度旗下的自动驾驶出行服务平台“萝卜快跑”无人驾驶出租车在武汉街头与行人相撞，视频中可以看到一个行人躺在出租车前，交警正在现场，事故造成了部分车辆拥堵。这件事故引出了一个亟待解决的问题：无人驾驶车应该如何定责。目前，我国还没有建立一套完善的全国性法规，只有地方规定。此外，在长江网武汉市民留言板上，有关于“萝卜快跑”的留言，目前已累计达到 324 条。留言板多个内容显示，萝卜快跑 Robotaxi 在道路上运营期间，出现车辆在绿灯状态下停滞不前、红灯时冲入路口中央、转弯时卡顿不动等情况，并引发交通拥堵现象，对市民出行造成了一定影响。

针对此类现象，武汉经开区管委会回应称：“确认涉诉车辆为自动驾驶测试车，正在调试中。开发区交通大队将定期与公司负责人沟通和反映问题，确保道路安全。”另外，近日还有网友在社交平台称，无人驾驶的萝卜快跑其实有驾驶员人为干预。网传图片显示，在萝卜快跑汽车机器人智控中心，有真人坐在带方向盘的屏幕前操作。百度方面截至发稿没有回应。

据网信永川公众号 2023 年 7 月发布的内容，位于永川区大数据产业园的百度无人驾驶实验基地内，有云代驾安全员在 5G 云代驾舱进行远程实时控制，通过高带宽、低时延的 5G 网络，从屏幕组上观察汽车周围 360°状况，并利用方向盘、档把、脚踏板等控制器驾驶无人车辆。5G 云代驾的意义在于，在无人车没有安全员的情况下，当无人车出现解决不了的问题时，云端安全员可以帮助其远程脱困。

三星爆发大规模罢工，韩媒：半导体部门员工是罢工主力

据报道，韩国三星电子旗下最大工会“全国三星电子工会”于 8 日上午开始在京畿道华城市三星电子华城工厂正门前举行罢工，计划持续 3 天。该工会会员总数为 3 万人，约占三星电子员工总数（12.5 万人）的 24%。据悉，在 8 日的罢工中，工会推算有 4000 至 5000 人参与，三星公司和警方则估计有 3000 人参加。

韩媒称，这是三星电子成立 55 年来首次爆发大规模罢工。此前在 6 月初，工会部分成员曾利用休年假的形式罢工 1 天。工会此次提出的主要诉求有：全体工会成员薪酬上调、改变奖金标准、公司履行带薪休假承诺，以及对因罢工导致的工资损失进行补偿等。工会主席在接受采访时还表示，公司不透明的奖金计算方式，导致员工对自身利益的不确定性增加；若公司在 10 日前未拿出解决方案，工会将于 15 日起进行第二阶段的罢工。

韩国 SBS 电视台称，半导体部门的员工是此次罢工的主力。三星公司称半导体生产线的运行没有受到重大影响，但《东亚日报》报道称，即使许多生产线实现了自动化，操作这些生产线的重要人员也很难替换。半导体生产线一旦停止运转，恢复生产需要耗费大量时间和成本。

腾讯全员邮件宣布调薪：员工月工资增加 3200 元等

7 月 10 日，腾讯内部向全员发布邮件称，将调整内部的薪酬福利政策，对薪酬结构做出调整。

校招生的房补从每月 4000 元调整为按 15 个月发放，并将其纳入月薪基数中。调整后，员工每月基本工资增加 3200 元，多出来的三个月将在年终奖一起发放。根据资料，腾讯公司给校招生提供的房补标准为每月 4000 元（北上广深地区为 2000 元），三年共计 14.4 万元。
员工服务奖（13 薪）从年底发放调整为平摊到 12 个月，并加入月薪基数中。腾讯邮件中称，这两个举措旨在帮助大家在更高、更稳定的月收入基础上更安心地安排工作与生活。相关调整于 2024 年 7 月 1 日起生效，8 月 5 日的发薪中开始体现。

大模型人才紧缺，字节跳动加速争夺全球高校顶尖技术人才

近日，字节跳动“筋斗云人才计划”启动。该计划是字节跳动面向优秀校园技术人才推出的专项招聘，意图在全球范围内，吸引和招募有志于用技术创造突破性价值的顶尖学生。

据悉，本次招聘涵盖 AI 应用、搜索、推荐、广告、AI for Science、AI Safety、机器人、隐私与安全、硬件、视频架构、工程架构等技术领域。招聘的目标群体是 2024 年 9 月 -2025 年 8 月毕业的博士群体，重点针对有亮眼学术成果、拥有顶会顶刊论文或专利的学术达人；有丰富的大赛经历，在国际知名竞赛中取得优异成绩的竞赛达人；或有极强的实践能力，参与过重大项目，擅长解决难题的实战达人。

在大模型相关技术人才招聘上，字节跳动是国内互联网大厂最积极的公司。据一位大模型行业人士透露，今年字节跳动的 AI 人才招聘规模最大。脉脉高聘人才智库数据印证了这一信息：今年上半年，字节跳动位列新发人工智能岗位最多的企业。从招聘指数上看，字节跳动以 9.53 位居第一，大幅领先于小红书（7.96）、蚂蚁集团（5.84）、美团（4.86）、腾讯（2.48）等互联网大厂。

去哪儿员工每周三、周五可自主选择办公地点

7 月 9 日，去哪儿 CEO 陈刚发全员信宣布，从 7 月 15 日起，每周三、周五，员工可以灵活选择办公地点。陈刚在信中强调，员工按规定混合办公，“无需任何申请审批”。

据了解，混合办公的适用人员范围以入职 6 个月以上的标准工时正式员工为主。

去年 10 月，去哪儿开始了为期 9 个月的混合办公试验。回收数据显示，员工对混合办公的各个维度反馈正面 —— 超过九成的员工认为混合办公后幸福感有明显提升，员工主动离职率在混合办公后下降了三成。

去哪儿 COO（首席运营官）刘连春表示，“混合办公没有让公司业绩变坏，并且显著提升了员工的幸福度。那这件事情公司何乐而不为呢？”

微软要求中国区员工必须使用 iPhone？微软回应

7 月 9 日消息，据媒体报道，微软中国员工已被告知，登录公司系统时必须使用 iPhone 进行身份验证。从 9 月起，将禁止使用 Android 智能手机作为多因素身份验证设备。

据介绍，此举属于微软全球安全未来计划的一部分，将影响中国大陆的数百名员工，旨在确保所有员工都使用微软 Authenticator 密码管理器和 Identity Pass 身份验证应用。另有消息显示，由于部分中国安卓设备不支持谷歌服务，微软将为受影响员工提供 iPhone15 作为工作手机。

一位微软发言人回应表示：「Microsoft Authenticator 和 Identity Pass 应用程序已正式在 Apple Store 和 Google Play Store 上架。我们希望为员工提供访问这些必要应用程序的途径，由于本地区无法使用 Google 移动服务，我们即向员工提供了例如 iOS 设备的选择。」

对此，不少网友称，若是能配发工作机就没问题。但若强制要求员工自行购买，则“不能接受”。

阿里云宣布与月之暗面“联姻”：帮 Kimi 技术突破

7 月 8 日，阿里云官宣两位新“代言人”——月之暗面科技有限公司创始人杨植麟和智联招聘集团总裁张月佳。

这是月之暗面首次公开与阿里云的合作情况。信息显示，阿里云的算力和大模型服务平台，助力月之暗面提升模型推理效率，加速 Kimi 智能助手实现技术突破。此外，智联招聘集团的大模型应用，也基于阿里云实现快速部署和上线支持。

AMD 重砸 6.65 亿美元收购欧洲最大私人 AI 实验室 Silo AI

AMD 宣布以价值约 6.65 亿美元的全先进交易价值收购欧洲最大的私人 AI 实验室 Silo AI。该收购案预计在 2024 年下半年完成。

收购完成后，Silo AI 首席执行官兼联合创始人 Peter Sarlin 将继续领导 Silo AI 团队，向 AMD 高级副总裁 Vamsi Boppana 汇报工作。

据了解，Silo AI 总部位于芬兰赫尔辛基，业务遍及欧洲和北美，专注于端到端 AI 驱动解决方案，帮助客户快速轻松地将 AI 集成到其产品、服务和运营中。他们的工作涉及不同的市场，客户包括安联、飞利浦、劳斯莱斯和联合利华。除了 SiloGen 模型平台外，Silo AI 还在 AMD 平台上创建了最先进的开源多语言 LLM，例如 Poro 和 Viking。

AMD 在新闻稿中表示，此次收购代表该公司基于开放标准并与全球 AI 生态系统建立强有力的合作伙伴关系，并提供端到端 AI 解决方案的战略又迈出了重要一步。Silo AI 团队由世界一流的 AI 科学家和工程师组成，他们拥有丰富的经验，为云、嵌入式和终端计算市场的领先企业开发量身定制的 AI 模型、平台和解决方案。

多方监管增压，微软放弃参与 OpenAI 董事会

7 月 10 日，据媒体报道，随着欧美监管机构加强对人工智能市场的反垄断审查，微软公司决定放弃在美国开放人工智能研究中心 (OpenAI) 董事会中的观察员席位。

微软 9 日致函 OpenAI 说明上述决定，并解释称，OpenAI 自去年发生董事会人事震荡以来，经营管理已有改善，因此不再需要微软参与。微软选择放弃观察员席位，决定“立即生效”。

据报道，去年 OpenAI 首席执行官萨姆·奥尔特曼“离职又复职”风波过后，微软在 OpenAI 董事会获任无投票权观察员。据此前报道，微软支持并短暂聘用过奥尔特曼。

小红书被曝获 DST 投资，估值 170 亿美元

7 月 11 日消息，小红书获得了风险投资公司 DST Global 的支持。三位知情人士透露，小红书在最近几周进行了股份出售，公司估值达到 170 亿美元。

DST Global 曾投资过 Facebook，并与红杉中国一起参与了小红书这一轮投资，红杉中国增加了其现有股份。此外高瓴资本、博裕资本和中信资本也进行了跟投。

此前有消息称，小红书在 2023 年首次实现盈利。据四位知情人士透露，小红书去年净利润达 5 亿美元，营收达 37 亿美元。

大模型一周大事

大模型发布

OpenAI 绝密项目「草莓」首次曝光，内部人士曾称其可能威胁人类

7 月 13 日，据外媒报道，OpenAI 内部正在一个代号为「草莓（Strawberry）」的项目中开发一种新的人工智能模型。该项目的细节此前从未被报道过，而 OpenAI 正努力证明其提供的各类模型能够提供高级推理能力。

当被问及上述所说的草莓技术时，OpenAI 的发言人在一份声明中表示：“我们希望自身 AI 模型能够像我们（人类）一样看待和理解世界。持续研究新的 AI 能力是业界的常见做法，大家都相信这些系统的推理能力会随着时间的推移而提高。”

尽管发言人并未直接回应有关“草莓”项目的问题，但媒体报道指出，该项目之前被称为 Q*，而 Q*正是去年导致 OpenAI CEO 被意外解雇的重要导火索。

OpenAI 的内部人士曾向董事会发出警告，称 Q* 的重大发现可能对全人类构成威胁。

媒体推测，Q* 可能具备 GPT-4 所缺乏的基础数学能力，这可能意味着它具有与人类智能相媲美的推理能力。而这可能标志着 OpenAI 在实现其 AGI 目标方面迈出了重要一步。

蚂蚁集团开源 EchoMimic：支持为人像照片对口型、生成肖像动画视频

近日，蚂蚁集团推出了一项开源项目——EchoMimic，这款 AI 工具能够根据声音内容，为照片中的人物创建逼真的口型同步动画。

EchoMimic 具备较高的稳定性和自然度，通过融合音频和面部标志点（面部关键特征和结构，通常位于眼、鼻、嘴等位置）的特征，可生成更符合真实面部运动和表情变化的视频。

EchoMimic 的技术核心在于其能够精确捕捉音频信号和面部特征之间的关联，并以此为基础生成动画。在训练过程中，EchoMimic 采用了先进的数据融合技术，确保了音频和面部特征的有效整合，从而提高了动画的稳定性和自然度。

经过与多个公共数据集和自收集数据集中的替代算法进行的全面比较，EchoMimic 在定量和定性评估方面均展现出卓越的性能。这一点在 EchoMimic 项目页面上的可视化效果中得到了充分体现。

腾讯开源 web 端地图组件库 tlbs-map

7 月 11 日，腾讯开源了其基于腾讯位置服务 JavaScript API 封装的地图组件库 —— tlbs-map，用于在网页上绘制地图，并在地图上绘制点、线、面、热力图等效果。它支持 Vue2、Vue3、React 等主流技术栈，可以帮助开发者降低地图开发的成本。

据官方介绍，tlbs-map 封装腾讯地图 API 为响应式组件，无需关心复杂的地图 API，只需要操作数据即可；同时，组件提供地图和图层实例，用户可编写自定义组件或直接调用地图 API 满足定制化需求。

为了方便开发者使用，tlbs-map 还提供了详尽的组件使用文档和示例代码，可以帮助开发者轻松上手，快速开发。

智谱 AI 开源推出视频理解模型 CogVLM2-Video

7 月 12 日，智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法，生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据，引入了多帧视频图像和时间戳作为编码器输入，训练了一种新的视频理解模型—CogVLM2-Video。

智谱 AI 表示，目前视频理解的主流方法使模型失去了时间感知能力，无法准确地将视频帧与精确的时间戳关联起来。因此，模型缺乏时间定位、时间戳检测和总结关键时刻的能力。为了解决这些问题，团队提出了 CogVLM2-Video，这是基于 CogVLM2 图像理解模型的扩展视频模型。

该模型不仅在开放域问答中实现了先进的性能，还能感知视频中的时间戳信息，从而实现时间定位和相关问答。

具体来说，这种方法就是从输入视频片段中提取帧，并为其注释时间戳信息，使后续的语言模型能够准确知道每一帧在原视频中对应的确切时间。

几分钟生成四维内容，还能控制运动效果：北大、密歇根提出 DG4D

近期，商汤科技 - 南洋理工大学联合 AI 研究中心 S-Lab ，上海人工智能实验室，北京大学与密歇根大学联合提出 DreamGaussian4D（DG4D），通过结合空间变换的显式建模与静态 3D Gaussian Splatting（GS）技术实现高效四维内容生成。

据悉，四维内容生成近来取得了显著进展，但是现有方法存在优化时间长、运动控制能力差、细节质量低等问题。DG4D 提出了一个包含两个主要模块的整体框架：1）图像到 4D GS ；团队使用 DreamGaussianHD 生成静态 3D GS，接着基于 HexPlane 生成基于高斯形变的动态生成；2）视频到视频纹理细化；团队通过细化生成 UV 空间纹理映射，并通过使用预训练的图像到视频扩散模型增强其时间一致性。

值得注意的是，DG4D 将四维内容生成的优化时间从几小时缩短到几分钟，允许视觉上控制生成的三维运动，并支持生成可以在三维引擎中真实渲染的动画网格模型。

企业应用

7 月 10 日，谷歌宣布将于本月底向所有谷歌账号用户开放「暗网报告」功能，旨在帮助用户快速了解网络上发生的个人数据泄露事件，并提供相关漏洞信息的搜索服务。
7 月 10 日，阿里推出专为科研人员、高校教师和学生、职场人士研发的大模型应用产品心流，其产品定位为用户的 AI 搜索助手，提供智能搜索、知识问答、智能阅读、辅助创作等能力。
7 月 10 日，夸克宣布升级“超级搜索框”，推出以 AI 搜索为中心的一站式 AI 服务，为用户提供从检索、创作、总结，到编辑、存储、分享的一体化信息服务价值。
7 月 11 日，三星表示将在今年推出基于自己人工智能（AI）模型的升级版语音助手 Bixby，据悉，这次 Bixby 的升级是三星在其设备套件上推广人工智能功能的一部分。
7 月 12 日，粉笔发布了基于首个专注于职教行业的垂域大模型 AI 产品——粉笔 AI 老师 “粉笔头”，旨在让 AI 帮助老师化身“高效能人士”，向学员提供更有针对性的服务。

内容推荐

AIGC技术正以惊人的速度重塑着创新的边界，InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书，深度对话30位国内顶尖大模型专家，洞悉大模型技术前沿与未来趋势，精选10余个行业一线实践案例，全面展示大模型在多个垂直行业的应用成果，同时，揭秘全球热门大模型效果，为创业者、开发者提供决策支持和选型参考。关注「AI前线」，回复「领航者」免费获取电子书。