- Open-Sora全面开源升级:支持16s视频生成和720p分辨率
机器之心发布机器之心编辑部Open-Sora 在开源社区悄悄更新了,现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。生成个横屏圣诞雪景,发b站再生成个竖屏,发抖音还能生成单镜头1
- 国内销量持续领跑,荣耀告诉你切入AI手机的正确姿势
机器之心报道机器之心编辑部该有人给出个标准了。「AI 手机」到底是什么?这个问题至今还没有结论。ChatGPT 出现后,科技界迎来技术爆发。自去年底开始,新一代的旗舰手机纷纷引入大模型,它们有的实现了大模型端侧落地,有的推进端云一体,配置了多种 AI 能力,有的引入了第三方 AI 应用。虽然都叫 A
- 黄仁勋亲自给OpenAI送货,全球首台DGX H200开箱了
机器之心报道作者:泽南、杜伟又是一张历史性大合照。今天,黄仁勋又来送 AI 芯片了,还是超强悍的那种。OpenAI 联合创始人、总裁 Greg Brockman 发推,晒出了自己、OpenAI CEO 奥特曼与英伟达创始人兼 CEO 黄仁勋的合照。他表示,老黄亲自为 OpenAI 送来了全球第一台
- 仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型
机器之心报道编辑:小舟、崔亚鹂Snowflake 加入 LLM 混战。Snowflake 发布高「企业智能」模型 Arctic,专注于企业内部应用。刚刚,数据管理和仓库提供商 Snowflake 宣布加入 LLM 混战,发布了一款专注于企业级应用的顶级大型语言模型(LLM)——Snowflake A
- 视频生成技术与应用 AI 技术论坛圆满收官
致力于助力企业和广大从业者掌握 AI 视频生成技术前沿,把握时代机遇的“视频生成技术与应用 — Sora 时代”——机器之心 AI 技术论坛日前圆满收官。活动当天,北京六道口氪空间论坛现场门庭若市,来自全国多个城市的近 200 名参会者亲临现场,在 10 位视频生成领域的技术专家带领下,系统拆解了
- 8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen
- 挑战拯救痴心“舔狗”,我和大模型都尽力了
机器之心发布机器之心编辑部天降猛男,大模型化身为 “痴情男大”,等待人类玩家的拯救。一款名为 “拯救舔狗” 的大模型原生小游戏出现了。游戏规则很简单:如果玩家在几轮对话内说服 “他” 放弃追求对他并无青睐的女神,就算挑战成功。听起来并不难,然而游戏源于生活,模型人设是痴情属性,相当油盐不进且自我攻略
- 这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
机器之心报道编辑:Panda还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可参看机器之心当时的报道《全网大讨论:引爆 OpenAI 全员乱斗的 Q * 到底是什么?》简而言之,Q* 很可能是 Q 强化学习
- 微软发布Phi-3,性能超Llama-3,可手机端运行
机器之心报道编辑:小舟、泽南数据已成为提升大模型能力的重点。Llama-3 刚发布没多久,竞争对手就来了,而且是可以在手机上运行的小体量模型。本周二,微软发布了自研小尺寸模型 Phi-3。新模型有三个版本,其中 Phi-3 mini 是一个拥有 38 亿参数的语言模型,经过 3.3 万亿 token
- Llama3后,Meta又开放自家头显操作系统,打造元宇宙时代新安卓
机器之心编译编辑:杜伟、崔亚鹂虽然向第三方开放了操作系统,但 Meta 将继续开发 Quest 头显设备。Meta 誓将开放进行到底。这次把自家 VR 头显 Quest 采用的操作系统「Meta Horizon OS」向第三方硬件制造商开放了,包括华硕、联想和微软等一众企业。此举意在展示作为 MR
- CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen
- 24GB单卡全量微调Llama 3-8B,仅需添加一行代码
自ChatGPT问世以来,大型语言模型在各个领域引起了广泛兴趣,并催生了基于语言模型的应用,包括但不限于自动文本生成、信息检索、智能助理、聊天机器人以及智能教育系统等。这些应用的表现和效果往往取决于模型本身的对话能力、逻辑推理能力以及上下文理解能力等核心特征。在实际应用中,为了满足不同领域对模型能力
- Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型
选自Lil’Log作者:Lilian Weng机器之心编译编辑:Panda过去几年来,扩散模型强大的图像合成能力已经得到充分证明。研究社区现在正在攻克一个更困难的任务:视频生成。近日,OpenAI 安全系统(Safety Systems)负责人 Lilian Weng 写了一篇关于视频生成的扩散模型
- 时代2024最具影响力100人:黄仁勋、Bengio、纳德拉 、王传福等人入选
机器之心报道编辑:小舟、陈萍刚刚,《时代》周刊发布了 2024 年度最具影响力的 100 人名单。在这份名单中,我们看到了很多熟悉的学者和企业家。微软公司 CEO、董事长萨蒂亚・纳德拉,比亚迪创始人王传福,英伟达创始人兼首席执行官黄仁勋,图灵奖得主 Yoshua Bengio 等均入选。下面我们整理
- Linux之父讽刺AI炒作:很搞笑,大概我也会被大模型取代
机器之心编译编辑:杜伟、崔亚鹂Linus Torvalds 对硬件错误、「邪恶的」开发者和搞笑的人工智能炒作发表了自己的看法。几天前,由 Linux 基金会主办的北美开源峰会(Open Source Summit North America)在华盛顿西雅图闭幕。会上,Linux 之父 Linus T
- AI重建粒子轨迹,发现新物理学
将 ScienceAI 设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 | 绿萝电子学在核物理领域从来都不是一帆风顺的。大型强子对撞机作为全球最强大的加速器,所产生的数据如此之多,使得全部记录这些数据从来都不是一个可行的选择。因此,处理来自探测器的信号波的系统擅长于「遗忘」——它
- 首个基于Mamba的MLLM来了!模型权重、训练代码等已全部开源
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen
- 史上首次!AI驾驶战机成功与人类飞行员空中「狗斗」
机器之心报道编辑:杜伟遗憾的是,这场「人机空战」的胜负结果未知。AI 操纵的战斗机又一次进化了!近日,美国 DARPA 透露称,去年 9 月一架由 F-16 改装而成的 AI 验证机,有史以来首次成功地在视距内与人类飞行员进行空中缠斗(俗称狗斗),让我们看到了人工智能在空战领域的应用前景。该验证机代
- AI Pioneers|星海图高继扬:人形机器人不是具身智能的唯一答案
人类正在迎来人工智能领域的爆炸式更新,技术向未知拓展的每一步,几乎都引起惊人的关注度。在人工智能边界扩张的过程中,重要赛道的技术路线创新与分歧并存。技术先锋者的判断和选择,影响着众多跟随者的脚步。过去一年,机器之心独家率先将月之暗面、生数科技、爱诗科技、无问芯穹等优秀公司介绍给大家,为他们在互联网世
- CVPR 2024 | 跳舞时飞扬的裙摆,AI也能高度还原了,南洋理工提出动态人体渲染新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen