- 单镜头16秒720p高清视频一键生成,开源版Sora又有新惊喜了
机器之心发布机器之心编辑部潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展,支持无缝产出任意风格的高质量短片,令人惊喜的是,他们选择再给开源社区带来亿点点震撼,继续全部开源。开源地址:https://github.com/hpcaitech/Open-Sora
- 大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度
机器之心发布作者:李师尧(无问芯穹TechView)基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数,采用FP16存储,模型大小约为350GB,而即使是英伟达最新的B200 GPU
- 杀疯了!谷歌卷视频到语音,逼真音效让AI视频告别无声!
机器之心报道编辑:杨文AI圈这遍地开花的大好局面,让吃瓜群众们甚是惊喜。这几天,大洋彼岸杀疯了!Luma 的热乎劲儿还没过去,昨晚 Runway 就甩出一个王炸 ——Gen-3 Alpha。(查看详情请移步:Runway 版 Sora 发布:高保真、超强一致性,Gen-3 Alpha 震撼到网友了)
- 字节打造大模型TTS:不仅能高保真合成,而且支持调整编辑
机器之心报道编辑:Panda通过高保真合成语音与真人语音无异。首先来听一段《凡人修仙传》:你猜的没错,这段有声书并非来自某个专业制作团队,而是一个 AI 模型 Seed-TTS,而这个模型则是来自字节跳动的 Seed Team。TTS 是指文本转语音,这是一种具备诸多妙用的技术,像是让个人智能助理说
- 清华等高校推出首个开源大模型水印工具包MarkLLM,支持近10种最新水印算法
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen
- AI研究的主要推动力会是什么?ChatGPT团队研究科学家:算力成本下降
机器之心报道编辑:PandaAI 研究发展的主要推动力是什么?在最近的一次演讲中,OpenAI 研究科学家 Hyung Won Chung 给出了自己的答案。近日,斯坦福大学《CS25: Transformers United V4》课程迎来了一位我们熟悉的技术牛人:Hyung Won Chung。
- 3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D
机器之心发布机器之心编辑部2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。链
- 大模型+蒙特卡洛树搜索,一招让LLaMa-3 8B奥数水平直逼GPT-4
机器之心报道编辑:陈萍、杜伟通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。这几天,17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选赛中取得全球第 12 名的新闻刷了屏。而同时,AI 挑战赛的成绩显示,在所有 563 支 AI 参赛队伍中,最高分 34 分,平均分 18 分,赶
- 字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen
- 答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen
- ACL 2024论文盖棺定论:大语言模型≠世界模拟器,Yann LeCun:太对了
机器之心报道机器之心编辑部如果 GPT-4 在模拟基于常识任务的状态变化时准确率都只有约 60%,那么我们还要考虑将大语言模型作为世界模拟器来使用吗?最近两天,一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simula
- 星环科技孙元浩:语料已经是大模型最大的挑战
机器之心报道作者:Esther「原来以为语料已经匮乏了,大模型训练已经没有语料了,实际上不是的,数据还远远没有跑光」。作为大数据领域超过十年的创业者,「星环科技」创始人及CEO孙元浩并不认同「大模型已经将人类互联网数据穷尽」的说法。根据他的观察,如今在各行各业企业内部的数据还远远未被足够利用,人类在
- 新一轮「硬件彩票」:MatMul-free 会改变大模型的游戏规则吗?
机器之心PRO · 会员通讯 Week 24---- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ----1. 新一轮「硬件彩票」:MatMul-free 会改变大模型的游戏规则吗?MatMul-free 为何大火?「硬件彩票」是什么?为什么移除 MatMul 很重要?近期
- 高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen
- AI将是数学家的得力助手,陶哲轩谈AI在证明过程中的潜力
机器之心报道编辑:大盘鸡AI 将大大提高数学研究的效率。陶哲轩是公认的数学天才,被誉为「数学神童」。他从小便展现出惊人的数学天赋,9 岁时就参加了美国数学奥林匹克,并获得了金牌。他在数论、调和分析、偏微分方程等多个数学领域做出了重要贡献,并获得了菲尔兹奖, 这一奖项被视为数学界的最高荣誉,相当于数学
- 现在起,真正的强者敢于直面「扣子」的「模型广场」
机器之心原创作者:Sia实时 Pk、“蒙面“ 对垒、大众点评、定期排名...... 就问敢不敢揭榜?字节版 GPTs “扣子”上线后,五年级小学生都能创建自己的英语外教。“扣子”有一个相当大的优势,就是支持国内知名大语言模型作为底座,还免费,许多 “AI bot" 孕育而生。不过,无限续杯也有烦恼。
- 仅存活三个月的Copilot GPTs,因无盈利希望,被微软强制「退休」
机器之心报道编辑:山茶花Copilot GPTs 下月停服,Recall AI 功能也被推迟发布,微软这是啥情况?近日,微软在其官网宣布,将于 2024 年 7 月 10 日起停止其 Copilot GPTs 服务,同时将删除所有由用户创建的既有 Copilot GPT 及相关数据。一石激起千层浪。
- SIGGRAPH2024|上科大、影眸联合提出DressCode:从文本生成3D服装板片
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];zhaoyunfen
- 有望解决一个千禧年大奖难题,这个20多年前的猜想终于得到证明
选自quantamagazine作者:Leila Sloman机器之心编译编辑:Panda在数学抽象方面,最简单的莫过于图(graph)了。在平面上散放一些点,用线将其中一些连接起来,这就是一个图了。但图却非常强大。人们已经用它来解决各种各样的问题,从建模大脑中的神经元到为路上的送货卡车设计路径。在
- 英伟达开源最强通用模型Nemotron-4 340B
机器之心报道机器之心编辑部性能超越 Llama-3,主要用于合成数据。英伟达的通用大模型 Nemotron,开源了最新的 3400 亿参数版本。本周五,英伟达宣布推出 Nemotron-4 340B。它包含一系列开放模型,开发人员可以使用这些模型生成合成数据,用于训练大语言模型(LLM),可用于医疗