机器之心文章 - 公众号作者

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>公众号

机器之心

最后更新于 2024-06-18 05:06

机器之心

[2024/06/15 - Now]

热搜关键词：

#科技 #其他

单镜头16秒720p高清视频一键生成，开源版Sora又有新惊喜了2024-06-18 05:06
机器之心发布机器之心编辑部潞晨 Open-Sora 团队在 720p 高清文生视频质量和生成时长上实现了突破性进展，支持无缝产出任意风格的高质量短片，令人惊喜的是，他们选择再给开源社区带来亿点点震撼，继续全部开源。开源地址：https://github.com/hpcaitech/Open-Sora
大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度2024-06-18 05:06
机器之心发布作者：李师尧（无问芯穹TechView）基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16存储，模型大小约为350GB，而即使是英伟达最新的B200 GPU
杀疯了！谷歌卷视频到语音，逼真音效让AI视频告别无声！2024-06-18 05:06
机器之心报道编辑：杨文AI圈这遍地开花的大好局面，让吃瓜群众们甚是惊喜。这几天，大洋彼岸杀疯了！Luma 的热乎劲儿还没过去，昨晚 Runway 就甩出一个王炸 ——Gen-3 Alpha。（查看详情请移步：Runway 版 Sora 发布：高保真、超强一致性，Gen-3 Alpha 震撼到网友了）
字节打造大模型TTS：不仅能高保真合成，而且支持调整编辑2024-06-18 05:06
机器之心报道编辑：Panda通过高保真合成语音与真人语音无异。首先来听一段《凡人修仙传》：你猜的没错，这段有声书并非来自某个专业制作团队，而是一个 AI 模型 Seed-TTS，而这个模型则是来自字节跳动的 Seed Team。TTS 是指文本转语音，这是一种具备诸多妙用的技术，像是让个人智能助理说
清华等高校推出首个开源大模型水印工具包MarkLLM，支持近10种最新水印算法2024-06-18 05:06
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；zhaoyunfen
AI研究的主要推动力会是什么？ChatGPT团队研究科学家：算力成本下降2024-06-17 16:06
机器之心报道编辑：PandaAI 研究发展的主要推动力是什么？在最近的一次演讲中，OpenAI 研究科学家 Hyung Won Chung 给出了自己的答案。近日，斯坦福大学《CS25: Transformers United V4》课程迎来了一位我们熟悉的技术牛人：Hyung Won Chung。
3D 版 SORA 来了！DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D2024-06-17 16:06
机器之心发布机器之心编辑部2024 年 5 月，DreamTech 官宣了其高质量 3D 生成大模型 Direct3D，并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。链
大模型+蒙特卡洛树搜索，一招让LLaMa-3 8B奥数水平直逼GPT-42024-06-17 16:06
机器之心报道编辑：陈萍、杜伟通过算法层面的创新，未来大语言模型做数学题的水平会不断地提高。这几天，17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选赛中取得全球第 12 名的新闻刷了屏。而同时，AI 挑战赛的成绩显示，在所有 563 支 AI 参赛队伍中，最高分 34 分，平均分 18 分，赶
字节豆包、武大提出 CAL：通过视觉相关的 token 增强多模态对齐效果2024-06-17 16:06
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；zhaoyunfen
答案抽取正确率达96.88%，xFinder断了大模型「作弊」的小心思2024-06-17 16:06
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；zhaoyunfen
ACL 2024论文盖棺定论：大语言模型≠世界模拟器，Yann LeCun：太对了2024-06-16 05:06
机器之心报道机器之心编辑部如果 GPT-4 在模拟基于常识任务的状态变化时准确率都只有约 60%，那么我们还要考虑将大语言模型作为世界模拟器来使用吗？最近两天，一篇入选 ACL 2024 的论文《Can Language Models Serve as Text-Based World Simula
星环科技孙元浩：语料已经是大模型最大的挑战2024-06-16 05:06
机器之心报道作者：Esther「原来以为语料已经匮乏了，大模型训练已经没有语料了，实际上不是的，数据还远远没有跑光」。作为大数据领域超过十年的创业者，「星环科技」创始人及CEO孙元浩并不认同「大模型已经将人类互联网数据穷尽」的说法。根据他的观察，如今在各行各业企业内部的数据还远远未被足够利用，人类在
新一轮「硬件彩票」：MatMul-free 会改变大模型的游戏规则吗？2024-06-16 05:06
机器之心PRO · 会员通讯 Week 24---- 本周为您解读 ③ 个值得细品的 AI & Robotics 业内要事 ----1. 新一轮「硬件彩票」：MatMul-free 会改变大模型的游戏规则吗？MatMul-free 为何大火？「硬件彩票」是什么？为什么移除 MatMul 很重要？近期
高质量3D生成最有希望的一集？GaussianCube在三维生成中全面超越NeRF2024-06-16 05:06
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；zhaoyunfen
AI将是数学家的得力助手，陶哲轩谈AI在证明过程中的潜力2024-06-16 05:06
机器之心报道编辑：大盘鸡AI 将大大提高数学研究的效率。陶哲轩是公认的数学天才，被誉为「数学神童」。他从小便展现出惊人的数学天赋，9 岁时就参加了美国数学奥林匹克，并获得了金牌。他在数论、调和分析、偏微分方程等多个数学领域做出了重要贡献，并获得了菲尔兹奖，这一奖项被视为数学界的最高荣誉，相当于数学
现在起，真正的强者敢于直面「扣子」的「模型广场」2024-06-15 05:06
机器之心原创作者：Sia实时 Pk、“蒙面“ 对垒、大众点评、定期排名...... 就问敢不敢揭榜？字节版 GPTs “扣子”上线后，五年级小学生都能创建自己的英语外教。“扣子”有一个相当大的优势，就是支持国内知名大语言模型作为底座，还免费，许多 “AI bot" 孕育而生。不过，无限续杯也有烦恼。
仅存活三个月的Copilot GPTs，因无盈利希望，被微软强制「退休」2024-06-15 05:06
机器之心报道编辑：山茶花Copilot GPTs 下月停服，Recall AI 功能也被推迟发布，微软这是啥情况？近日，微软在其官网宣布，将于 2024 年 7 月 10 日起停止其 Copilot GPTs 服务，同时将删除所有由用户创建的既有 Copilot GPT 及相关数据。一石激起千层浪。
SIGGRAPH2024｜上科大、影眸联合提出DressCode：从文本生成3D服装板片2024-06-15 05:06
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：[email protected]；zhaoyunfen
有望解决一个千禧年大奖难题，这个20多年前的猜想终于得到证明2024-06-15 05:06
选自quantamagazine作者：Leila Sloman机器之心编译编辑：Panda在数学抽象方面，最简单的莫过于图（graph）了。在平面上散放一些点，用线将其中一些连接起来，这就是一个图了。但图却非常强大。人们已经用它来解决各种各样的问题，从建模大脑中的神经元到为路上的送货卡车设计路径。在
英伟达开源最强通用模型Nemotron-4 340B2024-06-15 05:06
机器之心报道机器之心编辑部性能超越 Llama-3，主要用于合成数据。英伟达的通用大模型 Nemotron，开源了最新的 3400 亿参数版本。本周五，英伟达宣布推出 Nemotron-4 340B。它包含一系列开放模型，开发人员可以使用这些模型生成合成数据，用于训练大语言模型（LLM），可用于医疗