Redian新闻
>
一次性支持 200 万字无损上下文!Kimi智能助手玩了个大的——月之暗面「登月」最新进展!

一次性支持 200 万字无损上下文!Kimi智能助手玩了个大的——月之暗面「登月」最新进展!

公众号新闻

夕小瑶科技说 原创
作者 |  王二狗
让大模型一次性无损地「吃下」一本书已经不是什么稀奇的事了,但如果我告诉你是下面👇🏻这样一本近百万字的书呢?

没错,这么疯狂的事竟然真的发生了——就在昨天月之暗面(Moonshot AI)召集了一次媒体沟通会,宣布在大模型长上下文窗口技术上取得新的突破:不到半年,Kimi 智能助手升级十倍——从支持20万字直接到支持 200 万字超长无损上下文。

ps:Kimi Chat已改名为Kimi智能助手,并已在官网(kimi.ai)开启“内测”。

超长上下文解锁超多可能

月之暗面现场展示了一些超长无损上下文的使用场景示例。最令人印象深刻的自然是开头提到的近百万字的《中医内科学》一书。当月之暗面工程副总裁许欣然抱出这本书时,引起了现场所有人的惊叹,好家伙,Kimi还真能一下“消化掉”并给出准确的诊疗建议,这背后的技术就像这本书一样“沉甸甸”。

支持超长上下文之后,Kimi在处理超多文件的业务场景时自然解锁了更多可能。例如,公司 HR 可以快速从500 份简历中让 Kimi 快速找出有某个行业从业经历,同时从计算机类专业毕业的求职者:

Kimi十分钟速成专家

大家肯定都听过一万小时专家定律,月之暗面在现场提出了「Kimi十分钟速成专家定律」——在 200 万字无损上下文的支持下,只需 10 分钟,Kimi 就能接近任何一个新领域的初级专家水平。比如上传英伟达过去几年的完整财报,马上就能让 Kimi 成为英伟达财务研究专家,帮用户分析总结英伟达历史上的重要发展节点。


而如果将甄嬛传全集几十万字的剧本传给 Kimi,你就能成为堪比一个看了好几十遍电视剧的“甄”学家,无论是甄嬛、果郡王的情感线以及和他们孩子的真相,借助Kimi都能秒答出来:

除了快速成为专家之外,Kimi还能让你扮演跑团游戏主持人,体验各种数字分身……

月之暗面「持续登月」

实现通用人工智能就像是登月,在通往AGI的路上,无损的长上下文将会是一个很关键的基础技术。从 word2vec 到 RNN、LSTM,再到 Transformer,历史上所有的模型架构演进,本质上都是在提升有效的、无损的上下文长度。”

月之暗面创始人&CEO杨植麟前不久在接受腾讯科技采访时表示:“长文本是登月第一步,它很本质。它是新的计算机内存,它能解决很多现在的问题。比如,现在多模态架构还需要tokenizer,但当你有一个无损压缩的long context就不需要了,可以把原始的放进去。进一步讲,它是把新计算范式变成更通用的基础……”

事实证明,月之暗面在登月的第一步上成绩斐然,月之暗面将 Kimi 智能助手的无损上下文长度从20 万字提升到200 万字只用了不到半年时间。而在这半年时间里,由于没有采用常规的渐进式提升路线,月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能,月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走“滑动窗口”、“降采样”等技术捷径,攻克了很多底层技术难点,才取得了新的突破。

月之暗面工程副总裁许欣然在媒体沟通会上表示,“无论是内存、算力还是网络带宽,历史上每一次基础技术的升级,都会解锁新的产品形态和应用场景。我们对 200 万无损上下文的 Kimi 可以带来哪些超出想象力的创新机遇充满期待。”

杨植麟此前在接受采访时明确表示,登月的第一步是长文本,第二步则会有两个大的milestone。其中之一就是真正的统一各种不同模态的世界模型,即一个真正的scalable和general的architecture(可扩展、通用的系统结构)。关于影响下一步“登月”计划的多模态模型,月之暗面在现场透露,他们早在Sora发布之前就在研发多模态大模型,预计今年就会亮相。

最后,就让我们小小地期待下,月之暗面会不会在视频生成时长上也在国内带来类似长文本一样“一骑绝尘”的突破吧。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
模型上下文长度达到10000000,又一批创业者完蛋了?AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了一口气读完甄嬛传剧本、大部头医书:月之暗面200万字上下文Kimi开启内测月之暗面Kimi正被大厂“围剿”:90后清华学霸带队“卷”长文本,不到一年估值破百亿LongRoPE:超越极限,将大模型上下文窗口扩展超过200万tokens月之暗面回应创始人套现四千万美金:不实!几乎所有中文输入法均曝严重漏洞,近10亿用户受影响;特斯拉大量毁约应届生 | Q资讯现在男生家都这么cheap了?准媳妇上门,给$100, $200“红包”?谷歌7大模型22项AI大招轰炸:70秒视频生成、Gemini安卓合体、200万tokens上下文58行代码把Llama 3扩展到100万上下文,任何微调版都适用Mamba超强进化体一举颠覆Transformer!单张A100跑140K上下文独家 | 月之暗面正在进行两亿美元融资,投前估值高达 15 亿美元史上首次!嫦娥六号启程“取样”,即将揭开“月之暗面”神秘面纱AI早知道|Kimi智能助手升级;Meta开源推出新一代大语言模型Llama3最新进展!那个华裔女医生毒杀丈夫案!女医生或将面临8年监禁!Stability CEO自己跑路:没董事会控制权;月之暗面Kimi火爆至宕机,已扩容5次;王小川怼李彦宏:活在幻觉中|AI周报Meta 训练 AI 成本超「阿波罗登月」;马斯克 560 亿美元薪酬提案待通过;国家铁路净利润 33 亿元破纪录 |极客早知道一家之煮:当Pecan决定分手时强力覆盖导购、本地生活,月之暗面推出多个“Kimi分身”,大模型应用元年加速到来?我的健康厨房 - 我是如何控制和管理血糖的《早晨的故乡》&《橱窗》LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文AI早知道|腾讯文档智能助手开启公测;GPT-4、文心一言领跑主流大模型美国酝酿AI「登月计划」,陶哲轩领衔62页报告重磅发布谷歌、阿里、字节、科大讯飞、月之暗面、智谱等大模型落地实践案例集结完毕|AICon 北京 2024 议程上线英伟达交付OpenAI全球首块H200;月之暗面否认创始人套现数千万美元;苹果发布设备端开源AI模型|AIGC周观察第四十一期美国酝酿AI「登月计划」,陶哲轩领衔62页报告重磅发布!劳伦斯:久别重逢刘苏里Kimi、阿里、资本大佬,联手玩了个高端局完整的Interval 初阶练习 200*6,300*4(BQ计划 24周)宇宙人(1490期)习近平向中拉航天合作论坛致贺信;我国载人登月项目最新进展;旅行者1号复活!中国科学家验证《三体》重要情节纽约琐事(二)事事难料月之暗面回应创始人杨植麟套现数千万美元;斗鱼主播一条小团团被捕;苹果5月7日将开发布会;全国首例AI声音侵权案一审宣判|邦早报万字长文总结多模态大模型最新进展(Modality Bridging篇)月之暗面 Kimi 智能助手实现 200 万字长上下文,火山引擎提供云服务支持AI安全之问:我们的智能助手真的安全吗?月之暗面正在进行两亿美元融资,投前估值高达15亿美元实测智能助手「黑马」海螺 AI:人人上手即用的 AI 产品长这样子
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。