Redian新闻
>
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态

手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单对话面壁智能刘知远:大模型将有新的「摩尔定律」,AGI 时代的智能终端未必是手机大模型时代的蓝海任务,GPT4V准确率不足10%,港科大发布指代理解基准RefCOCO完全开源!谢赛宁发布最新SOTA多模态模型Cambrian-1,“不与GPT-4V媲美”全新长岛薰衣草庄园出发啦!面积比往年增加一倍!纽约的普罗旺斯来啦!高考碰上端午假期,出行需求激增GPT-4o仅排第二!北大港大等6所高校联手,发布权威多模态大模型榜单!首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律Mamba成功杀入ECCV 2024!VideoMamba:高效视频理解的状态空间模型MIT、耶鲁官网推荐!门槛低、体验佳的「国际语言学奥赛」来啦![电脑] 136K+七彩虹B760I+索泰 RTX 4070S + 九州风神 CH160 ITX 手提小钢炮装机方案分享联汇科技OmChat:突破长视频理解极限的多模态大模型37项SOTA!全模态预训练范式MiCo:理解任何模态并学习通用表示|港中文&中科院Apple多模态最新工作4M-21:搞定21种模态!刷新多个SOTA!字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走一万亿token!34亿张图像,扩大10倍!史上最大开源多模态数据集MINT-1T发布!面壁 WAIC 新发布:新一代高效低能耗架构面壁小钢炮、一键开发大模型 APP 的全栈工具集手机上能跑的 GPT-4V!面壁发布端侧最强多模态小钢炮 2.6,实时视频理解首次上端高程图、坡向图、坡度图.....到底怎么做?中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑无需人工/GPT-4V排序,针对多模态大模型的全自动多级偏好学习万亿token!史上最大多模态数据集诞生​Gemini终于赢了GPT-4o!Video-MME首个视频多模态基准来了!可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术中科院、人大、百川提出视频理解基准合成框架VideoNIAH仅8B,全面超越GPT-4V!单图、多图、视频理解端侧三冠王!史上最强端侧多模态诞生考考大模型视频理解能力,中科院人大百川提出新基准合成框架英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。