Redian新闻
>
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态

手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
手机上能跑的 GPT-4V!面壁发布端侧最强多模态小钢炮 2.6,实时视频理解首次上端高程图、坡向图、坡度图.....到底怎么做?完全开源!谢赛宁发布最新SOTA多模态模型Cambrian-1,“不与GPT-4V媲美”面壁 WAIC 新发布:新一代高效低能耗架构面壁小钢炮、一键开发大模型 APP 的全栈工具集可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术无需人工/GPT-4V排序,针对多模态大模型的全自动多级偏好学习iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑万亿token!史上最大多模态数据集诞生WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律全新长岛薰衣草庄园出发啦!面积比往年增加一倍!纽约的普罗旺斯来啦!7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单大模型时代的蓝海任务,GPT4V准确率不足10%,港科大发布指代理解基准RefCOCO一万亿token!34亿张图像,扩大10倍!史上最大开源多模态数据集MINT-1T发布!字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走仅8B,全面超越GPT-4V!单图、多图、视频理解端侧三冠王!史上最强端侧多模态诞生联汇科技OmChat:突破长视频理解极限的多模态大模型​Gemini终于赢了GPT-4o!Video-MME首个视频多模态基准来了!英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!性能对标GPT-4o对话面壁智能刘知远:大模型将有新的「摩尔定律」,AGI 时代的智能终端未必是手机[电脑] 136K+七彩虹B760I+索泰 RTX 4070S + 九州风神 CH160 ITX 手提小钢炮装机方案分享首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次GPT-4o仅排第二!北大港大等6所高校联手,发布权威多模态大模型榜单!高考碰上端午假期,出行需求激增Mamba成功杀入ECCV 2024!VideoMamba:高效视频理解的状态空间模型MIT、耶鲁官网推荐!门槛低、体验佳的「国际语言学奥赛」来啦!考考大模型视频理解能力,中科院人大百川提出新基准合成框架Apple多模态最新工作4M-21:搞定21种模态!刷新多个SOTA!中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑中科院、人大、百川提出视频理解基准合成框架VideoNIAH37项SOTA!全模态预训练范式MiCo:理解任何模态并学习通用表示|港中文&中科院
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。