Redian新闻
>
仅8B,全面超越GPT-4V!单图、多图、视频理解端侧三冠王!史上最强端侧多模态诞生

仅8B,全面超越GPT-4V!单图、多图、视频理解端侧三冠王!史上最强端侧多模态诞生

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
完全开源!谢赛宁发布最新SOTA多模态模型Cambrian-1,“不与GPT-4V媲美”Apple多模态最新工作4M-21:搞定21种模态!刷新多个SOTA!联汇科技OmChat:突破长视频理解极限的多模态大模型字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走北京大学:利用好不确定性,8B小模型也能超越GPT-4万亿token!史上最大多模态数据集诞生阿里发布大模型发布图结构长文本处理智能体,超越GPT-4-128k中科院、人大、百川提出视频理解基准合成框架VideoNIAH高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRFMamba成功杀入ECCV 2024!VideoMamba:高效视频理解的状态空间模型大模型时代的蓝海任务,GPT4V准确率不足10%,港科大发布指代理解基准RefCOCO一万亿token!34亿张图像,扩大10倍!史上最大开源多模态数据集MINT-1T发布!手机上能跑的 GPT-4V!面壁发布端侧最强多模态小钢炮 2.6,实时视频理解首次上端全面超越Transformer!清华蚂蚁推出纯MLP架构,长短程时序预测大幅提升字节跳动豆包大模型支持实时语音通话;阿里发布Qwen2-Math:数学推理全球第一,超越GPT-4o丨AIGC日报考考大模型视频理解能力,中科院人大百川提出新基准合成框架Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?​Gemini终于赢了GPT-4o!Video-MME首个视频多模态基准来了!首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4oRAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态无需人工/GPT-4V排序,针对多模态大模型的全自动多级偏好学习高程图、坡向图、坡度图.....到底怎么做?超级AI即将诞生?史上最强超算9月上线,英伟达最强芯片加持NVIDIA把Llama-3的上下文长度扩展16倍,长上下文理解能力超越GPT-4可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度AI早知道|腾讯元宝上线3D角色梦工厂;Claude 3.5 Sonnet数据可视化超越GPT-4o
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。