Redian新闻
>
仅8B,全面超越GPT-4V!单图、多图、视频理解端侧三冠王!史上最强端侧多模态诞生

仅8B,全面超越GPT-4V!单图、多图、视频理解端侧三冠王!史上最强端侧多模态诞生

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
完全开源!谢赛宁发布最新SOTA多模态模型Cambrian-1,“不与GPT-4V媲美”无需人工/GPT-4V排序,针对多模态大模型的全自动多级偏好学习手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态一万亿token!34亿张图像,扩大10倍!史上最大开源多模态数据集MINT-1T发布!字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走考考大模型视频理解能力,中科院人大百川提出新基准合成框架NVIDIA把Llama-3的上下文长度扩展16倍,长上下文理解能力超越GPT-4AI早知道|腾讯元宝上线3D角色梦工厂;Claude 3.5 Sonnet数据可视化超越GPT-4o首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次阿里发布大模型发布图结构长文本处理智能体,超越GPT-4-128k大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度Mamba成功杀入ECCV 2024!VideoMamba:高效视频理解的状态空间模型大模型时代的蓝海任务,GPT4V准确率不足10%,港科大发布指代理解基准RefCOCO7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单RAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术​Gemini终于赢了GPT-4o!Video-MME首个视频多模态基准来了!Llama 8B搜索100次超越GPT-4o!推理+搜索即可提升性能,新「Scaling Law」诞生?全面超越Transformer!清华蚂蚁推出纯MLP架构,长短程时序预测大幅提升字节跳动豆包大模型支持实时语音通话;阿里发布Qwen2-Math:数学推理全球第一,超越GPT-4o丨AIGC日报北京大学:利用好不确定性,8B小模型也能超越GPT-4超级AI即将诞生?史上最强超算9月上线,英伟达最强芯片加持高程图、坡向图、坡度图.....到底怎么做?中科院、人大、百川提出视频理解基准合成框架VideoNIAH联汇科技OmChat:突破长视频理解极限的多模态大模型高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF谷歌终于赢了OpenAI一回:实验版本Gemini 1.5 Pro超越GPT-4o手机上能跑的 GPT-4V!面壁发布端侧最强多模态小钢炮 2.6,实时视频理解首次上端Apple多模态最新工作4M-21:搞定21种模态!刷新多个SOTA!万亿token!史上最大多模态数据集诞生
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。