Redian新闻
>
考考大模型视频理解能力,中科院人大百川提出新基准合成框架

考考大模型视频理解能力,中科院人大百川提出新基准合成框架

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
今日arXiv最热NLP大模型论文:清华大学:大语言模型的常见词僻意理解能力竟不如中学生有文化和没文化,有兴趣接龙吗?《花尾渡》(小说) 三十二章 与上帝的秘密约定百川新模型冲顶中文测试基准!首款AI助手“百小应”同时发布,“最懂搜索”中科院张家俊团队最新综述,谈大模型研究的新领域:多模型协作字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走让人物跳起来!华科&阿里巴巴提出UniAnimate:人类跳舞视频生成新框架!支持合成一分钟高清视频!CVPR 2024 中科院等提出:实时人像视频三维感知重光照方法探索视频理解新境界!在12项任务中,Mamba先打败了Transformer大型视觉语言模型攻击综述:资源、进展与未来趋势7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单今日arXiv最热大模型论文:首个面向AI的python编程框架,提升大模型编程能力新思路手机上能跑的 GPT-4V!面壁发布端侧最强多模态小钢炮 2.6,实时视频理解首次上端专治大模型“刷题”!贾佳亚团队新基准让模型只挑错不做题,GPT-4得分不到50Mamba再次击败Transformer!在视频理解任务中杀疯了!4K图像理解轻松拿捏!IXC2-4KHD:开创性的大型视觉语言模型!CoT提出者Jason Wei:大模型评估基准的「七宗罪」小鬼子进村今日arXiv最热NLP大模型论文:揭露大语言模型短板,北京大学提出事件推理测试基准ISSTA 2024 | 北大提出CoderUJB,面向代码大模型的可执行多任务代码评估基准揭示真实能力与局限中科院、人大、百川提出视频理解基准合成框架VideoNIAHNVIDIA把Llama-3的上下文长度扩展16倍,长上下文理解能力超越GPT-4ACL2024主会:中科院发布表格理解大模型Table-LLaVA,刷榜23项指标支持合成一分钟高清视频,华科等提出人类跳舞视频生成新框架UniAnimate大模型时代的蓝海任务,GPT4V准确率不足10%,港科大发布指代理解基准RefCOCO仅8B,全面超越GPT-4V!单图、多图、视频理解端侧三冠王!史上最强端侧多模态诞生Mamba成功杀入ECCV 2024!VideoMamba:高效视频理解的状态空间模型ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架退休 111-探视史珲手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现汽車測試場邊的有趣對話阿里通义千问2.5大模型发布;阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉丨AIGC日报无一大模型及格! 北大/通研院提出超难基准,专门评估长文本理解生成联汇科技OmChat:突破长视频理解极限的多模态大模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。