Redian新闻
>
最强GPT-4o也才刚及格?智源联合多所高校推出首个多任务长视频评测基准MLVU(4)

最强GPT-4o也才刚及格?智源联合多所高校推出首个多任务长视频评测基准MLVU(4)

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
比比划划走世界ISSTA 2024 | 北大提出CoderUJB,面向代码大模型的可执行多任务代码评估基准揭示真实能力与局限今日神图 | 雷军视频评论区,倒反天罡……7B最强长视频模型! LongVA视频理解超千帧,霸榜多个榜单清华等高校推出首个开源大模型水印工具包MarkLLM,支持近10种最新水印算法Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大故园超越 Transformer 与 Mamba,Meta 联合斯坦福等高校推出最强架构 TTT大模型时代的蓝海任务,GPT4V准确率不足10%,港科大发布指代理解基准RefCOCO无一大模型及格! 北大/通研院提出超难基准,专门评估长文本理解生成初中男生“开黄腔”调戏女老师?现场视频评论太恶臭:老师裙子好短好性感!八旬老范啃嫩草还立牌坊,弘扬哪国的优秀传统文化?GPT-4o仅排第二!北大港大等6所高校联手,发布权威多模态大模型榜单!全球140+大模型全方位评测结果出炉,智源评测体系发布ChatGPT 之父最新专访:发现 GPT-4o 惊喜用途,下一代模型可能不是 GPT-5GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次适应多形态多任务,最强开源机器人学习系统「八爪鱼」诞生​Gemini终于赢了GPT-4o!Video-MME首个视频多模态基准来了!黄仁勋重磅发布!英伟达剧透新一代最强GPU,打破摩尔定律掀起新工业革命豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格首个AI高考全卷评测结果发布:数学全不及格;严打虚拟主播?腾讯视频号拟限制数字人带货;马斯克:宁愿亲眼见证AI毁灭人类丨AI周报开源视频版GPT-4o?快速记忆,实时问答,拿下CVPR'24长视频问答竞赛冠军北航等提出超大规模多语言代码评测基准,涵盖40种编程语言首次引入GPT-4o!图像自动评估新基准来啦有学生用AI代写论文?!多所高校发通知!网友:那最新的GPT-4o你们能检测出来吗?OpenAI踏入小模型战场,发布GPT-4o Mini,同日Mistral联合英伟达推出竞品克罗地亚杜布罗夫尼克(Dubrovnik),海边城堡大局:俄罗斯向东看,意义很不寻常!两年前精准预测俄坞战局和今日中俄关系的这段视频评论员,今天再次做预判和忠告:切勿错判错估形势~ICML 2024 | 面向第三代推荐系统:Meta提出首个生成式推荐系统模型陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现AAAI 2024 Oral|打破边界!利用CLIP的多任务多模态视频行为识别方法桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”樱中少数派,色品姣姣者
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。