Redian新闻
>
图像解码器;多头混合专家网络;视觉模型美学对齐;医学视觉任务适应基准

图像解码器;多头混合专家网络;视觉模型美学对齐;医学视觉任务适应基准

科技

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍只需将感知推理能力拆分,2B大模型就能战胜20B!国产新框架高效处理视觉任务CVPR上新 | 从新视角合成、视频编解码器、人体姿态估计,到文本布局分析,微软亚洲研究院精选论文抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法无需人类或GPT-4打标签!南大&旷视研究院无监督范式大幅降低视觉大模型对齐成本21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA余承东揭秘“25亿元转让问界”;小米辟谣将推出SU8;霸王茶姬就员工离职被公示致歉;爱奇艺客服回应基础会员有广告...ACL 2024 | 大语言模型的安全对齐会适得其反?无需训练便能逆转安全对齐大模型时代的蓝海任务,GPT4V准确率不足10%,港科大发布指代理解基准RefCOCO字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果CVPR 24|ETH Zurich等团队:重新定义小样本3D分割任务,新基准开启广阔提升潜力!全球首个支持单任务千卡规模异构芯片混合训练平台,来自无问芯穹宇宙人(1537期)美国防部:5年内将100颗“星盾”卫星纳入其通信网络;萤火虫ALPHA火箭复飞成功;软银与银行商讨借贷事宜今日arXiv最热大模型论文:大模型对齐告别微调,直接编辑表征空间即可解决ICML 2024 | 川大发布用于开集图像复原的测试时退化适应框架当Mamba遇上视觉压缩:首个具有选择性状态空间的视觉压缩网络算法、系统和应用,三个视角全面读懂混合专家(MoE)ICML 2024 Spotlight | 在解码中重新对齐,让语言模型更少幻觉、更符合人类偏好早期的限制性输入有助于后天的感官能力发展!Science | 揭示大脑为何擅长识别彩色图像和黑白图像加快410倍!字节豆包新工作TiTok:全新图像Tokenizer!生成图像最低只需32个token罗永浩发长文回应“五宗罪”;多平台治理体育“饭圈化”违规内容;视频号治理“快速过款”违规行为 | 一周简讯首次引入GPT-4o!图像自动评估新基准来啦最强GPT-4o也才刚及格?智源联合多所高校推出首个多任务长视频评测基准MLVU(4)同时操控手机和电脑,100项任务,跨系统智能体评测基准有了太全了!苹果上新视觉模型4M-21,搞定21种模态专治大模型“刷题”!贾佳亚团队新基准让模型只挑错不做题,GPT-4得分不到50字节、华科发布多语种视觉文本理解新基准,多模态大模型还有很长的路要走吴恩达团队新作:多模态多样本上下文学习,无需微调快速适应新任务MICCAI 2024 | 港科大提出ViP:利用LLM的通用知识对齐医学图像分析任务清华大学联合斯坦福大学提出混合注意力机制MoA,大模型解码速率提高6倍
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。