Redian新闻
>
ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

ACL 2024 | 提升大模型持续学习性能,哈工大、度小满提出共享注意力框架SAPT

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
清华大学联合斯坦福大学提出混合注意力机制MoA,大模型解码速率提高6倍北京内推 | ​度小满金融AI LAB招聘数字人/文生视频方向研究型实习生宇宙人(1503期)普京访哈工大参观火星探测车模型;工信部部署启动5G异网漫游商用推广;四维地球探索版正式上线;大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事奥特曼昨晚放话也要把大模型价格打下来!微软一夜革新生产力:Copilot 贯穿全场、小模型持续炸街ICLR 2024 | 冻结住的CLIP仍可作为教师模型!港大提出全新开集动作识别模型CVPR 2024 | 中大哈佛等提出全新训练方法CLoT,探究大模型幽默创新力洛杉矶东区猫狗领养活动 4/28/2024 周日下午3参观哈工大,普京现场透露摆脱懒惰妙招今日小满:万物繁盛好时节,人间小满胜万全阿里通义千问2.5大模型发布;阿里达摩院提出“知识链”框架,逐步纠错降低大模型幻觉丨AIGC日报今日arXiv最热大模型论文:LoRA又有新用途,学得少忘得也少,成持续学习关键!CVPR'24:文生图提示词自动优化,还发现三个小窍门,人大度小满等机构出品搬家清囤的Lululemon, Aritzia Randy & Murphy, Sophie Webster蝴蝶鞋及其他ECCV 2024 | 提升GPT-4V、Gemini检测任务性能,你需要这种提示范式闲话人生(235)与学生一起去采访怪味作家祖慰《沂蒙山永远的爹娘》&《我和你是劫是缘》YYDS!哈工大博士的PyTorch笔记火了!!复旦大学:没钱标数据的有福了!利用合成数据就能大幅提升大模型归纳推理能力在哈工大,普京透露了一个克服懒惰的妙招ICML 2024 | 川大提出外部引导的深度聚类新范式,大幅提升CLIP图像聚类性能哈工大经费狂涨27亿!背后隐藏着怎样的秘密?中科院、人大、百川提出视频理解基准合成框架VideoNIAH超越扩散模型!度小满、中科大等联合提出全新自回归通用文生图模型哈工大博士PyTorch笔记火了!!什么叫“顾客是上帝”?CHANEL的审美又回来了!2024/25 秋冬系列成衣很出彩ICLR 2024 | 微软提出视觉新主干EfficientMod:融合卷积和注意力机制GPT-4预测股票涨跌更更更准了!东京大学新框架LLMFactor提升显著 | ACL 2024哈工大2024录取通知书延续宇宙级浪漫!今年送把金钥匙!NAACL 2024 | 阿里提出大语言模型对齐框架Reward Learning on Policy (RLP)愚人节(4/1/2024)ICML 2024|华为诺亚提出SLAB:从BN和注意力角度改进Transformer什么样的毛笔字叫好书法?ACL 2024 | SMU、NUS提出参数高效微调增强剂,显著提升大语言模型性能超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像,中科大哈工大度小满出品2.5%KV缓存保持大模型90%性能,大模型金字塔式信息汇聚模式探秘|开源Best CD Rates Of April 2024: Up To 5.42%今日arXiv最热大模型论文:首个面向AI的python编程框架,提升大模型编程能力新思路悄悄地问一句: 什么是主流社会?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。