Redian新闻
>
ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

公众号新闻

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
没算法没实验,这篇论文凭借纯理论入选ICML 2024 SpotlightICML 2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类的2级推理ICML 2024 | 为什么我们应该做online RLHF/DPO?Llama3比GPT-4o更爱说谎,首个大模型“诚实性”评估基准来了 | 上海交大ICML 2024 | 自动化所提出SpikeLM,首个完全脉冲驱动的通用语言建模方案清华“天眸芯”登Nature封面!全球首款类脑互补视觉芯片,施路平团队最新成果今天的前院花园 6/6/2024,5区北京内推 | ​微软亚洲研究院DKI组LLM团队招聘LLM方向研究型实习生身高不仅影响颜值还影响你的寿命!研究表明:身高与死亡率的联系呈U型,男性身高174cm,女性身高158cm时全因死亡率最低上交、清华联合发布rLLM,业界首个关系表格大模型算法库U.S.News 2024-2025 全球最佳大学排名,清华继续亚洲第一Befor and After2024 ASCO | 李云峰/张旋团队最新研究:TNT联合免疫治疗有效提高pMMR/MSS型局晚期直肠癌肿瘤CR率ICML 2024 | 大模型Checkpoint极致压缩,精度无损存储降低70倍三支国内团队获荣誉提名,英伟达CMU各占40%!ACM顶会SIGGRAPH 2024最佳论文揭晓Miss Alabama 2024AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024ACM顶会SIGGRAPH 2024最佳论文揭晓,英伟达CMU各占40%!三支国内团队获荣誉提名ICML2024高分论文!大模型计算效率暴涨至200%,来自中国AI公司CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA专家观点 | 以太彩光网 VS PON网络 谁更适合企业级园区贾扬清点赞:3K star量的SGLang上新,加速Llama 405B推理秒杀vLLM、TensorRT-LLM中科院张家俊团队最新综述,谈大模型研究的新领域:多模型协作ICML 2024 Spotlight | 在解码中重新对齐,让语言模型更少幻觉、更符合人类偏好2024 意大利南部行清华等高校推出首个开源大模型水印工具包MarkLLM,支持近10种最新水印算法清华提出时间序列大模型:面向通用时序分析的生成式Transformer | ICML 2024迪士尼笑了!陈丹琦团队最新研究,打造AI"版权护盾",AI创新不侵权ICML 2024爆火演讲!Meta等揭秘大模型内心世界:不同于人类的2级推理2024 意大利南部行ICML 2024|复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了一文看尽LLM对齐技术:RLHF、RLAIF、PPO、DPO……2024全网疯抢的“心机内裤”!薄至0.01cm,7A聚乳酸抑菌,穿一次就上瘾~~CMU&清华新作让LLM自己合成数据来学习,特定任务性能同样大幅提升ICML 2024 | 清华提出DecisionNCE,用多模态表征预训练加速具身智能
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。