Redian新闻
>
2024年大模型潜力方向:大浪淘沙后的SFT和RLHF

2024年大模型潜力方向:大浪淘沙后的SFT和RLHF

公众号新闻

从一年前ChatGPT突然爆火,到不久前文生视频大模型Sora以霸屏之势吸引全球舆论,再到近日OpenAI发布的王炸GPT-4o与AI大模型相关的议题越来越多地被大众所讨论如果说2023年的大模型风暴还集中在“对话”上,那么,今年AI带来的亿点点震撼,就突破了文字乃至图像的范畴!


大模型相关内容之所以那么火,与其相结合的技术原理绝对不容忽视,为了能让大家更能进一步了解时下大模型相关前沿热点,我们特邀QS前50博导、大厂算法研究员等多位大牛打造了大模型系列课程,附论文代码讲解,原价666元,限时免费领!


扫码领取课程(附老师授课PPT)
免费领导师推荐150篇大模型论文合集&复现代码


部分授课ppt&代码复现&论文展示

课程概览

系列1:万物皆可大模型系列

1.GPT Plugin背后的原理

2.大模型与数据库交互

3.大模型玩Minecraft


系列2:个惊艳的大模型高效参数微调法

1.大模型微调-任务特定的P-tuning

2.大模型微调-任务/模型无关的LORA

3.大模型微调方法-Peft库使用实践(实战篇)


系列3:知识图谱增强的LLM

1.知识图谱组成要素及其分类

2.知识图谱和 LLM 融合路线

3.知识图谱增强 LLM 的方法


系列4:惊艳的文本生成模型SORA

1.目前主流视频生成模式

2.主流模式的缺点

3.sora的工作原理及优点


系列5:大模型超级外挂:RAG让LLM不再胡说八道

1.目前主流视频生成模式

2.主流模式的缺点

3.sora的工作原理及优点


系列5:基于大模型的文本生成新神器

1.大模型时代下的文本生成

2.文本生成目前的挑战和未来发展




大模型必然是未来很长一段时间我们工作生活的一部分,而对于这样一个与我们生活高度同频互动的“大家伙”,除了性能、效率、成本等问题外,大规模语言模型的安全问题几乎是大模型所面对的所有挑战之中的重中之重,机器幻觉是大模型目前还没有极佳解决方案的主要问题,大模型输出的有偏差或有害的幻觉将会对使用者造成严重后果。同时,随着 LLMs 的“公信度”越来越高,用户可能会过度依赖 LLMs 并相信它们能够提供准确的信息,这点可以预见的趋势增加了大模型的安全风险。


扫码领取课程(附老师授课PPT)
免费领导师推荐150篇大模型论文合集&复现代码


部分授课ppt&代码复现&论文展示


最后,展望一下大模型研究的未来,目前大模型主要面临的挑战可以被归类如下:

  1. 实践验证:当前针对大模型的评估数据集往往是更像“玩具”的学术数据集,但是这些学术数据集无法完全反应现实世界中形形色色的问题与挑战,因此亟需实际的数据集在多样化、复杂的现实问题上对模型进行评估,确保模型可以应对现实世界的挑战;

  2. 模型对齐:大模型的强大也引出了另一个问题,模型应该与人类的价值观选择进行对齐,确保模型行为符合预期,不会“强化”不良结果,作为一个高级的复杂系统,如果不认真处理这种道德问题,有可能会为人类酝酿一场灾难;

  3. 安全隐患:大模型的研究要进一步强调安全问题,消除安全隐患,需要具体的研究确保大模型的安全研发,需要更多的做好模型的可解释性、监督管理工作,安全问题应该是模型开发的重要组成部分,而非锦上添花可有可无的装饰;

  4. 模型未来:模型的性能还会随着模型规模的增加而增长吗?,这个问题估计 OpenAI 也难以回答,我们针对大模型的神奇现象的了解仍然十分有限,针对大模型原理性的见解仍然十分珍贵。

文末福利


给大家送一波大福利!我整理了100节计算机全方向必学课程,包含CV&NLP&论文写作经典课程,限时免费领!



立即扫码
免费领100节计算机必学课程

-END-

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Ilya出走加剧OpenAI离职潮!RLHF作者Jan Leike同日辞职,超级对齐项目分崩离析就在明天!探索自己独特的研究方向:临床心理学PhD学长直播预告今日arXiv最热NLP大模型论文:大模型RAG新宠!浙江大学发布自反馈检索增强方法2今日arXiv最热NLP大模型论文:清华大学提出IFT对齐算法,打破SFT与RLHF局限性HFrEF指南导向药物治疗现状亟需改善!四联药物治疗率不足50%,目标剂量治疗率仅1% | ESC-HFA 2024剑桥提出RLHF平替方案:在SFT以外,我们还能拿SFT数据做什么?司美格鲁肽三项重磅研究发布,HFpEF合并肥胖患者综合获益再添力证! | ESC-HFA 2024未来风口方向:大模型应用开发!大浪淘沙十周年,最火文章大合集云天励飞余晓填:剖解大模型技术演进与挑战,算法芯片化突破大模型落地“三角约束”丨GenAICon 2024OpenAI联创:RLHF是超级智能的秘密武器1仅靠开源数据复刻出LLaMA3指令学习效果,在线迭代RLHF全流程解决方案来了ICML 2024 | 为什么我们应该做online RLHF/DPO?全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法今日arXiv最热大模型论文:大模型也来看球,还能判断是否犯规ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景纯加法Transformer!结合脉冲神经网络和Transformer的脉冲Transformer | NeurIPS 2023大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事绿色金融 | 2024政府工作报告:大力发展绿色低碳经济——绿色金融月报(2024年3月)英国私家小众包团4-7人9天7晚游:伦敦+剑桥+爱丁堡+格特纳格林+温德米尔+曼彻斯特+斯特拉福德+牛津大学 LHRLHR9V卷疯了!最强开源大模型Llama 3发布,最大参数4000亿,小扎内心:大模型比元宇宙香多了2024年ACC HFrEF决策路径发布,看看HFrEF治疗有哪些新变化!今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单大模型训练之序列并行双雄:DeepSpeed Ulysses和Ring-Attention伽马射线暴伽马射线暴的研究难点性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!曾毓群公布宁德时代新方向:分享技术,推动开放式创新今日arXiv最热大模型论文:COLING 2024: 复旦发布AoR,层级聚合推理突破大模型复杂推理上限周末逛逛晚晴园,吃点南洋美食,明天又要搬砖了开源大模型火了!(附99个大模型微调模型/数据/工具)!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。