Redian新闻
>
7 Papers | GPT-4等大模型自己制作工具;识别ChatGPT造假

7 Papers | GPT-4等大模型自己制作工具;识别ChatGPT造假

公众号新闻

机器之心 & ArXiv Weekly 

参与:楚航、罗若天、梅洪源

本周的重要论文包括大模型迎来进化转折点,不只使用而且会自己制作工具了;北大、华为的研究者们提出的识别各式 AI 生成语料的可靠文本检测器。


目录:


  1. Multiscale Positive-Unlabeled Detection of AI-Generated Texts

  2. Towards Revealing the Mystery behind Chain of Thought: a Theoretical Perspective

  3. Large Language Models as Tool Makers

  4. SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification

  5. Cheap and Quick: Efficient Vision-Language Instruction Tuning for Large Language Models

  6. mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video

  7. Where to Go Next for Recommender Systems? ID- vs. Modality-based Recommender Models Revisited


论文 1:Multiscale Positive-Unlabeled Detection of AI-Generated Texts


  • 作者:Yuchuan Tian, Hanting Chen 等

  • 论文地址:https://arxiv.org/abs/2305.18149


摘要:AI 造假的成功率很高,前几天「10 分钟骗 430 万」还上了热搜。在最热门的大语言模型上,北大、华为的研究者们最近探索了一种识别方法。如下列举了几个人和 AI 分别对同一问题做出回答的例子:




推荐:识别「ChatGPT 造假」,效果超越 OpenAI:北大、华为的 AI 生成检测器来了


论文 2:Towards Revealing the Mystery behind Chain of Thought: a Theoretical Perspective


  • 作者:Guhao Feng、Bohang Zhang 等

  • 论文地址:https://arxiv.org/abs/2305.15408


摘要:思维链提示(CoT)是大模型涌现中最神秘的现象之一,尤其在解决数学推理和决策问题中取得了惊艳效果。CoT 到底有多重要呢?它背后成功的机制是什么?本文中,北大的几位研究者证明了 CoT 在实现大语言模型(LLM)推理中是不可或缺的,并从理论和实验角度揭示了 CoT 如何释放 LLM 的巨大潜力。


本文选取了两个非常基础但核心的数学任务:算术和方程(下图给出了这两个任务的输入输出示例)



推荐:思维链如何释放语言模型的隐藏能力?最新理论研究揭示其背后奥秘


论文 3:Large Language Models as Tool Makers


  • 作者:Tianle Cai、 Xuezhi Wang 等

  • 论文地址:https://arxiv.org/pdf/2305.17126.pdf


摘要:受到制造工具对人类重要性的启发,在本文中,Google Deepmind、普林斯顿和斯坦福大学的研究者将这种「进化」的概念应用于 LLM 领域,进行了初步探索。他们提出了一个闭环框架,在这个框架中 LLM 作为工具制作者(LLMs As Tool Makers ,LATM),使其能够生成自己的可重新使用的工具来处理新任务。



推荐:GPT-4 等大模型迎来进化转折点:不只是使用,还会自己制作工具了


论文 4:SpecInfer: Accelerating Generative LLM Serving with Speculative Inference and Token Tree Verification


  • 作者:Xupeng Miao、Gabriele Oliaro 等

  • 论文地址:https://arxiv.org/abs/2305.09781


摘要:近日,来自卡耐基梅隆大学(CMU)的 Catalyst Group 团队发布了一款「投机式推理」引擎 SpecInfer,可以借助轻量化的小模型来帮助大模型,在完全不影响生成内容准确度的情况下,实现两到三倍的推理加速。



推荐:LLM 推理提速 2.8 倍,CMU 清华姚班校友提出「投机式推理」引擎 SpecInfer,小模型撬动大模型高效推理


论文 5:Cheap and Quick: Efficient Vision-Language Instruction Tuning for Large Language Models


  • 作者:Gen Luo、 Yiyi Zhou 等

  • 论文地址:https://arxiv.org/pdf/2305.15023.pdf


摘要:本文提出了一种新颖且经济实惠的解决方案,用于有效地将 LLMs 适应到 VL(视觉语言)任务中,称为 MMA。MMA 不使用大型神经网络来连接图像编码器和 LLM,而是采用轻量级模块,即适配器,来弥合 LLMs 和 VL 任务之间的差距,同时也实现了图像模型和语言模型的联合优化。同时,MMA 还配备了一种路由算法,可以帮助 LLM 在不损害其自然语言理解能力的情况下,在单模态和多模态指令之间实现自动切换。



推荐:训练时间减少 71.4%,存储成本节省 99.9%,厦大指令调优新方案 MMA 让羊驼模型实现多模态


论文 6:mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video


  • 作者:Haiyang Xu、 Qinghao Ye 等

  • 论文地址:https://arxiv.org/pdf/2302.00402.pdf


摘要:对于多模态基础模型,我们希望其不仅可以处理特定的多模态相关任务,还希望其处理单模态任务时也具有优异的性能。阿⾥达摩院团队发现现有的模型往往不能很好的平衡模态协作和模态纠缠的问题,这限制了模型在各种单模态和跨模态下游任务的性能。


基于此,达摩院的研究者提出了 mPLUG-2,其通过模块化的⽹络结构设计来平衡多模态之间的协作和纠缠问题,mPLUG-2 在 30 + 多 / 单模态任务,取得同等数据量和模型规模 SOTA 或者 Comparable 效果,在 VideoQA 和 VideoCaption 上超越 Flamingo、VideoCoca、GITv2 等超⼤模型取得绝对 SOTA。此外,mPLUG-Owl 是阿⾥巴巴达摩院 mPLUG 系列的最新工作,延续了 mPLUG 系列的模块化训练思想,把 LLM 升级为⼀个多模态⼤模型。mPLUG-2 的研究论文已被 ICML 2023 接收。



推荐:ICML 2023 | 基于模块化思想,阿里达摩院提出多模态基础模型 mPLUG-2


论文 7:Where to Go Next for Recommender Systems? ID- vs. Modality-based Recommender Models Revisited


  • 作者:Zheng Yuan、Fajie Yuan 等

  • 论文地址:https://arxiv.org/abs/2303.13835


摘要:本文调查了一个富有潜力的问题,即多模态推荐系统 MoRec 是否有望终结 IDRec 在推荐系统领域长达 10 年的主导地位,基于此,论文进行了深入研究。相关成果已被 SIGIR 2023 接收。下图为网络架构。



推荐:SIGIR 2023 | 推荐系统何去何从,经典 ID 范式要被颠覆?


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
单卡30秒跑出虚拟3D老婆!Text to 3D生成看清毛孔细节的高精度数字人,无缝衔接Maya、Unity等制作工具GPT-4等大模型迎来进化转折点:不只是使用,还会自己制作工具了ChatGPT中文版来了!只需简单注册ChatGPT.bj,即刻使用【最先进】的AI工具~5042 血壮山河之武汉会战 鏖战幕府山 11大模型的思想钢印:如何让ChatGPT相信水是有毒的?​中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制7 Papers & Radios | OpenAI用GPT-4解释GPT-2;Meta开源多感官基础模型DeepSpeed ZeRO++:降低4倍网络通信,显著提高大模型及类ChatGPT模型训练效率识别「ChatGPT造假」,效果超越OpenAI:北大、华为的AI生成检测器来了大模型自主智能体爆火,OpenAI也在暗中观察、发力,这是内部人的分析博客OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%张俊林:GPT4等LLM模型具备类人智慧了吗?碾压ChatGPT?Meta开源多语言大模型,可识别4000多种语言、错误率仅为OpenAI产品的一半据称百度文心大模型内测多项得分超ChatGPT;OpenAI等将向英国政府开放模型 | 环球科学要闻用ChatGPT造机器人;功能饮料成分抗衰老;银河系考古重要发现…|WE科学周报写给表姐的一封信GPT-3.5逆袭GPT-4!谷歌DeepMind华人天团,让LLM像人类一样制作工具,完胜CoTGPT-4充当评测老师,效果惊艳,港中文(深圳)开源凤凰、Chimera等大模型ChatGPT上线新必应搜索;PS更新AI图像生成工具;Anthropic募资近4.5亿美元丨AIGC大事日报大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型InfoQ 2023 年趋势报告:影响组织文化的两个最大的因素是大裁员和 ChatGPT 等大型语言模型大模型掌握16000+真实世界API了,清华等机构ToolLLM的工具使用能力不输ChatGPT盛名之下其实难副的日本温泉微软开源DeepSpeed Chat,人人可快速训练百亿、千亿级ChatGPT大模型【城事】巴黎市长将重修Châtelet 广场以方便行人今年的清明非同寻常三行代码调用PandaLM大模型自动实现保护隐私、可靠、可复现的大模型评估《蓝色的哈达》&《饮酒欢歌》阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4 训练,实力碾压当前最强开源模型ChatGPT 又断网了!OpenAI 暂时下线 ChatGPT 搜索功能,只因绕过付费墙?人手一个ChatGPT!微软DeepSpeed Chat震撼发布,一键RLHF训练千亿级大模型巴黎市长将重修Châtelet 广场以方便行人让ChatGPT调用10万+开源AI模型!HuggingFace新功能爆火:大模型可随取随用多模态AI工具ChatGPT全新功能公开演示!OpenAI总裁:ChatGPT会重新定义计算机(全文记录)GPT-4考过MIT造假,三位教授联名「甩锅」!猪队友作弊,抢发论文
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。