Redian新闻
>
田渊栋等原班人马又一新作:AI生成长篇故事,数千字长文也能连贯、有趣

田渊栋等原班人马又一新作:AI生成长篇故事,数千字长文也能连贯、有趣

公众号新闻

机器之心报道

编辑:小舟、陈萍
以后,写故事这脑力活可以交给 AI 了。
前段时间,模仿人类写作过程的语言模型 Re^3 发布,该模型不需要微调大模型,而是通过设计 prompt 来生成一致性强的故事。

现在,该研究团队又提出了一个生成故事的新模型 DOC。论文作者 Kevin Yang、田渊栋也在推特上发文宣传了 DOC 模型,表示 DOC 比 Re^3 生成的故事更加连贯、有趣。


DOC 框架意指详细大纲控制(Detailed Outline Control),用于在自动生成数千字长故事时提高情节的连贯性。DOC 由两个互补的组件组成:详细大纲组件(Detailed Outliner)、详细控制器(Detailed Controller)。


论文地址:https://arxiv.org/pdf/2212.10077.pdf

Detailed Outliner 负责创建详细的、分层结构的大纲,将写作创意从起草转移到规划阶段。Detailed Controller 则通过控制故事段落与大纲细节对齐,确保生成结果遵循详细的大纲。

该研究对模型自动生成故事的功能进行了人工评估,DOC 在多个指标上获得了大幅增益:情节连贯性(22.5%)、大纲相关性(28.2%)和趣味性(20.7%),大大优于 Re^3 模型。此外,DOC 在交互式生成环境中更易于控制。

DOC

与 Re^3 类似,DOC 通过将写作过程分解为计划、起草、重写和编辑步骤,生成超过 2000 字、情节连贯的长篇故事。DOC 遵循 Re^3 的高级写作过程和基于结构化提示的段落生成。不过 DOC 删除了耗时的编辑步骤,即便如此,但对最终故事的质量没有影响。

不同于 Re^3 存在的缺点,如无法保持远程情节的连贯性、与周围环境不符的冗长段落、故事经常偏离最初计划等,DOC 旨在通过两项创新来解决这些缺点:通过 Detailed Outliner 实施更详细的规划,通过 Detailed Controller 在起草过程中相应地进行更详细的控制。

DOC 的高层概述。

Detailed Outliner 

Detailed Outliner 递归地生成任意粒度的分层详细大纲。图 3 总结了各个组件。


Detailed Controller 

Detailed Controller 增强了生成器与详细大纲保持相关性的能力。该研究将 Detailed Controller 实现为 FUDGE 控制器,以根据给定的摘要指导段落生成。

在起草过程中,Detailed Controller 的灵活性体现在:

  1. 事件。将事件描述(图 2,橙色文本)逐字输入控制器。 
  2. 设置。如果设置发生变化,该研究通过构建输入摘要来说明角色移动到新设置,与事件描述相比使用较低的控制强度。 
  3. 角色。如果出现了一个没有出现在前一个大纲条目中的角色,该研究还是通过构建一个输入摘要来说明这一点,再次使用较低的控制强度。


实验与评估

该研究比较了处于同一顶级大纲条目的 1000 到 1500 字的段落,而不是完整的故事。评估指标包括三个:连贯性、相关性以及趣味性。

结果如表 1 所示,DOC 生成的段落情节更加连贯且与大纲相关。


表 3 显示了 DOC 根据表 2 中的详细大纲(经大量删节)编写的一个故事(经大量删节):虽然有些问题仍然存在,但故事还保持整体连贯,遵循大纲内容。



人机交互故事生成:如表 4 所示,在四个人机交互指标上,人类更喜欢 DOC 而不是 RE^3 生成的故事:至少四分之三的人表示 DOC 在每个评估指标上都更优秀。


消融实验

为了评估 DOC 的两个主要组成部分,该研究对 DOC 进行了如下两种修改:

  • DOC-NOOUTLINE,仅根据粗略大纲而不是完整的详细大纲生成故事,使用固定强度的 Detailed Controller。 
  • DOC-NOCONTROL,除了 Detailed Controller 关闭外,其他设置与 DOC 相同。

消融实验的结果如下表 5 所示:


该研究发现,与 Re^3 相比,趣味性的提高主要是由于 DOC 有更详细的大纲;而 Detailed Controller 可能会稍微损害趣味性。该研究通过定性观察发现:进一步增加控制强度会产生更多重复的输出,这些输出越来越狭隘地拟合给定的大纲,而失去了创造力。

如下表 6 所示,该研究又进一步实验证明:Detailed Controller 的作用是大大提高 DOC 在起草过程中遵循大纲细节的能力。


了解更多研究,请参考原论文。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
有眼光、有耐心、有温度的投资人在哪里?张文宏刷屏录音究竟讲了什么?万字长文,首次讲清美国入境档案--邵洵美,钱天鹤,颜鹤鸣胡锦涛看走眼,纵容小人得志春节,有你、有我、有烟火「通信行程卡」正式下线;小米 13 发布,售价 3999 元起;马斯克:Twitter 将支持 4000 字长文 | 极客早知道【招人啦】专业、有爱、有梦想的「向日葵儿童」,欢迎优秀的你加入!敏感词最新UPDATE:完蛋,架走,登基,AirDrop…人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史万字长文复盘2022:陨落篇退休老同学聚会现场管理,要有目标、有战略、有组织田渊栋团队发布「长故事生成器」第二版DOC:连贯性大幅提升,趣味性提升20.7%!扩散模型再下一城!AR-LDM:用扩散模型合成连贯视觉故事!输入字幕就能脑补画面,代词ta都分得清最好的教育:有管、有教、有罚、有爱榜单 | 真故2022年最值得阅读的10篇故事卷!用扩散模型合成连贯视觉故事,输入字幕就能脑补画面,代词ta都分得清2022 ACM Fellow新增57人!北大梅宏、清华朱文武、腾讯俞栋等13位华人入选万字长文:CEX 交易所纷纷暴雷 如何保障你的加密资产安全?关于苏纳克的家庭背景以及如何看印度裔当英国首相万字长文,学 Linux 看这篇!田渊栋等人提出Re^3:一种自动生成长故事的模型万字长文干货分享!刘润年度演讲2022:进化的力量一颗GPU,秒出3D模型!OpenAI重磅新作:Point-E用文本即可生成三维点云模型谷歌新作:基于扩散模型的视频生成谷歌Imagen首次开放测试,安卓苹果都能玩,还有AI写作助手、超长连贯性视频生成模型资深运营总监千字长文总结:关于产品运营的独白与思考张文宏最新录音值得每个人收藏!万字长文讲清治疗新冠该如何用药【深度】王栋等 | 美国的中国观:演变历程及其启示百元门票免费赠送!李诞携脱口秀大会原班人马来多伦多陪你过除夕!万字长文、七位专家解读全真互联:与元宇宙侧重点不同,重视三大核心技术有趣、有味、有料的科学Jay Alammar再发新作:超高质量图解Stable Diffusion,看完彻底搞懂「图像生成」原理新加坡国大商学院教授万字长文,预测2023年世界各国经济走势连锁咖啡品牌「AoTiger虎闻咖啡」完成天使轮融资,由「鹿角巷」原班人马打造|早起看早期
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。