Redian新闻
>
田渊栋等原班人马又一新作:AI生成长篇故事,数千字长文也能连贯、有趣

田渊栋等原班人马又一新作:AI生成长篇故事,数千字长文也能连贯、有趣

公众号新闻

机器之心报道

编辑:小舟、陈萍
以后,写故事这脑力活可以交给 AI 了。
前段时间,模仿人类写作过程的语言模型 Re^3 发布,该模型不需要微调大模型,而是通过设计 prompt 来生成一致性强的故事。

现在,该研究团队又提出了一个生成故事的新模型 DOC。论文作者 Kevin Yang、田渊栋也在推特上发文宣传了 DOC 模型,表示 DOC 比 Re^3 生成的故事更加连贯、有趣。


DOC 框架意指详细大纲控制(Detailed Outline Control),用于在自动生成数千字长故事时提高情节的连贯性。DOC 由两个互补的组件组成:详细大纲组件(Detailed Outliner)、详细控制器(Detailed Controller)。


论文地址:https://arxiv.org/pdf/2212.10077.pdf

Detailed Outliner 负责创建详细的、分层结构的大纲,将写作创意从起草转移到规划阶段。Detailed Controller 则通过控制故事段落与大纲细节对齐,确保生成结果遵循详细的大纲。

该研究对模型自动生成故事的功能进行了人工评估,DOC 在多个指标上获得了大幅增益:情节连贯性(22.5%)、大纲相关性(28.2%)和趣味性(20.7%),大大优于 Re^3 模型。此外,DOC 在交互式生成环境中更易于控制。

DOC

与 Re^3 类似,DOC 通过将写作过程分解为计划、起草、重写和编辑步骤,生成超过 2000 字、情节连贯的长篇故事。DOC 遵循 Re^3 的高级写作过程和基于结构化提示的段落生成。不过 DOC 删除了耗时的编辑步骤,即便如此,但对最终故事的质量没有影响。

不同于 Re^3 存在的缺点,如无法保持远程情节的连贯性、与周围环境不符的冗长段落、故事经常偏离最初计划等,DOC 旨在通过两项创新来解决这些缺点:通过 Detailed Outliner 实施更详细的规划,通过 Detailed Controller 在起草过程中相应地进行更详细的控制。

DOC 的高层概述。

Detailed Outliner 

Detailed Outliner 递归地生成任意粒度的分层详细大纲。图 3 总结了各个组件。


Detailed Controller 

Detailed Controller 增强了生成器与详细大纲保持相关性的能力。该研究将 Detailed Controller 实现为 FUDGE 控制器,以根据给定的摘要指导段落生成。

在起草过程中,Detailed Controller 的灵活性体现在:

  1. 事件。将事件描述(图 2,橙色文本)逐字输入控制器。 
  2. 设置。如果设置发生变化,该研究通过构建输入摘要来说明角色移动到新设置,与事件描述相比使用较低的控制强度。 
  3. 角色。如果出现了一个没有出现在前一个大纲条目中的角色,该研究还是通过构建一个输入摘要来说明这一点,再次使用较低的控制强度。


实验与评估

该研究比较了处于同一顶级大纲条目的 1000 到 1500 字的段落,而不是完整的故事。评估指标包括三个:连贯性、相关性以及趣味性。

结果如表 1 所示,DOC 生成的段落情节更加连贯且与大纲相关。


表 3 显示了 DOC 根据表 2 中的详细大纲(经大量删节)编写的一个故事(经大量删节):虽然有些问题仍然存在,但故事还保持整体连贯,遵循大纲内容。



人机交互故事生成:如表 4 所示,在四个人机交互指标上,人类更喜欢 DOC 而不是 RE^3 生成的故事:至少四分之三的人表示 DOC 在每个评估指标上都更优秀。


消融实验

为了评估 DOC 的两个主要组成部分,该研究对 DOC 进行了如下两种修改:

  • DOC-NOOUTLINE,仅根据粗略大纲而不是完整的详细大纲生成故事,使用固定强度的 Detailed Controller。 
  • DOC-NOCONTROL,除了 Detailed Controller 关闭外,其他设置与 DOC 相同。

消融实验的结果如下表 5 所示:


该研究发现,与 Re^3 相比,趣味性的提高主要是由于 DOC 有更详细的大纲;而 Detailed Controller 可能会稍微损害趣味性。该研究通过定性观察发现:进一步增加控制强度会产生更多重复的输出,这些输出越来越狭隘地拟合给定的大纲,而失去了创造力。

如下表 6 所示,该研究又进一步实验证明:Detailed Controller 的作用是大大提高 DOC 在起草过程中遵循大纲细节的能力。


了解更多研究,请参考原论文。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
连锁咖啡品牌「AoTiger虎闻咖啡」完成天使轮融资,由「鹿角巷」原班人马打造|早起看早期谷歌Imagen首次开放测试,安卓苹果都能玩,还有AI写作助手、超长连贯性视频生成模型春节,有你、有我、有烟火敏感词最新UPDATE:完蛋,架走,登基,AirDrop…退休老同学聚会现场管理,要有目标、有战略、有组织谷歌新作:基于扩散模型的视频生成有趣、有味、有料的科学【招人啦】专业、有爱、有梦想的「向日葵儿童」,欢迎优秀的你加入!最好的教育:有管、有教、有罚、有爱Jay Alammar再发新作:超高质量图解Stable Diffusion,看完彻底搞懂「图像生成」原理万字长文干货分享!刘润年度演讲2022:进化的力量美国入境档案--邵洵美,钱天鹤,颜鹤鸣卷!用扩散模型合成连贯视觉故事,输入字幕就能脑补画面,代词ta都分得清一颗GPU,秒出3D模型!OpenAI重磅新作:Point-E用文本即可生成三维点云模型万字长文、七位专家解读全真互联:与元宇宙侧重点不同,重视三大核心技术万字长文,学 Linux 看这篇!万字长文:CEX 交易所纷纷暴雷 如何保障你的加密资产安全?榜单 | 真故2022年最值得阅读的10篇故事【深度】王栋等 | 美国的中国观:演变历程及其启示田渊栋团队发布「长故事生成器」第二版DOC:连贯性大幅提升,趣味性提升20.7%!胡锦涛看走眼,纵容小人得志扩散模型再下一城!AR-LDM:用扩散模型合成连贯视觉故事!输入字幕就能脑补画面,代词ta都分得清2022 ACM Fellow新增57人!北大梅宏、清华朱文武、腾讯俞栋等13位华人入选关于苏纳克的家庭背景以及如何看印度裔当英国首相万字长文复盘2022:陨落篇百元门票免费赠送!李诞携脱口秀大会原班人马来多伦多陪你过除夕!有眼光、有耐心、有温度的投资人在哪里?人工智能300年!LSTM之父万字长文:详解现代AI和深度学习发展史「通信行程卡」正式下线;小米 13 发布,售价 3999 元起;马斯克:Twitter 将支持 4000 字长文 | 极客早知道张文宏最新录音值得每个人收藏!万字长文讲清治疗新冠该如何用药新加坡国大商学院教授万字长文,预测2023年世界各国经济走势田渊栋等人提出Re^3:一种自动生成长故事的模型张文宏刷屏录音究竟讲了什么?万字长文,首次讲清资深运营总监千字长文总结:关于产品运营的独白与思考
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。