田渊栋等原班人马又一新作：AI生成长篇故事，数千字长文也能连贯、有趣

2022-12-23 11:12

机器之心报道

编辑：小舟、陈萍

以后，写故事这脑力活可以交给 AI 了。

前段时间，模仿人类写作过程的语言模型 Re^3 发布，该模型不需要微调大模型，而是通过设计 prompt 来生成一致性强的故事。

现在，该研究团队又提出了一个生成故事的新模型 DOC。论文作者 Kevin Yang、田渊栋也在推特上发文宣传了 DOC 模型，表示 DOC 比 Re^3 生成的故事更加连贯、有趣。

DOC 框架意指详细大纲控制（Detailed Outline Control），用于在自动生成数千字长故事时提高情节的连贯性。DOC 由两个互补的组件组成：详细大纲组件（Detailed Outliner）、详细控制器（Detailed Controller）。

论文地址：https://arxiv.org/pdf/2212.10077.pdf

Detailed Outliner 负责创建详细的、分层结构的大纲，将写作创意从起草转移到规划阶段。Detailed Controller 则通过控制故事段落与大纲细节对齐，确保生成结果遵循详细的大纲。

该研究对模型自动生成故事的功能进行了人工评估，DOC 在多个指标上获得了大幅增益：情节连贯性（22.5%）、大纲相关性（28.2%）和趣味性（20.7%），大大优于 Re^3 模型。此外，DOC 在交互式生成环境中更易于控制。

DOC

与 Re^3 类似，DOC 通过将写作过程分解为计划、起草、重写和编辑步骤，生成超过 2000 字、情节连贯的长篇故事。DOC 遵循 Re^3 的高级写作过程和基于结构化提示的段落生成。不过 DOC 删除了耗时的编辑步骤，即便如此，但对最终故事的质量没有影响。

不同于 Re^3 存在的缺点，如无法保持远程情节的连贯性、与周围环境不符的冗长段落、故事经常偏离最初计划等，DOC 旨在通过两项创新来解决这些缺点：通过 Detailed Outliner 实施更详细的规划，通过 Detailed Controller 在起草过程中相应地进行更详细的控制。

DOC 的高层概述。

Detailed Outliner

Detailed Outliner 递归地生成任意粒度的分层详细大纲。图 3 总结了各个组件。

Detailed Controller

Detailed Controller 增强了生成器与详细大纲保持相关性的能力。该研究将 Detailed Controller 实现为 FUDGE 控制器，以根据给定的摘要指导段落生成。

在起草过程中，Detailed Controller 的灵活性体现在：

实验与评估

该研究比较了处于同一顶级大纲条目的 1000 到 1500 字的段落，而不是完整的故事。评估指标包括三个：连贯性、相关性以及趣味性。

结果如表 1 所示，DOC 生成的段落情节更加连贯且与大纲相关。

表 3 显示了 DOC 根据表 2 中的详细大纲（经大量删节）编写的一个故事（经大量删节）：虽然有些问题仍然存在，但故事还保持整体连贯，遵循大纲内容。

人机交互故事生成：如表 4 所示，在四个人机交互指标上，人类更喜欢 DOC 而不是 RE^3 生成的故事：至少四分之三的人表示 DOC 在每个评估指标上都更优秀。

消融实验

为了评估 DOC 的两个主要组成部分，该研究对 DOC 进行了如下两种修改：

消融实验的结果如下表 5 所示：

该研究发现，与 Re^3 相比，趣味性的提高主要是由于 DOC 有更详细的大纲；而 Detailed Controller 可能会稍微损害趣味性。该研究通过定性观察发现：进一步增加控制强度会产生更多重复的输出，这些输出越来越狭隘地拟合给定的大纲，而失去了创造力。

如下表 6 所示，该研究又进一步实验证明：Detailed Controller 的作用是大大提高 DOC 在起草过程中遵循大纲细节的能力。

了解更多研究，请参考原论文。

转载请联系本公众号获得授权

投稿或寻求报道：[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq