今晚直播 | ACL 2023原作解读:研究评测与提升大语言模型时间推理能力
报告介绍
本文介绍了大语言模型在时间推理能力上的缺陷,并构建了一个更全面的时间敏感问答基准数据集TempReason,其时间范围更广(634年到2023年),覆盖了所有三类时间推理类型的问题。此外本文提出了一种新的时间学习框架,首先通过时间跨度抽取进行预训练,再进行任务特定的监督微调,最后利用时间敏感的强化学习进一步提升模型的时间推理能力。实验结果显示该方法可以持续改进强大基线模型的时间敏感问答性能。
论文信息
Towards Benchmarking and Improving the Temporal Reasoning Capability of Large Language Models
收录会议:
论文链接:
数据代码:
文章解读:
LLM难以理解时间变迁?达摩院联合NUS提出时间推理数据集以及时间强化的训练范式
谭清宇
新加坡国立大学和达摩院联培博士生
扫码下方二维码
进入直播间观看
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
微信扫码关注该文公众号作者
戳这里提交新闻线索和高质量文章给我们。
来源: qq
点击查看作者最近其他文章