Redian新闻
>
今晚直播 | ACL 2023原作解读:研究评测与提升大语言模型时间推理能力

今晚直播 | ACL 2023原作解读:研究评测与提升大语言模型时间推理能力

公众号新闻





 学术直播间 第 1 期 


论文原作解读✔️

在线实时Q&A✔️


 直播主题 


ACL 2023:
研究评测与提升大语言模型时间推理能力

 直播嘉宾 


谭清宇
新加坡国立大学和达摩院联培博士生

 直播时间 


2023年8月22日(周二)
19:00-19:30

 观看方式 


扫码下方二维码

进入直播间观看



 报告介绍 


本文介绍了大语言模型在时间推理能力上的缺陷,并构建了一个更全面的时间敏感问答基准数据集TempReason,其时间范围更广(634年到2023年),覆盖了所有三类时间推理类型的问题。此外本文提出了一种新的时间学习框架,首先通过时间跨度抽取进行预训练,再进行任务特定的监督微调,最后利用时间敏感的强化学习进一步提升模型的时间推理能力。实验结果显示该方法可以持续改进强大基线模型的时间敏感问答性能。


论文信息

文标题: 

Towards Benchmarking and Improving the Temporal Reasoning Capability of Large Language Models

收录会议: 

ACL 2023

论文链接: 

https://arxiv.org/abs/2306.08952

数据代码: 

https://github.com/DAMO-NLP-SG/TempReason

文章解读: 

LLM难以理解时间变迁?达摩院联合NUS提出时间推理数据集以及时间强化的训练范式



 嘉宾介绍 


谭清宇

新加坡国立大学和达摩院联培博士生

谭清宇,新加坡国立大学与阿里达摩院联培博士四年级,师从 Ng Hwee Tou 和邴立东老师。其研究方向为 NLP,主要包括文档信息抽取和时间问答推理。其在 ACL, EMNLP, COLING 等 NLP 相关顶级会议发表了 7篇文章,其中一作占 5 篇。曾获新加坡政府奖学金,NUS 研究卓越奖等荣誉。



扫码下方二维码

进入直播间观看



🔍


现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧


·
·

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
MetaMath:新数学推理语言模型,训练大模型的逆向思维【今晚直播】队列研究:临床医生的“时间机器”走,到巴西去(五)伊瓜苏印象面向真实用户需求的中文大语言模型评测第二期(LLMEVAL-2)发布PromptBench: 首个大语言模型提示鲁棒性的评测基准大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机UCLA发布SciBench,评估大语言模型的科学问题解决能力MIT惊人证明:大语言模型就是「世界模型」?吴恩达观点再被证实,LLM竟能理解空间和时间今晚直播 | StructGPT:面向结构化数据的大模型推理框架Light and Shadow-13 Moving Wall给大语言模型“开个眼”,看图说话性能超CLIP!斯坦福等新方法无需多模态预训练丨开源4 岁就能玩!又萌又硬核,培养空间推理+逻辑推理,从这套桌游开始学习生成式大语言模型,东北大学自然语言处理实验室有一堂课直播预告 | ACL 2023原作解读:自查纠错—知识增强的思维链框架大语言模型会偷懒?新研究:上下文太长,模型会略过中间不看 | 本周论文推荐比 Spark 快 9 倍,超越 ClickHouse,在大语言模型时代构建全新数据平台全面的中文大语言模型评测来啦!香港中文大学研究团队发布微软发布 Guidance 语言,用于控制大语言模型DALL·E 3 推理能力炸裂提升,OpenAI 抢跑“ChatGPT 原生”胜利大会师 – 厉害的老妈在香港 (上)大语言模型击败扩散模型!视频图像生成双SOTA,谷歌CMU最新研究,一作北大校友从108篇顶会论文看大语言模型时代的推荐系统陈丹琦 ACL'23 Tutorial - 基于检索的大语言模型 学习笔记ACL 2023 | 达摩院、NTU提出多视图压缩表示,显著提升预训练语言模型鲁棒性生成式 AI 与大语言模型时代的 NVIDIA GPU 生态 | NVIDIA 解决方案与架构技术总监张瑞华演讲预告Google提出LaCLIP:大语言模型重写本文输入,让CLIP重焕光彩!北京内推 | 航天信息招聘大语言模型算法研究实习生(2023年暑期)ACL 2023 | 使用语言模型解决数学推理问题的协同推理框架夏夜的温柔“千模千测”——针对大语言模型认知能力的高效测试方法大语言模型真能“理解”语言吗?​基于MCTS和Residual-EBM的数学推理能力提升实践从文心一言 APP 看大语言模型时代的 C 端产品研发变革|QCon故梦萦怀话渝州: (2)山城往事ICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。