Redian新闻
>
NIPS2023 | 评估大语言模型的事实性

NIPS2023 | 评估大语言模型的事实性

公众号新闻
评估大语言模型的事实性
陈适琪
香港城市大学博士生
FELM: Benchmarking Factuality Evaluation of Large Language Models - NeurIPS 2023


备注:昵称-学校/公司-方向/会议(eg.ACL),进入技术/投稿群


id:DLNLPer,记得备注呦

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
GitHub 基于大语言模型构建 Copilot 的经验和教训FuseLLM:大语言模型的知识融合!大语言模型的32种消除幻觉的技术,你都了解吗?五种资源类别,如何提高大语言模型的资源效率,超详细综述来了Meta 宣布改组旗下 AI 部门,正训练自家下一代大语言模型 Llama 3;国内首个网络安全大模型评测平台发布丨AIGC日报今日Arxiv最热NLP大模型论文:清华大学让大语言模型自动并行自回归解码,速度提升高达4倍!NeurIPS 2023 | 基于双重结构知识图的视觉语言模型高效迁移评论能力强于GPT-4,上交开源13B评估大模型Auto-J万字长文再论大语言模型的位置编码及其外推性用跑1个LoRA微调大语言模型的延迟跑10个!三个方面浅析数据对大语言模型的影响ACL23 | 基于检索的大语言模型-陈丹琦报告阅读视觉模型+大语言模型:首个支持10K+帧长视频理解任务的新型框架大语言模型击败扩散模型!视频图像生成双SOTA,谷歌CMU最新研究,一作北大校友​ICLR2024得分888居然被拒?Area Chair的Meta review完全事实性错误?引入大语言模型、首个支持国产算力生态,全新开源RL框架RLLTE来了哈工大发布大模型思维链推理综述:200+文献全面解析大语言模型思维链推理最新进展HaluEval 2.0:大语言模型事实性幻象的实验性分析第十四章 现代文明的历史演变 (1)80 聘礼字节跳动李航:对大语言模型的若干观察和思考NeurIPS 2023 Spotlight | 基于超图的表格语言模型EMNLP 2023 | MMEdit——如何编辑多模态大语言模型?感谢Google和T-Mobile学术成果 | EMNLP2023:MMEdit——如何编辑多模态大语言模型?波提切利:追求诗意、梦幻、美丽境界的伟大画家北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型MIT惊人再证大语言模型是世界模型!LLM能分清真理和谎言,还能被人类洗脑OpenAI科学家Andrej Karpathy力荐,23年必读的大语言模型论文清单[突发]BC房产评估大调整 两百斤黄金没人领 失主或是华人?!两飞机相撞起火 多人死亡379人疏散!这国对华免签!EMNLP 2023 | 用于开放域多跳推理的大语言模型的自我提示思想链大Batch训练大语言模型的探索与实践ICLR 2024得分888居然被拒?Area Chair的Meta review完全事实性错误?OSCHINA&Gitee:2023大语言模型LLM技术报告中国河南出英雄
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。