Redian新闻
>
大语言模型会偷懒?新研究:上下文太长,模型会略过中间不看 | 本周论文推荐

大语言模型会偷懒?新研究:上下文太长,模型会略过中间不看 | 本周论文推荐

公众号新闻

每周,「领研网」都为你挑选近期重要或有趣的学术报道。点击标题即可阅读~

医药 · 生物

雌性,但有睾丸:这种动物的“雌雄同体”是如何炼成的?
@科研圈   Science


被这种寄生虫感染后,它的寿命延长到了原来的三倍(可以更多)
@环球科学   Royal Society Open Science; bioRxiv


当一只公鸭,进入另一只公鸭的尸体,科学家观赏了75分钟
@环球科学   Deinsea


最佳睡眠时间出炉:每晚睡7小时,晚上10-11点入睡,或最有益健康
@生物世界   Nature Aging; JAMA Network Open; Aging;Journal of the American Society of Nephrology; European Heart Journal – Digital Health; Sleep; Cerebral Cortex Communications; Nature Communications; Molecular Cell; PNAS; Cell


早饭和晚饭什么时候吃更好?10万人研究发现:这个时间段吃,可能让你更健康
@健康榨知机   International Journal of Epidemiology


半年一针就能控制高血压!NEJM发布创新RNAi疗法的积极临床结果
@药明康德   The New England Journal of Medicine


计算机 · 人工智能

Llama 2直接开源可商用:一夜之间,大模型格局变了
@科研圈


像GPT-4一样能看懂图文,李飞飞等人的具身AI给机器人造了个多模态对话框
@机器之心   arXiv


语言模型悄悄偷懒?新研究:上下文太长,模型会略过中间不看
@机器之心   arXiv


材料 · 能源

首个室温常压超导掀全球热度,数万人正在围观这个中国团队的复现进度
@机器之心   arXiv


Nature一作兼通讯,超导再获新进展!
@纳米人   Nature


在更热的世界里,制冷需求增加因国家而异
@环球科学   Nature Sustainability


物理 · 天文

自1988年起,每隔22分钟我们就会收到这个神秘的信号
@环球科学   Nature


Science:黑磷助攻,霍尔效应新突破!
@纳米人   Science


宇宙究竟多老?最新估计267亿岁
@环球科学   Monthly Notices of the Royal Astronomical Society

封面图来源:Pexels


更多精彩内容
点击直达👇🏻
<
滑动查看更多
>

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务微软发布 Guidance 语言,用于控制大语言模型文档字越多,模型越兴奋!KOSMOS-2.5:阅读「文本密集图像」的多模态大语言模型深圳内推 | 华为诺亚方舟语音语义实验室招聘大语言模型研究实习生零糖不健康?常用人工甜味剂有基因毒性,会破坏DNA|本周论文推荐田渊栋团队新作:通过位置插值来扩展大语言模型的上下文窗口1.5万中国人研究发现,这样睡觉更容易得癌症|本周论文推荐从108篇顶会论文看大语言模型时代的推荐系统三十二 肃反大语言模型综述全新出炉:51页论文带你盘点LLM领域专业化技术Meta开源像语言识别系统,模型识别唇语翻译6种语言,本地部署人人可用中午睡一睡,大脑年轻好几岁?;有这8个习惯的人,不容易得癌症!特别是乳腺癌、肺癌和结直肠癌|​本周论文推荐ChatGPT凌晨重磅更新!GPT-3.5/4双升级:上下文飙升4倍,用API自己造插件我国60岁以下“老年痴呆”患者调查占比超20%;糖尿病是“睡”出来的?有这3个睡眠习惯的人可能更容易患病 | 本周论文推荐再投八个亿,谱写新篇章断崖式衰老一般发生在几岁?首个中国女性适用的“衰老时钟”来了;室温超导Dias数据捏造实锤?过往PRL被撤|本周论文推荐GitHub斩获2.2k星!多模态大语言模型首篇综述,论文列表实时更新三十一 插秧学习生成式大语言模型,东北大学自然语言处理实验室有一堂课将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?一辈子没有痛觉、不知焦虑,奇女子“超能力”的真相有了答案|本周论文推荐田渊栋团队最新研究:不到1000步微调,将LLaMA上下文扩展到32K谷歌最新《自然》论文:大语言模型构建的AI医生,比人类医生更出色When RS Meets LLM:推荐系统如何从大语言模型中取长补短?面向应用视角的全面综述硬核观察 #1071 研究发现更大的上下文对大语言模型来说意义不大为什么美国顶尖大学学生很少偷懒?大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机5082 血壮山河之武汉会战 黄广战役 14睡得少,痴呆跑不了:新研究表明不睡觉等于在大脑中养毒|本周论文推荐语言模型悄悄偷懒?新研究:​上下文太长,模型会略过中间不看如何能够战无不胜?ICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成北京内推 | 航天信息招聘大语言模型算法研究实习生(2023年暑期)2023年,你得学会偷懒!今晚直播 | ACL 2023原作解读:研究评测与提升大语言模型时间推理能力
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。