Redian新闻
>
硬核观察 #1071 研究发现更大的上下文对大语言模型来说意义不大

硬核观察 #1071 研究发现更大的上下文对大语言模型来说意义不大

科技
 
导读:🅷 研究发现更大的上下文对大语言模型来说意义不大 🄸 谷歌敦促 Gmail 用户启用 “增强型安全浏览” 🄸 五年后,Cython 3.0 发布 » »
本文字数:1067,阅读时长大约:1分钟

作者:硬核老王

研究发现更大的上下文对大语言模型来说意义不大

在大语言模型中,上下文窗口指的是模型在给定实例中可以处理和响应的文本长度。它可以被视为特定文本分析或聊天机器人对话的工作记忆。许多人都认为,语境窗口变大的趋势将继续提高 大语言模型的性能和在各种应用中的实用性。但根据一项最新研究,大语言模型往往无法访问和使用在较长的上下文窗口中提供给它们的相关信息。当相关信息出现在输入上下文的开头或结尾时,它的性能最佳;而当模型必须在长上下文中间获取相关信息时,性能就会明显下降。此外,随着输入上下文的长度增加,即使是明确的长上下文模型,性能也会大幅下降。

消息来源:Venture Beat🔗 venturebeat.com

老王点评:可见我们对大语言模型内部到底发生了什么,还是一无所知。

谷歌敦促 Gmail 用户启用 “增强型安全浏览”

这项增强的安全功能已经存在了三年,但谷歌最近开始在 Gmail 收件箱中显示一条信息,建议人们打开 “增强安全浏览” 功能。如果谷歌认为你正在浏览的网站冒充你的银行等,你就会看到一个红色的警告屏幕。一般而言,开启这项安全功能是个好主意,虽然它会收集你的更多信息,但如果你本来就使用了 Gmail 等谷歌服务,其实它已经收集了足够多的信息。如果你开启了该功能,即使你没有登录谷歌账户,谷歌也会对你访问的网站了如指掌。它还会从你访问的网站上收集一些视觉图像,以扫描诈骗网站的特征。

消息来源:MSN🔗 www.msn.com

老王点评:你应该自己决定是否愿意放弃部分隐私来换取额外的安全保护,以防止常见的犯罪行为。

五年后,Cython 3.0 发布

Cython 是一种基于 Python 的编程语言和编译器,它可以编译输出原生代码,执行速度可能比 CPython 解释器快得多。它既可用于优化 Python 应用程序,也可用于创建 CPython 可使用的模块,从而在解释器中运行应用程序的主要部分时,编译性能关键的代码。Cython 至今已有 21 年历史。在接近五年的漫长时间后,Cython 3.0 发布,增加了许多新功能,现在支持 Python 3 的所有版本,但放弃了对 Python 2.6 的支持。但 Cython 2.x 和 Cython 3.0 之间的兼容性问题已经造成了一些问题,影响到了包括 AWS CLI 在内的一些重要项目。

消息来源:Dev Class🔗 devclass.com

老王点评:觉得 Python 慢吗?那就编译好了。

昨日观察

关注 Linux 中国,每日硬核点评

欢迎遵照 CC-BY-SA 协议规定转载,
如需转载,请在文章下留言 “转载:公众号名称”,
我们将为您添加白名单,授权“转载文章时可以修改”。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
首篇!Point-In-Context:探索用于3D点云理解的上下文学习商汤大模型全面升级!「商量SenseChat 2.0」大语言模型疯狂上分深圳内推 | 华为诺亚方舟语音语义实验室招聘大语言模型研究实习生大语言模型会偷懒?新研究:上下文太长,模型会略过中间不看 | 本周论文推荐将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?懂3D的语言模型来了!UCLA、上交、MIT等联合提出3D-LLM:性能大涨9%剑桥、腾讯AI Lab等提出大语言模型PandaGPT:一个模型统一六种模态历史名城:耶路撒冷笑谈邂逅(4)章熊先生激励我不断前行学习生成式大语言模型,东北大学自然语言处理实验室有一堂课大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型上下文1.6万token的编程大模型来了!与Stable Diffusion出自同门,一次吃5个Python文件不费劲看热闹不怕事儿大BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」In-Context-Learning在更大的语言模型上表现不同Transformer的上下文学习能力是哪来的?语言模型悄悄偷懒?新研究:​上下文太长,模型会略过中间不看硬核观察 #1075 Twitter 抢夺了已注册 16 年的 @X 账号天生一棵好韭菜Elon MuskNot teaching and explaining the relevance is core problICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成微软发布 Guidance 语言,用于控制大语言模型大语言模型的视觉天赋:GPT也能通过上下文学习解决视觉任务大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机硬核观察 #1073 谷歌的《网络环境完整性 API》提案遭到抨击硬核观察 #1072 特斯拉将向其他汽车制造商授权全自动驾驶套件硬核科普:大语言模型,都是如何生成内容的ChatGPT上下文碾压64K开源模型!UC伯克利:开源模型能力严重「虚标」|最新硬核评测曝光微信朋友圈大规模上线置顶功能 网友:这功能意义不大田渊栋团队新作:通过位置插值来扩展大语言模型的上下文窗口今晚直播 | ACL 2023原作解读:研究评测与提升大语言模型时间推理能力北京内推 | 航天信息招聘大语言模型算法研究实习生(2023年暑期)“千模千测”——针对大语言模型认知能力的高效测试方法硬核观察 #1074 甲骨文的新 Java 许可条款将增加 2-5 倍费用硬核观察 #1070 社区批评 Meta 滥用“开源”来称呼其新大语言模型
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。