Redian新闻
>
硬核观察 #1004 研究称 AI 的涌现能力来自于评估模式的错误

硬核观察 #1004 研究称 AI 的涌现能力来自于评估模式的错误

科技
 
导读:🅷 研究称 AI 的涌现能力来自于评估模式的错误 🄸 苹果公司注册 xrOS 商标 🄸 只需 15 分钟训练,iPhone 将能用你的声音说话 » »
本文字数:1162,阅读时长大约:1分钟

作者:硬核老王

研究称 AI 的涌现能力来自于评估模式的错误

GPT-3 等大语言模型(LLM)随着规模的扩大而表现出意想不到的 “涌现” 能力。然而,有研究人员认为,这是测量错误的后果,而不是奇迹般的能力。他们认为,LLM 是概率模型,它们并不像有些人认为的那样拥有任何一种有知觉的智能。该团队观察到,大多数(92%)检测到的意外行为是在通过 BIG-Bench 评估的任务中发现的。其中一项测试是精确字符串匹配,它检查一个模型的输出,看它是否与一个特定的字符串完全匹配,而不对几乎正确的答案给予任何权重。当较小的模型对一个问题的回答可能非常接近正确,但由于它是使用二进制的精确字符串匹配来评估的,它将被标记为错误。研究人员强调,他们并没有排除 LLM 中出现 “涌现” 行为的可能性;他们只是说,以前关于出现 “涌现” 行为的说法看起来像是考虑不周的衡量标准。

消息来源:The Register🔗 www.theregister.com

老王点评:也许不是突然出现的能力,而是逐渐提升的能力。但是目前的 AI 给人的感觉是突然变得很聪明,这中间确实给人一种跨越式的感觉。我倾向于认为是量变导致了质变的看法。

苹果公司注册 xrOS 商标

苹果公司已经在新西兰注册了 “xrOS” 的字样,这是该公司第一次间接透露其即将推出的头戴设备的操作系统名称。xrOS 是指 “扩展现实”,代表了该头戴设备将支持的增强和虚拟现实功能。在开发过程中,苹果曾在内部将该软件称为 “Reality OS” 或 “rOS”。xrOS 将有一个苹果用户会感到熟悉的类似于 iOS 的界面。

消息来源:Mac Rumors🔗 www.macrumors.com

老王点评:就 AR、VR、XR 等方面,我还是看好苹果公司的发展。不过,我觉得可能还需要一段时间,尤其是目前苹果在 AI 方面的落后可能会拖慢这一进程。

只需 15 分钟训练,iPhone 将能用你的声音说话

苹果公司今天预览了为认知、视觉、听觉和行动无障碍而设计的一组新功能,其中包括为可能失去说话能力的人设计的新的个人语音功能,允许他们创造 “听起来像他们的合成语音” 与朋友或家人交谈。用户可以通过在 iPhone 或 iPad 上大声朗读一组文字提示来创建个人语音,总共录制 15 分钟的音频。用户可以输入他们想说的话,然后用他们的个人语音读给他们想交谈的人。

消息来源:The Verge🔗 www.theverge.com

老王点评:上面刚刚说过苹果在 AI 方面的落后,这一条其实正好印证了,因为做到这一点目前并不稀奇。

昨日观察

关注 Linux 中国,每日硬核点评

欢迎遵照 CC-BY-SA 协议规定转载,
如需转载,请在文章下留言 “转载:公众号名称”,
我们将为您添加白名单,授权“转载文章时可以修改”。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
5个步骤告诉你,如何建立评估模型斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果硬核观察 #971 龙芯 3A5000 可能是目前最有希望的国产 CPU硬核观察 #1016 中国淡出超算 TOP500 榜单硬核观察 #1046 红帽认为 RHEL 克隆品是对开源公司的“真正威胁”三中一华某家招股书:笔误、引用错误、计算错误、统计错误……硬核观察 #1010 必应超越百度成为中国最大的桌面搜索引擎硬核观察 #1058 OpenAI 拿出五分之一的算力来防止人工智能“叛变”硬核观察 #1045 人工智能正在扼杀旧互联网重磅!科普用于评职称将写进法律别 . 情硬核观察 #994 研究发现,硬盘一般三年就坏核酸检测文心一言迭代数据曝光,QPS提升10倍,留给大模型创业玩家的涌现时间不多了硬核观察 #1042 人工智能工件需要新的开源许可证硬核观察 #1007 谷歌新推出几个顶级域,招致批评谁说设计一定要高大上?生活中随处可见的小物件,说不定来自于100年前 !硬核观察 #1048 Linus 的放松方式是写内联汇编硬核观察 #1040 RHEL 源代码将只放在 CentOS Stream 上硬核观察 #1006 Gartner:多云并不是必要的硬核观察 #1043 数百万 GitHub 项目易受依赖库劫持攻击硬核观察 #965 谷歌前 CEO 因担心中国而拒绝暂停人工智能研究2023卫生资格考试「电子合格证明」开始下载,可用于评职称!硬核观察 #1023 AMD 霄龙 Rome 芯片会在连续运行 1044 天后崩溃硬核观察 #1047 ReactOS 项目冒泡表示还活着API-Bank:用于评估LLMs使用外部工具能力的测试基准硬核观察 #1000 修复一个零日漏洞要多久,有时候需要一年硬核观察 #987 Windows 10 已发布最终版本硬核观察 #1041 AlmaLinux 确认受到 RHEL 源代码发布变化影响《定风波》瑾沐篇(34):父慈子孝硬核观察 #1001 微软正在研究使 Linux 脚本更安全硬核观察 #1008 拥有最多电子支付的国家是印度大模型的涌现能力介绍美国优胜美地国家公园,人生境界请问这棵树得了什么病?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。