Redian新闻
>
硬核观察 #1004 研究称 AI 的涌现能力来自于评估模式的错误

硬核观察 #1004 研究称 AI 的涌现能力来自于评估模式的错误

科技
 
导读:🅷 研究称 AI 的涌现能力来自于评估模式的错误 🄸 苹果公司注册 xrOS 商标 🄸 只需 15 分钟训练,iPhone 将能用你的声音说话 » »
本文字数:1162,阅读时长大约:1分钟

作者:硬核老王

研究称 AI 的涌现能力来自于评估模式的错误

GPT-3 等大语言模型(LLM)随着规模的扩大而表现出意想不到的 “涌现” 能力。然而,有研究人员认为,这是测量错误的后果,而不是奇迹般的能力。他们认为,LLM 是概率模型,它们并不像有些人认为的那样拥有任何一种有知觉的智能。该团队观察到,大多数(92%)检测到的意外行为是在通过 BIG-Bench 评估的任务中发现的。其中一项测试是精确字符串匹配,它检查一个模型的输出,看它是否与一个特定的字符串完全匹配,而不对几乎正确的答案给予任何权重。当较小的模型对一个问题的回答可能非常接近正确,但由于它是使用二进制的精确字符串匹配来评估的,它将被标记为错误。研究人员强调,他们并没有排除 LLM 中出现 “涌现” 行为的可能性;他们只是说,以前关于出现 “涌现” 行为的说法看起来像是考虑不周的衡量标准。

消息来源:The Register🔗 www.theregister.com

老王点评:也许不是突然出现的能力,而是逐渐提升的能力。但是目前的 AI 给人的感觉是突然变得很聪明,这中间确实给人一种跨越式的感觉。我倾向于认为是量变导致了质变的看法。

苹果公司注册 xrOS 商标

苹果公司已经在新西兰注册了 “xrOS” 的字样,这是该公司第一次间接透露其即将推出的头戴设备的操作系统名称。xrOS 是指 “扩展现实”,代表了该头戴设备将支持的增强和虚拟现实功能。在开发过程中,苹果曾在内部将该软件称为 “Reality OS” 或 “rOS”。xrOS 将有一个苹果用户会感到熟悉的类似于 iOS 的界面。

消息来源:Mac Rumors🔗 www.macrumors.com

老王点评:就 AR、VR、XR 等方面,我还是看好苹果公司的发展。不过,我觉得可能还需要一段时间,尤其是目前苹果在 AI 方面的落后可能会拖慢这一进程。

只需 15 分钟训练,iPhone 将能用你的声音说话

苹果公司今天预览了为认知、视觉、听觉和行动无障碍而设计的一组新功能,其中包括为可能失去说话能力的人设计的新的个人语音功能,允许他们创造 “听起来像他们的合成语音” 与朋友或家人交谈。用户可以通过在 iPhone 或 iPad 上大声朗读一组文字提示来创建个人语音,总共录制 15 分钟的音频。用户可以输入他们想说的话,然后用他们的个人语音读给他们想交谈的人。

消息来源:The Verge🔗 www.theverge.com

老王点评:上面刚刚说过苹果在 AI 方面的落后,这一条其实正好印证了,因为做到这一点目前并不稀奇。

昨日观察

关注 Linux 中国,每日硬核点评

欢迎遵照 CC-BY-SA 协议规定转载,
如需转载,请在文章下留言 “转载:公众号名称”,
我们将为您添加白名单,授权“转载文章时可以修改”。


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
硬核观察 #994 研究发现,硬盘一般三年就坏5个步骤告诉你,如何建立评估模型请问这棵树得了什么病?《定风波》瑾沐篇(34):父慈子孝硬核观察 #1023 AMD 霄龙 Rome 芯片会在连续运行 1044 天后崩溃硬核观察 #1010 必应超越百度成为中国最大的桌面搜索引擎文心一言迭代数据曝光,QPS提升10倍,留给大模型创业玩家的涌现时间不多了硬核观察 #1007 谷歌新推出几个顶级域,招致批评硬核观察 #1041 AlmaLinux 确认受到 RHEL 源代码发布变化影响斯坦福最新研究警告:别太迷信大模型涌现能力,那是度量选择的结果硬核观察 #1058 OpenAI 拿出五分之一的算力来防止人工智能“叛变”硬核观察 #971 龙芯 3A5000 可能是目前最有希望的国产 CPU三中一华某家招股书:笔误、引用错误、计算错误、统计错误……硬核观察 #1048 Linus 的放松方式是写内联汇编硬核观察 #1043 数百万 GitHub 项目易受依赖库劫持攻击硬核观察 #1016 中国淡出超算 TOP500 榜单官方承认高铁“造假”:靠人蹬车前进,动力来自茶叶蛋?差点信了……API-Bank:用于评估LLMs使用外部工具能力的测试基准3种“活化石”蜘蛛被发现;研究称一个重要人类视力基因来自远古细菌丨科技早新闻硬核观察 #1045 人工智能正在扼杀旧互联网核酸检测硬核观察 #1001 微软正在研究使 Linux 脚本更安全美国优胜美地国家公园,人生境界硬核观察 #1042 人工智能工件需要新的开源许可证谁说设计一定要高大上?生活中随处可见的小物件,说不定来自于100年前 !重磅!科普用于评职称将写进法律硬核观察 #1040 RHEL 源代码将只放在 CentOS Stream 上硬核观察 #1046 红帽认为 RHEL 克隆品是对开源公司的“真正威胁”大模型的涌现能力介绍硬核观察 #1008 拥有最多电子支付的国家是印度硬核观察 #1000 修复一个零日漏洞要多久,有时候需要一年硬核观察 #965 谷歌前 CEO 因担心中国而拒绝暂停人工智能研究别 . 情硬核观察 #1047 ReactOS 项目冒泡表示还活着硬核观察 #1006 Gartner:多云并不是必要的
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。