Redian新闻
>
Google Bard 大更新!我们用 GPT-4 给它出了 20 道题

Google Bard 大更新!我们用 GPT-4 给它出了 20 道题

科技

AI 热潮以来,「突发」就成了我们标题的常客。
昨天,来自 Google 的大语言生成类 AI 模型 Bard 又迎来更新,新增了「Google it」按钮,增强了数学与逻辑能力,并发布了一个全新的功能更新公告板。
发布以来就饱受争议的 Bard,如今能在数理逻辑领域,与 GPT-4 一较高下吗?
三个更新点,做数学题是重点
为了让用户更方便的了解 Bard 更新变化,Google 上线了 experiment updates(实验更新)界面,展示 Bard 的最新消息。网址如下:
https://bard.google.com/updates
相比其他厂商「提高系统稳定性,优化系统流畅度」的更新对联,Bard 不仅告诉你更新了什么,还告诉你为什么更新。Google 表示,这是为了让用户更快的进行测试、提供反馈。
顺着更新公告往下看,「Google it」是这次的第一个功能更新,当你问过 Bard 后,可以在答案下方看到「Google it」的按钮,点击后 Bard 会生成几个相关主题,以便你使用 Google 进行更多元的搜索。
这样一来,Google 搜索就变成了 Bard 的补充,如果在未来,Bard 完全替代前者我也不会感到意外。
不过,Google it 在提取复杂问题的主题时准确性还不够高,比如在我询问奥数题时,Google it 的主题几乎没有价值。

最后,也是最大的更新,Bard 的数学和逻辑能力得到了升级,以前一道 123456*654321 就开始乱说的大语言模型终于站起了身,开始实践「学好数理化,走遍网络都不怕」的道理。
光说不练假把式,Bard 的数理能力够不够强,我们给它出了 20 道题,看看它的表现如何。
GPT-4 出了 20 道题,Bard 满分
第二题答案有误,应为(2,-1)
我们用 GPT-4 整理了 20 道数学、逻辑类问题,用于测试 Bard 的数理能力。
先不说对不对,Bard 的反应速度着实很快,即使是加速后的 GPT-3.5 也不是它的对手。
先来看看 Bard 的表现,Bard 不仅完全答对了所有题目,还给出了详细的解题过程。
ChatGPT 的表现也不错,数学题全对,逻辑题只错了一个。
我们也把同样的问题翻译成中文去提问了百度的文心一言和阿里的通义千问,10 道数学题,通义千问仅对 1 题,文心一言则对了 4 题;10 道逻辑判断,通义千问 3 题正确略胜一筹,文心一言 2 题正确屈居第二。
不得不说,数理计算对大语言模型来说,门槛确实比较高。
10*3.14=314
无中生有的兔子
从我们简短的测试来看,Bard 的表现相比它刚发布时确实有了显著的提升,在回答问题的逻辑性和正确性上已经逐渐赶上了 GPT-3.5。
比 ChatGPT 表现更好的是,Bard 在回答问题时还会加入引用信源,降低了编造事实的可能。
目前 Google 对 Bard 的试用申请似乎放松了不少,只要申请加入 Waitlist 后再刷新几次界面,就能马上体验 Bard。
感兴趣的朋友可以在下方地址体验。
https://bard.google.com/
如果你的试用申请一直都没通过,也不用着急。
Google 的 CEO Sundar Pichai 最近在接受采访时透露,Google 计划将 Bard 整合到搜索引擎中,以应对 ChatGPT 等聊天机器人带来的竞争压力和更为广泛的商业问题。
未来 Google 应该会像 Bing 那样开放一个聊天搜索界面,直接在搜索引擎就能调用 Bard。
目前 Google 并没有给出明确的时间表,也许在 5 月 10 日召开的 Google I/O 2023 大会上会透露出更多的信息。
AI 不会画手、AI 不会做数学题,这些问题已经慢慢成为了历史,那么问题来了,AI 的下一个突破点,又会在哪里呢?


点击「在看

是对我们最大的鼓励

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
"𝙇𝙚𝙖𝙙 𝙏𝙝𝙚 𝘾𝙝𝙖𝙧𝙜𝙚"广告#创译挑战Google 疯狂的一周才刚结束,ChatGPT 下周又要大更新|Hunt Good 周报停止内耗!Google和DeepMind被ChatGPT逼急了,决定合作打败GPT-4美国平台责任230条款三十年荣辱:评Gonzalez v Google案【2.5万字实录】OnBoard!硬核对话Google Brain, Stability AI: 生成式AI的技术实践与商业未来2010年沈阳一女演员裸死酒店,体内测出5人DNA,凶手让人难以置信GPTGoogle发布二代大模型,但与GPT-4仍有差距Yorkdale附近寿司店10项卫生违规!Google评分4.7也不靠谱了OLED版iPad Pro或明年推出 /《灌篮高手》票房破3亿/Google母公司CEO去年薪酬2.26亿美元精选MLE岗位 | Apple、ByteDance、Googlel等公司持续热招!王炸升级!Google 全新大模型赶超 GPT-4,Bard 全面开放,要把搜索彻底颠覆“我后悔!我后悔!我后悔!我后悔!我后悔!我后悔!”Google Bard正式开放使用/苹果联合创始人对AI发出警告/ 任天堂官宣新Switch消息AIGC疯狂一夜!英伟达投下“核弹”、Google版ChatGPT开放,盖茨都震惊了Google新大模型赶超GPT-4/理想一季度交付量创历史新高/阿里巴巴取消首席技术官职位韦神出的这道题火了,GPT复旦大学 MOSS 大模型正式开源;周鸿祎:360 员工不会被 GPT 淘汰;Google 重组 AI 研究部门|极客早知道今后要好好的爱自己怎么来理解人工智能的学习Google 版 ChatGPT 首秀翻车之后,还能凭什么逆风翻盘首发评测丨阿里版 ChatGPT 来了!我们问了100多道题,它得了 90 分二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开阿里大模型敢对标GPT-3.5?我们让GPT-4给它上了点强度。Google 版 ChatGPT 大更新!用 GPT-4 给它出的难题全都满分回答Bonus延期,裁员补偿出尔反尔,Apple Google都怎么了?正在取代Google 搜索的,不是ChatGPTGoogle 内部文件泄漏:我们和 OpenAI 都没护城河,开源可以打败 ChatGPT正在取代 Google 搜索的,不是 ChatGPTGoogle内部文件首次泄漏:ChatGPT 没有护城河,开源才是大模型未来GPT4横空出世,互联网霸主Google跌落神坛 | 纽约客【原创】Google裁员的原因?那些年,Google 五大失败的产品~ (下)AI追踪 | ChatGPT开启四天周工作日大门,媒体再度面临生存威胁,google搜索引擎也将加入AIGpt 4一出,谁与争锋15英寸MacBook Air或于今年推出/Google 加速将AI融入搜索/好莱坞去年最亏钱电影出炉ChatGPT大更新!联网/插件功能无需排队,Plus用户下周即可体验掉脑袋的事:Google Brain和DeepMind合并成Google DeepMind!!!ChatGPT会取代Google,成为互联网的第一入口|万字深度长文也说《狂飙》:你到底爱张颂文还是高启强?【庭院养蜂】上哪儿买蜜蜂?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。