Redian新闻
>
Gpt 4一出,谁与争锋
avatar

Gpt 4一出,谁与争锋

wahhhaha
楼主 (北美华人网)
厉害啦……
avatar
2 楼
我很好奇gpt-3.5怎么在sat数学拿到590/800的。。。它连小学简单的加减乘除都会做错。
avatar
honeybunch
3 楼
这种测试knowledge型不是很好的比较baseline。我觉得一些没有正确答案的才是比较好的衡量标准。我前两天问一个问题:对于一个situation,what are the best options。结果ChatGPT写不出来,卡住了。ChatGPT现在对我就是一个summary tool,还是不能够和人竞争。
avatar
shanggj
4 楼
我很好奇gpt-3.5怎么在sat数学拿到590/800的。。。它连小学简单的加减乘除都会做错。
睿 发表于 2023-03-14 16:01

AP Calculus 能拿 4, 为什么 SAT 才 700?
avatar
shanggj
5 楼
这种测试knowledge型不是很好的比较baseline。我觉得一些没有正确答案的才是比较好的衡量标准。我前两天问一个问题:对于一个situation,what are the best options。结果ChatGPT写不出来,卡住了。ChatGPT现在对我就是一个summary tool,还是不能够和人竞争。
honeybunch 发表于 2023-03-14 16:11

现在也就能拿没有正确答案的 来显示优越感了。
avatar
fridec2
6 楼
我很好奇gpt-3.5怎么在sat数学拿到590/800的。。。它连小学简单的加减乘除都会做错。
睿 发表于 2023-03-14 16:01

对每个domain,先要输入一段 咒语,比如网上找了几个:
(1) mathematician:
I want you to act like a mathematician. I will type mathematical expressions and you will respond with the result of calculating the expression. I want you to answer only with the final amount and nothing else. Do not write explanations. When I need to tell you something in English, I’ll do it by putting the text inside square brackets {like this}.
(2) math teacher:
I want you to act as a math teacher. I will provide some mathematical equations or concepts, and it will be your job to explain them in easy-to-understand terms. This could include providing step-by-step instructions for solving a problem, demonstrating various techniques with visuals or suggesting online resources for further study. My first request is "I need help understanding how probability works.
avatar
MMmm
7 楼
看demo可以用来报税了
avatar
daapple
8 楼
回复 1楼wahhhaha的帖子
还是上不了T14法学院
avatar
wahhhaha
9 楼
看demo可以用来报税了
MMmm 发表于 2023-03-14 16:55

这些都是小活。但做错了不负责 哈哈
avatar
10 楼
我看了一下对gpt4更加详细的报道,感觉数学这一块是快给攻克了。之前的3.0版本的确不行。不过这个进步的速度,逻辑方面有大大的提升。gpt5应该就非常非常强了。看来AI时代的确到来了。机器人和人类无妨碍对话,建议和咨询已经在我们的面前了。
马公的几万行code不敢保证gpt4能找bug或者改code。不过下几代的确没有这个问题了。包括很多行业,人工智能会辅助人类一起工作了。
实在不敢相信来的那么快,人工智能会慢慢的充斥在世界的各个角落。
avatar
shanggj
11 楼
我看了一下对gpt4更加详细的报道,感觉数学这一块是快给攻克了。之前的3.0版本的确不行。不过这个进步的速度,逻辑方面有大大的提升。gpt5应该就非常非常强了。看来AI时代的确到来了。机器人和人类无妨碍对话,建议和咨询已经在我们的面前了。
实在不敢相信来的那么快,人工智能会慢慢的充斥在世界的各个角落。
睿 发表于 2023-03-14 23:46

进步速度太快了。前几天还跟女儿说 大学认真学点 AI 的东西 赶上这波革命。现在看 当心还没上完大学 革命就结束了
avatar
orientexpress
12 楼
就按两年一代的速度,现在说AI不行的方面,下一代也许就全面超越了。 回顾一下AlphaGo, 刚出来还要人类棋谱来“喂”,下一代就完全脱离人类经验数据,从零开始自学习。
相关阅读
今天又跟lg争论最美小龙女GPT2023年3月14日(周二)冯站长之家三分钟晚间新闻最新外刊《基督教科学箴言报》分享:2023年3月4日2023年3月排期表已出,毫无起色为什么我不吃益生菌类补品?第二次徒步圣路,750公里葡萄牙之路+英国之路:D30~惊魂难定大家怎么看美国外卖小哥收到客人8刀小费后嫌少,怒将客人餐点摔烂的事件?Lv和草间弥生的联名鞋子竟然还不错周立波才被国内全平台禁言啊。还以为早就被封杀了二年级选课,忽闻一夜 GPT 来,千课 万课 AI 开这样你嫁吗?这样你娶吗?爱情买卖?买回国机票求推荐2023年度部分AP科目在2023年2月1日-2月14日可申请逾期报名挖个树洞,妈妈走了,我是个没妈的孩子了杨紫琼真的很爱RM,获奖之路全靠它撑场想买件oversized卫衣搭配legging穿,能遮住至少半个屁股,求推荐ChatGPT群雄逐鹿:陆奇屠龙,号令天下;小川不出,谁与争锋出差错过航班改签的费用自己出?杨紫琼做到了难诉相思,送谢莉斯老师230329奶崩帝一出,谁与争峰?230308谁与争锋量子论对狭义相对论的致命的依赖韦神出的这道题火了,GPT回国, 十年签证可办了没人愿意提北约在基辅的秘密指挥部被炸吗?李光洁的老婆才是真正的魔鬼身材,第一次见震惊了(图)今天去银行办事荒诞华夏的操蛋事薅羊毛!维州新一轮的$250能源补贴2023年3月24日开始!(附申请网址)换成夏令时这两天都是五点不到就醒了,我是一个人么ChatGPT因访问量激增崩了;抖音否认3月1日上线外卖服务;百度将于3月推出ChatGPT产品丨邦早报吃在邮轮一个老海归的“逃出”Hungry Jack’s发布新的优惠券啦!有效期:2023年3月28日 - 2023年6月26日全民K歌《我是你的格桑花》每年的花费就是个无底洞,大家怎么攒钱的?迪丽热巴终于正面回应怀孕传闻了2023 內心成熟的人,看誰都顺眼!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。