最近哪哪都是ChatGPT,说啥革命性进展,啥职业都要被取代,都是蹭热点的。
我就不一样了,作为外科医生,我一点都不慌,他ChatGPT有本事爬起来去给我18床病人换个药啊???玩归玩,闹归闹。危机感还是要有的,尤其是看到一消息,说的是ChatGPT已经通过了美国USMLE,也就是美国执业医师考试。我搜索了一下,果真如此,他们甚至还发表了一篇预印本的论文,结果表明ChatGPT未进行任何医学训练的情况下,就在USMLE考试中达到了平均水平以上,准确率达到了60%左右。外国这帮小崽子灌水蹭热点本事也不小
这一点还是很恐怖的,要知道,USMLE的通过率是很低的,一个非医学专业的AI模型达到这样的程度足以引起我们的警惕。
震惊之余,我不禁思考,如果让ChatGPT考一下中国执医,结果又如何呢?为此,我耗费巨资专门去淘宝买到了2022年的执医真题。
因为2022年的真题在互联网上是搜索不到的,即使有也是要付费的,这样就避免了ChatGPT去搜答案的可能性(像极了我线上考试的样子)。
中国的执业医师考试笔试部分一共四个单元,每个单元满分150分,总分600分,360分为及格,笔试通过率大约为50%。
那么,ChatGPT能否通过中国的执业医师考试呢?我把2022年的真题复制黏贴到ChatGPT的对话栏中,然后获得它的答案和解释,再对照真题答案确定是否正确。
每复制到对话框中,ChatGPT都要反应一段时间,这个和真人倒蛮像的,大概30S左右的时间就可以给出答案,有时候比我读题答题都快。只是,可能是用户过多的原因,答题过程经常出错,到最后到37题之后,干脆提示服务器过载,拒绝访问了。有趣的是,他的拒绝访问页面也是类似ChatGPT问答的形式,给出的答案是贼几把冷。这画面像极了我高中做完形填空时噩梦般的场景,20道题错14道那种。
那么,ChatGPT究竟是错在哪里呢?我挑了好几道经典题目跟大家分享一下。
没错,正常人一般都会选E 终止妊娠吧,毕竟是严重并发症,随时可能威胁孕妇的生命。结果ChatGPT答:D 胎儿保健。这都啥时候了,还搁这儿保健呢?直到看到了他的解释,我才明白。毕竟他是美国的软件,在美国堕胎是非法的,所以这个选项直接被排除了。这题你别看了,我估计你跟我一样,也不知道答案,啥是非胸腺依赖性抗原都他么忘得一干二净了。答案是A 乙肝病毒抗原。还解释了一番,虽然这个解释有点废话,但看起来非常自信,我已经信了。我陷入了深深的疑虑之中,我甚至不知道该相信ChatGPT还是答案了。。。
于是我又百度了一下,才知道答案确实是E 肽聚糖。我瞬间觉得好可怕,这ChatGPT自信的语气,让人无法怀疑。我刚准备相信这份答案,可下一题又重新让我陷入到自我怀疑中去。这是一道统计题,作为畅销书《临床回顾性研究实用指南》的主编,丁香公开课排名第二的《零基础发表临床回顾性研究SCI》主讲,这种题我想都不想就选出了答案——
这是课上讲的例题啊,用两组仪器测试同一组对象,测出的数据必然是配对资料,而肺活量是计量资料,样本量又不大,用t检验就可以,所以但是配对t检验。我这时候不仅开始怀疑ChatGPT,甚至开始怀疑自己的专业能力。于是,我找到店家,问他答案是不是错了。
那他么我该怎么办啊???我信ChatGPT和我,还是信答案啊。。。这让我恍惚间又回到了高三晚自习的英语课上,我做完完形填空后对答错了,觉得答案不对,又专门问了老师,结果还是错的,之后对人生产生了怀疑的状态。接下来的几道题,我重拾了自信,ChatGPT的答案错到了离谱他妈给离谱开门——离谱到家的程度。这货对中医经典可谓一无所知。可惜,我们中国执医也是要考一部分中医的内容哦~
他么的你“三查七对”你不对姓名的啊???护士长跳出来打死你。答案是B 性别。就这样,磕磕绊绊,网站时常崩溃,我一边刷新,一边自己做,一边给ChatGPT做,一边对答案,一边再去网上找答案,花了两个小时,才做了37道题。
总结一下,ChatGPT在一些专业知识方面的答案还是比较准确的,但是一些政策、制度、中医、规范方面经常出错,这可能是由于他是美国AI,在中国水土不服的原因。可这部分内容在中国执业医师考试中占比不低,所以他的正确率也比较低。37题只对了14道(37.8%),离60%的正确率还有一定差距。
恭喜大家,不用担心ChatGPT抢我们中国医生的饭碗了。不过有一说一,他回答问题时自信的样子还是很适合做医生的。毕竟,当医生就是要够自信,才能唬住病人。
PS:昨天的红包抽奖,大家都中了没?!
本文系授权发布,By 唱不完的情歌,From 我想逗乐这个闷闷的世界。欢迎分享到朋友圈,未经许可不得转载,INSIGHT视界 诚意推荐