Redian新闻
>
封印解除!Bing 抢先 ChatGPT 支持识图功能,不仅能看懂梗图还能「看病」

封印解除!Bing 抢先 ChatGPT 支持识图功能,不仅能看懂梗图还能「看病」

科技

还记得今年 3 月 OpenAI 在发布 GPT-4 时提到的多模态功能吗?

GPT-4 回答 Demo,由机器翻译
GPT-4 支持图片输入,可以看懂梗图、看懂物理题,还能看懂论文,一经发布便震惊了所有人,这也是 GPT-4 相较 GPT-3.5 最大的升级点。
只可惜,OpenAI 表示图像输入功能仍然是研究预览阶段,还不能向公众公开。

新增了一个识图图标 图片来自:Reddit
然而,近日 Reddit 有网友发现,自己的 Bing Chat 账号悄悄新增了一个上传图片的入口,把图片上传上去后,Bing Chat 竟然会识图回答!
插句题外话:目前 Bing Chat 面向所有微软账户开放,快来开盲盒看看你有没有收到测试资格吧 ⬇️
https://www.bing.com/new
此前微软曾透露 Bing Chat 使用的正是 GPT-4 模型,并在上个月的大更新日志中有提到会为 Bing 加入多模态支持,综合来看,Bing Chat 很可能正在逐步开发向用户开放识图功能测试。
该网友对 Bing Chat 做了大量测试,让我们一起看看「长了眼睛」的 Bing Chat 有多厉害吧。
首先是 GPT-4 最让人拍案叫绝的看梗图功能。GPT-4 不仅可以理解图片里的内容,还能像人类一样分析出梗图的笑点在哪里。
例如这张梗图中,GPT-4 可以看出图片想要表达用过时的 VGA 形状的接口给 iPhone 充电是一件很荒谬的事,引入发笑。

由机器翻译
网友给 Bing Chat 上传了同样的梗图做测试,奇怪的事情发生了:Bing Chat 并没有认出这是 VGA 接口,因此它也「get」不到其中的笑点。

不过 Bing Chat 还是一五一十地把照片解读了出来,甚至还能说出线缆的品牌,并给出更详细的资料。
这也许是 Bing Chat 偶然的误差,也可能是微软在实际应用 GPT-4 做了更多的限制调整导致回答偏差。
网友再上传了另一幅关于机器学习的梗图漫画,这次 Bing Chat 就能比较准确地答出图中的内容和笑点。
Bing Chat 对另一张在汽车上烫衣服的梗图分析也同样到位。

此处翻译有误,原文为:Diddy Kong, Pyra, Pikachu, Zero Suit Samus, Donkey Kong, Sonic the Hedgehog, Ness, Cloud Strife, and Incineroar
Bing Chat 识图的精度有多高呢?他上传了一张《任天堂大乱斗》游戏的角色图,同一张图上有排列着非常多的角色,要求 Bing Chat 一一认出所有的角色。
结果是,Bing Chat 在 12 个角色中认出了 7 个,看来二次元问题对它来说还是有点难度。
OpenAI 在发布时还展示了一个拍手绘图就能编程网页的案例,该网友也手画了一张图考考 Bing。

让我们跳过冗长的代码环节,直接看看这个网页跑起来的效果。可以看出,基础的网页雏形还是搭出来了。
识图功能的加入给 Bing Chat 增添非常多的用途,毕竟现实中很多内容(例如公式、图表)很难用文字表达清楚,这时候直接一张图甩给 AI 就能得到回答。
例如让它解释一下染色体在减数分裂时交叉互换的过程。
让它扮演生物老师,分析一下肾元过滤的工作原理。
甚至可以让它充当网络医生,简单诊断一下症状。
此前,ChatGPT 由于出色的文字理解和表达能力,已经被人们开发出了学外语、练口语的功能。

再加入视觉识别后,Bing Chat 甚至可以担任一个初高中乃至大学老师的角色,帮助学生解答复杂的数理化问题,如果未来能把识图功能推广开来的话,这也许在一定程度上可以解决教育资源不均衡的问题。
用户还可以用它做基础的医疗诊断,节约就医所需要的金钱和时间,体现出 AI 普惠大众的价值。
当然,Bing Chat 虽然能基本看懂现实世界的内容,但它的回答终究只能作为参考,不可以当做专业意见。
所以要完全向公众开放识图功能的话,微软还需要做大量的限制和调试,才能确保公众不会因为误信 AI 的回答而出现安全问题。

在短期内,Bing Chat 识图应该还只是少部分用户才可以使用的测试性功能,如果你感兴趣的话,可以立刻登录一下你的微软账号,看看在 Bing Chat 的聊天栏上是否多了一个图片的图标。



点击「在看

是对我们最大的鼓励

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
巴黎市长将重修Châtelet 广场以方便行人反问句千万别忽略“仪式感”!不仅能让孩子感到更多的爱和幸福,还能让我们带娃更轻松微信内测状态评论功能,黄仁勋安保费用大涨7倍,武汉小米回应裁员35岁员工,三星入局ChatGPT,这就是今天的其他大新闻3天近一万Star,无差体验GPT-4识图能力,MiniGPT-4看图聊天、还能草图建网站引领手机向“全知全能”进化!iOS版ChatGPT推出联网模式:集成Bing搜索功能,仅对付费用户开放ChatGPT 干倒了补习班股票, CHGG 近乎腰斩ChatGPT 又断网了!OpenAI 暂时下线 ChatGPT 搜索功能,只因绕过付费墙?武曌骑唐(6)手握权柄到最后一秒的精致利己主义者死了,恶龙的封印解除了(万字篇)抢先GPT-4!微软Bing突然升级「识图」功能,读梗看病写代码,样样精通微信内测朋友圈置顶功能,传华为江淮合作进军豪华纯电,小米回应被乌制裁,法国西班牙将调查ChatGPT,这就是今天的其他大新闻!ChatGPT 新增六项功能,GPT-4 成默认模型,可上传文件、用快捷键1.2万Star!无差体验GPT-4识图能力,MiniGPT-4看图聊天、还能草图建网站ChatGPT路线图曝光:没有GPT-5、识图功能要等到明年、GPT-3或将开源Chatgpt 眼中的“马云数钱”,大家看AI绘画靠谱么?OpenAI 创始人演讲:ChatGPT 炸裂新功能,分享怎样教 AI 使用工具|GGViewChatGPT 美国用户人群画像出来了:年轻、富裕、受过良好教育Nature Medicine | 致幻蘑菇不仅能看到“小人”,还有望治疗神经性疾病!谷歌 I/O:全新大模型,赋能「全家桶」;广汽埃安+滴滴,2025 量产 L4 车型;加入通话功能,推特变微信 | 极客早知道不仅能在大自然中奢侈一把,还能躺着拿绿卡?属于GPT-4的一周:免费体验、增强问答、抢先识图|Hunt Good周报丰田的智能「进化」,不是堆砌功能,而是回归需求遭遇杀猪盘(1)寒门还能出贵子吗?他会告诉你不仅能,而且还能上天呢!谷歌Bard支持中文了!十级过关,看懂梗图,直接上手免费体验ChatGPT增六项功能,GPT-4成默认模型,可上传文件、用快捷键神奇的粽子,不仅能吃,居然还能喝ChatGPT的替代品来了!HuggingChat号称媲美GPT-3.5,要拆掉OpenAI的围墙这显微镜不仅能拍照录像,还能手持拿到户外,把世界放大到800倍...别的简报|PS添加AI扩展图片功能,网友用来补全梗图“红二代的黑五类”刘亚洲【城事】巴黎市长将重修Châtelet 广场以方便行人今天才知道Friend里的Chandler Bing,暴打过加拿大总理小土豆很多次ChatGPT在律所:聪明人已经在用ChatGPT吊打同事了!说好的web3怎么悄无声息了?反倒AI有了突破(ChatGPT)因朋友的私事再次去了法庭微信内测朋友圈置顶功能,官方:为内部体验功能,后续可能会取消从冬天直接到夏天ChatGPT全新功能公开演示!OpenAI总裁:ChatGPT会重新定义计算机(全文记录)还能这么玩?清华给 ChatGPT 做逆向,发现了 ChatGPT 的进化轨迹!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。