Redian新闻
>
会看图的「ChatGPT」来了!给张图就能聊天、讲故事、写广告

会看图的「ChatGPT」来了!给张图就能聊天、讲故事、写广告

科技

机器之心报道

编辑:张倩

从室温超导聊到《最后的晚餐》,这个能用图片聊天的类 ChatGPT 应用有点意思。

能用图片聊天的「ChatGPT」你用过吗?由于 OpenAI 目前给出的对话框只支持文字输入,所以在 ChatGPT 上,我们是无法体验到这种乐趣的。


但是,一个名为「元乘象 Chatlmg」的国产 AI 模型弥补了这一遗憾。它不仅支持文字聊天,还能看懂图片上的内容并根据图片内容回答问题。



据机器之心了解,「元乘象 Chatlmg」最近刚刚上线,关注微信公众号「元乘象」可以体验该应用。


但受限于算力,目前该应用为邀请制访问方式。机器之心在获得邀请码后体验了一把。


元乘象初体验


给「元乘象 Chatlmg」一张「搭载火箭升空的大脑」的图像,它不仅能解读出图片的内容,还能给图片取标题并判断该场景在现实中是否合理。



甚至,它还能根据图片编个故事,而且编的故事往往比较积极、阳光:



如果你想聊聊艺术,「元乘象 Chatlmg」也能陪你聊,并告诉你艺术品背后的故事。



可以想象一下,如果不知道这幅画的名字,我们要怎么才能得到这些答案?首先,我们要把图片输入搜索引擎,从而根据匹配结果得到画的名字,然后再拿着这个名字去搜想知道的信息。而且这些信息可能以大篇幅的形式弹出,需要你自己去找感兴趣的段落。而借助「元乘象 Chatlmg」,我们只需要上传图片、提问题就可以了。


而且,「元乘象 Chatlmg」的这些能力不止可以用来闲聊,还可以用来写搭配建议、商品文案、旅游宣传词…… 这些都是可以商业变现的场景。



虽然结果可能不能直接拿来用,但用作参考还是很实用的。


当然,如果你对结果不满意,还可以要求「元乘象 Chatlmg」重写,完整体验做甲方的感觉。



此外,我们还在测试过程中发现了一些有趣的现象。比如,如果「元乘象 Chatlmg」仅根据图像和文字线索回答不出你的问题,它会让你帮忙提供更多信息。在增加信息之后,它有可能给出正确答案。



除了解读图像内容,「元乘象 Chatlmg」在纯文字的聊天方面表现也很优秀。



背后的技术与团队


如今,大模型在 NLP 任务中取得了成功的应用。但真实世界的数据模态是多样的。在通用人工智能的发展过程中,多模态感知极为重要的一环,也是解锁大模型技术应用的关键。


据机器之心了解,「元乘象 Chatlmg」就是搭载了自研的百亿级别参数多模态大模型,从而能让我们像体验的那样能感知图片并进行对话。


简单介绍来说,目前元乘象 Chatlmg 大模型参数规模大概 150 亿;数据方面目前主要是图文对数据、VQA 数据等。而在训练过程中,该模型放开尽量少的可学习参数,从而保证在有限算力上的高效训练。


未来,除了当下的图文互动外,该模型还将集成图片生成的能力并加入视频、音频等多种模态,甚至与数字人等技术结合,开发出更生动立体的形象。


顺便透露一下,这个好玩的应用来自中国人民大学高瓴人工智能学院教授卢志武带领的团队。卢志武教授曾主导设计了首个公开的中文通用图文预训练模型文澜 BriVL,并发表于 Nature Communications。该模型经过 6.5 亿弱相关中文图文对的预训练,学习到独特的中文语义理解能力并能很好地将中文语义与视觉信息联系起来,尤其擅长读取中文独有的含蓄语义与图片中的抽象概念。


最后,读者福利,我们提供50个邀请码让读者体验元乘象Chatlmg,请微信留言,先到先得。流程:关注微信公众号「元乘象」,注册,填写邀请码。


探寻隐私计算最新行业技术,「首届隐语开源社区开放日」报名启程


春暖花开之际,诚邀广大技术开发者&产业用户相聚活动现场,体验数智时代的隐私计算生态建设之旅,一站构建隐私计算产业体系知识:

  • 隐私计算领域焦点之性

  • 分布式计算系统的短板与升级策略

  • 隐私计算跨平台互联互通

  • 隐语开源框架金融行业实战经验

3月29日,北京·798机遇空间,隐语开源社区开放日,期待线下面基。

点击阅读原文,立即报名。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
微软再扔AI聊天画图炸弹!视觉模型加持ChatGPT,Visual ChatGPT横空出世苹果今晨推送新系统/ChatGPT出现泄露聊天记录的风险/英伟达ChatGPT同款超算上云ChatGPT版必应惨遭「切脑」,粉丝大闹4天!微软认怂:一天能聊60次美精英评中美防疫的‘傲慢与偏见’极氪获新融资,估值 130 亿美元;传阿里清空「印度支付宝」Paytm 股票;谷歌:「ChatGPT」会编造信息 | 极客早知道1.2万Star!无差体验GPT-4识图能力,MiniGPT-4看图聊天、还能草图建网站7 Papers & Radios | MiniGPT-4看图聊天、还能草图建网站;视频版Stable Diffusion来了制造业「ChatGPT」来了,我们和「奇智孔明」聊了聊博客文章总汇集成ChatGPT后必应日活量首破亿!微软推出Azure OpenAI ChatGPT 服务,GPT-4下周发布浏览器增强版ChatGPT无敌了?超强插件Monica,能聊能写效率Max城市NoA,自动驾驶的「ChatGPT时刻」 |PowerOn未见毛泽东诚请《贫下中农》当老师「ChatGPT之母」最新采访:GPT-4离超级智能还很远,半年内不会训练GPT-5GitHub刷屏!MiniGPT-4开源:可以看图聊天、教学、创作、搭网站......毫末智行,首推自动驾驶「ChatGPT」chatgpt 说顾城剽窃教ChatGPT学会看图的方法来了智能聊天机器人ChatGPT为何成科技巨头新宠?我就是境外反华势力3天近一万Star!MiniGPT-4来了!看图聊天,不在话下!300美元复刻ChatGPT九成功力,GPT-4亲自监考,130亿参数开源模型「小羊驼」来了ChatGPT黑化版来了!拉踩TikTok用户智商、写暴力故事等为所欲为,bug只因3个字母ChatGPT讲座:ChatGPT并不神秘,但ChatGPT很神奇PK chatgpt 的诗评Bing上线了「ChatGPT」搜索,为啥评价两极化?当GPT-4学会看图文,一场生产力革命已势不可挡纽约每天30人死于XBBHunt Good 周报:AI 不靠谱?快来试试这个专业答疑版「ChatGPT」超越诺奖?生物界「ChatGPT」首次实现从零合成全新蛋白,登Nature子刊!喂了2.8亿种氨基酸序列绘本只用来讲故事、讲道理,太可惜...双博士妈妈教你这样读(精华干货)百度拾起「ChatGPT」这杆枪“特能聊的 ChatGPT”是智能对话技术的下半场吗?| Q推荐Chatgpt 4 要release 了微软发布Visual ChatGPT:视觉模型加持ChatGPT实现丝滑聊天chatGPT. 一本正经胡说八道百度将推「文心一言」,打响国内「ChatGPT」第一枪全球最大ChatGPT开源平替来了!支持35种语言,写代码、讲笑话全拿捏厉害了我的 ChatGPT, 弱3天近一万Star,无差体验GPT-4识图能力,MiniGPT-4看图聊天、还能草图建网站
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。