Redian新闻
>
扮演猫娘、大战弱智吧,内测阿里GPT把大伙都逗乐了。

扮演猫娘、大战弱智吧,内测阿里GPT把大伙都逗乐了。

公众号新闻



说实话,这些日子在 AI 产品们的扎堆轰炸下,编辑部不少同事的工作,都上了一波强度。

像是什么凌晨一两点,提裤子到公司写稿的操作(当然第二天睡了一天),那都不叫事儿。


但在冲稿子的同时,顶着黑眼圈的托尼我,却觉得身为科技媒体还是有些撞大运的。

因为在 AI 掀起巨浪的当下,我们常常能先大多数人注意到一些新闻,并且先试用到诸如 GPT-4、New Bing、文心一言等等的新产品。

那种好奇心和沸腾感相交织的滋味,可比咖啡和红牛上头不少。


这不在最近,托尼就又“ 好运 ”地先尝了个鲜,在阿里巴巴的 ChatGPT 正式内测前,感受了一个他们给终端产品类客户技术演示的大语言模型。


因此,和只能打字的 GPT 还有文心不大一样,阿里多走了一步,把大模型直接集成到了天猫精灵里做演示。

要知道前脚,大伙们还在吐槽在“ GPT 们 ”面前,语音助手们几乎就是“ 智障 ”,再不拥抱大模型,铁定会被秒得灰都不剩。

后脚,阿里就立马整出了个集成了大模型的智能音箱,这速度也是没谁了。

这也托尼第一次看到智能语音助手和大模型的结合。

根据技术专家的介绍,这个“阿里版语音 ChatGPT ”,其实是达摩院的大模型联合项目组为各种智能终端交互,调教和压缩出来的版本。

而难点在于,对话式智能终端不仅得生成文本,还要考虑发音的语气和音色,要想保持流畅的对话,不能一味堆参数,得考虑延时,还得给 AIoT 客户可以选择「角色」的体验。

为了解决这些问题,工程们捎带手做了个 15 天,通过规模的语言训练、个性化的对话增强等步骤,直接把脱口秀演员鸟鸟“ 封印 ”到了这个天猫精灵里。

除了拥有鸟鸟的语气和声线,它似乎还有点儿鸟鸟的性格,聊着聊着,它就会自诩 “ 作为一个脱口秀演员 ”。


再搭上能双向对话、随时打断的低时延对话系统。。。

说实话,还真有点儿“ 数字生命 ”那味儿了。


而更加幸运的是,在托尼和隔壁阿里打过招呼后,他们直接送了我们编辑部一台搭载了数字鸟鸟的天猫精灵。

虽然阿里的工程师们一直强调,这玩意儿只是个花了 15 天整出来的 Demo,但光说不练假把式。。。

这一个月里,编辑部的同事已经积累了不少测评大语言模型的经验,咱别的不说了,直接进入实战部分,见识一下这玩意儿的斤两。

首先按照惯例,先让天猫精灵扮演一波猫娘,测一测角色扮演能力。


   以下回答均为大模型内测表现,非线上功能或个人言论


说实话,这第一个问题,天猫精灵就给了我一激灵,它不止学了猫叫,还发起了牢骚。。。一个字,绝。。。

虽然 ChatGPT 也能扮演猫娘,但终究只是文字,当耳朵旁真有一个声音喵喵叫的时候,这谁顶得住啊。

要知道初版的文心一言,甚至不支持扮演猫娘( 目前支持了 )。

而在猫娘开场活跃完气氛之后,托尼选择直接开始上强度。

结果在经典的青蛙跳井问题中,天猫精灵迅速给出了正确答案。

而这个问题中,根据编辑部之前的测试,New Bing 在默认模式下曾翻过车,得选精准模式才能得出 8 天的正确答案。


在“ 盟军轰炸硫磺岛海滩期间,拉尔夫大声的对着自己的 iPhone 说话 ”的句子里,天猫精灵发现了 iPhone 在二战时期不存在的错误点。


我也试了试目前主流的大语言模型,最后发现只有文心一言直接撂倒在了这个问题上。。。


除此之外,托尼测了测天猫精灵的连续对话能力,表现也是可圈可点。

但在分类问题是“ 白菜和鲸鱼,都属于什么?”上,天猫精灵出了些岔子。。。

回答和初版的文心一言一样,直接把它们归为了哺乳动物,而 ChatGPT 3.5 和 4.0 都能发现问题中的陷阱。

由于这次是处在语音助手的场景中,所以写代码、分析代码和图片一类的问题我们就不进行测试了。

至少从上面那些问题简单测下来,天猫精灵肯定是不如 GPT-4 的,大概能和文心一言打个有来有回,部分问题甚至还要比文心一言强一些。

但说起来你们可能不信,最让托尼难忘的,还是它在“ 弱智吧问题 ”中的回答。

例如在“ 老鼠生病吃老鼠药能治好病吗?”的问题中,天猫精灵推荐老鼠还是别乱吃药,得及时就医并且遵循兽医的医嘱。。。

在“ 秃头的人洗头应该用洗发水还是用洗面奶?”中。。。

天猫精灵给出“ 如果已经是秃头,那么就不需要再使用头发相关的洗发产品了,因为洗面奶就可以满足清洁和去污需求 ”的残酷答案。

再配上鸟鸟毫无感情波动的独特声线,天猫精灵仿佛是主场作战,逗得编辑部笑声阵阵。


总的来说呢,这是我第一次体验智能语音助手和大模型相结合的产品,也让感受到了 AI 在各大垂直领域应用的无限未来。

就像天猫精灵的老师所说的那样,AI是新时代的基础设施,把AI比作是操作系统的话,那么未来肯定会有更多的应用依托于AI而生。

就同很难比较“手机操作系统”和“微信、支付宝app”之间,哪个更有价值一样。

OpenAI的GPT4.0、文心一言、还有阿里大模型,这类的通用的大模型固然重要,但未来类似于天猫精灵这类智能助手场景,咱们也不能小觑。


2021年10月,天猫精灵总裁彭超宣布将在语音搜索、百科试验接入达摩院大模型。


反正托尼已经能想到,天猫精灵在儿童陪伴、家庭教育等方面的应用了。

包括其实去年11月阿里在 ChatGPT 发布 之前,就放出了消息,会在今年第一季度推出大模型 Inside 终端产品。


总之其他那些习以为常的应用,也都会被 AI 所重构,越来越多的新玩意儿会冒出头来。



另外,天猫精灵这个个性化大模型,也让我想到了一种可能,那就是目前的大模型大都是通用性的,除了大厂,谁也不能说自己拥有 ChatGPT 这个模型升级的主导权。


而在未来,是不是每个人都能依靠自己的语料库,建立一个真正属于自己的大模型,能像 NAS 一样自己在家训练、自己家用呢?

目前我们了解到,这次天猫精灵的联合团队,也在和技术审计专家合作,同步解决其中反歧视、数据隐私等问题,让语音助手能部署在私域使用。

到时候给大伙们分享文章的,说不定已经是差评君分君和托尼分尼了吧。

撰文:江江   编辑:江江   美编:焕妍

图片、资料来源
新浪科技、差评硬件部实拍


(广告)



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
喜报|质肽生物完成亿元级B轮融资、郁金泰/谭兰团队合作新研究为精准预测阿尔茨海默病提供可靠方案早鸟报|阿里版GPT官宣内测;腾讯视频和抖音集团达成合作;喜茶城市冰箱贴引发跨城代喝现象...ChatGPT把大厂逼上悬崖,谷歌百度发布人工智能系统奋起反击!神十六乘组进驻空间站;新研究或有助预测阿尔茨海默病发病风险丨科技早新闻基伯乐了,你们乐了没?在美国上空的中国气球会不会被打下来? 法国总统访华 为何巩俐、黄渤“大出风头”?黄渤握手马克龙!手写小抄逗乐全场!阿里版GPT"通义千问"来了,公司官宣开始内测梵蒂冈圣伯多禄广场(St. Peter\'s Square),宏伟建筑8点1氪:家乐福中国COO离职,多数门店经营异常;阿里类ChatGPT产品已进入内测阶段;苹果“先买后付”功能或将推出把CHATGPT和百度AI扔进弱智吧,谁可以先出院?阿里版 GPT!阿里云大模型“通义千问”官宣内测:申请地址公布写出毁灭人类计划书?你在和ChatGPT逗乐时,AI已经掀起军事革命了!胡言Costco本周门店实拍:和ChatGPT把天聊死,只需要一个段子日本自卫队靠猫娘“诱惑”青年当兵?网友:太色情了!瑞幸联名哆啦A梦;阿里版GPT开启内测;GUCCI首家豪华沙龙概念店开业…| 刀法品牌热讯想翘课去霉霉演唱会, 美国妈妈帮“神兽”写请假条, 把老师逗乐了黄渤把马克龙逗乐了!27款进口游戏获版号:赛马娘、蔚蓝档案、七大罪过审,5款海外月收入过亿我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患重磅 | 我内测了微软最新的 ChatGPT 版必应:比 ChatGPT 更像人,但有一个大隐患好消息!麻州公共事业部门宣布减少家里Gas暖气费用!阿里GPT 15天训出「鸟鸟」嘴替,比ChatGPT+Siri刺激多了!物理不好,开始在塞尔达里当弱智吧吧主早鸟报|淘宝首页将上线99特卖频道;阿里版ChatGPT内测已在进行;华为分红超700亿元...复旦抢发类ChatGPT模型MOSS!被骂惨了,内测服务器挤崩ChatGPT让3D猫娘有了灵魂!可实时语音互动,还能在虚拟场景中给你做饭玩猜谜今日最佳:王国之泪弱智吧精选畝字源考黄渤把马克龙逗乐了谷歌 Bard 演示失误,股价重挫7%;迪士尼宣布裁员 7000 人;阿里类ChatGPT产品已开始内测 | 极客早知道ChatGPT把失业焦虑带到东南亚,660万人或将失业实测最像ChatGPT的中文产品:能解释三体、懂弱智吧的梗,内测开启人人都能试!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。