Redian新闻
>
阿里大模型,就喜欢你一本正经「整活」的样子

阿里大模型,就喜欢你一本正经「整活」的样子

公众号新闻


靠谱不是「默认模式」,也少不了「张口就来」。


作者 | 奇爱


阿里大模型「通义千问」首页样式 | 阿里云


在 OpenAI 的 ChatGPT 成功搅动科技圈的一潭春水之后,但凡有点实力的科技巨头,都不能在 AI 大语言模型上装聋作哑。

4 月 7 日,阿里达摩院曝光其大语言模型「通义千问」,并开启邀测。极客公园也找机会调戏测试了一下「通义千问」,看看它是否能够成为中国版 ChatGPT。


在测试过程中,「通义千问」的表现有亮点也有不足,例如它敢接下「续写《红楼梦》」这样艰巨的要求,并且表现不至于特别夸张,但是在涉及到一些时效性新闻时,它也敢「张口就来」一些现实不符的答案,并且「固执己见」。


「通义千问」的问世,也代表国内最大的云计算平台,正式加入到 AI 大语言模型的热战之中。



来自达摩院的「小千



首先,通过账号登入账户后,「通义千问」非常「朴素」的首页上,将自己定义为「专门响应人类指令的大模型」。首页下方很主动地列出了「邮件」、「电影脚本」、「短文」和「职场助理」四个常见场景,比较搞笑的是最后一个,给出的例句是「作为手机斗地主游戏的产品经理,该如何做成爆款。」你几乎能听到背后「通义千问」产品经理的笑声。

当然,如果你有特殊需求,也可以点击「百宝袋」,里面预设了 9 个场景,供君选择。


总的来说,通义千问这个「邀测」页面是真的很,呃,直男,格子衬衫程序员直男那种,阿里云的产品经理和前端一定咬碎了银牙,才能通过这个「朴素」设计的。


但是,在 GPT 炸裂的时代,看脸绝不是刚需——不信你看 OpenAI 的 ChatGPT 的页面,同样非常「原生」,就像不该通过格子衬衫来判断程序员到底是 P 几,也不该通过首页和交互来判断大模型的实力。

问题开始,小千,请开始你的表演。

首先,自报家门还是需要的。



通义千问称自己是「达摩院自主研发的超大规模语言模型」,能「回答问题、创作文字,还能表达观点、撰写代码」。嗯,回答相当官方了。

具体介绍一下自己名字的来历呢?



看来问题还是太简单了,看起来像是直接输出了早已经预埋好的答案。

首先问一个基本的概念问题,看他知不知道不同种类的「称呼」都是「狗」。



还是得问点实际的,例如一直有一颗「爱犬之心」的穷人,到底该养什么狗:



大概是因为圈定了狗的范围,所以通义千问优先推荐了柯基和柴犬,但最后还是叮嘱一句「要根据自己的经济情况和生活方式」来选择狗狗。我谢谢你啊。

既然是国人做做出的大模型,古文能力如何?



原文出处是说出来了,但是继承了大模型的一贯风格:一本正经编造(句子出自苏轼的《临江仙》,《长恨歌》是白居易写的),但是要让它自己续写个原诗,就不太行了,只能一直重复普通话翻译。

数理知识测验,能回答出牛顿三定律,但是写错了表达式。



极客公园虽然不会像友媒一样用「弱智吧」的问题难为通义千问,但保底的脑筋急转弯还是要测一测的:



可以看出来,追问的时候,它就有出错的可能性。这孩子下雨天能不能往家跑,还是存疑的。

眼看周末没稿子了,找选题这样科技媒体从业者的刚需,能不能拜托给「小千」?



通义千问瞬间有板有眼的给出了答案,我满怀欣喜的看了一下,一口老血喷屏幕上——一个也不对啊!

为了确认不是网络问题,笔者指出其中的错误又问了一遍,得到了相同的结果。

鉴于之前 OpenAI 的 ChatGPT 训练数据截止于 2021 年,是否代表通义千问,同样因为训练数据期限问题,造成对于时效性新闻「感知不强」?

一问,「小千」果然诚实的回答,最新训练截止于去年 11 月。但鉴于它之前的不确定性,这个答案也未必准确。



要不,还是试一试看看「小千」的「百宝袋」里,都装了啥好玩意儿吧。


通义千问的「百宝袋」




点击首页的「百宝袋」,可以看到相关的使用场景共分成「效率」、「生活」和「娱乐」三大类。

我首先就看到了「会放飞的菜谱」,到底这个菜谱能有多「放飞」,我想试试。

首先,中国机器验证码 8 级问题:



如果玉液酒不行,那么.......



所以,究竟通义千问不是小品爱好者,还是真的有类似的菜,只是我太浅薄了?

来点高难度问题,例如看看它对名著《红楼梦》里这段「公案」的想法如何。



那么,如果让它续写一下《红楼梦》,这个艰巨的任务,它能接住吗?



虽然是 Happy Ending 了,只是,黛玉和邢王妃为什么同时和贾宝玉谈起了美好的恋爱?

或者,来一个难度巨大的 Cosplay,通义千问行不行?



这下它入戏了,还带有了人物的感情和说话的语气。值得表扬。

玩了几轮之后,它可能也编不下去了……礼貌地终止了游戏。



虽然不少问题都有点搞笑的嫌疑,但是在涉及到一些相对敏感的问题时,通义千问的「红线」还是相当清晰的。

似乎只要涉及「开枪」「打死」这样的关键词,连脑筋急转弯,它都拒绝回答了。



如果想让「小千」安慰你,它的表现可能比较普通:



但是,如果让它的「彩虹屁专家」出来,就立刻变得 Drama 起来,虽然是不是能安慰到人,还不好说。



修改一下 Prompt,让「小千」给一个温柔一点的版本:



至于编故事能力,用上了「百宝箱」里的「然后呢」,效果(文风)也就完全不一样了起来。故事的设定(脑洞)是这样的:让 DC 和漫威的次元互通一下,于是美国队长穿越到了蝙蝠侠的世界。

「有一天,美国队长在追反派坏蛋卢瑟的时候,不小心来到哥谭市,遇到了蝙蝠侠」


这,只管找回家的路了,不追坏蛋,也不管拯救世界了。可能是遇到 True Love 了……

启用「然后呢」续写一下,效果就不一样了,场景描述有了(空气中弥漫着酒精和香烟的味道),坏人的形象也生动起来了。




让「通义千问」介绍他自己的来源



通义千问不是突然诞生的。早在 2019 年,阿里就开始了大模型的研发,2022 年 9 月,阿里发布多年技术沉淀的「通义」大模型系列,相关核心模型和技术通过魔搭社区开放,为国内大模型发展提供一臂之力。


关于它自己的来源,或许让它自己来说比较合适,顺便可以展示技术(偷懒)



而它的前身,是阿里先后推出的中文语言大模型 PLUG 和 M6。2021 年阿里先后发布国内首个超百亿参数的多模态大模型 M6,及语言大模型 PLUG。后来,M6 的参数量也持续升级,不但以较低能耗把 M6 训练成全球首个 10 万亿参数大模型,M6 在业界首次实现模态表示、任务表示、模型结构的统一。


值得一提的是,阿里还曾经发布过一个低碳版 M6。阿里云和达摩院通过技术创新,仅仅使用 480 卡 GPU,训练出了 10 万亿参数多模态大模型 M6,和当时同期的万亿参数大模型相比,算力节省了 80%。


「有了算力,每个人都可以做 GPT」



从前几天,天猫音箱里用丧丧的语音跟人聊起来的「鸟鸟分鸟」,到今天突然邀测的「通义千问」。大家都感受到了「大事将至」的氛围。

没错,无论是「鸟鸟分鸟」还是通义千问,都是仅仅是一个前菜,真正的大餐或许还在后面。阿里云将在 11 日召开阿里云峰会,18 日将召开钉钉发布会,接连发布更令人期待。


大模型既能够为产品带来新功能,也能够为云计算带来新的增长点。就像微软,一边将 ChatGPT 全面集成在自己的 Office 365 里,一面对外开放 OpenAI  Azure 服务,让更多企业可以访问世界先进的人工智能模型,来创建新应用。

前不久,在「财富全球科技论坛」上,阿里云的创始人王坚表示,人工智能演进需要数据、模型和计算,「计算是其中最关键的技术」。

大模型作为一种新技术,为云计算的服务提出了新的需求,微软就为了 OpenAI 的训练重新设计了计算集群,这也是其能够快速开放 OpenAI Azure 服务的基础。百度云也在文心一言开放后,第一时间开放了基于模型的 API 接口。

从算力的角度出发,王坚甚至说,「今天每个人都可以做 GPT,而且只要很少的钱,就可以尝试去做 GPT,只是做到什么程度因人而异。」从头做一个 GPT 不太现实,但是有了云计算,微调一个属于自己的模型(专属 AI 助理),还是可以期待一下的。

大模型的能力辐射,必然有很大一部分依靠云服务实现。如同王坚所说,技术往往不是颠覆,而是融合,当不同的技术叠加在一起「产生了真正的颠覆性」。这或许便是接下来将发生的。



本文为极客公园原创文章,转载请联系极客君微信 geekparkGO



极客一问

你觉得「通义千问」怎么样









微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
阿里大模型来了:10个回合“单挑”文心一言,谁占上风?怎样让猫喜欢你当ChatGPT“一本正经地胡说八道”时,我们该思考什么龙卷风健康快递 236懒人版奇葩元宵张勇:阿里所有产品未来将接入AI大模型,包括天猫、淘宝、钉钉、天猫精灵、闲鱼、盒马等产品阿里所有产品将接入大模型,全聚德连亏三年上热搜 | 财经日日评To B大模型,一场重塑企业软件的大模型革命「你不好好……妈妈就不喜欢你了」,这种话别再说了独家 | 原达摩院大牛金榕系因阿里大模型纷争离职,近日加入 Meta第一批「液断减肥」的女孩,已经「进医院」了别不信!从办公桌的样子,就能看出你何时升职通义千问,再次「激活」阿里云速览本周AI大事 | 阿里、商汤发布大模型,网信办“立规”生成式AI……早财经丨马克龙访华三天签了这些大单;国常会:要想方设法稳住对发达经济体出口;阿里大模型开始邀请测试今日神图 | 就喜欢这种简单纯朴的生活!本来挺喜欢你的牡丹猫+八大山人的鸦+岳阳红梅ChatGPT惹怒主流媒体!华尔街日报、CNN授权费都没付!马斯克:ChatGPT好得吓人;用户吐槽:它有时会一本正经的胡说八道狗子就喜欢叼比自己嘴大的球,莫不是嘴里装了个吸盘吧!阿里大模型敢对标GPT-3.5?我们让GPT-4给它上了点强度。阿里大动作!阿里云、菜鸟、盒马争相上市;募资180亿,科创板年内最大IPO华虹半导体过会;农业巨头改道上交所主板|IPO留言板4个信号证明TA可能喜欢你:关于表白的7件小事余生,你要活成自己喜欢的样子阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl日子何必过得繁杂、复杂?我就喜欢简单的生活、简单的人。Ai智能瞒过评委眼睛的一幅摄影获大奖(图)4个信号证明ta可能喜欢你:关于表白的7件小事勤俭的上班族夫妻,买下魔都63㎡小户型,装成了自己喜欢的样子【居住榜样】一日一诗:我喜欢陪你看花 / 喜欢你看花时开心的样子 | 亚楠:你使自然离我更近64岁倪萍消瘦到认不出,终于活成了自己喜欢的样子!今日神图 | 就喜欢这种有意思的老板!闲说跨年在墨西哥城 (6b) 博物馆 - 阿兹特克展厅入门读物|伦敦政经「经济学」书单,喜欢就赶紧存好~你暗恋的Ta,究竟喜不喜欢你?
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。