Redian新闻
>
“通义千问”来了,阿里将为白热化的AI大模型赛道带来什么?

“通义千问”来了,阿里将为白热化的AI大模型赛道带来什么?

财经
来源:凤凰网财经
作者:胡毓堃

去年11月底ChatGPT一鸣惊人,掀起了一股“AI技术革命”的新浪潮。围绕人工智能改变世界、改变人类未来的讨论疯狂刷屏,而在热闹喧嚣的舆论场外,国内各家大厂也在这场新一轮加速的AI竞赛中加足马力、全力跟进。
         
3月16日,百度推出“文心一言”,标志着中国企业正式踏入这一AI新赛道,而这无疑只是一个开始。中国在这个全新的AI时代能做什么?还有多少潜力可以挖掘?我们能否赶上OpenAI并创造新的可能?AI新时代震撼冲击下所有人心中的疑问,也是中国企业们亟需完成的答卷。
         
4月7日,阿里巴巴旗下的大语言模型——“通义千问”开启企业邀测。用其负责人、阿里云智能CTO周靖人的话说,它不是起点、也不是终点,而是阿里自主探索道路上的“节点”。然而,“通义千问”的体验仍足够令人眼前一亮。而它所依托的阿里,则要凭借自己的独特优势在这条日趋拥挤的AI赛道上,回答外界的疑问、创造新的可能。
         
1、“通义千问”企业邀测开启:超出预期的体验

“AI时代开始了。”
         
这是比尔·盖茨去年9月体验过ChatGPT的惊人表现后得出的结论。2月10日,盖茨在接受德国《商报》播客采访时,将当前的AI发展称为“最重要的创新”,而ChatGPT的应用“将改变我们的世界”。随后他在3月21日发表博客文章,进一步阐释了ChatGPT为何是继图形用户界面后最重要的技术革命。
         
虽然未必严谨,但ChatGPT正在引爆新的技术革命,已经成为业内和公众某种程度上的共识,至少引发了类似的思考。从表面上看,作为聊天机器人,它互动、回答、创作的准确度在不少情况下可以媲美甚至超过人类。
         
而透过花样繁多的现象案例,在超强算力的给力支持下,经过充分的训练和深度的学习,ChatGPT不仅强于历史上所有的AI,更大的悬念在于,如果它以强于普通人的学习能力持续成长,“AI巨兽”未来可能实现的潜能边界在哪里?
         
正是这样的特质、能力与潜力,GPT无疑正在改变人类社会生活的方方面面:小到一个个可能被取代的人类岗位,中到未来的商业模式与投融资方向,大到可能被冲击、重塑的经济产业结构,甚至国与国之间的竞争,人类社会如何自处、如何与AI共处……变革正在发生,GPT所牵出的不确定性,恐怕要甚于它自带的能力。
         
变革与不确定性笼罩下,两种截然相反的动向竟然在同时同步地进行:一方面,马斯克与上千名业内人士发出联名信,呼吁暂停训练比GPT-4更强大的AI系统,意大利政府甚至禁止使用ChatGPT;另一方面,中国企业不敢懈怠,正在加速研发类似的AI大模型,争取进入领先赛道、参与头部竞争。
         
百度用“文心一言”打响了第一枪,华为“盘古”大模型何时上线也牵动外界注意力。但大家的期待显然不止于此。作为互联网行业领先的巨头,早已开始默默准备的阿里何时做出反应?4月7日开启企业邀测的“通义千问”,可能是阿里答卷的开篇。
         
“千问,千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的,也一定是真有学问,以及,AI和我们一样,都有千万次交互的热情。”作为大模型研发者,阿里巴巴达摩院如此解释它的命名。是否经得起“千万次的问”,是所有邀测人士的共同关切。
         
相比于几天前的天猫精灵大模型版的演示版本,据说这次邀测的才是“完整版”阿里GPT。通义千问亮相之前,达摩院曾研发世界首个突破10万亿参数的AI大模型,还联手中国计算机学会(CCF)开源发展委员会,搭建了国内规模最大的 AI 模型服务社区 “魔搭”。通义千问的出现,早有伏笔。
         
在测试实践体验中,用知名互联网消费互动媒体TechWeb的话说,“有惊喜也有惊讶”。

它的主界面简洁明了,明确介绍自己是“专门响应人类指令的大模型”,给出了电影脚本、写封邮件、职场助理、撰写短文等示例。值得注意的是,通义千问还有单独的“百宝袋”板块,演示并提供了九种特定话题场景、文本体裁的内容输出。
         
作为中国创造,中文无疑是通义千问明显的“母语优势”。在各种对话实例中,它对中文语义的理解能力(包括诸如“李四壮差点上上上上海的车”这类拗口语句)、逻辑推断能力、科技与知识理解分享、文学理解与创作、应用写作等方面,均表现出不逊于GPT3.5、与文心一言各有所长的特点。
         
当然,它在其它语言中的表现也并不差。
         
通义千问目前尚不能直接生成图片,专注于生成文本、编写代码等内容输出领域。它生成的答案看起来比ChatGPT和文心一言更偏向于理性、注重逻辑、严谨,似乎更擅长于科学类知识(或许是此前阿里基于业务需要的训练倾向所致)。
         
它不会混淆“苹果电脑”和“自产苹果”,写出的小学生作文被在读学生认定为“小学三年级水平”,SWOT(强弱危机)分析颇具工作实用性,甚至敢写多场景切换的《流浪地球3》剧本……
         
常规问答逻辑正常,专门领域输出质量在线,功能宝库齐全,通义千问或许暂时不能比肩OpenAI的GPT4技术,但它的“即战力”足以证明自己是AI赛道上的新晋实力派玩家,潜力和前景更值得期待。
         
至少在被ChatGPT搅动心绪、又担心亚洲账号封禁的当下,我们将拥有一个可以畅通无阻的自家代表。
         
2、久久为功、厚积薄发:AI赛道日益拥挤,阿里何以创造新的可能性?

大家都在抢做聊天机器人,OpenAI、百度与阿里的大模型类型相似、性能对比有来有回,那么阿里加入竞赛的意义仅限于“不能落后”吗?随着AI新赛道日益拥挤,阿里有何独特优势,从而跳出“内卷”窠臼、创造新的可能?
         
这便要理解阿里对“通义千问”的定位:它不只是个聊天界面,而是大语言模型。打造AI大模型门槛极高,但大模型的基础设施与开放平台能开拓无尽的前沿边界,实现前所未有的潜能。这便是“通义千问”这个“中间节点”所折射出的阿里AI战略之路。
         
之所以说是“中间节点”,是因为阿里的大模型探索之路从2019年便已经开始,经过近几年的技术迭代,用周靖人的话说,大语言模型已开始能根据自然语言理解有效地提取人类大量的知识体系。
         
为了做到这一点,大模型的研发动辄要超千亿参数,其难度远远超出了单一的算法或GPU芯片的简单堆砌。这是一个囊括底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要的是AI云计算的全栈技术能力。更简单地说,当下的AI大模型竞争,本质上就是算力竞争。
         
阿里的提前准备,为自己建构了实力引领的先发优势。阿里达摩院在国内率先布局AI技术与大模型研发,2021年先后发布了国内首个超百亿参数的多模态大模型M6与及被称为“中文版GPT-3”的语言大模型PLUG,此后还训练实现了全球首个10万亿参数AI模型。2022年达摩院推出的通义大模型系列,更是在语言及多模态能力、超大模型、通用统一模型等多个技术维度上处于国内第一梯队。
         
在核心竞争力——算力层面,阿里云是国际权威机构Gartner榜单中亚洲第一、全球第三的云计算服务商。尤其在2021年底Gartner对云厂商整体能力评估中,阿里云IaaS基础设施能力拿下全球第一,在计算、存储、网络、安全四项核心评比中均斩获最高分。
         
此外,阿里在去年8月底推出的“飞天智算平台”是国内最大规模的智能算力中心,阿里云机器学习平台PAI更是以数倍的量级提升了AI训练和推理效率。多年的耐心准备与坚持探索,令阿里具备了强大的云计算基础设施能力、深厚的大模型技术积淀,这正是其加入本轮AI技术竞赛、持续竞逐“兵家必争之地”的核心优势。
         
透过阿里的优势与“先发制人”的势头,外界似乎窥见了这家头部大厂更宏大的战略布局:阿里要做的,并不只是可以媲美GPT的同质模型。
         
围绕多模态大模型的早早布局,表明阿里早已注意到AI发展的最新动向,把握住不同的路线选择、提早在业内竞争中站住身位。而魔搭社区的成立,凸显出阿里还有超乎企业自身的更大愿景。
         
秉承“模型即服务”的理念,魔搭社区把AI模型变为直接可用的服务,用极低的门槛便可体验模型效果,实现模型推理、调优、定制。达摩院率先贡献家底,全面开源开放300多个经过检验的优质AI模型,并吸引了澜舟科技、深势科技、智谱AI、启智社区、哔哩哔哩、IDEA研究院、WeNet等十多家知名机构贡献模型。
         
目前魔搭社区已上线十亿参数以上的大模型超过30个,百亿参数大模型超过10个,包括自然语言理解和生成、对话、文本生成图片、文本生成视频、多模态表征等多个重要方向。这是对传统认知的颠覆:大模型研发不应以训练难度和成本的高门槛排斥多数机构,而要开放生态、降低门槛,方可凝聚力量,促成所有AI从业者积极探索、自由使用、研究突破、应用推广。
         
唯有如此,大模型成为AI时代的基础设施,中国本土才会有源源不断的创新土壤,通义千问所预示的潜能与前景方可充分实现。
         
周靖人曾经卖关子:通义千问只是阿里通义模型的一个成员,下一个已经在路上。4月11日召开的2023阿里云峰会,或许将见证更多来自中国本土的可能性。在日趋激烈的AI赛道上,以阿里为代表的中国力量也将注入新鲜活力。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
能分开CCP和中国人民吗?张艺谋21岁私生子越来越像巩俐?与巩俐相恋8年,娶小31岁娇妻生三胎醉卧沙场君莫笑“通义千问”带动阿里上涨,中国AI竞赛升温王菲女儿窦靖童出家,宗萨仁波切亲自剃度,知道原因我只佩服王菲阿里云大模型“通义千问”4 月 11 日带来重磅消息张兰称不会再招聘低学历主播;网易有道回应被苏炳添起诉侵权;阿里所有产品将接入通义千问;推特已不再作为独立公司存在...阿里巴巴所有产品未来将接入「通义千问」,将推企业专属大模型|最前线相信终有一天,通义千问能理解河道英对朴妍珍的情感阿里版 GPT!阿里云大模型“通义千问”官宣内测:申请地址公布不要都在大模型赛道厮杀,ChatGPT创业还有一条潜力黄金赛道阿里云大模型发布 “通义千问”开启企业邀测阿里版GPT"通义千问"来了,公司官宣开始内测阿里版GPT“通义千问”推出;新东方罕见激励|首席周末热点精华谦寻斥资两千万买地做直播;钉钉接入“通义千问”大模型;美团外卖首次直播带货 | 一周简讯阿里通义千问大模型加持,专攻音视频生产力的「听悟」来了大模型赛道正“热”:卷场景、卷芯片、卷人才白热化的城市竞争,谁将胜出?| 专精特新峰会“通义千问”官宣,阿里张勇:未来阿里所有产品都将接入AI大模型阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl通义千问,再次「激活」阿里云国内首个开放公测的大模型产品上线,接入通义千问理解与摘要能力 | 新闻阿里版GPT通义千问实测来了!中文十级,数学、编程、情书全套整活对话阿里云CTO周靖人:“通义千问”不是起点也不是终点阿里达摩院发布“通义千问”,首席首测,学问如何?宝马MINI再次发文道歉,马斯克称0利润卖车也能赚钱,天猫精灵接入阿里云通义千问,微信可免费听周杰伦,这就是今天的其他大新闻!未央播报 | 网信办拟出台生成式人工智能服务管理办法 阿里巴巴所有产品将接入“通义千问”大模型张鹏对谈潘乱、李翔:通义千问发布后,阿里巴巴的下一步会怎么走?张勇:阿里巴巴所有产品都将借“通义千问”重新定义升级抖音与腾讯视频宣布达成合作;阿里云自研大模型“通义千问”官宣邀测;胡润全球白手起家U40富豪榜发布……早鸟报|腾讯视频入驻抖音;阿里所有产品将接入通义千问;字节试水快时尚服装生意...AMD 招人:世界各地、多专业等阿里版ChatGPT「通义千问」邀请测试,我们第一时间试了试阿里所有产品将接入“通义千问”;商汤科技公布“日日新SenseNova”大模型体系;腾讯定性微信QQ故障为一级事故……苏炳添起诉网易侵权;阿里云正式推出大语言模型通义千问;京东零售取消事业群制;联合国将官宣印度成人口第一大国丨邦早报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。