Redian新闻
>
雷军杀入大模型

雷军杀入大模型

公众号新闻

小爱同学距ChatGPT,还差一个文心一言。


作者 | 王非

来源 | 猎云精选

(ID:lieyunjingxuan)


“全力以赴、坚决拥抱”,雷军为小米大模型发展定调!


继任命栾剑担任技术委员会AI实验室大模型团队负责人后,雷军于4月14日晚间在微博发文,首度谈及小米对大模型和AIGC的看法。


除了定下发展基调,雷军还透露,对于大模型,小米“正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”


事实上自3月份以来,各路互联网大佬和技术大牛,以及BAT华为360商汤等大厂密集发声,雷军此番表态,可谓“虽迟但到”。


值得注意的是,雷军在微博提及小米,在AI领域有AI实验室、小爱同学、自动驾驶等团队。


于是,小米在大模型领域的发力方向,可窥一二。


来源:微博截图


出身微软,栾剑成小米大模型领头人


4月14日,据澎湃新闻报道,小米集团发布内部邮件,任命栾剑担任技术委员会AI实验室大模型团队负责人,向技术委员会副主席、AI实验室主任王斌汇报。


公开资料显示,栾剑现任小米技术委员会AI实验室语音生成团队负责人,曾任东芝研究院研究员、微软工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。


目前,网络上关于栾剑的报道并不多。在知乎上,他的个人标签为“小米NlP技术高级总监”。


2018年5月,知乎官方发布《我们和微软小冰发了一首单曲 | 为「新知青年」而唱》一文后,栾剑本人还赞同了该文章。


据SegmentFault报道,2019年11月,在微软小冰的一场内部WorkShop上,时任微软小冰首席语音科学家栾剑与另外两位“首席科学家”共同分享了微软小冰当年在自然语言处理、语音学研究、多模态生成等领域研究进展。


彼时,栾剑以《小冰唱歌技术进展》为题演讲。他提到,微软小冰团队“在语音合成领域大方面的东西可能已经解决,但语义理解方面,可能还需要通过长时间的积累和技术的发酵。”最终,团队找到了一个更有挑战性的课题——唱歌。做唱歌主要有三个原因:第一个原因,唱歌的门槛比说话高;第二唱歌的情感表达更加丰富激烈;第三它是一个很重要的娱乐形式。


值得一提的是,栾剑还在现场分享中提到,深度学习其实在上世纪90年代就火过一阵,但那个时候却没有取得像今天这么大的成果。他认为主要有两个主要的原因:


1. 因为硬件技术的方法,当时的算力还不够,现在有GPU,而且GPU还在不断地升级,所以它的计算能力在提高;2. 另外一个很重要的支撑就是数据,现在有大数据的支持,所以才能够把深度学习做得这么好。


随后,栾剑就从微软跳槽到了小米,具体时间不详。


北京大学现代信号与数据处理实验室于2021年5月发布的文章显示,2020年5月,小米人工智能部语音技术总监王育军及其团队应邀来校举行北大&小米技术交流会。当天,栾剑博士的汇报题目是《语音生成技术》,介绍了语音合成的基本概念,并就该领域的关键问题展开讨论。


今年以来,ChatGPT爆火后,栾剑也在4月份接连在知乎发布两篇文章,分享自己的感悟。


作为“一个AI领域近20年的从业者”,栾剑在4月5日发布的《一个关于ChatGPT能力涌现成因的猜想》一文中认为,产生“涌现”能力的三要素可总结为:


大数据:如果数据不够丰富,就可能也没必要挖掘出“概念”与“常识”;大模型:如果参数量不够多,模型没有足够的空间去完成“层级结构”;多任务:如果任务比较单一,模型没有动力去做结构调整,“平行结构”成为模型的“偷懒”选择。


随后在4月8日发布的《hatGPT的训练过程对“鸡娃”的启示》一文中,栾剑“通过类比,尝试定性地探讨儿童教育可以从ChatGPT的训练过程中得到哪些启示”。


出身微软,拥有丰富的AI语音技术储备和工作经历,如今担任小米大模型团队负责人后,栾剑如何发挥自身优势,又能与“小爱同学”碰撞出怎样的火花,我们也只能拭目以待。


内有千人AI团队,外有金山云护驾


当地时间4月14日,英国《金融时报》援引知情人士消息报道,特斯拉CEO埃隆•马斯克(Elon Musk)正在组建人工智能初创公司,为了与ChatGPT的研发公司OpenAI展开竞争。


作为中美互联网圈,最受瞩目的“网红创始人”。马斯克都来了,雷军还会远吗?


巧合地是,两人都是在4月14日,针对大模型,显露出自己的布局。


事实上,小米入局大模型领域可谓“水到渠成”。


从内部人才储备来看,小米目前已拥有超过1200人的AI团队。如今,雷军也终于为大模型团队选定了栾剑为“舵手”。


来源:小米官网


从服务能力协同来看,雷军手中亦有金山云这张底牌。金山云是金山软件的附属公司,在公司掌舵人雷军超前布局下,是与阿里巴巴最早在中国全力进军云计算的企业。


ChatGPT热潮带来的AI竞争,最直接的受益者正是云计算平台。


一方面,生成式AI应用背后的大模型需要更强的算力。OpenAI此前公布过一组数据,目前大模型训练所需算力的增速保持在3-4个月/倍速度增长,远超摩尔定律18-24个月/倍。


另一方面,区别于传统云计算平台提供的算力、存储等资源,拥有大模型的云厂商未来可以提供基于大模型开发应用。李彦宏不久前在接受采访时就抛出过类似的观点,未来企业在购买云计算的时候不看底层算力,而是看大模型的优劣。


就在上周,阿里和腾讯先后官宣“大动作”。


在4月11日举办的阿里云峰会上,张勇表示,智能化时代带来算力的爆发,同时也提出了更高的要求,阿里云将为AI时代提供好算力基础和大模型能力,全面服务智能化进程。为此,阿里云要做好核心两件事:第一,让算力更普惠,推动自研技术和规模化经营的正循环,持续释放技术红利;第二,让AI更普及,让每家企业的产品都能接入大模型升级改造,并有能力打造自己的专属大模型。


随后在4月14日,腾讯面向大模型训练,发布“超强算力集群”,要助力企业云上训练AI大模型,解决中小企业和创业公司的算力压力。


金山云方面虽然并未像阿里腾讯那样“声势浩大”,但也已有相关动作。


天眼查App显示,近日,北京金山办公软件股份有限公司申请注册多个“chat 会议”“chat 演示”“chat 表单”“chat Office”“chat everything”等商标,国际分类为网站服务,当前商标状态均为申请中。


来源:天眼查


内有千人AI团队并由栾剑掌舵,外有金山云护驾,小米大模型已顺利起航。


小爱同学距ChatGPT,还差一个文心一言


早在今年2月的小米投资者日上,对于小米在ChatGPT上的布局,小米手机部总裁曾学忠就表示,ChatGPT基于AI大模型、千亿级参数量、数据量、还有人工标注支撑,AI大模型方面小米一直都有投入。手机和汽车业务有很多AI大模型落地的场景。


随后,在今年3月的2022年财报电话会议上,小米集团总裁卢伟冰谈到ChatGPT相关问题时表示,小米很早就在AI大模型方面进行了许多部署,同时采用了多技术路线并行的策略,小爱同学就是小米大模型落地的代表。


据卢伟冰介绍,小爱同学已经做了6年,在与用户的交互体验中积累了长期可复用的经验,同时,小米有丰富的场景落地经验,小爱同学支持手机、音箱、车等多场景的智能融合。未来小米将继续大模型研究,引入更加先进的大模型能力,包括探索多模态能力、智能座舱交互体验提升等。


不难发现,小爱同学或许是小米在大模型领域,最直观最先落地的产品。


来源:小米官网


然而,需要注意的是,小爱同学的产品能力,与基于GPT-3.5训练而来的ChatGPT仍有不小差距。何况,OpenAI也已发布了更为先进的GPT-4大模型,就连GPT-5也已身处“传说”中。


此前,微软CEO萨蒂亚·纳德拉最近在接受英国《金融时报》采访时表示,苹果的Siri、亚马逊的Alexa,微软自家的Cortana(中文名:小娜)以及公认拔尖的Google Assistant,这些语音助手有一个算一个:都笨得跟石头一样。


随后,微软在2021年就正式宣布停止支持iOS和Android上的Cortana应用,仅保留对Windows平台的支持。


直到OpenAI带来了ChatGPT,微软直接“满血复活”,战斗力爆表。


Siri联合创始人Adam Cheyer也在近期表示,ChatGPT理解复杂信息的能力让现有的语音助手看起来很蠢。


那么,“小爱同学+ChatGPT”,究竟会怎样?


在全球最大的代码托管平台Github上,有开发者尝试将ChatGPT接入小爱同学,Star数已经达到了1.3k。据项目介绍,只要有ChatGPT的账号、小爱音箱、正常连接ChatGPT的网络以及python 3.8+,人人都可以在小爱音箱上使用“ChatGPT版小爱同学”。


具体原理为,唤起小爱同学后,以“帮我”开头询问的问题会自动以文本形式发送一份给ChatGPT,同时会屏蔽小爱同学原本的回答,替换成“正在问GPT,请耐心等待”,而ChatGPT生成的文本则会被小爱同学通过TTS(语音合成技术)进行语音回答。


从开发者的演示显示,整个过程足够流畅,实际回答也远超小爱同学原本的“智力”。


然而,小米官方显然不能直接与OpenAI合作,推出“ChatGPT版小爱同学”。


作为对比,早在今年2月,百度旗下人工智能助手“小度”就宣布,小度将融合“文心一言”的全面能力,打造针对智能设备场景的人工智能模型“小度灵机”,并应用到小度全系产品。


随后在3月份的文心一言发布会上,百度创始人李彦宏曾表示,文心一言差不多是今年1月份ChatGPT的水平,但差距不大,可能只是一两个月的时间。


由此可见,小爱同学距离ChatGPT,至少还差一个文心一言,然后再加“一两个月的时间”。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AI大模型闪聊会:中美顶流AI大模型的碰撞与契机完成Pre-A+轮融资,语言大模型企业「澜舟科技」推出孟子MChat可控大模型|36氪首发原达摩院大模型 M6 带头人杨红霞加入字节,语言生成大模型再迎新玩家对话李志飞:大模型的关键在于如何把大模型用起来|年度AI对话可复现、自动化、低成本、高评估水平,首个自动化评估大模型的大模型PandaLM来了又一AI大神杀入大模型领域!亚马逊首席科学家李沐被曝离职,与导师搭档创业ChatGPT 带火大模型!深度解读人工智能大模型在产业中的服务新态势三行代码调用PandaLM大模型自动实现保护隐私、可靠、可复现的大模型评估海底捞禁止自带菜;字节加入大模型之战;周鸿祎:ChatGPT可能两三年内就会威胁到人类;梁万年:本轮疫情已经基本结束丨邦早报Alex Smola 与李沐师徒官宣创业:舍亚马逊,入大模型To B大模型,一场重塑企业软件的大模型革命抖音加入大模型之战!网信办公布《生成式人工智能服务管理办法》;张勇:阿里所有产品将接入大模型;京东零售开启组织变革 | 极客早知道只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型永动机存在的意义,局限,及禁忌之荒唐俄州列车出轨事件圈内人二月记美团“杀入”大模型;叮咚买菜回应撤出川渝;京东618开启;呷哺集团推付费会员模式;美团香港外卖平台上线;泰禾或终止上市|联商头条长篇小说土楼情人故事介绍索引8大道华社如临大敌 偷渡大军杀到BK!恐怖分子混入移民堆!偷渡客路已被封死!又一 AI 大神杀入大模型领域!亚马逊首席科学家李沐被曝离职,与导师搭档创业美团「杀入」大模型:已秘密研发数月,王兴很关注谷歌将推新版大模型;抖音发布AIGC平台规范;宇视推出行业大模型 | AIGC日报前京东高管杀入大模型领域,狂揽数亿元天使投资GPT5短期不会问世 马斯克已悄然注册AI公司加入大模型之战智源发布FlagOpen大模型技术开源体系,要做大模型时代的“新Linux”OpenAI 重金悬赏找漏洞/iPhone 15全系屏幕或采用M12材料/阿里全系产品将接入大模型张朝阳:谨慎对待新技术 投入大模型研发应基于业务理智选择阿里CEO下令所有产品接入大模型!钉钉对标微软Office,已解锁近10项新功能阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl中国大模型时代新Linux初显!FlagOpen大模型技术开源体系发布阿里所有产品将接入大模型,全聚德连亏三年上热搜 | 财经日日评闲话人生(232)“漏划的地主”是地主吗?不测不知道,一测吓一跳,早报 | adidas大中华区去年收入大跌36%;Prada去年收入大涨近25%;LV客服回应消费者网购手袋两年没发货事件残酷! 3万俄军杀红眼! 战线形势紧迫,乌军陷两难! 泽伦斯基警告…
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。