Redian新闻
>
两个多月后,360那个刚出生的孩子「长大了」

两个多月后,360那个刚出生的孩子「长大了」

科技


在做数据积累,用户反馈时,也不能忘了安全。”                            
作者 | 何思思
编辑 | 林觉民
           

周鸿祎:你为什么不废掉刘婵取而代之呢?刘备不也同意你这么做吗?

360 AI数字人:夫天下之事非一人之所能独为。虽君父有命,亮亦不忍背之。况刘氏托名汉室,实为一邦之主。亮岂敢以私怨而王大义哉...
在前段时间刚结束的认知型通用大模型360智脑发布会上,360集团创始人周鸿祎与360 AI数字人角色进行多轮对话后,现场响起了一阵又一阵的掌声。
时隔两个多月的时间,周鸿祎携4.0版本的360智脑大模型亮相,同时还发布了核心创新产品——AI数字人。
雷峰网了解到,360 AI数字人目前拥有200多个角色,分为数字名人和数字员工两类。其中数字名人包括历史人物、偶像明星等,具有较强的可玩性。数字员工强调的则是高可用性,致力于解决企业的实际问题,可成为企业员工的知识助手和办公助手。
与传统数字人相比,360 AI数字人最大的特点在于有灵魂、有记忆、有人设,能够复刻人类的思维方式和经历。周鸿祎表示,数字人是未来大模型最重要应用入口,360将依托360智脑大模型能力,重新定义“数字人”。
可以说360 AI数字人是周鸿祎对AI认知的具象表现。在他看来,AI应该以人为本,无论做多么强大的AI,都是在为人类做有史以来最好的工具。

01

百模大战、千模大战,比拼的是多模态的能力

目前国内大模型呈遍地开花之势,几乎到了每个人都可以做出一个大模型的阶段。
周鸿祎认为,一个完整的AI大模型一定要具备多模态能力,包括文字处理、图像处理、语音处理、视频处理四大能力。同时他形象的比喻道,AI大模型是一个从只有眼睛,到有耳朵、鼻子、嘴巴的蜕变过程。
这从360 AI大模型的发展路径中也可以看出来,3月29日360推出大模型1.0,当时只能和搜索结合,还不支持多轮对话;4月26日2.0版本上线,具备了多轮对话的能力;5月18日发布多模态文生图的应用“360鸿图”,同时迭代到了2.5版本;5月31日发布智脑视觉大模型,并迭代到了3.0版本。
而近日发布的360智脑大模型不仅升级到了4.0版本,还加入了多模态的能力。
缘何这么做?
周鸿祎告诉雷峰网,GPT1和GPT2都是以文字处理为主,GPT3扩大了参数量,GPT4展露了一小部分多模态的能力,但之后再也没有新的成果发布。所以我预测,GPT5一定会全面支持多模态。
反观国内自研的大模型基本能力已经成熟,甚至很多方面都赶超了GPT3.5。所以下一步的重点不是文字能力的较量,而是多模态能力的比拼。
对此,周鸿祎还进一步解释道,大模型训练到一定水平后,人类的知识会愈发不够用。以GPT4为例,其学习的Token数目接近4千万种图书,而人类有史以来的图书不足1亿本,所以当大模型具备了多模态能力后,它获得知识的途径不再局限于文字,也可以是图片,亦或视频。
这也是周鸿祎把多模态融入到360智脑大模型的重要原因,目前也成了其最重要的组成部分。
雷峰网了解到,360智脑大模型已经具备了生成与创作、多轮对话、书写代码、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、多语言翻译等十大能力,200多种细分的子能力。
“2015年360就成立了AI研究院,2018年开始多模态的探索。我们未来会发布插件平台,我们要让大模型不仅仅停留在大脑层次,多模态可以给它增加眼睛、耳朵、鼻子、嘴巴,插件可以让它有手和脚的能力,这样大模型的能力才能发挥出来,”周鸿祎补充道。

02

构建大模型的关键:数据、用户反馈、安全

多模态可以说是进阶版的大模型,但就目前国内大模型发展来看,很多企业仍处于起步阶段,讨论的更多的还是如何做大模型?门槛高不高等问题。

对此业界可谓众说纷纭,一部分人更是极端地把大模型描绘成了“曼哈顿计划”,像原子弹一样高精尖的技术。
但周鸿祎却持否定态度,他表示,做大模型一是找一个类似Transformer架构的基础模型,二是给大模型灌知识,即无监督学习或者预训练的知识,三是刷题训练,即有监督的微调。此外,还需要在用户场景中不断反馈优化。过程中,用什么样的数据做预训练,用什么样的题海战术做有监督的微调,以及用户的使用反馈都对大模型的持续训练起着至关重要的作用。
360在这方面就显得轻松地多。
首先360以搜索业务起家,这意味着其在自然语言理解方面有丰富的技术积累。雷峰网了解到,360每天在全球会抓取1.4亿的网站数据,2.8亿的专业文献,1.2亿的行业数据。其中,包括数十种语言、图片、视频等多种形式的基础材料。
其次,360还具备清洗能力,对全网数据清洗后,仍会留下10T级优质的规模数据,更重要的是这个过程还会产生高质量的问题,比如用户每天在搜索引擎里有1亿次的使用,用户搜索的这些问题就是高质量的问题,这就会更加了解用户在想什么,从而有的放矢地做知识的标注。
“搜索能力对大模型不仅会影响数据积累,也会影响结果的真实性。”
对此,周鸿祎解释道,大模型最大的短板是数据更新不及时,甚至有时候会产生幻觉。而搜索恰恰可以补足,我们可以通过搜索最新的内容,让GPT随时训练到最新的事实内容,同时把结果通过搜索做内容的校正,这个能力还在不断研发。
除数据和用户反馈外,360还非常重视安全问题,周鸿祎谈到,大模型如果只一味地讲发展不讲安全,这个大模型肯定是走不远的。
目前360已经启动安全团队专门做人工智能安全方面的研究,具体分为两部分:一是用安全加强大模型的能力;二是用安全使大模型在安全方面更加可控。
所谓道高一尺,魔高一丈,周鸿祎更是形象地把自家的安全手段比喻为:以其人之道反制其人之身,即通过全球的网络攻击大数据,安全行业的智能大脑,帮助企业更好地辨别黑客的攻击,网上隐藏的攻击,从而增强安全防卫能力。
当然,在周鸿祎看来,研发大模型不能把大模型当成一个黑盒子,而是要了解它的来龙去脉、工作原理,才能从根本上解决大模型的安全问题,为此,360首创了大模型安全风险的评估体系“AISE”,为全球大模型提供安全保障。
基于此,360提出了“一体双翼”的发展战略,并重发展和安全,此外,为了切实解决千行百业的实际问题,包括360安全浏览器、360搜索以及安全卫士等在内的产品已经全面接入360智脑大模型。
可以预见的是百模大战、千模大战的战火会愈演愈烈,对于大模型厂商来说,只有不断增强大模型的能力,提供差异化的服务,才能在这场战争中保持优势。
//

近期热门文章

Shopee踩刹车背后:内斗不休、决策滞后、腹背受敌


极兔IPO「生死时速」:资金承压、客户反水、对手围攻


Temu动物凶猛

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
结婚人数再创新低,520那天早已泄露“天机”判了!女子将俩幼女锁房间1个多月不归,致其双双饿死....渔歌子(2):纷点沙滩如散星这3个时间出生的孩子,说明是个“福娃”,看看你家孩子有没有?免中介费和两个月房租|接本科生|近橙线/绿线新建高级公寓studio折后2606+, 1b折后3360+ 2b2b折后4436+两个多月完成全自研:大模型之争,从 GPU 卷到了向量数据库银行行长跑官买官!已被"双开"两个多月,判决结果择期宣布重磅!新西兰移民局独家回应:这些工作经验不算数!新政下审批大提速,一个多月就能拿绿卡!?但有人更难办了...我与【夕阳红】的故事别信偏方!刚出生的宝宝住进ICU,因奶奶给他尝这个...父亲将刚出生的儿子砸在地上,一下,两下,三下|我的骨头会唠嗑32宝宝的智商居然和出生的月份有关?这个月份出生的宝宝更聪明?一个多月收到39张罚单,券商研报怎么了?“太难抢了!排了一个多月都没买到!”3%的大额存单都找不到了?定闹钟拼手速,此地周一“捡漏”!恐怖校园枪击案9死7伤!13岁小孩疯狂开枪!策划了一个多月看美国县级初中数学竞赛被阿里裁员,失业2个多月了,还没找到工作,心态崩了!美国出生公民权的由来!川普当选总统就废「出生公民权」:能想像非法移民生的孩子变公民吗?华裔黄金德胜诉 百年判例影响深远20号,龚俊颇特直播Cut+总结【奇闻】英国夫妇在法国山区的谷仓里迎接新出生的孩子女挺5个多月孕肚爬楼梯,Apple Watch突然传"这警讯"意外救命殖人说加拿大山火2小时能灭?已经烧了一个多月了!广末凉子的出轨风波,已经过去一个多月辞职一个多月就生病,我真后悔......房车水电用起来方便么?我已经一个多月没给房车充电了川普当选总统就废「出生公民权」:能想像非法移民生的孩子变公民吗?“非美国公民出生的孩子,禁予美国籍”!众议院新法案,打击生育黑市!安省新移民因为缺了一份文件被拒绝入境!被迫与10岁女儿分离3个多月美籍公民为海外出生的孩子申请CRBA,是否有时间限制?紧急通知:出生证是2019-2023年出生的孩子要注意了,家长再忙也要看一下!墨尔本华人爸爸悲痛求助!救救我太太,帮帮我刚出生的儿子吧!上海宝马闯祸了“天才翻译家”签下遗体捐赠书!四个多月前曾为父亲签字……失联一个多月后,年薪超200万券商总裁辞职,曾任朱从玖秘书川普当选总统就废「出生公民权」:能想像非法移民生的孩子变公民吗
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。