Redian新闻
>
两个多月后,360那个刚出生的孩子「长大了」

两个多月后,360那个刚出生的孩子「长大了」

科技


在做数据积累,用户反馈时,也不能忘了安全。”                            
作者 | 何思思
编辑 | 林觉民
           

周鸿祎:你为什么不废掉刘婵取而代之呢?刘备不也同意你这么做吗?

360 AI数字人:夫天下之事非一人之所能独为。虽君父有命,亮亦不忍背之。况刘氏托名汉室,实为一邦之主。亮岂敢以私怨而王大义哉...
在前段时间刚结束的认知型通用大模型360智脑发布会上,360集团创始人周鸿祎与360 AI数字人角色进行多轮对话后,现场响起了一阵又一阵的掌声。
时隔两个多月的时间,周鸿祎携4.0版本的360智脑大模型亮相,同时还发布了核心创新产品——AI数字人。
雷峰网了解到,360 AI数字人目前拥有200多个角色,分为数字名人和数字员工两类。其中数字名人包括历史人物、偶像明星等,具有较强的可玩性。数字员工强调的则是高可用性,致力于解决企业的实际问题,可成为企业员工的知识助手和办公助手。
与传统数字人相比,360 AI数字人最大的特点在于有灵魂、有记忆、有人设,能够复刻人类的思维方式和经历。周鸿祎表示,数字人是未来大模型最重要应用入口,360将依托360智脑大模型能力,重新定义“数字人”。
可以说360 AI数字人是周鸿祎对AI认知的具象表现。在他看来,AI应该以人为本,无论做多么强大的AI,都是在为人类做有史以来最好的工具。

01

百模大战、千模大战,比拼的是多模态的能力

目前国内大模型呈遍地开花之势,几乎到了每个人都可以做出一个大模型的阶段。
周鸿祎认为,一个完整的AI大模型一定要具备多模态能力,包括文字处理、图像处理、语音处理、视频处理四大能力。同时他形象的比喻道,AI大模型是一个从只有眼睛,到有耳朵、鼻子、嘴巴的蜕变过程。
这从360 AI大模型的发展路径中也可以看出来,3月29日360推出大模型1.0,当时只能和搜索结合,还不支持多轮对话;4月26日2.0版本上线,具备了多轮对话的能力;5月18日发布多模态文生图的应用“360鸿图”,同时迭代到了2.5版本;5月31日发布智脑视觉大模型,并迭代到了3.0版本。
而近日发布的360智脑大模型不仅升级到了4.0版本,还加入了多模态的能力。
缘何这么做?
周鸿祎告诉雷峰网,GPT1和GPT2都是以文字处理为主,GPT3扩大了参数量,GPT4展露了一小部分多模态的能力,但之后再也没有新的成果发布。所以我预测,GPT5一定会全面支持多模态。
反观国内自研的大模型基本能力已经成熟,甚至很多方面都赶超了GPT3.5。所以下一步的重点不是文字能力的较量,而是多模态能力的比拼。
对此,周鸿祎还进一步解释道,大模型训练到一定水平后,人类的知识会愈发不够用。以GPT4为例,其学习的Token数目接近4千万种图书,而人类有史以来的图书不足1亿本,所以当大模型具备了多模态能力后,它获得知识的途径不再局限于文字,也可以是图片,亦或视频。
这也是周鸿祎把多模态融入到360智脑大模型的重要原因,目前也成了其最重要的组成部分。
雷峰网了解到,360智脑大模型已经具备了生成与创作、多轮对话、书写代码、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、多语言翻译等十大能力,200多种细分的子能力。
“2015年360就成立了AI研究院,2018年开始多模态的探索。我们未来会发布插件平台,我们要让大模型不仅仅停留在大脑层次,多模态可以给它增加眼睛、耳朵、鼻子、嘴巴,插件可以让它有手和脚的能力,这样大模型的能力才能发挥出来,”周鸿祎补充道。

02

构建大模型的关键:数据、用户反馈、安全

多模态可以说是进阶版的大模型,但就目前国内大模型发展来看,很多企业仍处于起步阶段,讨论的更多的还是如何做大模型?门槛高不高等问题。

对此业界可谓众说纷纭,一部分人更是极端地把大模型描绘成了“曼哈顿计划”,像原子弹一样高精尖的技术。
但周鸿祎却持否定态度,他表示,做大模型一是找一个类似Transformer架构的基础模型,二是给大模型灌知识,即无监督学习或者预训练的知识,三是刷题训练,即有监督的微调。此外,还需要在用户场景中不断反馈优化。过程中,用什么样的数据做预训练,用什么样的题海战术做有监督的微调,以及用户的使用反馈都对大模型的持续训练起着至关重要的作用。
360在这方面就显得轻松地多。
首先360以搜索业务起家,这意味着其在自然语言理解方面有丰富的技术积累。雷峰网了解到,360每天在全球会抓取1.4亿的网站数据,2.8亿的专业文献,1.2亿的行业数据。其中,包括数十种语言、图片、视频等多种形式的基础材料。
其次,360还具备清洗能力,对全网数据清洗后,仍会留下10T级优质的规模数据,更重要的是这个过程还会产生高质量的问题,比如用户每天在搜索引擎里有1亿次的使用,用户搜索的这些问题就是高质量的问题,这就会更加了解用户在想什么,从而有的放矢地做知识的标注。
“搜索能力对大模型不仅会影响数据积累,也会影响结果的真实性。”
对此,周鸿祎解释道,大模型最大的短板是数据更新不及时,甚至有时候会产生幻觉。而搜索恰恰可以补足,我们可以通过搜索最新的内容,让GPT随时训练到最新的事实内容,同时把结果通过搜索做内容的校正,这个能力还在不断研发。
除数据和用户反馈外,360还非常重视安全问题,周鸿祎谈到,大模型如果只一味地讲发展不讲安全,这个大模型肯定是走不远的。
目前360已经启动安全团队专门做人工智能安全方面的研究,具体分为两部分:一是用安全加强大模型的能力;二是用安全使大模型在安全方面更加可控。
所谓道高一尺,魔高一丈,周鸿祎更是形象地把自家的安全手段比喻为:以其人之道反制其人之身,即通过全球的网络攻击大数据,安全行业的智能大脑,帮助企业更好地辨别黑客的攻击,网上隐藏的攻击,从而增强安全防卫能力。
当然,在周鸿祎看来,研发大模型不能把大模型当成一个黑盒子,而是要了解它的来龙去脉、工作原理,才能从根本上解决大模型的安全问题,为此,360首创了大模型安全风险的评估体系“AISE”,为全球大模型提供安全保障。
基于此,360提出了“一体双翼”的发展战略,并重发展和安全,此外,为了切实解决千行百业的实际问题,包括360安全浏览器、360搜索以及安全卫士等在内的产品已经全面接入360智脑大模型。
可以预见的是百模大战、千模大战的战火会愈演愈烈,对于大模型厂商来说,只有不断增强大模型的能力,提供差异化的服务,才能在这场战争中保持优势。
//

近期热门文章

Shopee踩刹车背后:内斗不休、决策滞后、腹背受敌


极兔IPO「生死时速」:资金承压、客户反水、对手围攻


Temu动物凶猛

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
我与【夕阳红】的故事恐怖校园枪击案9死7伤!13岁小孩疯狂开枪!策划了一个多月判了!女子将俩幼女锁房间1个多月不归,致其双双饿死....两个多月完成全自研:大模型之争,从 GPU 卷到了向量数据库美国出生公民权的由来!川普当选总统就废「出生公民权」:能想像非法移民生的孩子变公民吗?华裔黄金德胜诉 百年判例影响深远【奇闻】英国夫妇在法国山区的谷仓里迎接新出生的孩子宝宝的智商居然和出生的月份有关?这个月份出生的宝宝更聪明?一个多月收到39张罚单,券商研报怎么了?上海宝马闯祸了这3个时间出生的孩子,说明是个“福娃”,看看你家孩子有没有?被阿里裁员,失业2个多月了,还没找到工作,心态崩了!“非美国公民出生的孩子,禁予美国籍”!众议院新法案,打击生育黑市!女挺5个多月孕肚爬楼梯,Apple Watch突然传"这警讯"意外救命广末凉子的出轨风波,已经过去一个多月父亲将刚出生的儿子砸在地上,一下,两下,三下|我的骨头会唠嗑32“天才翻译家”签下遗体捐赠书!四个多月前曾为父亲签字……失联一个多月后,年薪超200万券商总裁辞职,曾任朱从玖秘书殖人说加拿大山火2小时能灭?已经烧了一个多月了!美籍公民为海外出生的孩子申请CRBA,是否有时间限制?别信偏方!刚出生的宝宝住进ICU,因奶奶给他尝这个...渔歌子(2):纷点沙滩如散星重磅!新西兰移民局独家回应:这些工作经验不算数!新政下审批大提速,一个多月就能拿绿卡!?但有人更难办了...川普当选总统就废「出生公民权」:能想像非法移民生的孩子变公民吗?20号,龚俊颇特直播Cut+总结墨尔本华人爸爸悲痛求助!救救我太太,帮帮我刚出生的儿子吧!结婚人数再创新低,520那天早已泄露“天机”“太难抢了!排了一个多月都没买到!”3%的大额存单都找不到了?定闹钟拼手速,此地周一“捡漏”!看美国县级初中数学竞赛房车水电用起来方便么?我已经一个多月没给房车充电了服刑多月后川普集团前CFO出狱 曾效忠家族近50年川普当选总统就废「出生公民权」:能想像非法移民生的孩子变公民吗紧急通知:出生证是2019-2023年出生的孩子要注意了,家长再忙也要看一下!安省新移民因为缺了一份文件被拒绝入境!被迫与10岁女儿分离3个多月银行行长跑官买官!已被"双开"两个多月,判决结果择期宣布辞职一个多月就生病,我真后悔......
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。