Redian新闻
>
两个周鸿祎继续厮杀「百模大战」,红衣教主:国内LLM弯道超车还得是多模态

两个周鸿祎继续厮杀「百模大战」,红衣教主:国内LLM弯道超车还得是多模态

科技
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

周鸿祎,给所有不想自己上班的家人们谋福利了!

360智脑大模型应用发布会现场,他让自己的数字分身周鸿祎扛大旗,“今天我们不设媒体专访了,有什么问题问他”。

虽然谨慎起见,事先声明过“说对了算我的,说错了算他的”,但数字人周鸿祎的表现……好像还不错?

面对“你对360发展人工智能有信心吗?”这个问题,红色polo衫数字人周鸿祎的回答,从投入、安全领域应用经验、数据来源、可解释性和安全性等方面聊了一圈,最后表示:

充满信心,并会继续努力推动。

听了答案,真人周鸿祎乐呵呵,直言“回答得比我好”。

接下来的几个问题,数字人周鸿祎也对答如流,被周鸿祎称为“滴水水不漏,面面俱到”。

老周本人为360 AI数字人展台,不全是出于为产品站台。更重要的是,他吃到了自家数字人的第一枚甜枣:

不久前,嗓子哑掉的周鸿祎,训练了数字人,代替自己参加活动进行演讲,观众反馈不错,还称数字老周“比本人温柔”。

这虽然让他巨有危机感,但能有个AI分身帮自己干活,可太爽了。

数字人周鸿祎发布即上任

360智脑大模型应用发布会将360智脑迭代到4.0版本,统共有三个关键词:多模态全端应用数字人

互动性最强、现场反响最热烈的,就是360智脑AI数字人

这也是360在大模型上的核心创新点。

关于打造360 AI数字人的初衷,周鸿祎现场给出了解释。

一方面,周鸿祎称自己是坚信,AI发展下,在将来,浏览器、搜索、桌面都未必是普通个人和中小企业进入AI大模型最合适的入口。

他强调,大模型一定要场景化、产品化、平民化、垂直化。

比如现在与大模型对话十分重要的提示词工程(prompt engineering),对大多数普通人来说并不友好,熟练掌握也需要漫长的过程。

“让所有中小企业的老板都变成提示词专家,写出非常漂亮的提示词,我觉得是不现实的。”但是AI不断进化,应该成为人类的助手和朋友

由此在360看来,未来进入AI大模型最合适的入口,最有可能是数字人

以此为基础,360希望在GPT大脑的基础上,把多模态能力——周鸿祎称发展多模态能力,是中国自研大模型弯道超车的关键——融合在一起,包装成一个有自己思想、目标,有“灵魂”的数字人概念。

为了让人直观感受,现场推出360数字人广场平台,一口气发布了200多个数字人。

分为两大类,一类是数字名人,一类是数字员工。

数字名人偏向to C,包含明星偶像、历史先贤、文学IP,比如诸葛亮、林黛玉、孙悟空,还有马斯克……

没有事先录制视频,周鸿祎选择在现场向数字名人诸葛亮语音提问。

赤壁之战的时候,如果有iPhone,你会怎么使用?

最初,数字人给出的答案有些讨巧,周鸿祎现场让他再回答了一次这个脑洞大开的问题,于是得到这样的答案:

夫兵者,国之大事,死生之地,存亡之理,不可不察。

若有iPhone,吾必善加利用。

或可借其先进的通讯技术,迅速联络各方力量,调整战术策略,提高作战力量;亦可利用其强大的计算能力,准确预测战场变化,及时调整兵力部署。

……

此后的其他对话,以及和孙悟空的交谈,都比较符合角色的性格及身份。

另一类数字员工(专家、助手)偏向to B,是360针对企业和办公一族打造。

最勾得人心痒痒的,还是每个人能够定制自己的数字人,就像周鸿祎那样。

问,周鸿祎创建一个周鸿祎,一共需要几步?

答案是3步(倒也符合360对大模型持有的平民、易用理念)

第一步,在360智脑平台上选择添加数字人;

第二步,添加角色信息,上传图像,添加角色描述;

第三步,导入资料,上传定制数字人的知识库,比如周鸿祎就上传了他的讲话稿、个人资料。

最后一步也直接展示了360称自家AI数字人“有灵魂”的原因,大多数数字人吸引人的点,多在外形姣好、逼真,以及贴合说话内容的口音和动作神态态。

到了360这里,最基本的,周鸿祎定义其“一定不是一个简单的对口型的虚拟形象,也不是一个念稿的机器”。

360的每个AI数字人,都有自己不同的人设,最后有自己的记忆、目标,并且能够自主学习、链接外围系统。

未来的研究方向,360希望自家的数字人能够跟人类对话、交流,进行讨论,提供帮助。

而做到这一切,需要其背后的360智脑提供多模态能力支撑,现已迭代到4.0版本。

大模型的仗,360怎么打?

从3月底官宣,加入全球“百模大战”,360千亿参数大语言模型360智脑如今是打了2个多月仗的“老兵”。

彼时周鸿祎口中爆出来给大家看看的“刚出生的孩子”,已经陆续有了看得见的成果——

在普通人间广为流传的,当属360智脑大模型押中今年全国甲卷和新课标II卷的两道作文题目,一度冲上新闻热榜。

从专业测评角度,360智脑是国内首个通过信通院AIGC大语言模型功能评测的大模型,研发团队还参与了大模型国家标准的编写,算是“国家队”的一员。

同时,在中文模型评测基准SuperCLUE 5月底更新的榜单中,新增360智脑大模型,在总榜单、基础能力榜单、中文特性榜单上都处于大模型第一梯队

SuperCLUE总榜单(5月23日更新)

而如果依照应用功能来,2个多月的时间里,360智脑相继发布了文生图、图生图、图生文功能。

发布会现场,又首发文生视频功能,各生成了4段奔跑的野马、企鹅在沙漠里洗澡、熊猫划船等短视频。

诸多多模态能力的展现,为360 AI数字人能够复刻思维方式和人生经历,成为AI分身提供技术底气。

如果将大模型视作新时代的发电厂,而非娱乐工具或消磨时间的软件,360智脑目前体现出的能力,似乎已经可以点亮小簇跳动的灯火,一定程度上提高个人和组织的工作效率了。

进步如斯,原因何为?

周鸿祎回顾2018年起,360对谷歌所发布BERT的跟踪和研究,到2023年积攒下了多个方面的经验,全部迁移到对大模型的研发上:

  • 自然语言处理基因技术(搜索底色)

  • 大规模/多样性/高质量数据优势(搜集和清洗数据是360的强项)

  • 补足大模型短板的搜索增强优势(通过实时搜索对大模型幻觉进行矫正)

  • 15亿全球用户和大流量训练出的工程调度能力(分布在能力层、平台层和框架层)

  • 国民级互联网应用场景优势(和微软AI全家桶一般,让大模型能力接入全端产品)

  • 数据安全+AI安全能力沉淀的大模型安全优势(360内部已成立专门的AI安全团队)

  • A股市场前列的算力资源(卡数多,有knowhow)

在此过程中,周鸿祎还分享了一个训练千亿级大模型的方法。

即把部分训练方法先在百亿模型上求证,快速验证后再在千亿模型上进行实践,如此能够明显提高训练速度。

关于如何继续提升大模型的能力,360会继续走“两翼齐飞+四路场景”战术,一如老周继续秉持“不发展GPT才是最大的不安全”——

回看国内卷起“百模”厮杀后,至今,大模型已经遍地开花,无论是通用还是垂域模型,种类和数量都日渐丰富。

具体落到360智脑身上,周鸿祎表示AI的进化要以人为本

既要“争先”,发展多模态的全面能力,铸造360迈向AGI的新的一级台阶,为360 AI数字人筑牢地基;

也要“求长”,推出结合场景的应用,如未来发展方向是生成声音、视频并拥有长期记忆的AI数字人,让它们拥有“手和脚”,具备执行力,更好提供服务,也成为360智脑对外亮剑的利刃。

发布会最后,红衣教主还留下了一个one more thing彩蛋——

数字人群聊,将是360智脑下一次版本更新的发布目标,把给出的林黛玉&诸葛亮&周鸿祎&孙悟空群聊demo,从视频变成实际功能。

这个功能让人想起前段时间斯坦福和Google的合作论文,研究者们让25个AI智能体在一个虚拟小镇上生存,活脱脱就是AI时代的《西部世界》。

如果红衣教主真能兑现承诺,也许普通人可以直接参与和观察的AI《西部世界》,就由360智脑搬来第一块砖也说不定哈~

— 联系作者 —

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
蚂蚁集团透露大模型研发进展 AI “百模大战”再添重磅选手华泰证券宏观研究:中国出口竞争力不降反升,新兴行业弯道超车大模型“选拔组队”后,百模大战的下一站将在哪里?李彦宏豪掷10亿寻找下一独角兽,“百模大战”进入应用创新时代少量!北美Management Consulting实习直推来袭,带你弯道超车火星乐园第三部《灰界》第六章 末日精英健行告春鸟、春告鸟湖仓一体:国产基础软件的创新突破与弯道超车系统设计,最容易弯道超车的一轮面试!遇罗克,中华的马丁.路德. 金ChatGPT访问骤降,国产大模型弯道超车机会来了?2万星GitHub项目亮剑,国内产品7月上线百模大战拉开序幕,企业该怎么选大模型?|甲子光年弯道超车!墨尔本超越悉尼,提前成为澳洲第一大城市!这一刻,墨尔本人等待了百年时间!百模大战可休矣!李彦宏内部讲话点破AI竞赛关键2023厨电行业增长狂飙,森歌“弯道超车”多模态大语言模型综述来啦!一文带你理清多模态关键技术达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力硅基智能司马华鹏:“百模大战”不争才是大争,不追风口我们造风口|甲子光年两年两获亿元级融资,押注非LNP递送技术的慧疗生物能否弯道超车?行业观察 | 百模大战当前,企业如何选择更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」《乘梦去飞》&《江南柳》大模型内卷:2天发了10余款,百模大战开打了从零训练一个多模态LLM:预训练+指令微调+对齐+融合多模态+链接外部系统行业观察 | 华泰证券宏观研究:中国出口竞争力不降反升 新兴行业弯道超车中国Adobe迎战“百模大战”为多模态LLM指明方向,邱锡鹏团队提出具有内生跨模态能力的SpeechGPT弯道超车的中国新能源,要被人直线超车了?“百模大战”背后,是昇思用三年打造了一个AI大模型“创造营”智源Emu开源!超越DeepMind,刷新8项SOTA,首个「多模态-to-多模态」全能高手“百模大战”,掀动资本波澜中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作百模大战之下,阿里云最在意的还是生态百度副总裁吴甜:“百模大战”终局会集中在少数几个大模型上
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。