Redian新闻
>
夸克发布自研大模型,加速探索革新性搜索产品

夸克发布自研大模型,加速探索革新性搜索产品

公众号新闻

数据的“质”正在悄然平衡着AI对于数据量的过度崇拜。


11月16日,阿里巴巴集团发布2024财年第二季度业绩公告。阿里巴巴集团CEO吴泳铭表示,阿里巴巴将保持创业心态,重点强调“用户为先、AI驱动”的战略重心。
随着Open AI发布GPTs,大模型的“场景争夺战”进入白热化阶段。中文大模型方面,无论是互联网公司还是硬件厂商纷纷下场。阿里作为布局较早的国内厂商之一,明确要抓住AI科技变革带来的全新机会,以创造更多客户价值。

在本次财报中,作为近几年持续增长的潜力选手,夸克符合各项遴选标准,入选第一批战略级创新业务,并与“AI驱动”战略紧密相连。近日,夸克正式发布了基于Transformer架构的多模态自研大模型,参数达到千亿级,一经发布就占据了C-Eval与CMMLU两大权威榜单的榜首,并在社会科学等多个知识领域排名第一。这无疑是为阿里的AI战略及其在2024财年的增长信心,再添上了一道炬火。

从技术底座到用户驱动,中文大模型来到“深水区”
夸克大模型的能力与基因优势主要来自于三个方面。
首先,以搜索场景作为主体,通过信息检索、数字资产、存储等服务立足于“准国民级应用”之列,夸克在过去三年中呈现出了持续向上的市场表现。尤其是在当下AI的主要受众与消费者——年轻人群体中,从口碑到用户粘性都位于市场前列。可以说,大模型浪潮如今在中国最重要的推动群体,正是夸克的核心优势区。
根据QuestMobile发布的《2023年轻人群智能效率应用研究》报告显示,夸克App在泛学生人群和新生代职场人群的用户占比最高,年轻用户使用时长位列行业第一。
另一方面,当下资本与开发者对于生成式AI的共识是:它正在经历一个从技术驱动向用户群体驱动转变的过程。这也就代表着,数据的“质”正在悄然平衡着AI对于数据量的过度崇拜。
一是优质的用户群与数据,二则是延展性足够强的场景。未来,夸克大模型将主要应用于通用搜索、医疗健康、教育、办公等效率场景,这些场景的用户行为数据也与搜索请求密切相关。在年轻人用户群密度足够大的情况下,夸克大模型的应用层再造也呈现出了知识信息更加专业、有效的差异化优势。
其次,依靠夸克自身的产品创新与技术能力,夸克在“AI时代”快速跨越了新生代阶段,其产品爆发期与大模型爆发期几乎无缝衔接,因此,业务升级与重构的难度相对也会低很多。

第三,夸克大模型之所以没有在大模型尝鲜期急于追逐风口,是因为夸克作为一个高度产品化的业务,需要为用户解决更加实际、具体、高频的问题。出于增强效率体验而非接入AI原生化的目的,夸克在这一技术相对成熟的阶段推出大模型,避免了前期的舆论质疑与用户流失,入局时间更加合适。

阿里AI战略下的信息服务“创新者”
相对独立开发商,大厂自研大模型的研发与训练具有低成本、高处理量、长期投入、数据量可持续的特点,场景定位与用户群体也更加精准。
而从整个生成式AI的发展路径来看,搜索引擎作为实现AI“入口业务价值”的直接解决方案,自必应与OpenAI深度绑定以来,就成为了大厂的“必争之地”。聚焦到阿里的主要业务阵地,电商和信息效率无疑是其中最重要的两个入口级业务线。之于后者,不难得出结论,本身就拥有效率产品矩阵及爆品的夸克,最适合在未来大模型插件化的趋势下,成为阿里针对C端用户的王牌“效率”战舰。
为了实现全栈自研的技术路线,夸克搭建了数百人规模的独立产研团队,每天会对亿级的图文数据进行训练和精调,这也使得它在大模型权威评测榜单CMMLU和C-Eval中分别获得第一名的好成绩。
C-Eval是由清华大学、上海交通大学、爱丁堡大学合作构建的综合性考试评测集,覆盖52个学科;CMMLU是由MBZUAI、上海交通大学、微软亚洲研究院推出的专门用于评估语言模型在中文语境下综合能力的榜单。评测数据显示,中文语境下,夸克大模型的整体水平已经超过了GPT-3.5,在写作、考试等部分场景也已经超过了GPT-4的表现。从技术来看,夸克大模型在数据增强、模型选择、训练策略、模型融合以及模型评估上,都表现不俗。
比起传统的知识数据库,大模型的价值在于以可交互的方式为人类整合与判断信息的千变万化。因此,从C-Eval、CMMLU等权威榜单的评判维度也可以得见,目前无论是对于GPT还是正在“圈地”的中文大模型,垂类知识处理能力和专业级语言创作能力已经变得越来越重要。

比如,在中文写作上,夸克拥有广泛的知识覆盖、上下文理解、创造性表达能力,能够基于各类文本类型进行时效性创作。
另一方面,AI能够模拟的不仅是人类的学习能力,还有人类期许的高阶推理、专业辨伪、提效的自我驱动力。这也是夸克大模型在信息服务领域中,最擅长且正在逐步融入产品中的领域之一。今年以来,大模型已经陆续升级夸克的智能工具产品,夸克扫描王在复杂场景下扫描的更清晰、夸克网盘的自然语言搜索功能进一步提升了找资产的效率,都很好地印证了这一点。
尽管GPT已经火了近一年,不少厂商的大模型却仍然没有广泛地应用于各行各业的降本增效,而是走向了下游开发者和封闭生态。
可以看出,自建生态对于AI的意义,连OpenAI都“真香”了。而如今中文大模型竞争的残酷,本身不在于层出不穷的同质化体验,而是关于时间差的无效内卷。厂商一边野蛮入场,另一边却因为把饼画得太大,反而消磨了大众的想象力。
只有清醒地看到自身的能力边界,才能更好地利用AI去扩张生态价值。
中文世界,需要的不再是像十年前一样追赶时间差,而是进击关键而精准的多模态效率,不让用户的预期落空。
阿里新CEO上任后,明确提出了对符合用户需求和AI驱动变革趋势的业务,将作为第一优先级重点投入;对于面向未来的革新型产品,将秉持长期主义坚决投资,为阿里培育面向未来的新业务与新动能。
普通用户的生活,也就代表着对于人工智能更高的信赖和更低的容错空间。正是因为普通人没有那么高的专业判断能力,作为国民级应用厂商,才更需要兼顾前沿技术的体验性与信息传达的简便性,让知识的门槛逐步降低。
作为从“小而美”迈向“准国民应用”的信息服务市场增量新星,夸克或许会在阿里百花齐放的大模型时代下,承担起用户体验层面的重担。

独家、深度、前瞻,为1%的人捕捉商业先机

36氪旗下精选公众号

👇 真诚推荐你来关注 👇

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
vivo将发布自研AI大模型矩阵,C-Eval、CMMLU双榜排名第一;百度上线“千帆AI原生应用商店”丨AIGC日报三大新搜索革命:抖音、微信、小红书!微软深夜放大招:GPT-4 、DALL·E 3、GPTs免费用,自研大模型专用AI芯片vivo发布自研BlueOS;iPhone销量霸榜,小米14卖得还不错;比亚迪宋L发布专访vivo副总裁周围:从自研大模型迈向“智能体”手机闲闲而记探寻互联网发展:如何利用“大模型 + 大数据”加速产业革新? | 华为云联创营 MVP 专访OpenAI回应ChatGPT服务故障;新研究以99%准确率识别ChatGPT生成化学论文;三星发布自研大模型丨AIGC日报无题大模型时代,探迹要给每位销售配上AI助理|100个革新产品(3/100)当着黄仁勋的面,微软一口气发布两款自研芯片,英伟达止步十连涨;滴滴杀入大模型,聚焦ToB商旅;零一万物回应架构争议丨AI周报【文学城漫画】亚裔家长何以解忧?微软推出首款自研大模型AI芯片;英伟达合作微软推出AI代工服务;WPS AI开启公测丨AIGC日报北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型新 iPad 或今明发布 / 报告称华为手机在中国销量已超苹果 / vivo将发布自研AI大模型矩阵我的童年(二)vivo发布蓝心大模型,手机端运行且开源,自研系统亮相手机能跑百亿参数大模型,骁龙8Gen3来了,自研PC架构上线Apple Watch S10将拥有血压检测功能/vivo发布自研AI蓝心大模型/问界累计大定超过 8 万台真场景炼大模型,夸克借 AI 再次「提速」每周硅闻 | 突发!微软发布自研AI芯片;苹果安卓计划互通;亚马逊又裁员!阿里夸克蒋冠军:大模型应用要解决知识正确性问题微软推出首款自研大模型AI芯片!台积电5nm、1050亿颗晶体管,OpenAI率先试用阅文集团进军短剧,重金征剧本;理想汽车10月销量首次突破4万辆;vivo发布自研蓝河操作系统BlueOS……阿里巴巴智能信息事业群发布夸克大模型;李开复AI公司回应“抄袭”;贾乃亮双11总销售额超13.6亿……李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大解题准确率较GPT高出70% 夸克大模型多项考试评测成绩领先行《本日公休》影后陸小芬寶刀未老美图秀秀上车最新自研大模型,各类AIGC玩法可直接体验VS Code史上呼声最高的特性终于实现;vivo发布自研操作系统蓝河 (BlueOS) | 周热点中方将出席英国AI安全峰会;文心一言推出会员模式;vivo发布自研蓝心大模型丨AIGC大事日报科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新微软发布自研芯片,英伟达黄仁勋为何站台?手机大模型爆发:vivo 发布自研蓝心大模型,参数追赶 GPT-3
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。