夸克发布自研大模型，加速探索革新性搜索产品

2023-11-17 10:11

数据的“质”正在悄然平衡着AI对于数据量的过度崇拜。

11月16日，阿里巴巴集团发布2024财年第二季度业绩公告。阿里巴巴集团CEO吴泳铭表示，阿里巴巴将保持创业心态，重点强调“用户为先、AI驱动”的战略重心。

随着Open AI发布GPTs，大模型的“场景争夺战”进入白热化阶段。中文大模型方面，无论是互联网公司还是硬件厂商纷纷下场。阿里作为布局较早的国内厂商之一，明确要抓住AI科技变革带来的全新机会，以创造更多客户价值。

在本次财报中，作为近几年持续增长的潜力选手，夸克符合各项遴选标准，入选第一批战略级创新业务，并与“AI驱动”战略紧密相连。近日，夸克正式发布了基于Transformer架构的多模态自研大模型，参数达到千亿级，一经发布就占据了C-Eval与CMMLU两大权威榜单的榜首，并在社会科学等多个知识领域排名第一。这无疑是为阿里的AI战略及其在2024财年的增长信心，再添上了一道炬火。

从技术底座到用户驱动，中文大模型来到“深水区”

夸克大模型的能力与基因优势主要来自于三个方面。

首先，以搜索场景作为主体，通过信息检索、数字资产、存储等服务立足于“准国民级应用”之列，夸克在过去三年中呈现出了持续向上的市场表现。尤其是在当下AI的主要受众与消费者——年轻人群体中，从口碑到用户粘性都位于市场前列。可以说，大模型浪潮如今在中国最重要的推动群体，正是夸克的核心优势区。

根据QuestMobile发布的《2023年轻人群智能效率应用研究》报告显示，夸克App在泛学生人群和新生代职场人群的用户占比最高，年轻用户使用时长位列行业第一。

另一方面，当下资本与开发者对于生成式AI的共识是：它正在经历一个从技术驱动向用户群体驱动转变的过程。这也就代表着，数据的“质”正在悄然平衡着AI对于数据量的过度崇拜。

一是优质的用户群与数据，二则是延展性足够强的场景。未来，夸克大模型将主要应用于通用搜索、医疗健康、教育、办公等效率场景，这些场景的用户行为数据也与搜索请求密切相关。在年轻人用户群密度足够大的情况下，夸克大模型的应用层再造也呈现出了知识信息更加专业、有效的差异化优势。

其次，依靠夸克自身的产品创新与技术能力，夸克在“AI时代”快速跨越了新生代阶段，其产品爆发期与大模型爆发期几乎无缝衔接，因此，业务升级与重构的难度相对也会低很多。

第三，夸克大模型之所以没有在大模型尝鲜期急于追逐风口，是因为夸克作为一个高度产品化的业务，需要为用户解决更加实际、具体、高频的问题。出于增强效率体验而非接入AI原生化的目的，夸克在这一技术相对成熟的阶段推出大模型，避免了前期的舆论质疑与用户流失，入局时间更加合适。

阿里AI战略下的信息服务“创新者”

相对独立开发商，大厂自研大模型的研发与训练具有低成本、高处理量、长期投入、数据量可持续的特点，场景定位与用户群体也更加精准。

而从整个生成式AI的发展路径来看，搜索引擎作为实现AI“入口业务价值”的直接解决方案，自必应与OpenAI深度绑定以来，就成为了大厂的“必争之地”。聚焦到阿里的主要业务阵地，电商和信息效率无疑是其中最重要的两个入口级业务线。之于后者，不难得出结论，本身就拥有效率产品矩阵及爆品的夸克，最适合在未来大模型插件化的趋势下，成为阿里针对C端用户的王牌“效率”战舰。

为了实现全栈自研的技术路线，夸克搭建了数百人规模的独立产研团队，每天会对亿级的图文数据进行训练和精调，这也使得它在大模型权威评测榜单CMMLU和C-Eval中分别获得第一名的好成绩。

C-Eval是由清华大学、上海交通大学、爱丁堡大学合作构建的综合性考试评测集，覆盖52个学科；CMMLU是由MBZUAI、上海交通大学、微软亚洲研究院推出的专门用于评估语言模型在中文语境下综合能力的榜单。评测数据显示，中文语境下，夸克大模型的整体水平已经超过了GPT-3.5，在写作、考试等部分场景也已经超过了GPT-4的表现。从技术来看，夸克大模型在数据增强、模型选择、训练策略、模型融合以及模型评估上，都表现不俗。

比起传统的知识数据库，大模型的价值在于以可交互的方式为人类整合与判断信息的千变万化。因此，从C-Eval、CMMLU等权威榜单的评判维度也可以得见，目前无论是对于GPT还是正在“圈地”的中文大模型，垂类知识处理能力和专业级语言创作能力已经变得越来越重要。

比如，在中文写作上，夸克拥有广泛的知识覆盖、上下文理解、创造性表达能力，能够基于各类文本类型进行时效性创作。

另一方面，AI能够模拟的不仅是人类的学习能力，还有人类期许的高阶推理、专业辨伪、提效的自我驱动力。这也是夸克大模型在信息服务领域中，最擅长且正在逐步融入产品中的领域之一。今年以来，大模型已经陆续升级夸克的智能工具产品，夸克扫描王在复杂场景下扫描的更清晰、夸克网盘的自然语言搜索功能进一步提升了找资产的效率，都很好地印证了这一点。

尽管GPT已经火了近一年，不少厂商的大模型却仍然没有广泛地应用于各行各业的降本增效，而是走向了下游开发者和封闭生态。

可以看出，自建生态对于AI的意义，连OpenAI都“真香”了。而如今中文大模型竞争的残酷，本身不在于层出不穷的同质化体验，而是关于时间差的无效内卷。厂商一边野蛮入场，另一边却因为把饼画得太大，反而消磨了大众的想象力。

只有清醒地看到自身的能力边界，才能更好地利用AI去扩张生态价值。

中文世界，需要的不再是像十年前一样追赶时间差，而是进击关键而精准的多模态效率，不让用户的预期落空。

阿里新CEO上任后，明确提出了对符合用户需求和AI驱动变革趋势的业务，将作为第一优先级重点投入；对于面向未来的革新型产品，将秉持长期主义坚决投资，为阿里培育面向未来的新业务与新动能。

普通用户的生活，也就代表着对于人工智能更高的信赖和更低的容错空间。正是因为普通人没有那么高的专业判断能力，作为国民级应用厂商，才更需要兼顾前沿技术的体验性与信息传达的简便性，让知识的门槛逐步降低。

作为从“小而美”迈向“准国民应用”的信息服务市场增量新星，夸克或许会在阿里百花齐放的大模型时代下，承担起用户体验层面的重担。