Redian新闻
>
解题准确率较GPT高出70% 夸克大模型多项考试评测成绩领先行

解题准确率较GPT高出70% 夸克大模型多项考试评测成绩领先行

公众号新闻
允中 发自 凹非寺
量子位 | 公众号 QbitAI

“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,夸克百亿级参数大模型同样在法律、医疗、问答等领域的性能评测中夺冠。

凭借在搜索业务和智能技术上的长期积累,夸克大模型利用数据、平台、知识增强等优势,可以大幅提升知识正确性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至5%,处在行业领先水平。

夸克推进搜索革新,自研大模型打造技术新底座

在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。但是随着移动互联网内容生产和供给模式的转变,传统搜索逐步变得封闭化、孤岛化。基于大模型的AIGC技术将会给搜索产品带来全新变化,推进搜索革新已经成为行业共识。

夸克技术负责人蒋冠军表示,夸克大模型是面向搜索、生产力工具和资产管理助手的应用型大模型。在搜索应用中,将通过图文多模理解、专业知识生成、交互方式创新进一步拓宽应用场景,提升用户体验。

夸克技术负责人蒋冠军

夸克大模型的优势源自于智能技术实力与搜索业务基础,蒋冠军认为,夸克大模型有四大优势:第一、最全面的通用知识数据和行业知识数据,以及知识理解和评估体系;第二、得益于搜索技术体系的积累,拥有千亿级参数平台的模型训练能力;第三、拥有长期智能化产品经验的智能技术产运团队。第四、拥有全行业的知识增强技术体系及能力。

面向未来,要解决大模型的应用问题,关键要解决知识正确性问题。据悉,基于强大的搜索产品和智能技术积累,夸克大模型在知识增强上的优势可以大幅提升知识正确性。同时,在医疗健康领域,夸克已经可以将问答内容的幻觉率降低至5%,处在行业领先水平。夸克大模型也将是持续推动夸克App产品体验创新和迈向新一代搜索的技术底座。

夸克大模型性能评测夺冠 四大能力提升用户效率

日前,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克大模型的整体水平超越GPT-3.5,在多语言翻译、写代码、安全合规、内容创作等方面处在国内行业头部水平。

针对AIGC技术与搜索产品在大模型领域的协同发展,清华大学新闻学院教授、博士生导师沈阳认为,依托搜索平台,夸克大模型拥有高质量的各类数据,在中文语境下,模型能力处在行业领先水平。在教育、医疗等垂直领域中,夸克在对话、解题上的能力取得了新的突破,是国产自研大模型的优秀代表之一。同时,在安全性能上,夸克经历了搜索场景下的长时间考验,累积了非常丰富的经验和能力。

数据显示,夸克大模型接连登顶C-Eval和CMMLU两大权威评测榜单,多项性能优于GPT-4。在国内大模型赛道火热的当下,夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力,整体水平达到行业一流水平。

另外,在最新的百亿参数测试集中,夸克同样在法律、医疗、问答等多个领域中排名第一,夸克大模型在不同参数量级的对比中均表现优秀。

在大模型技术落地层面,夸克大模型的能力体现在四个方面,可以帮助用户提升工作、学习效率。知识能力,拥有广泛的知识覆盖、信息搜集和多语言支持等,支持外接专业知识增强,提升跨领域的知识和语言理解能力;对话能力,具备较强的上下文理解、语境推理、关键信息保持和记忆能力,更好地适应不断变化的语境,理解用户的意图和需求,确保对话回复准确、合理、连贯;创作能力,能够根据主题或关键词,生成连贯、有逻辑、有深度的文本内容,支持续写、润色、仿写、批改等多种不同写作需求;安全能力,具备较好的世界观、价值观,对于明显的虚假信息,均能做到准确识别、正确回答或者给出合理指引。

以用户需求出发,打造工作、学习、生活的AI助手,夸克App持续迭代进化。据悉,夸克大模型将全面升级夸克在搜、用、存上的智能化体验,帮助用户进一步提升效率。同时,基于多年累积的搜索优势,夸克将借助AI驱动推进搜索革新,加速迈向下一代搜索。

MEET 2024大会定档!

首批嘉宾阵容公布

量子位「MEET2024智能未来大会」正式定档12月14日!点击报名线下参会

李培根院士、360集团梁志辉、小冰李笛、浪潮刘军、昆仑万维方汉商汤科技王晓刚DeepWay田山、千挂科技廖若雪、潞晨科技尤洋、小米集团栾剑、蚂蚁集团杨铭、星动纪元陈建宇等嘉宾已确认出席。

点击“预约”按钮,一键直达大会直播现场!


点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
让大模型看图比打字管用!NeurIPS 2023新研究提出多模态查询方法,准确率提升7.8%大模型的最大bug,回答正确率几乎为零,GPT到Llama无一幸免;长期炎症值得警惕!可能是癌症的得力助手|本周论文推荐中国已经有238个大模型了?李彦宏劝各位少做点大模型多搞搞应用吧李彦宏万字演讲:文心大模型4.0相较GPT4已经毫不逊色大模型搞“人肉搜索”,准确率高达95.8%!研究作者:已提醒OpenAI谷歌MetaAI早知道|联想 AI 助手即将上线;夸克 App 上线“元知”等大模型应用;OpenAI拟建立AI芯片工厂网络微软仅凭「提示工程」让GPT-4成医学专家!超过一众高度微调模型,专业测试准确率首次超90%回国大开眼界,这些东西你吃过吗?(图)LLM准确率飙升27%!DeepMind提出全新「后退一步」Prompt技术夏婳:两情难相知(十二)维基百科+大模型打败幻觉!斯坦福WikiChat性能碾压GPT-4,准确率高达97.3%更像人脑的新型注意力机制,Meta让大模型自动屏蔽任务无关信息,准确率提高27%安省G牌考试改革不合规?!恐恢复多项考试内容!事故率近期上升DeepMind让大模型学会归纳和演绎,GPT-4准确率提升13.7%港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构SambaNova的新芯片可运行比OpenAI的ChatGPT高级版大两倍以上的模型大模型落地最后一公里:111页全面综述大模型评测阿里夸克蒋冠军:大模型应用要解决知识正确性问题加州公校标准考试成绩出炉,湾区学生成绩略领先全加州,但仍落后于疫情前谷歌让大模型更具“心智”,GPT-4任务准确率大增真场景炼大模型,夸克借 AI 再次「提速」OpenAI回应ChatGPT服务故障;新研究以99%准确率识别ChatGPT生成化学论文;三星发布自研大模型丨AIGC日报GPT-4搞“人肉搜索”,准确率高达95.8%太疯狂,GPTs上线:奥特曼表演手搓马斯克大模型,还有人已搞出第三方市场(附教程)唯老是尊——中国养老现状及探讨(一)GPT-4不会图形推理?“放水”后准确率依然只有33%工业异常检测大模型来了!哈工大提出Myriad:利用视觉专家进行工业异常检测的大型多模态模型GPT-4完成正确率仅6%!北大等提出首个「多轮、多模态」PPT任务完成基准PPTCAI看图猜位置,准确率超90%!斯坦福最新PIGEON模型:40%预测误差不到25公里一个提示,让Llama 2准确率飙至80.3%?Meta提出全新注意力机制S2A,大幅降低模型幻觉阿里巴巴智能信息事业群发布夸克大模型;李开复AI公司回应“抄袭”;贾乃亮双11总销售额超13.6亿……夸克发布自研大模型,加速探索革新性搜索产品CodeFuseEval - 代码类大模型多任务评估基准第十章第四节 海陆空三军和国民警卫队荡游威尼斯
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。