Redian新闻
>
性能超越Llama2-13B,可免费商用,姚星创业公司开源百亿参数通用大模型

性能超越Llama2-13B,可免费商用,姚星创业公司开源百亿参数通用大模型

公众号新闻

机器之心报道

机器之心编辑部


高性能、可商用,国产大模型又有开源新动向。


8 月 7 日,百亿参数高性能通用大模型「XVERSE-13B」宣布开源

 


  • Hugging Face:https://huggingface.co/xverse/XVERSE-13B

  • Github:https://github.com/xverse-ai/XVERSE-13B


而 XVERSE-13B 的打造者,正是腾讯公司副总裁姚星老师于2021年初创立的AI 与元宇宙技术服务公司元象 XVERSE

姚星

在离职创业之前,姚星主导创建了腾讯首个人工智能实验室 AI Lab(2016 年)和首个机器人实验室 Robotics X (2018 年),曾推进腾讯在机器学习、计算机视觉、语音到自然语言处理等前沿 AI 技术的研究与应用,主导推出多个有行业影响力的应用与产品,包括国家围棋队 AI 陪练「绝艺」、王者荣耀 AI「绝悟」、中国首款临床用智能显微镜、AI 驱动的新药发现平台「云深智药」及腾讯智慧种植方案 iGrow 等。


打造最强性能的开源大模型


XVERSE-13B 是目前同尺寸中效果最好的多语言大模型,可免费商用。它具备了高性能、全开源、可商用等诸多优势,能大大降低高校和企业部署使用大模型的成本,不仅实现了国产可替代,也是中文应用更好的选择。


在多项权威的标准中文和英文测评中,性能超越了 Llama-2-13B、Baichuan-13B 等国内外开源大模型(见下图一)。


图一:经过多项权威测评,XVERSE-13B 是目前同尺寸中效果最好的多语言大模型。


作为一个通用大模型,XVERSE-13B 可提供文本生成、自动化写作、数据分析、知识问答、多语言翻译、个性化交互、人物角色扮演、专业小助手等多方面的生成服务,在医疗、文旅、金融和娱乐等多个行业具有广阔应用前景。

 

据了解,元象近期还将发布大模型 Chat 版,开箱即用,持续优化开发者体验。


训练语料对大模型效果至关重要。XVERSE-13B 构建了一个高达 1.4 万亿高质量、多样化 tokens 的训练数据集,同时优化采样策略和数据组织方式,让模型支持中、英、俄、西等 40 多种语言,并且多语言任务处理的性能与效果俱佳。


XVERSE-13B 支持 8192 的上下文窗口,是同尺寸模型中最长的,从而能出色应对复杂场景,比如更长的多轮对话、知识问答与摘要等,应用范围更广泛。


模型使用标准 Transformer 网络结构,从零开始训练,还自主研发多项关键技术,包括高效算子、显存优化、并行调度策略、数据 - 计算 - 通信重叠、平台和框架协同等,让训练效率更高,模型稳定性强,在千卡集群上的峰值算力利用率可达到 58.5%,位居业界前列。

 

多个权威中文测评中表现优异,超越 Baichuan-13B


为验证模型各项能力,XVERSE-13B 通过 C-Eval、AGIEval 和 GAOKAO-Bench 等三个最具影响力的中文测评基准的综合评估(图二),表现优异,超越了同参数规模主流模型,如 Baichuan-13B、Llama-2-13B、Ziya-LLaMA-13B 等。 

 

图二:在多个权威中文测评中,XVERSE-13B 表现超越了同参数规模的主流模型。

 

在中文 C-Eval 的测评中(图三),XVERSE-13B 综合评分达到了 54.7 分,超越了同参数规模的主流模型。C-EVAL 测评基准由上海交通大学、清华大学以及爱丁堡大学联合创建,是面向中文语言模型的综合考试测试集,覆盖了 52 个来自不同行业领域的学科。

 

图三:C-Eval 中文测评结果。


在 AGIEval 测评里,XVERSE-13B 综合评分达到 41.4 分,超越了同参数规模主流模型(图二)。AGIEval 测评基准由微软研究院发起,旨在全面评估基础模型在人类认知和问题解决相关任务上的能力,包含了中国的高考、司法考试,以及美国的 SAT、LSAT、GRE 和 GMAT 等 20 个公开且严谨的官方入学和职业资格考试。


在 GAOKAO-Bench 测评中,XVERSE-13B 综合评分达到了 53.9 分,显著领先于同参数规模的主流模型(图二)。GAOKAO-Bench 测评基准是复旦大学研究团队创建的测评框架,以中国高考题目作为数据集,用于测评大模型在中文语言理解和逻辑推理能力方面的表现。

 

英文测评表现领先 Llama-2-13B


XVERSE-13B 的英文表现同样出色,在英文最权威评测 MMLU 中,其综合评分高达 55.1 分,几乎在所有维度超越了同参数规模的主流模型(图四),包括 Llama-2-13B、Baichuan-13B 等。

 

图四:MMLU 英文测评结果。


MMLU 由加州大学伯克利分校等知名高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的 57 个科目,主要目标是对模型的英文跨学科专业能力进行深入测评。其内容广泛,从初级水平一直涵盖到高级专业水平。


需要强调的是,测评只反映了大模型底座的核心能力,元象将持续迭代优化,全面提升模型能力。


免费可商用 哈工大率先使用助力研究

 

秉持开源精神,XVERSE-13B 代码采用 Apache-2.0 协议,向学术研究完全开源,企业只需简单登记,即可免费商用。

 

哈尔滨工业大学(下称「哈工大」)作为我国最早从事自然语言处理研究的顶级科研团队,已经率先使用 XVERSE-13B 大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示,「开源是互联网时代主流模式,不仅能贡献社区,推动技术持续创新,还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。」


元象 XVERSE 创始人姚星表示:「真实世界的感知智能(3D),与真实世界的认知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持续探索 3D 与 AI 前沿技术的动力。XVERSE-13B 是我们在国产技术自立自强上迈出的一小步,而开源开放将激发大模型生态活力,让 AI 的未来发展迈出一大步,为实体经济、数字经济的发展注入强劲动力。我们期待与众多企业与开发者携手,开创大模型商用新纪元。」

 

 


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
最强“GPT-4平替”开源!Meta推出免费商用的Llama 2,联手微软掀全球AI狂欢《梦中的白云》&《深深的怀念》1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4【公告】ChatGLM2-6B,免费商用十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型官方的Code Llama开源:免费商用,神秘版本接近GPT-4全面超越LLaMA2,月下载量超三百万,国产开源大模型如何成为新晋顶流?彻底开源,免费商用,上海AI实验室把大模型门槛打下来参数量仅为1/700,性能超越GPT-3.5!CMU+清华开源Prompt2Model框架改写游戏规则!Meta开源大语言模型Llama 2,可免费商用;微软Copilot定价每月每用户30美元 | 环球科学要闻基模型12项性能超越GPT-4,商汤语言大模型就等你来用Biden will ask Congress for $13B to support Ukraine篝火与诗,最是难凉爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元“牵手门”的董小姐和暧昧的成都免费、可商用,阿里云开源70亿参数通义千问大模型650亿参数大模型预训练方案开源可商用!LLaMA训练加速38%,来自明星开源项目Meta发布免费商用大模型 / 微信团队取消秋招/ iPhone 16 Pro Max拍照性能或大幅提升650亿参数,训练飙升38%!LLaMA基础大模型复刻最佳实践开源,GitHub已获30k星54百亿参数大模型进化树重磅更新!85页盘点LLM发展史,附最详细prompt技巧全面拥抱大模型!腾讯正式开放全自研通用大模型:参数规模超千亿、预训练语料超 2 万亿 tokens買了一顆皇冠微软赢麻了!联合Meta 重磅发布开源、可直接商用大模型Llama 2,网友:OpenAI 感觉如何?Meta被曝明年发布「开源版GPT-4级」全新大模型!参数量比Llama 2大数倍,可免费商用650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了王小川大模型25天再升级!13B版本开源免费可商用,3090即可部署国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%传滴滴造车VP创业大模型;澜舟科技推出400亿参数通用大模型;商汤AIGC相关收入增长670.4%T-,小藤级北交大开源交通大模型TransGPT·致远,可免费商用1800亿参数,性能碾压Llama 2,世界最强开源大模型Falcon 180B发布国内首款开源交通大模型TransGPT(致远),可免费商用斯坦福博士独作!大模型训练速度再翻倍,还官宣加入明星创业公司当首席科学家百川智能开源最新商用大模型!王小川:比LLaMA更香,下一枪打ChatGPT
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。