Redian新闻
>
讯飞星火V3.5整体接近GPT-4 Turbo!首个13B开源大模型发布,深度适配国产算力

讯飞星火V3.5整体接近GPT-4 Turbo!首个13B开源大模型发布,深度适配国产算力

科技



  新智元报道  

编辑:编辑部
【新智元导读】首个基于全国产化算力平台「飞星一号」的大模型,正式开源!

1月26日,美国商务部长雷蒙多表示,拜登政府正在尽全力阻止中国获得训练AI模型所需的算力资源。
美国的云计算公司,都被要求确定是否有外国实体正在访问美国数据中心以训练AI模型。
雷蒙多表示:「我们不能让非国家主体、中国或我们不希望访问我们的云计算系统的人,来训练他们的模型。」
显然,在被算力卡脖子的当下,深度适配国产算力的开源大模型,意义格外重大。
就在1月30日,科大讯飞重磅发布首个全国产算力训练的全民开放大模型——讯飞星火V3.5。
实测结果显示,讯飞星火V3.5在七大核心能力上都获得了全面提升。甚至,在数学、语言理解和语音交互能力上还超越了GPT-4 Turbo。
而同时发布的星火语音大模型,也在首批的37个主流语种上,实现了对OpenAI Whisper V3的超越。
此外,科大讯飞还首次开源了深度适配国产算力,拥有130亿参数的iFlytekSpark-13B模型(星火开源-13B)。不仅场景应用效果领先,而且还对学术和企业研究完全免费。

昇思MindSpore开源社区:https://xihe.mindspore.cn/modelzoo/iflytek/introduce

启智社区:https://openi.pcl.ac.cn/iflytek/iFlytekSpark-13B

Gitee地址:https://gitee.com/iflytekopensource/iFlytekSpark-13B

首个「全栈国产化」开源模型来了

具体来说,此次开源不仅包括基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,还有微调工具iFlytekSpark-13B-Lora,以及人设定制工具iFlytekSpark-13B-Charater。
基于这些全栈自主创新的套件,企业和机构可以方便地训练自己的大模型了。
那么,基础模型和精调模型性能如何?
可以看到,在C-EVAL、MMLU、CMMLU、AGIEVAL、FinancelQ等多项榜单测试中,与同尺寸开源模型相比,iFlytekSpark-13B更胜一筹。
而针对典型的应用场景,iFlytekSpark-13B在文本生成上提升23%,在语言理解上提升13%,文本改写提升25%,行业问答提升50%,机器翻译提升17%,头脑风暴提升29%。
正是科大讯飞团队对学习辅助、语言理解等领域的深入研究和优化,大幅提升了模型实用性,使得处理复杂任务时更得心应手。
这种优化不仅提高了模型的理解能力和生成质量,还确保了其在面对多样化和专业化的应用场景时能够保持高效和准确。
这对于追求高性能、低成本的企业来说,无疑有着巨大的吸引力,同时为各行各业的企业提供了一种性价比高的解决方案。

深度适配国产算力

面对算力的紧缺,只有国产算力取得突破,才能为大模型行业的发展提供强有力的支撑。
为此,讯飞星火与昇腾强强联合,打造了全国产的通用智能新底座,和基于自主创新的算力平台。
2023年8月15日,「星火一体机」正式发布——不仅可以为大模型提供源源不断的算力,还能提供大模型的训练、推理、优化、部署等全流程能力。
紧接着,在2023年10月24日又发布了国内首个可以训练万亿浮点参数大模型的大规模算力平台「飞星一号」。
合作期间,科大讯飞发挥多年积累的算法优势,深度参与大模型底层算子库开发和优化、大模型算法迁移和超大规模集群智能化运维软件开发等工作。
而攻关团队也放弃了中秋等节日的休息,才加班加点地推出了「飞星一号」平台。
具体来说,「飞星一号」平台采用的是昇腾AI集群和大容量交换机构建无损ROCE组网,以及高空间的全闪和混闪并行文件系统。
模型通过昇思MindSpore AI框架的训练效率提升了40%,与昇腾AI硬件协同实现超强性能。
此外,训练策略针对昇腾算力进行了极致优化,充分展示了国产算力在追赶国际先进水平方面的决心和能力。
有了国产软硬件环境的深度优化,模型的训练效果也直接翻番。
如今星火开源-13B的发布,距离1024「讯飞星火认知大模型」V3.0的升级才刚刚过去三个月。

自主创新开源生态

而开源,则是为了推动人工智能和机器学习领域的协作,在全球范围内促进技术革新。
它可以让更多的做理论研究和学术探索的科研院所、企业和个人加入进来,以此增进学术合作,增进产业探索。
因为,只有当开源有更多的落地场景,才能更好地促进生态合作。
一直站在「开源派」阵列的图灵三巨头之一LeCun曾在AI Native大会上称,「我认为开放是必然之路。因为大模型将成为社会人人依赖的基础设施,所以必须是开放的」。
对于国内的大模型生态来说,亦是如此。
此前,科大讯飞开源的中文预训练模型,成为许多高校和企业打造创新应用的基石,推动了业界在语音和语言处理技术上的快速发展。
而现在,iFlytekSpark-13B的发布,成为中国在自主创新和科技自立自强道路上的重要里程碑。
针对算力安全问题,科大讯飞提出了一种全新的实践方案——「全栈国产化」开源。
自主开发的大模型和算力平台,不仅能促进国内科研人员和企业的创新,还可以推动相关领域科技进步,增强国家技术安全,加速AI技术的社会和经济应用。
为此,科大讯飞还在2023年7月正式成立了星火军团,负责助力客户大模型产品打造和应用落地,赋能千行百业。
未来,在全国产化算力平台的支撑下,星火认知大模型将进一步对标国际先进水平,而星火开源大模型,也将使国内开源生态更加欣欣向荣。

参考连接:

https://openi.pcl.ac.cn/iflytek/iFlytekSpark-13B

https://gitee.com/iflytekopensource/iFlytekSpark-13B

https://xihe.mindspore.cn/modelzoo/iflytek/introduce


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
用Trade Joe 的Pizza Dough做匹萨,想做什么口味的,自己定,简单方便,经济实惠,值得一试Google 最强大模型发布,GPT-4 要被反超?Suno v3音乐生成模型发布,几秒钟生成完整歌曲;富士通用生成式AI加速药物研发丨AIGC日报AI早知道|科大讯飞星火认知大模型 V3.5发布;Midjourney V6动漫微调模型上线国产大模型落地为王!讯飞星火如何快人一步?AI早知道|Stability AI推出最小模型;国内首个视频大模型通过备案;内蒙古首个AI大模型工业互联网平台发布有 Turbo Tax small Business账户可以加入的吗?开源大模型火了!(附99个大模型微调模型/数据/工具)!无需训练实现价值观实时动态对齐:上交开源价值观对齐方法,闭源与开源大模型均适用讯飞医疗递交IPO申请;Meta发开源大模型Code Llama 70B;马化腾称两年内不会有纯原生AI大应用丨AIGC大事日报RAG+GPT-4 Turbo让模型性能飙升!更长上下文不是终局,「大海捞针」实验成本仅4%超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源全球顶尖AI研究者中国贡献26%;1320亿参数大模型开源;Anthropic大模型测评首超GPT-4丨AIGC大事日报最接近GPT-4的国产大模型诞生了【皇帝是我】姐从H20到H200,国产算力差在哪儿?千元成本搞定专业大模型,系统优化+开源大模型是关键 | 潞晨卞正达@MEET2024国产算力和国产大模型,迎来双赢时刻天工2.0 MoE大模型发布;苹果开源自动修图神器MGIE;香港公司被AI换脸骗走2亿港元丨AIGC大事日报7B开源数学模型干翻千亿GPT-4,中国团队出品性能逼近GPT-4,开源Mistral-Medium意外泄露?CEO最新回应来了无题性能强,成本低,运行快!最强开源大模型出现,超越ChatGPT和Llama!同诗不同命赵匡胤刘邦《题菊花》黄巢诗三首王友琴:女性的野蛮史上首个100%开源大模型重磅登场!破纪录公开代码/权重/数据集/训练全过程,AMD都能训马斯克正式开源 Grok-1,成为全球最大的开源大模型逼近GPT-4的新模型发布!「欧洲版OpenAI 」联手微软,却被质疑违背初心GLM-4国产大模型上线 称整体性能逼近GPT-4 降低推理成本国产大模型,逼近GPT-4|甲子光年宇宙人(1473期)阿波罗任务“隐藏”了超过20000次月震信息;联发科首次实现大模型在手机芯片端深度适配2023 turbo tax, home & business , 17刀一个人无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用微软Copilot史诗级更新!GPT-4 Turbo免费用,必应深度搜索30秒精准解答AI早知道|微软Copilot将可免费使用GPT-4Turbo; 国产670亿参数大模型DeepSeek亮相讯飞星火V3.5,1月30日正式发布!开源大模型王座再易主,1320亿参数DBRX上线,基础、微调模型都有
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。