Redian新闻
>
国产百亿大模型再增一员!400亿参数孟子GPT发布,各项任务平均提升10-15%

国产百亿大模型再增一员!400亿参数孟子GPT发布,各项任务平均提升10-15%

公众号新闻
明敏 发自 凹非寺
量子位 | 公众号 QbitAI

刚刚,国产大模型明星选手孟子GPT上新!

400亿参数通用大模型正式发布,已开启邀测。

数据显示,孟子GPT-40B版本全面领先7B版本,大约提升10-15个百分点

并超越部分国内大模型,在多语言任务等方面接近ChatGPT-3.5。

孟子GPT来自澜舟科技,其创始人为NLP领域大牛周明

自21年成立以来,澜舟科技先后发布孟子系列模型、MChat以及多个垂直领域模型,并拿下数亿元融资。

这次发布是孟子GPT上新。除了基础大模型以外,澜舟科技还同步上线了行业大模型,以及基于大模型的产品应用。

分别是:

  • 基于孟子GPT打造的金融大模型

  • 基于孟子GPT打造的会议内容分析平台“澜舟智会”

基于这三方面上,澜舟科技也表示,未来将全面拥抱MaaS服务,提供基础模型、大模型训练框架/工具包等服务。

使用更成熟预训练技术

据发布会介绍,孟子GPT-40B主要在中文及多语言能力、写作、多轮对话等方面做了提升。

通过网页、百科、社交媒体、新闻以及高质量开源数据集,孟子GPT-40中文能力更加突出。

并且基于万亿tokens多语言语料联合训练,更进一步提升了英语等语言能力。

在底层算法上,澜舟表示使用了更成熟的预训练技术,利用50万指令数据精调,基于70亿参数量的奖惩函数进行强化学习。

基于FlashAttention的高效注意力计算,训练速度提升8.5倍。基于TGI等加速框架,推理速度提升4.6倍

在孟子GPT-40B基础上,还能更进一步训练出行业大模型。

同步发布的澜舟智会,能提取出会议录音/视频的核心内容,生成总结和摘要,并且能对要点进行问答。

就在最近,孟子大模型还登顶中文大语言模型测评榜单C-Eval。

澜舟已拿下数亿元融资

澜舟科技是以NLP技术为基础的认知智能公司,由AI大牛周明创办,成立于2021年6月。

周明,当今NLP领域成就最高的华人之一,他不仅是中国第一个中英翻译系统的研制者,还在2019年成为AI语言领域最高级顶会ACL(国际计算语言协会)主席。

1991年在NLP重镇哈工大拿到博士学位后,周明进入清华任教;1999年被微软亚洲研究院创始院长李开复挖走,后来不久成为NLP研究组负责人。

2020年离开MSRA加盟创新工场担任首席科学家时,周明已担任MSRA副院长多年。

澜舟科技成立以来,主打加速AI落地,在轻量化大模型、垂直领域大模型上都做了颇多探索。

据介绍,除了孟子大模型外,目前澜舟科技已经开源了20个左右大模型。

今年3月,澜舟科技最新拿下Pre-A轮融资,由北京中关村科学城公司领投,斯道资本和创新工场跟投。这是澜舟科技收获的第2轮融资,2轮累计总额数亿元。

「量子位智库·仿生机器人沙龙」招募中

9月6日,「量子位智库·仿生机器人沙龙」将在北京中关村举办,欢迎全行业仿生机器人玩家参与 ~

点击图片了解详情,企业报名可联系活动负责人王琳玉(微信:iris_wang17,请备注企业+姓名)。沙龙观众通道后续开放,敬请期待 ~


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
54百亿参数大模型进化树重磅更新!85页盘点LLM发展史,附最详细prompt技巧1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4AMD王宏强:700亿参数大模型单个GPU部署,做好AI软件和生态实现“开箱即用”丨GACS 2023手机能跑百亿参数大模型,骁龙8Gen3来了,自研PC架构上线性能超越Llama2-13B,可免费商用,姚星创业公司开源百亿参数通用大模型1800亿参数,性能碾压Llama 2,世界最强开源大模型Falcon 180B发布美东之行—普林斯顿的雷阵雨传滴滴造车VP创业大模型;澜舟科技推出400亿参数通用大模型;商汤AIGC相关收入增长670.4%一个灵魂的故事全球最强CPU一夜易主,130亿参数大模型被塞进PC,没网也能生成邮件周报PPTGPT-4版微软Win11下周二见;千亿参数生物医药大模型面世;DALL·E 3模型将接入Bing丨AIGC大事日报从「最强2D」升维「最强3D」!智源联合清北重磅发布10亿参数Uni3D视觉大模型2023回国 在上海吃的最浪费的一顿酒席(多图)1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4幻觉处理国内最优!530亿参数Baichuan2推理能力飙升100%,首次开放API商用DeepMind让大模型学会归纳和演绎,GPT-4准确率提升13.7%王小川第三个大模型发布!530亿参数、服务B端、文科更强高通甩出最强芯片三件套!手机跑100亿参数大模型,PC芯片逆袭苹果英特尔国产130亿参数大模型免费商用!性能超Llama2-13B,支持8k上下文,哈工大已用上国产大模型开源一哥再登场,最强双语LLM「全家桶」级开源!340亿参数超越Llama2-70B首次击败GPT-4?700亿参数Xwin-LM登顶斯坦福AlpacaEval,13B模型吊打ChatGPTGPT-4关键信息遭泄露;北京将发4000万元算力券;百川智能推130亿参数大模型丨AIGC大事日报清华校友立功!谷歌发布首个全科医疗大模型,14项任务SOTA真的强?国产百度文心大模型 3.5 爆分了!34B参数量超越GPT-4!「数学通用大模型」MAmmoTH开源:平均准确率最高提升29%智能周报|OpenAI发布ChatGPT企业版,预计今年营收10亿美元;首批11家国产大模型「获批」,不包括阿里巴巴通义大模型十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型《高阳台 - 夏晖》比GPT-4还强,20亿参数模型做算术题,准确率几乎100%正面硬刚GPT-4V!浙大校友开源多模态大模型LLaVA-1.5,130亿参数8个A100一天训完中国版Copilot?代码优化提效5倍、采纳率提升44%……讯飞iFlyCode2.0正式发布,各项能力全面开放显著偏离标准模型:μ子g-2实验发布迄今最高精度结果;一天只要走够4000步,全因死亡风险就会降低 | 环球科学要闻爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元忆一位因脑溢血去世的同学
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。