Redian新闻
>
小米AI大模型MiLM-6B:64亿参数,C-Eval总榜排名第10

小米AI大模型MiLM-6B:64亿参数,C-Eval总榜排名第10

公众号新闻
出品 | OSC开源社区(ID:oschina2013)
小米 AI 大模型 MiLM-6B 首次曝光。
MiLM-6B 是由小米开发的一个大规模预训练语言模型,参数规模为 64 亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。
根据 C-Eval 给出的信息,MiLM-6B 模型在具体各科目成绩上,在 STEM(科学、技术、工程和数学教育)全部 20 个科目中,计量师、物理、化学、生物等多个项目获得了较高的准确率。
据悉,MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度,不过在 “法学、数学、编程、概率论、离散数学” 等涉及 “抽象思维” 的科目中,还有一定进步空间。
在 10 个 “社会科学” 测试科目中,除 “教育学和地理” 外,该模型在其他 8 个科目中都获得了较为理想的准确率。在人文科学的 11 个科目中,MiLM-6B 则在 “历史与法律” 基础上有着不错的准确率表现。
虽然小米 AI 大模型 MiLM-6B 当下才首次曝光,不过完成度已经较高,在未来该模型可能会被用于小米旗下 “小爱同学” 等虚拟助理服务中。
相关链接:https://github.com/XiaoMi/MiLM-6B


END



MySQL VS PostgreSQL 谁是世界第一?



这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
【第一天】开始3天的断食国产大模型开源一哥再登场,最强双语LLM「全家桶」级开源!340亿参数超越Llama2-70B650亿参数,训练飙升38%!LLaMA基础大模型复刻最佳实践开源,GitHub已获30k星7.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2023爱奇艺VR公司业务停滞,员工或被欠薪;阿里云开源通义千问 70 亿参数模型,免费可商用;华为正式发布鸿蒙 4,接入大模型|Q资讯正面硬刚GPT-4V!浙大校友开源多模态大模型LLaVA-1.5,130亿参数8个A100一天训完您贵姓?将蛋白质语言模型扩展到千亿参数,深度解读百图生科、清华xTrimoPGLM模型GPT-4参数最新爆料!1.76万亿参数,8个2200亿MoE模型,PyTorch创始人深信不疑1300亿参数,国内首个数学大模型MathGPT上线!多项基准赶超GPT-4阿里等大厂豪掷50亿美元买英伟达芯片;寒武纪被爆裁员,硬件部分只保留少数员工;小米曝光64亿参数AI大模型|AI一周资讯1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4澳洲人狂买中国汽车! 销量直接跳到第五, 省钱榜排名第一!十亿参数,一键瘦身!「模型减重」神器增强型 SmoothQuant,让大模型狂掉 3/4650亿参数,8块GPU就能全参数微调!邱锡鹏团队把大模型门槛打下来了!650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了小米 AI 大模型首次曝光:64 亿参数;马斯克:敲定意大利「决斗」地点;美国防部成立生成式 AI 工作组 | 极客早知道树莓派上运行 Stable Diffusion,260MB 的 RAM「hold」住 10 亿参数大模型中科院出手!1000亿参数全模态大模型发布,能看懂视频、绘画作曲、分析信号开源大模型FLM-101B:训练成本最低的超100B参数大模型GPT-4版微软Win11下周二见;千亿参数生物医药大模型面世;DALL·E 3模型将接入Bing丨AIGC大事日报54百亿参数大模型进化树重磅更新!85页盘点LLM发展史,附最详细prompt技巧the halo effect vs. DEI vs. Microaggressions长篇小说《如絮》第一百三十三章 越南-1966年 地狱沈向洋周明杨格大模型激辩:继续爆堆参数,大模型能出现新的「智能涌现」吗?复旦新作:单机微调650亿参数大模型;蚂蚁、百度参投AI大模型创企;杭州检方对AI换脸案提起公诉丨AIGC大事日报十亿参数,一键瘦身!「模型减重」神器让大模型狂掉3/4 | 最“in”大模型百川开源最强中英文百亿参数模型!超越LLaMA,中国开源大模型开启商用新纪元1800亿参数,性能碾压Llama 2,世界最强开源大模型Falcon 180B发布首次击败GPT-4?700亿参数Xwin-LM登顶斯坦福AlpacaEval,13B模型吊打ChatGPT十亿参数,一键瘦身!「模型减重」神器让大模型狂掉 3/4传滴滴造车VP创业大模型;澜舟科技推出400亿参数通用大模型;商汤AIGC相关收入增长670.4%国产百亿大模型再增一员!400亿参数孟子GPT发布,各项任务平均提升10-15%如何优化ChatGLM-6B?一行代码就行 | 最“in”大模型author names in other languages.
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。