国际科技财经博客移民网络热点娱乐民生时事公众号

>

小米AI大模型MiLM-6B：64亿参数，C-Eval总榜排名第10

小米AI大模型MiLM-6B：64亿参数，C-Eval总榜排名第10

公众号新闻

2023-08-14 11:08

出品 | OSC开源社区（ID：oschina2013)

小米 AI 大模型 MiLM-6B 首次曝光。

MiLM-6B 是由小米开发的一个大规模预训练语言模型，参数规模为 64 亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。

根据 C-Eval 给出的信息，MiLM-6B 模型在具体各科目成绩上，在 STEM（科学、技术、工程和数学教育）全部 20 个科目中，计量师、物理、化学、生物等多个项目获得了较高的准确率。

据悉，MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度，不过在 “法学、数学、编程、概率论、离散数学” 等涉及 “抽象思维” 的科目中，还有一定进步空间。

在 10 个 “社会科学” 测试科目中，除 “教育学和地理” 外，该模型在其他 8 个科目中都获得了较为理想的准确率。在人文科学的 11 个科目中，MiLM-6B 则在 “历史与法律” 基础上有着不错的准确率表现。

虽然小米 AI 大模型 MiLM-6B 当下才首次曝光，不过完成度已经较高，在未来该模型可能会被用于小米旗下 “小爱同学” 等虚拟助理服务中。

相关链接：https://github.com/XiaoMi/MiLM-6B

END

MySQL VS PostgreSQL 谁是世界第一？

这里有最新开源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得关注✔ 标星⭐ 哦

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

【第一天】开始3天的断食国产大模型开源一哥再登场，最强双语LLM「全家桶」级开源！340亿参数超越Llama2-70B 650亿参数，训练飙升38%！LLaMA基础大模型复刻最佳实践开源，GitHub已获30k星 7.7亿参数，超越5400亿PaLM！UW谷歌提出「分步蒸馏」，只需80%训练数据｜ACL 2023 爱奇艺VR公司业务停滞，员工或被欠薪；阿里云开源通义千问 70 亿参数模型，免费可商用；华为正式发布鸿蒙 4，接入大模型｜Q资讯正面硬刚GPT-4V！浙大校友开源多模态大模型LLaVA-1.5，130亿参数8个A100一天训完您贵姓?将蛋白质语言模型扩展到千亿参数，深度解读百图生科、清华xTrimoPGLM模型 GPT-4参数最新爆料！1.76万亿参数，8个2200亿MoE模型，PyTorch创始人深信不疑 1300亿参数，国内首个数学大模型MathGPT上线！多项基准赶超GPT-4 阿里等大厂豪掷50亿美元买英伟达芯片；寒武纪被爆裁员，硬件部分只保留少数员工；小米曝光64亿参数AI大模型｜AI一周资讯 1800亿参数，世界顶级开源大模型Falcon官宣！碾压LLaMA 2，性能直逼GPT-4 澳洲人狂买中国汽车! 销量直接跳到第五, 省钱榜排名第一！十亿参数，一键瘦身！「模型减重」神器增强型 SmoothQuant，让大模型狂掉 3/4 650亿参数，8块GPU就能全参数微调！邱锡鹏团队把大模型门槛打下来了！650亿参数，8块GPU就能全参数微调：邱锡鹏团队把大模型门槛打下来了小米 AI 大模型首次曝光：64 亿参数；马斯克：敲定意大利「决斗」地点；美国防部成立生成式 AI 工作组 | 极客早知道树莓派上运行 Stable Diffusion，260MB 的 RAM「hold」住 10 亿参数大模型中科院出手！1000亿参数全模态大模型发布，能看懂视频、绘画作曲、分析信号开源大模型FLM-101B：训练成本最低的超100B参数大模型 GPT-4版微软Win11下周二见；千亿参数生物医药大模型面世；DALL·E 3模型将接入Bing丨AIGC大事日报 54百亿参数大模型进化树重磅更新！85页盘点LLM发展史，附最详细prompt技巧 the halo effect vs. DEI vs. Microaggressions 长篇小说《如絮》第一百三十三章越南-1966年地狱沈向洋周明杨格大模型激辩：继续爆堆参数，大模型能出现新的「智能涌现」吗？复旦新作：单机微调650亿参数大模型；蚂蚁、百度参投AI大模型创企；杭州检方对AI换脸案提起公诉丨AIGC大事日报十亿参数，一键瘦身！「模型减重」神器让大模型狂掉3/4 | 最“in”大模型百川开源最强中英文百亿参数模型！超越LLaMA，中国开源大模型开启商用新纪元 1800亿参数，性能碾压Llama 2，世界最强开源大模型Falcon 180B发布首次击败GPT-4？700亿参数Xwin-LM登顶斯坦福AlpacaEval，13B模型吊打ChatGPT 十亿参数，一键瘦身！「模型减重」神器让大模型狂掉 3/4 传滴滴造车VP创业大模型；澜舟科技推出400亿参数通用大模型；商汤AIGC相关收入增长670.4%国产百亿大模型再增一员！400亿参数孟子GPT发布，各项任务平均提升10-15%如何优化ChatGLM-6B？一行代码就行 | 最“in”大模型 author names in other languages.

热点事件追踪