Redian新闻
>
书生・浦语 2.0(InternLM2)大语言模型正式开源

书生・浦语 2.0(InternLM2)大语言模型正式开源

公众号新闻
1 月 17 日,书生・浦语 2.0(InternLM2)发布会暨书生・浦源大模型挑战赛启动仪式在上海举行。上海人工智能实验室、商汤科技联合香港中文大学和复旦大学共同发布了新一代大语言模型书生・浦语 2.0(InternLM2)
开源地址
  • Github:https://github.com/InternLM/InternLM

  • HuggingFace:https://huggingface.co/internlm

  • ModelScope:https://modelscope.cn/organization/Shanghai_AI_Laboratory

这个模型在 2.6 万亿 token 的高质量语料基础上进行训练,包含 7B 和 20B 两种参数规格以及基座、对话等版本,以满足不同复杂应用场景的需求。上海 AI 实验室秉持“以高质量开源赋能创新”的理念,为 InternLM2 提供免费商用授权。
InternLM2 的核心理念在于回归语言建模的本质,通过提高语料质量和信息密度,提升模型基座的语言建模能力。它在数理、代码、对话、创作等方面都有显著进步,合性能达到同量级开源模型的领先水平。它支持 200K token 的上下文,一次性接收并处理约 30 万汉字的输入内容,准确提取关键信息,实现长文本中的精准筛选。
在评测中,研究人员定义了语言、知识、推理、数学、代码、考试等六个能力维度,并在 55 个主流评测集上对多个同量级模型进行了综合评测。结果显示,InternLM2 的轻量级(7B)及中量级(20B)版本在同量级模型中表现优异。与初代 InternLM 相比,InternLM2 在各项能力上都有显著提升,特别是在推理、数学和代码方面。


往期推荐



洗衣机日耗流量3.6GB,或被入侵后用于“挖矿”?

2023年IT界的「奇葩」新闻:盗用游戏源码获利1.5亿;视频软件“白嫖”带宽;程序员篡改ETC余额......

Linux内核被冬季风暴 “封印”



这里最新源资讯、软件更新、技术干货等内容

点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
万字长文再论大语言模型的位置编码及其外推性对标OpenAI GPT-4,MiniMax 国内首个 MoE 大语言模型全量上线今日Arxiv最热NLP大模型论文:清华大学让大语言模型自动并行自回归解码,速度提升高达4倍!有感即记回国,也来聊聊手机对标 OpenAI GPT-4,MiniMax 国内首个 MoE 大语言模型全量上线视觉模型+大语言模型:首个支持10K+帧长视频理解任务的新型框架北京/深圳内推 | 腾讯游戏AI大语言模型团队招聘LLM算法工程师/研究员大语言模型之生成/推理:参数与解码策略原理及其代码实现HaluEval 2.0:大语言模型事实性幻象的实验性分析使用BigDL LLM在Intel® Data Center GPU上进行Llama 2模型调优OSCHINA&Gitee:2023大语言模型LLM技术报告ICLR 2024 | 机器人领域首个开源视觉-语言操作大模型!RoboFlamingo框架激发开源VLMs更大潜能200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回OpenAI科学家Andrej Karpathy力荐,23年必读的大语言模型论文清单大语言模型的32种消除幻觉的技术,你都了解吗?NIPS2023 | 评估大语言模型的事实性国产开源模型标杆大升级,重点能力比肩ChatGPT!书生·浦语2.0发布,支持免费商用大语言模型引领内容生产方式变革国内各大语言模型生成的“关于公众号华尔街俱乐部”的内容FuseLLM:大语言模型的知识融合!最近几部剧的观感 - 好久不见ICLR'24 大语言模型智能体最新研究进展五种资源类别,如何提高大语言模型的资源效率,超详细综述来了Meta 宣布改组旗下 AI 部门,正训练自家下一代大语言模型 Llama 3;国内首个网络安全大模型评测平台发布丨AIGC日报马斯克宣布正式开源大语言模型Grok;人体避免多个精子使一个卵子受精的机制揭示 | 环球科学要闻北京内推 | ​默沙东高阶分析团队招聘大语言模型方向NLP算法实习生游泳赛机器人领域首个开源视觉-语言操作大模型,RoboFlamingo框架激发开源VLMs更大潜能拆解大语言模型RLHF中的PPO算法字节发布机器人领域首个开源视觉-语言操作大模型,激发开源VLMs更大潜能东北大学发布TechGPT2.0大语言模型用跑1个LoRA微调大语言模型的延迟跑10个!面向超长上下文,大语言模型如何优化架构,这篇综述一网打尽了红色日记 唐山地震 8.1-15
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。