Redian新闻
>
大模型杀疯了!谷歌、微软全All in

大模型杀疯了!谷歌、微软全All in

公众号新闻

2023年初以来,以ChatGPT为代表的大模型成为世界数字科技领域的新热点大模型目前在机器翻译、语言理解、聊天机器人、图像识别,图像视频生成、语音识别、推荐系统等等领域都获得了革命性的进步。


为了能够让大家更深入地了解大模型领域,我们联合沃恩智慧qs前50,人均20+篇一作作者,打造了大模型系列精品课程,原价699元,限时0元免费送!


扫码领取课程(附老师授课PPT)
免费领导师推荐近3年热门大模型论文&电子书


导师推荐近三年热门大模型论文合集&部分老师授课PPT原件



20+本ChatGPT相关电子书

大模型系列课程概览

系列1 万物皆可大模型系列

1.GPT Plugin背后的机理

2.大模型与数据库交互

3.大模型玩MineCraft

系列2 后AI大模型时代,多模态助你弯道超车

1.多模态学习-大模型开启AI新时代

2.如何快速训练自己的多模态AI大模型

3.后AI时代,多模态的研究方向和热点

系列3 惊艳的大模型高效参数微调法

1.大模型微调-任务特定的P-tuning

2.大模型微调-任务/模型无关的LORA

3.大模型微调方法-Peft库使用实践(实战篇)

系列4 大模型在文本生成方向的最新尝试工作

1.对比学习在多模态和NLP领域的应用

扫码领取课程(附老师授课PPT)
免费领导师推荐近3年热门大模型论文&电子书


导师推荐近三年热门大模型论文合集&部分老师授课PPT原件



20+本ChatGPT相关电子书


大模型微调遗忘问题依旧是当下的热点研究方向,近期有团队针对语言模型,在医疗问题解答(QA)任务的特定数据集上对其进行了微调。然后测量它在其他医学问答数据集上的分布通用性,并评估在常识性问答以及指令性任务中的任务通用性。



最近,又相继出现了各方向领域的微调模型,这里给大家介绍几个比较有特色的新微调模型:

TransGPT为一个开源交通大模型,能够实现交通情况预测、智能咨询助手、公共交通服务、交通规划设计、交通安全教育、协助管理、交通事故报告和分析、自动驾驶辅助系统等功能。

模型基座采用LLaMA7B进行训练。

地址:

https://github.com/DUOMO/TransGPT

墨子(Mozi)大模型,主要完成科技文本理解和生成任务,覆盖了包括科技问答、对话、信息抽取和摘要理解等特定任务。

基于llama7b、Baichuan7b,使用的训练方法为QLoRA优化,使用8卡3090服务器训练约9天完成。模型支持最大输入长度为4096。

地址:

https://github.com/gmftbyGMFTBY/science-llm

天文领域微调模型:StarGLM,该项目整合了司天工程相关的语料数据与知识库资料,训练得到了天文大语言模型StarGLM(ChatGLM for Variable Star),以期缓解大语言模型在部分天文通用知识和前沿变星领域的幻觉现象。

地址:

https://github.com/Yu-Yang-Li/StarGLM

在微调数据方面,先后经过ChatGPT-Corpus、Belle项目筛选数据、Firefly+Instinwild项目筛选数据、GPT-4-LLM项目筛选数据,并配合人工标注,共同组成20W条天文对话数据。





扫码领取课程(附老师授课PPT)
免费领导师推荐近3年热门大模型论文&电子书

-END-

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型Mesos 时代彻底消亡:10 年创业挣扎、微软谷歌收购未果,这家公司还是倒闭了GPT-4版微软Win11下周二见;千亿参数生物医药大模型面世;DALL·E 3模型将接入Bing丨AIGC大事日报突发!谷歌发布史上最强大模型Gemini,赶超GPT-4|亮马桥小纪严选GPT-4就是AGI!谷歌斯坦福科学家揭秘大模型如何超智能开年第一裁!谷歌、亚马逊先后解雇数百名员工!直播平台也减员35%大臣们怎么想?孤独,寂寞的Amazon软件工程师超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!【周六前瞻】微软、谷歌、亚马逊财报来袭,美股下周应该关注什么?UC伯克利团队开源MemGPT大模型上下文内存管理方案;AgentLM、多模态Fuyu-8B、数学LLEMMA等专用大模型开源医疗大模型爆火!微软、谷歌全All in硅谷最爱美国大学排名流出!谷歌、微软...偏爱这些毕业生!​开源模型在竞赛数学MATH上首次突破50%,清华、微软联合推出工具集成推理语言模型三种8卡GPU评测Llama2:解密大模型训练、微调和推理运行时的性能问题这个掌握全球经济命脉、硅谷最劲爆的华人,是Intel一生的对手,还让微软、谷歌、特斯拉都离不开!(附演讲视频)科研上新 | 大模型推进科研边界;大模型的道德价值对齐;优化动态稀疏深度学习模型;十亿规模向量搜索的高效更新澳洲记忆谷歌、亚马逊之后,微软也要自己造AI芯片震惊!!!谷歌发布最强多模态大模型Gemini名场面集合!狂上热搜300次,上海万圣节杀疯了!杀疯了!!突发!谷歌深夜掀桌子,发最强大模型Gemini,跑分碾压GPT-4【附60页技术报告】黑客入侵ChatGPT,OpenAI微软全被搞崩!「苏丹匿名者」:是我干的清华、微软等淘汰提示工程师?LLM与进化算法结合,创造超强提示优化器微软推出首款自研大模型AI芯片;英伟达合作微软推出AI代工服务;WPS AI开启公测丨AIGC日报南湾“刺激型杀手”现已获释,15岁时杀死同学只为体验一把腾讯混元大模型开放文生图;微软AI投资重心或转向应用和业务;国产大模型10月榜单公布丨AIGC大事日报语言模型战胜扩散模型!谷歌提出MAGVIT-v2:视频和图像生成上实现双SOTA!第九章第三节 联邦司法系统的组织运作北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型真实性惊人,谷歌、康奈尔提出真实的图像补全技术RealFill免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!确认: 微软全资收购暴雪, 见证历史!小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大那咬一口香死人的流沙月饼
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。