Redian新闻
>
要做中国OpenAI的很多,但智源要打造大模型领域的Linux

要做中国OpenAI的很多,但智源要打造大模型领域的Linux

公众号新闻
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

“要做中国的OpenAI!”“要打造中国版ChatGPT!”ChatGPT的火以燎原之势蔓延到每一个角落。

人们目光的焦点聚集到这个具体的现象级应用,或者其它大模型支撑的类ChatGPT产品上。大模型似乎成为了人人都能参与的游戏?智源研究院院长黄铁军并不这样想。

ChatGPT的出现,好比用电灯点亮了一个街区。
但是要建全国、全球的电网,中间还有很长的路要走。

“很长的路”上,技术、资金、算力、算法、基础设施,搭建了一道难以攻破的壁垒。要继续前行,得凿开壁垒,开凿的斧头应是大量的技术研究和创新合作。

智源研究就提供了这么一把斧头,它联合30多家产学研单位,开发了FlagOpen(飞智)大模型技术开源体系这也是国内首个大模型开源体系。

黄铁军

黄铁军表示,希望大家的关注点从AI“海平面以上”冰山一角的大模型,回归到“海平面以下”的AI技术生态的全部,尤其是技术体系上。

一枝独秀,不如降低AI的应用门槛

2022年的云栖大会上,阿里推出了AI大模型开源社区“魔搭”Model Scope,推出伊始,达摩院就向社区贡献了300余个AI模型,全面开源开放。

FlagOpen是否意味着又一个魔搭的诞生?智源研究院副院长兼总工程师林咏华解释了二者的不同。

“魔搭有点像抱抱脸(HuggingFace)”林咏华谈道,“FlagOpen和魔搭不一样的地方是,我们的主要目标不是构建一个聚集很多人的繁华社区,而是推动大模型技术的发展。”

基于这个目标,FlagOpen配套了六个模块,分别是FlagAI、FlagPerf、FlagEval、FlagData、FlagStudio和FlagBoot。

FlagAI

FlageAI集成了很多主流大模型算法技术,以及多种大模型并行处理和训练加速技术,并支持微调。目前涵盖的模型包括NLP、CV与多模态等领域,如语言大模型OPT、T5,视觉大模型ViT、Swin Transformer,多模态大模型CLIP等。目前,FlagAI已经加入Linux基金会

“悟道2.0”通用语言大模型GLM,“悟道3.0”视觉与训练大模型EVA,视觉通用多任务模型Painter,文生图大模型AltDiffusion(多语言),文图表征预训练大模型(多语言)等智源研究院“悟道”大模型项目多个成果也开源在FlagAI。

FlagPerf

AI软硬件评测面临异构程度高、兼容性差、应用场景复杂多变的挑战。FlagPerf搭建的AI硬件评测体系,支持多种深度学习框架,及时跟进最新主流模型评测需求,便于AI芯片厂商插入底层支撑工具,且不以排名为核心目标

截至FlagOpen体系发布,FlagPerf已和天数智芯、百度PaddlePaddle、昆仑芯科技、中国移动等进行合作。

FlagEval

FlagEval是覆盖多个模态领域、包含评测维度的评测工具,首先开放的是近期很火的多模态领域-CLIP系列模型评测工具,支持多语言多任务、开箱即用。

FlagData

FlagData数据工具开源项目集成包含清洗、标注、压缩、统计分析等功能在内的多个数据处理工具与算法。此前,智源研究院已经构建了WuDaoCorpora语料库。

FlagStudio

FlagStudio是文生图、文生音乐等艺术创作相关的开源项目集合,集合的算法和模型更贴合中文场景,当前主要提供智源研究院文生图相关能力的应用。

FlagBoot

FlagBoot是基于Scala开发的轻量级高并发微服务框架,默认完全异步,且没有宏、隐式转换等晦涩难懂的代码。极少的代码量便于开发者轻易了解背后逻辑,而后进行自定义修改。

“大数据+大算力+强算法=大模型”是当前AI发展的主流,用FlagOpen,开发者尤其是初创公司,可以尝试大模型的开发和研究工作,换句话说,AI的研发、应用门槛被降低了。

以大模型为主导的方向提供基础开源体系,某种意义上,智源研究院在追赶ChatGPT产品的热点上退了一步。这或许是其非营利性机构的性质使然。

而ChatGPT背后的OpenAI,也是打着非营利性机构的旗号出道的(2019年3月1日,OpenAI LP子公司成立,旨在营利)。同样的机构性质,同样押注AI,并关注大模型赛道,

智源研究院有打算,或者可能成为中国的OpenAI吗?

ChatGPT每日调动后台参数的成本已经是天文数字。如果要在中国打造一个OpenAI,需要多少成本打底?

“智源要不要做一个OpenAI,很难简单做对比。”黄铁军回答这个问题时说道,DeepMind、OpenAI和智源研究院是同类机构,但不能简单等同。追求AI前沿,做开放研究是三家机构的共鸣;没有大量投资就没有那么多人做大量探索,三个机构也都有各自的社会资源投入办法,比如微软刚追投了OpenAI100亿美元。

但黄铁军同时表达了自己的不解,那就是:中国版的OpenAI怎么定义?

“某种意义上,这就是很不清楚的问题。”

我没有批评的意思。但是有人站出来说要做中国的OpenAI,他到底是什么意思?是想和OpenAI一样有100倍的盈利吗?更多的还是要问想做中国OpenAI机构那个人,他眼中的定义是什么。

至于做出OpenAI的必要成本投入,黄铁军给出的答案是“很难估计”,并表示,投资不是他本人也不是智源研究院关心的问题。

开源的打不过封闭的?

PC时代,Linux打破Wintel联盟的垄断;在iOS的封闭生态和Android的准封闭生态下,开源的RISC-V异军突起。开源意味着开放,意味着多家机构同时维护带来的风险降低和问题减少。

FlagOpen是国内首个大模型开源体系,智源研究院拿出了这样的态度:

大模型时代,需要这样的开源。智能时代需要真开源,就像Linux、RISC-V和2022年完全转入开源社区的PyTorch。

聊到此处,林咏华表示更愿意把FlagOpen类比为大模型领域的Linux

但有一种说法广为流传,即开源虽好,能让得到更好的迭代和更新,但开源的打不过封闭的

对这个问题,黄铁军做出了回应。他称Linux的成功,不是因为把其它操作系统都打败了,而是在整个市场竞争中占据了主要份额。

开源开放应该是一个大趋势,大部分情况下,以开源形式或以开源形式为基础的产品会占据较大的份额。


与此同时,在某一特定方向上,有一个闭源产品做得更好并不奇怪。这不等于谁打败了谁,而是大家在满足用户需求时做出了不同选择。

开源是FlagOpen的选择,来一起看看这个选择现阶段的成果——

登陆GitHub可以看到FlagOpen体系里各个项目的标星,星最多的是FlagAI,尚不过千,最少的标星量只有几十。另外还可以观察发现,开源体系中只涉及推理方面,没有涵盖训练部分。

林咏华表示这是智源的策略,即不是等做到完美再开源,而是把种子点做了之后就开源,以此方便各个企业之间没有商业合作协议的情况下就能互相合作。

选择现在公布FlagOpen开源体系的另一个原因,是现在大模型火上了天,有很多没有接触过大模型的初创团队也开始尝试自己训模型。

工欲善其事,必先利其器,“既然有这么多人想做这件事,我们在这个时候开源出来,是想给予我们的经验,让他们更加顺利往前走。”

「中国AIGC产业峰会」启动

邀您共襄盛举

「中国AIGC产业峰会」即将在今年3月举办,峰会将邀请AIGC产业相关领域的专家学者,共同探讨生成新世界的过去、现在和未来。

峰会上还将发布《中国AIGC产业全景报告暨AIGC 50》,全面立体描绘我国当前AIGC产业的竞争力图谱。点击链接或下方图片查看大会详情:

寻找中国版ChatGPT,量子位邀你共同参与中国AIGC产业峰会


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
前京东高管杀入大模型领域,狂揽数亿元天使投资舅舅走了,天上添一尊如来!又一 AI 大神杀入大模型领域!亚马逊首席科学家李沐被曝离职,与导师搭档创业搜狗创始人王小川要打造中国版OpenAI/苹果电脑出货量大幅下降/微信QQ故障被定性一级事故深度对话丨百度要做中国的大语言模型这件事本身就是不成立的?如何在 Linux 中降级 Flatpak 软件包 | Linux 中国在 Linux 中创建定时器 | Linux 中国王小川创立AI公司五季智能,打造中国OpenAI!2022辞旧迎新原美团联合创始人王慧文宣布进军 AI,出资 5000 万美元再创业,要打造“中国 OpenAI”世界上只有两个 Linux 发行版:Arch Linux 与其它 | Linux 中国美团联合创始人欲打造中国OpenAI/腾讯视频回应多设备登录被封号/Android品牌面临高库存风险与TOP3券商在数字化转型领域达成长期合作王小川新注册人工智能公司「五季智能」,曾表示会下场做「中国OpenAI」丨最前线波性与粒性女儿突然打来的国际长途电话前京东AI掌门人入局ChatGPT!「不设上限」招揽中国OpenAI合伙人天赋“易昺(bǐng)”,创造历史!Agustín Hernández:中美洲建筑背景下的未来主义巨构对话元语智能创始团队:做中国版ChatGPT,为什么坚持大模型开源路线?|甲子光年又一AI大神杀入大模型领域!亚马逊首席科学家李沐被曝离职,与导师搭档创业美团大佬创业,要做中国的OpenAI!顶级VC认购2.3亿美元,75%股份用来招募人才OBS Studio 29 发布,但对 Linux 用户来说变化不大 | Linux 中国回顾 2022 五个最佳 Linux 发行版 | Linux 中国邱开冒:2022年,两场奇怪的战争中国大模型时代新Linux初显!FlagOpen大模型技术开源体系发布Weight & Biases:大模型军备竞赛的受益者,AI领域的Datadog早鸟报|原美团创始人称将打造中国OpenAI;腾讯视频回应多设备登录被封号;疯狂小杨哥新公司叫三只狼...TUXEDO Stellaris 16(Gen5)是目前所能找到的终极 Linux 笔记本电脑 | Linux 中国智源发布FlagOpen大模型技术开源体系,要做大模型时代的“新Linux”王慧文广发英雄帖:组队拥抱新时代 打造中国OpenAI以间充质干细胞为基础,这家公司要做RNA药物慢病治疗领域的先行者屏幕最大MacBook Air将推出/美团联合创始人欲打造中国OpenAI/Redmi K60降价OpenAI老板害怕ChatGPT,比亚迪智能手表来了,李开复要建中国OpenAI,百度网盘限速破解,这就是今天的其他大新闻!如何在 Linux 中更新 Flatpak 软件包 | Linux 中国
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。