Redian新闻
>
又双叒一清华系团队入局大模型创业!蚂蚁领投,主打多模态

又双叒一清华系团队入局大模型创业!蚂蚁领投,主打多模态

公众号新闻
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

清华计算机系教授朱军,终于正式站在了大模型创业赛的擂台上。

多方消息证实,他带领新团队成立新的AI公司,冲进大模型混战场——这是朱军继瑞莱智慧后,带领的第二支创业团队。

新公司生数科技,基于底层多模态通用大模型,面向图像创作、3D资产创建等场景打造垂类应用。

量子位进一步获悉,它刚刚曝出完成了近亿元天使轮投资,目前市场估值达1亿美金

蚂蚁集团是这次融资的领投方,BV百度风投和清华系专看AI的VC卓源资本紧随其后。

这是ChatGPT诞生后,蚂蚁集团第一次下手投资大模型公司,也是自今年1月7日阿里从蚂蚁集团实际控制人“身退”之后,蚂蚁集团对外曝光出的与AI初创公司第一次亲密接触。

(哪怕阿里和蚂蚁集团刚刚合作提出了VideoComposer,通过组合式生成范式,在视频领域同时实现时间和空间双维度的可控性,狗头.jpg)

打造可控多模态通用大模型

量子位进一步获悉,生数科技这家公司,由蚂蚁、BV百度风投,以及朱军第一次创业时成立的瑞莱智慧RealAI联合孵化而来。

目标是“致力于成为全球领先的生成式人工智能基础设施及应用建设者”。

据悉,生数科技研究团队主要来自清华大学人工智能研究院,主要来自朱军带领的课题组。

该课题组致力于贝叶斯机器学习的理论和算法研究,是国际上最早研究深度概率生成模型的团队之一

工作主要面向针对深度生成式模型的骨干网络、高速采样、可控生成、大模型训练等全栈底层原创研发。

而目前推进中的业务,是聚焦AIGC,打造可控的多模态通用大模型,覆盖文本、图像、3D模型、音视频等多个模态。

要覆盖的商业场景,包括艺术设计、游戏制作、影视后期、内容社交等。

生数科技大模型目前已处于迭代中,现阶段已经开始落地实践图像生成、3D内容生成和视频生成等业务。

业务水平究竟怎样?

面对量子位的上门追问,生数科技给出如下回答:

视频生成,团队目前聚焦于文本的视频自动化编辑。

生数科技视频生成效果(中)和Runway生成效果(右)

3D生成,团队提出新算法ProlifcDreamer,从贝叶斯建模和变分推断的角度,重新形式化了text-to-3D问题。

该技术能够在无需任何3D训练数据的前提下,通过文本描述,自动生成高质量带纹理的三维网格与NeRF图。

包括生成复杂效果和360°场景、根据同样的描述生成不同形式的3D内容。

以及首个实现了基于三视图自动生成高质量的3D内容,“是目前业内最接近产业级应用的3D生成效果”。

图像生成,团队旗下多模态大模型UniDiffuser,今年3月开源,是首个基于Transformer的多模态扩散大模型。

能够很好地在构图、风格、画面精准度等方面把握用户意图。

现状,是“正自研新一版的产业级模型,其中,图像生成效果已超过Stable Diffusion最新版基础模型水平”;

计划,是“将于年内赶超Midjourney最新版本”。

并且透露道,过去两年,生数科技团队在ICML、NeurIPS、ICLR等计算机顶会发了20多篇相关论文,扩散模型是团队的主要发力阵地

先后提出的采样算法Analytic-DPM、DPM-Solver等成果,被DALL·E、Stable Diffusion等应用。

论文成果颇丰,生数科技接下来的任务,就是把基础科研推向应用市场。

生数科技背后团队

生数科技领兵冲刺的带头人朱军,IEEE Fellow,现任清华大学计算机系教授。

同时也是清华人工智能研究院副院长,清华智能技术与系统国家重点实验室主任,智源首席科学家。

求学期间,他在清华计算机系拿下本科和博士学位,师从中国科学院院士、清华计算机系教授张钹

朱军

2011年,在张钹的邀请下,朱军回到清华计算机系任教。

去年,师徒二人围绕扩散概率模型合作的工作《Analytic-DPM: an Analytic Estimate of the Optimal Reverse Variance in Diffusion Probabilistic Models》,拿下ICLR 2022杰出论文奖。

朱军长期从事机器学习、贝叶斯方法、深度学习、数据挖掘等方面的研究,在顶会ICML、NIPS、IJCAI、AAAI、 JMLR、PAMI等发表论文100余篇,连续多年担任ICML、NeurIPS领域主席。

(贝叶斯方法是自然语言处理、机器学习、图像识别等AI领域的重要基础。)

2020年,朱军团队发布深度强化学习平台Tianshou天授。

这是一个针对强化学习的灵活可靠的基础设施,能够以极简代码极速实现强化学习的诸多算法和功能,在GitHub上有用6.4k+星星。

话说回来,生数科技不是朱军在科研和产业之间的第一次尝试。

他的首次创业要回溯到2018年。当时,他支持自己的学生田天创办了公司瑞莱智慧RealAI,专注提升人工智能的安全性。

并且和张钹共同担任该公司的首席科学家。

这一次正式入局大模型,朱军再次选择站在新公司“运筹帷幄”的位置上。

而根据企查查App资料,成立于3月的生数科技,在4月时进行了一次法人变动,从“田天”变更为“唐家渝”。

唐家渝其人,现在是生数科技的联合创始人兼CEO。

他同样毕业自清华大学计算机系,师从NLP组教授孙茂松

此前,对唐家渝外界的主要公开身份是瑞莱智慧的副总裁,先后负责公司产品团队、AI安全产研团队及业务。

而从再往前的简历可以看到,唐家渝曾在腾讯优图实验室工作。

唐家渝

最新能公开的消息是,生数科技团队近期在扩散模型工作上,提出了一种新的训练策略,能够尽可能用较少的标注,持续优化多模态生成效果。

如此看来,生数科技的多模态大模型可能武力值要再+1了?

以及不得不感慨一句,清华系AI初创公司在这一波大模型创业中,真的是风头无两。

哪怕单纯从数量上说,生数科技也已经是又双叒叕一个了~

参考链接:
[1]
https://github.com/thu-ml/tianshou
[2]https://www.cs.tsinghua.edu.cn/info/1121/3551.htm
[3]https://www.qcc.com/firm/3903aa13076b2df3918d75f504bb9395.html

— 联系作者 —

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「电商零售」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
王兴入局大模型!美团耗资21亿拿下光年之外100%股权王府井接手世界之花;名创优品Q3净利润大涨超3倍;新希望领投零食有鸣;疯狂小杨哥和辛巴团队入淘;京东高级VP王笑松退休|联商头条专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型智源Emu开源!超越DeepMind,刷新8项SOTA,首个「多模态-to-多模态」全能高手让ChatGPT调用10万+开源AI模型!HuggingFace新功能爆火:大模型可随取随用多模态AI工具BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」多模态大语言模型综述来啦!一文带你理清多模态关键技术看美国县级初中数学竞赛清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳北京/上海内推 | 字节跳动平台治理算法团队招聘NLP大模型/多模态算法实习生文革记忆 -- 活学活用忆苦饭创业笔记:气候行业是大模型创业的最好场景之一复旦新作:单机微调650亿参数大模型;蚂蚁、百度参投AI大模型创企;杭州检方对AI换脸案提起公诉丨AIGC大事日报上海宝马闯祸了我与【夕阳红】的故事20号,龚俊颇特直播Cut+总结达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力从零训练一个多模态LLM:预训练+指令微调+对齐+融合多模态+链接外部系统专访生数科技唐家渝:清华系团队拿到上亿融资,用Transformer来做多模态大模型为多模态LLM指明方向,邱锡鹏团队提出具有内生跨模态能力的SpeechGPT中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作训练成本不到1000元,直降90%!NUS、清华发布VPGTrans:轻松定制类GPT-4多模态大模型腾讯,终于入局大模型毫不意外谈崩,他们激怒了官方:美国要打多久,我们就打多久澳洲又双叒一家建筑商破产!欠债$330万,39个项目受影响数十家企业参编中国大模型标准;大模型创企获2.5亿美元投资;微软签署数十亿美元AI算力协议丨AIGC大事日报阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl苹果入局大模型活动倒计时8天,限时拼团,快速入局大模型系统实践!更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」腾讯AI Lab发布多模态指令调优语言模型,支持图像、视频等四种不同模态国内大模型北京占一半;李开复大模型创企官宣;文心一言App上架苹果应用商店丨AIGC大事日报微软提出CoDi:开创性多模态扩散生成模型,实现4种模态任意输入输出从感知到理解-融合语言模型的多模态大模型研究腾讯大手笔投资大模型,清华系AI公司赢麻了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。