Redian新闻
>
独家 | 多模态大模型初创企业“智子引擎”,近日完成千万元天使轮融资

独家 | 多模态大模型初创企业“智子引擎”,近日完成千万元天使轮融资

科技


作者 | 黄楠
编辑 | 陈彩娴
大模型在四五月份迎来“百家争鸣”,战况愈加激烈,有新玩家仍在陆续进场。
AI 科技评论获悉:近日,一家多模态大模型初创公司“智子引擎”完成了千万元天使轮融资。据了解,“智子引擎”的 CEO 是 90 后青年高一钊。高一钊是人大博士生,师从卢志武,卢志武在“智子引擎”公司中担任顾问一职。此外,卢志武担任软通动力首席 AI 科学家。
在 ChatGPT 火起来之前,北京智源人工智能研究院曾率先开拓中国大模型研究,名为“悟道”,当时聚集了四支主要力量,分别由清华唐杰、清华刘知远、清华黄民烈与人大文继荣领头(详情可以关注雷峰网后续深度报道《智源开拓中国大模型幕后详情》,欢迎感兴趣的读者添加作者微信:Fiona190913
其中,人大文继荣主要带领人大高瓴人工智能学院的科学家们开拓多模态大模型方向,名为“文澜”,卢志武便在团队中担任模型主力军,他的学生高一钊也参与进来,完成了核心的研究工作。“悟道”之后,唐杰、刘知远与黄民烈均基于大模型技术成立了公司,而人大的入局,为智源大模型“四大金刚”的创业阵容拉开了完满的序幕。
据 AI 科技评论了解,卢志武团队也是国内最早研究多模态大模型、并取得杰出技术成果的团队。



1

卢志武和高一钊二人
卢志武和高一钊从事多模态大模型始于 2020 年。
2020 年 5 月,由 OpenAI 研发的 GPT-3 在人工智能领域掀起了一阵巨浪,引发了国内从业者对预训练大模型的关注,其中就包括了卢志武等人。
卢志武早年就读于北京大学数学科学学院信息科学系,硕士毕业后,于 2011 年在香港城市大学计算机系取得博士学位,他主要的研究方向包括机器学习、计算机视觉等。

卢志武

当时,国内大部分人的注意力都聚焦在 NLP 领域,但有关从文字扩展到图像、视频的多模态大模型鲜少有人关注。
期间,中国人民大学高瓴人工智能学组建了多模态大模型研发团队,专门从事图文多模态预训练模型的研究和开发,由文继荣牵头,其他核心成员包括宋睿华、卢志武等人,这也是国内最早从事多模态大模型研究的团队。
高一钊在同年进入中国人民大学高瓴人工智能学院攻读博士、师从卢志武。

高一钊



2

“智子引擎”将推出多模态大模型
事实上,早在 ChatGPT 横空出世的三年前,北京智源人工智能研究院已率先开始中国大模型研究,名为“悟道”,其中由文继荣主要带领的人大高瓴人工智能学院科学家组成“悟道·文澜”团队,从事多模态大模型方向研究,卢志武任模型研发主力军。
2021 年 3 月,基于对 3000 万图文数据集的预训练,第一代“文澜”——图文检索模型 BriVL 正式问世,这是一个超大规模的多模态预训练模型,采用了双塔结构可分别对图像和文本进行编码,通过自监督任务来学习图像和文本之间的相似度。
以图文检索模型为基础,研究团队还开发了 H5 小应用“AI心情电台”,只需要向 AI 精灵提供一张图片,模型即可为该图片匹配一段合适的音乐。
随即三个月后,卢志武所在的文澜团队又发布了“文澜 2.0”(BriVL-2)。
基于视觉-语言弱相关的假设,研究团队提出图文弱相关假设,设计了高效的跨模态对比学习策略,同时提出了基于DeepSpeed的分布式多模态训练框架,从而提高模型的表达能力和泛化能力。
基于 6.5 亿弱相关的图文数据集的预训练,文澜 2.0 拥有的模型容量达到50亿参数,是目前最大的中文通用图文预训练模型,可覆盖多个领域和场景,在多个图文检索和生成任务上都取得了优异的性能,比如图像检索、图像描述、视觉问答等。
期间,高一钊也深度参与了文澜 1.0 和 2.0 的图文预训练工作,主要负责数据处理、模型训练和评估等。
在 ChatGPT 的热浪下,卢志武和高一钊看到了多模态研究在大模型时代的新机遇,成立多模态大模型公司“智子引擎”。借鉴以往参与文澜模型研发的经验,“智子引擎”团队于今年的 3 月 8 日正式推出了自主研发的多模态对话大模型,并发布了第一款应用级多模态 ChatGPT 产品“元乘象 ChatImg”。
“元乘象 ChatImg”的参数量在百亿级别,主要使用了图文对数据和 VQA 数据作为训练集,同时进行图文匹配、图文检索、图像描述生成、文本描述生成等多种任务的训练。根据用户输入的图片或文字,“元乘象 ChatImg”可以进行智能聊天、讲故事、写广告等。
自四五月份以来,陆续亮相的大模型引起一片喧嚣沸腾,大厂刀光剑影,创业公司也不遑多让。学术界下场入局大模型是个大趋势,如何能在靠近工程化的较量中找到自己的竞争力和位置,亟待从与时间的赛跑中找答案。

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!


公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」贼喊捉贼式的新疆指控,让人出离愤怒专注于钠离子电芯研发,「盘古新能源」完成数千万元天使轮融资丨36氪首发喜报|泽维生物完成千万元天使轮融资、迄今最详细的大脑发育基因图揭示五种疾病根源喜报|美诺医药完成超亿元B轮融资、神济昌华完成数千万天使轮融资【首发】微新生物完成数千万元天使轮融资,打造数据驱动微生物组工程平台「右脑科技」完成数千万元天使轮融资 | 奇绩校友融资新闻又见桐花开达摩院猫头鹰mPLUG-Owl亮相:模块化多模态大模型,追赶GPT-4多模态能力研发国产三坐标测量仪,「派姆特」完成千万元天使轮融资|早起看早期「芯算一体」完成千万级天使轮融资,开发机器视觉低代码组态IDE平台|早起看早期利用二氧化碳生产混凝土,「清捕零碳」完成千万元天使+轮融资|36氪首发「海豚干衣」获数千万元天使轮融资,客户复购率达80%|早起看早期专注冷库数字化解决方案,「珩兴智能」完成数千万元天使轮融资丨36氪首发独家 | 多模态大模型初创企业「智子引擎」,近日完成千万元天使轮融资「财小白」获千万元天使轮融资,投资方为华盛人和资本|早起看早期【首发】华链医疗完成数千万元天使轮融资,加速构建医学科学数据协作网专注冷库数字化解决方案,「珩兴智能」完成数千万元天使轮融资丨早起看早期鲜榨果汁气泡水打入餐饮渠道,「好飒」完成数千万元天使轮融资|36氪首发科技滑雪品牌「TOPAZ托帕兹」完成数百万元天使轮融资,众合创投投资|早起看早期遥思龙泉桃花宴【首发】北京清湃科技完成数千万元天使轮融资,加速光声成像的国产替代与临床落地毫厘科技完成千万级天使轮融资,专注生产型微流控技术的开发|早起看早期冷却的不止季节(41)— 丧葬费给宠物搭建专属「智能舱」,「小宠科技」完成近千万元天使轮融资|36氪首发毫厘科技完成千万级天使轮融资,专注生产型微流控技术的开发|36氪首发多模态大语言模型综述来啦!一文带你理清多模态关键技术【首发】泽维生物完成千万元天使轮融资,誉明创投联合投资开发薄膜太阳能激光设备,「迈科芯纳」完成数千万元天使轮融资|早起看早期智能硬件「乐天派」完成1900万元天使轮融资,探索主动式AI|早起看早期我和聊天机器人(AI)对话阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl专注于钠离子电芯研发,「盘古新能源」完成数千万元天使轮融资|早起看早期中科院发布多模态 ChatGPT,图片、语言、视频都可以 Chat ?中文多模态大模型力作日化巨头立白首次出手食品饮料,「有丛气」完成数百万元天使轮融资|早起看早期
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。