Redian新闻
>
独家 | 哈工深新跑出一家多模态大模型公司,聂礼强、张民等 AI 大牛加盟

独家 | 哈工深新跑出一家多模态大模型公司,聂礼强、张民等 AI 大牛加盟

科技

哈工深开讲大模型落地故事。

作者 | 郭   思

编辑 | 陈彩娴

AI 科技评论独家获悉:近日,聂礼强等人在深圳成立了一家大模型企业——若愚科技,定位中国最领先的多模态大模型研发商,此轮融资达3000万人民币,主要用于产品升级、团队扩展及市场推广。

天眼查显示,深圳大禹创科技(孙腾持股99%)、深圳睿诚科技以及聂礼强个人持股分别为45%、17.2%和13.6%。

公司初创团队主要由聂礼强、张民、孙腾、耿深等人构成。

公司董事长由哈工大(深圳)计算机执行院长聂礼强担任。

聂礼强是85后人士,国家级青年人才、国家级人才,主要研究方向为多媒体分析与多模态大模型 。他在顶级会议、期刊上发表过100多篇论文以及出版了五本书,曾获得SIGIR 2021年最佳学生论文奖,世界多模态顶会ACM MM BEST PAPER 20222最佳论文奖等,目前谷歌被引次数超过1.7万。

公司CEO由人工智能专业博士孙腾担任 ,其研究方向为多媒体分析与多模态大模型领域,相关研究成果在IEEE TKDE、ACM MM、 SIGIRand ToMM等国际 顶级期刊/会议发表。

若愚科技首席科学家则由国内NLP方向首位杰青,哈工大(深圳)特聘校长助理张民担任。

张民教授在1991年至1997年于哈尔滨工业大学先后获学士、硕士和博士学位,长期从事自然语言处理、机器翻译和人工智能研究,已发表CCF A/B类论文150余篇,出版Springer专著2部,主编英文论著(论文集)16本。在谷歌学术,张民的被引数超过了 10 万,h-index 超过了 130。

而愚科技投融资负责人则由著名证券分析师耿深担任。

若愚科技科研背景主要来自哈工深大模型团队积累,背后由若愚-哈工深联合实验室、高层次专业人才及青年人才支持,具备300余张A100 40G显卡算力储备。

值得一提的是,哈工深人工智能相关四个学科入选国家一流学科建设,并于今年4月与南洋理工合作提出全球首个「多模态DeepFake检测定位」,大模型研究相关排名国际领先,技术积累十分雄厚。

若愚科技现已发布了中国首个自主可控的多模态大模型若愚-九天,在多项评测指标中表现颇佳,具有模态覆盖面广、多模态数据集十分顶尖、模态联系能力强、可扩展性强等显著特点,其中若愚-九天对视频-文本处理部分和图片-文本处理部分相关论文,分别荣获 ACM MM 2022 顶会 的最佳论文(聂礼强教授为第一作者,张民教授为第四作者),ACM SIGIR 2021顶会最佳学生论文。

产品计划应用场景有AI模拟助手,具身机器人、工业数字机器人以及数字虚拟人等。

在战略规划上,若愚科技遵循的路线为纵向加横向双轮驱动, 在纵向上,持续迭代核心基座、自研加合作巩固核心优势,在横向上,拓展行业应用大模型,通过行业大模型验证底层引擎优势,完成技术、行业需验证,打磨形成完整行业大模型工具链及开放API。

未来,若愚科技将在大模型市场迸发出哪样的光芒,AI科技评论将持续关注,大模型行业又将迎来哪些新的入局者?欢迎添加作者微信(lionceau2046)交流,互通有无。

更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!


公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳多模态大模型的幻觉问题与评估更强更通用:智源「悟道3.0」Emu多模态大模型开源,在多模态序列中「补全一切」多模态大模型向前,机器人领域的新机遇在哪里?破解一切模态,无限接近AGI!新加坡华人团队开源全能「大一统」多模态大模型多模态大模型进展及应用 | 8月10日TF116报名综述 | 多模态大模型最全综述来了!从感知到理解-融合语言模型的多模态大模型研究中科大&字节提出UniDoc:统一的面向文字场景的多模态大模型中国最具人才吸引力城市TOP100多模态大模型的下一站在哪里?新多模态大模型霸榜!支持图文混合输入,不懂知识还能现学能「说」会「画」, VisCPM:SOTA 开源中文多模态大模型中文版开源Llama 2同时有了语言、多模态大模型,完全可商用曝OpenAI大模型新进展!将推出多模态大模型,新项目Gobi筹备中一代辉煌专访生数科技唐家渝:清华系团队拿到上亿融资,用Transformer来做多模态大模型多模态大一统、AI智能体将如何引领未来?阿里妈妈与人大高瓴学者探讨大模型趋势关于医学多模态大模型,你需要来学习这些最新研究多模态大模型能力测评:Bard 是你需要的吗?BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」多模态大语言模型综述来啦!一文带你理清多模态关键技术理解指向,说出坐标,Shikra开启多模态大模型参考对话新维度开源多模态大模型哪家强?TOP12榜单来了,GitHub揽获2.2k+星LaVIN-lite:单张消费级显卡微调多模态大模型多模态大模型最全综述来了!7位微软研究员大力合作,5大主题,成文119页实现输入到输出「模态自由」, NUS华人团队开源NExT-GPT,最接近AGI的大一统多模态大模型来了百度招聘多模态大模型实习生(内推)专访生数科技唐家渝:清华系团队拿到近亿融资,用Transformer来做多模态大模型马毅团队新作!微调多模态大模型会「灾难性遗忘」,让性能大减普京的秘密(1)——瓦格纳组织(1)多模态大模型迸发,创业机会和挑战在哪?丨GAIR 2023别把日子过成打牌GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gimini!为了纪念而纪念。
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。