Redian新闻
>
打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

公众号新闻



  新智元报道  

编辑:编辑部
【新智元导读】全球领先AI公司智慧眼发布了自研的通用大模型——砭石,海量代码文本数据训练后展现出强大的涌现能力,不仅能实现代码生成,韵律创作,甚至是多模态AI理解效果惊人。

每一次关键技术取得通用化的突破,都会深刻改变生产方式,并显著提升生产力水平,而「大模型」成为了打通人工智能技术通用性「任督二脉」的关键。智慧眼,作为全球领先的人工智能企业,最近推出了其创新研发的通用大模型——砭石。
AI正在从感知智能、认知智能向决策智能快速迭代演进。
在1.0时代,感知智能中以计算机视觉为代表,即基于深度学习算法,赋能计算机理解数字图像和视频,智慧眼正是在这个时候构建了机器视觉大模型,并在IDC的中国人工智能之计算机视觉应用市场份额排名中进入前七,荣获中国智能科学技术最高奖——吴文俊人工智能科技进步奖。
2.0阶段,认知智能将从认知心理学、脑科学及人类社会历史中汲取灵感,并结合跨领域知识图谱、自然语言处理、因果推理等技术,建立稳定获取和表达知识的有效机制,智慧眼发布了人工智能中台和大数据中台产品,实现了从感知智能到认知智能的跨越。
到了3.0时代,AI+X成为前沿方向,需要采用海量的高质量通用数据训练一个基础的底座,再针对不同的场景,利用少量的专业数据进行微调,实现低成本的AI场景落地。
智慧眼研发了通用大模型砭石,该模型基于严格审核过滤的海量多模态数据训练,通过「预训练+精调」模式带来了新的标准化AI研发范式,实现AI模型在更统一、简单的方式下规模化生产,支持多种任务执行。
大模型生成代码,砭石通过对开源代码数据集进行多次清洗,得到高质量的代码数据集,随后通过预训练和CoT训练等方式,使得大模型具有强大的代码生成和推理能力,极大地提高了软件开发的效率和质量。
大模型写作能力,砭石大模型在更多参数和更复杂的结构基础上,使用海量的通用文本型数据进行预训练,学习了大量通用知识和逻辑,表现出了强大涌现能力和学习能力,生成了富有韵律、节奏和情感表达的诗歌。
砭石大模型基于自然对话方式理解和执行任务,提供多种能力包含文本、图像、视频、音频输入,生成式输出文本信息,具备闲聊和知识问答能力,可以为情感陪伴、政策问答、大数据分析等场景赋能。

三大核心技术赋能,新一代大模型顺势而出

大模型的创新,远不止于模型本身的革新,其更深层次地依赖于人工智能领域中的各项核心技术突破。
在这方面,智慧眼公司拥有显著的优势,其在知识图谱、智能大模型以及隐私计算等关键技术上,都拥有自主研发的核心算法和独立的知识产权,这为通用大模型创新提供了坚实的基础。包括:
  • 在知识图谱方面:公司突破保护隐私的分布式知识迁移和联邦图谱推理,接入差异化的大规模行业数据,构建世界一流的高可信高质量的海量数据知识图谱,为知识图谱缓解大模型幻觉奠定基础。
  • 在智能大模型方面:公司突破了隐私计算条件下的大模型联邦训练、基于知识图谱的大模型知识增强等核心技术,显著提升大模型在专业领域的信息生成准确度。
  • 在隐私计算方面:突破了保护隐私的分布式知识迁移和联邦图谱推理技术,实现对高价值用户的敏感隐私数据的脱敏,真正做到数据的「可用不可见」安全应用,实现分布式知识的融合和基于分布式数据的大模型训练,支撑了用户数据价值的释放。

四大基础模型融合,共同塑造超强通用能力

智慧眼砭石大模型的核心定位是为各行各业注入新的活力,采用完全的分层解耦设计,包括两层:
  • 第一层为砭石通用大模型层,主要包括机器视觉、自然语言理解、多模态和认知4大基础模型,为各种应用场景提供相关的AI基础能力;

  • 第二层为行业大模型,基于通用大模型层,能够整合行业用户的自有数据,训练客户的自有专有大模型。

通过这种分层次的设计,智慧眼砭石大模型不仅提供了广泛的通用能力,还能根据各行业的具体情况,实现高度个性化的赋能。
具体来说,基础模型层面包含:
  • 机器视觉大模型,「为机器植入眼睛与大脑」。此模型通过在大规模图像数据上进行训练,可以实现各种视觉任务,能够进行图像的分割和识别、分析视频等。
  • 自然语言理解大模型,「让机器理解人类语言」。此模型基于数T Token的高质量语料训练而成,能够实现负责的自然语言处理任务。
  • 多模态大模型,「让机器拥有丰富感官」。此模型通过对文本、图片、视频和音频等不同储存信息载体的认知和理解,来模拟人与人之间的交互方式,为创新性应用提供了坚实的基础。
  • 认知大模型,「让机器思考分析决策」。此模型能够适应包括各类传感器等不同类型感知数据源的输入,实现对环境的的理解与分析。
在行业大模型层面,砭石将涵盖诸如医疗、医保、金融、保险、政务、养老、教育多个专业领域,这些大模型的核心价值在于为不同行业的发展提供了强大的赋能。
总结来说,基础大模型致力于攻克技术难题,深入探索通用性与泛化性;而行业大模型则通过深度融合行业数据与知识特性,为特定行业量身打造坚实的基础。
基础大模型为行业大模型的建设提供有力支撑,同时,行业大模型又能够结合实际应用场景与真实数据,为基础大模型的进一步优化提供宝贵的反馈与滋养。
大模型堪称人工智能领域的一座重要里程碑。
展望未来,智慧眼将秉承持续创新的精神,引领AI技术发展浪潮,推动大模型技术如高山流水般汹涌澎湃,广泛覆盖医疗、医保、金融、保险、政务、养老、教育等各行各业,从而为社会发展注入全新的、高质量的生产力。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思国产版Sora到来!视频大模型更上一层楼 | 大模型一周大事一季度国产自行车出口暴增|首席资讯日报让大模型不再「巨无霸」,这是一份最新的大模型参数高效微调综述【首发】天鹜科技完成数千万元Pre-A轮融资,加速蛋白质工程通用大模型商业落地外企社招丨Dräger德尔格,行业全球领导者,15薪,六险一金,多样福利,偏爱留学生今日arXiv最热NLP大模型论文:微软:用大模型分析用户满意度,让智能系统更善解人意独家丨周鸿祎x朱啸虎:没10亿美金闲钱,别碰通用大模型《时空的花朵》&《白》腾讯大模型APP真实测评!七家国产大模型“battle”,元宝顶得住吗?正式投用!关键硬件实现高度国产自主化钉钉发布 AI 搜索!不像百度也不像秘塔,还集齐国产大模型「七龙珠」如何避免文学城账户被封杀?Geoffrey Hinton:用更大模型「预测下一个词」值得全力以赴 | 5Y View打工人、宝妈、学生党都能用上大模型?6款国产大模型实用性测试小红书内测自研大模型「小地瓜」,社交和搜索是落地方向丨Long China 50独家AI早知道|淘天集团自研大模型“淘宝星辰”上线;Gemini Pro1.5向所有人开放;Suno正式发布V3音乐生成模型大模型「上车」,小鹏交出了自己的答卷单个4090可推理,2000亿稀疏大模型「天工MoE」开源无题讲成吉思汗后裔的故事(上)打通智能体「自我进化」全流程!复旦推出通用智能体平台AgentGym4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源李开复提出「PMF 不再适用大模型 AI-First 创业,要追求 TC-PMF」,如何理解?今日arXiv最热CV大模型论文:国产开源视觉大模型InternVL 1.5发布,赶超GPT-4V水准阶跃星辰:大模型「new game」里的新玩家今日arXiv最热大模型论文:大模型都能怎么用?中南大学最新综述:大模型时代的自然语言处理直播预约|对话VAST宋亚宸:聊聊3D生成「通用大模型」时代好人短命;何赛飞分享女人快乐秘籍;真爱在细节开源大模型火了!(附99个大模型微调模型/数据/工具)!​特斯拉中国版FSD或与百度合作/高合最晚将在 5 月初正式复工复产/小红书内测自研大模型「小地瓜」国产自免,即将深陷百药大战Hinton万字访谈:用更大模型「预测下一个词」值得全力以赴小红书内测自研大模型「小地瓜」,社交和搜索是落地方向丨36氪独家大模型的“瘦身”革命:巨头逐鹿轻量化大模型 | 大模型一周大事
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。