大模型混战时代,看云从科技如何打造场景落地风向标?
当前,百花齐放的大模型生态,已经到了实战检验的时刻。
年初以来,以ChatGPT为代表的认知大模型掀起了一场新的技术革命,但大模型的理解能力、较高的训练成本以及产业结合问题使得实际落地应用成为一大难题。
8月21日,有AI“四小龙”之称的云从科技正式发布了从容大模型1.5版本,为实现更好地场景落地提供了良好范例。
再进化
大模型前景固然美好,但不能只停留在讲故事层面,加快落地才是第一要务。
当前各大厂商的大模型大多是公有大模型,缺乏行业深度,难以满足业务场景的垂直性和专业性需求。此外,较高的投资成本也让其在落地层面遥遥无期。
而从容大模型1.5版本已经走在了前面。
云从科技本次版本升级重点聚焦在轻量化的行业大模型上,包含十亿级、百亿级、千亿级多种模型规格,参数量为130亿(13B),主要从千亿大模型中蒸馏产生。
这样既降低了算法推理的服务器需求和门槛,提升了算法推理的性能,在最终效果上也与千亿参数级大模型差距较小,在特定场景的表现甚至超过了ChatGPT和GPT4。
数据显示,在全球大模型综合评测(C-Eval)中,从容大模型1.5版本位居百亿级第1位,总榜单第4位。在52类测试指标中有43类超过ChatGPT、17类超过GPT-4。如此成绩距离从容大模型的发布仅仅只过去了2个多月。
能取得这样的成绩,云从科技董事长周曦认为,不同行业都有自身的大模型,没有强大的基础大模型,直接去做行业大模型不具备长期持续的生命力。如果想让行业大模型足够实用,便需要重新训练基础大模型。行业大模型在产业上要想真正做到量产实用,效率及成本控制必须是极致的,极致优化下也必须要掌握基础大模型,否则便是纸上谈兵。
对于企业而言,采用行业大模型的核心诉求,是在提升生产和经营效率的同时,也能够降低其使用成本。对于从容大模型这样专注于行业的轻量级大模型,低成本、高效率以及较强算法效果优势也为大模型的落地实践敲开了一扇窗。一味烧钱支撑的高成本运营大模型,在实际应用上注定困难重重。
从容大模型1.5版本还对行业做了定向优化,提高了金融、政务、零售、交通等行业的数据集占比,并重点训练了行业的下游任务。不仅优化了资源配置,提高了资源使用效率,还能与企业业务结合的更紧密。
大模型的上下文长度也是本次1.5版本的亮点。作为衡量大模型性能的重要指标之一,较长的上下文长度能够提供更加丰富的语义信息,帮助模型更好地理解指令,把握语言上下文的相关性,并生成更加准确连贯的文本。
本次从容大模型1.5版本的上下文长度达到了32K Tokens,超过了全球绝大部分模型的2k至8k水平,已经与GPT4模型的最高参数相当。
此外,从容大模型对中文上下文进行了深度优化,一个中文汉字平均仅占0.7 Tokens,这使得从容大模型1.5版本支持的上下文长度达到惊人的4.5万字,极大提升了大模型理解的深度和广度。
在AIGC浪潮下,云从科技在起跑线上已经取得了领先。
抢占AIGC制高点
大模型快速的崛起意味着AIGC浪潮全面铺开,不少研究报告将其比作上世纪90年代的互联网浪潮,甚至还被认为是人类的第四次工业革命。
毫无疑问的是,大模型受到如此重视,关键是对生产效率的极大提升。尤其是GPT4在专业和学术领域的惊艳表现,对各行各业都有巨大且深刻的影响。
据东方财富提供的数据,到2030年,办公室和行政人员劳动任务的自动化程度将达到75%,效率提升至原来的4倍。软件开发和会计岗位的自动化程度也将达到50%,效率提升至原来的2倍。
对于人工智能赛道,AIGC成为了赛道的起爆点,行业将进入快速发展期。据艾瑞咨询测算,2021年人工智能核心产业规模为1998亿,相关产业规模为7695亿。随着产业渗透的提升,预计2026年核心产业规模将达到6050亿,复合增速达24.8%;同期所带动的产业规模为2.1万亿,复合增速达22.3%。
随着AIGC在各行业的快速应用,诸如传媒、金融、通信、游戏等行业将迎来颠覆式变革,行业大模型也迎来了史无前例的机遇期。
云从科技选择进军大模型,可以说是正当其时。正如当年切入计算机视觉领域,赶上了人工智能第一次发展浪潮,进军大模型同样身处时代红利。
作为人机协同操作系统及方案提供商,云从科技的人机协同操作系统运作机制与大模型的学习训练理念有异曲同工之处。
该系统依托云从科技智能感知、人脸识别、NLP等核心技术和系统内置的各领域专业知识和经验,通过对具体业务数据、硬件设备和软件应用的链接,构建了人与机器间的交互入口,并为开发者设计智能应用提供支持,最终实现对行业的赋能。
因此,云从科技在研发行业大模型时,基于以前沉淀的人工智能技术和经验,会更加得心应手。在大模型的研发效率、性能以及最终落地进程上相较于同行的优势面更大。
而要做到大模型的领先,关键在于研发。近年来,云从科技一直保持着高强度的研发投入,甚至是超过营收的投入。
2023年上半年云从科技的研发费用为1.98亿,超过营业收入的1.64亿,在职研发人员为522人,占员工总数的比重超过了60%。
与此同时,云从科技的“3个支点+6大研发中心”的技术研发架构,保证了技术前沿性与项目落地。是公司技术研发的中流砥柱,也是推动大模型快速落地的关键所在。
其中3个支点指与重庆智能绿色研究院、上海交通大学、上海脑科学与类脑研究中心联合实验室的研发合作;6大研发中心是云从科技位于广州、重庆、上海、苏州、成都及芜湖六地的研发中心。
从大模型的人工智能属性和下游市场应用看,从容大模型生态将成为云从科技业绩的新增长点。
第三增长极
云从科技在人工智能领域有很深的技术积淀,外加创始团队背景和中科院“国家队”品牌背书,使得云从科技在业内有着较强的影响力。
早期云从科技孵化于中科院,创始人周曦资历深厚,曾带领团队多次斩获世界模式识别、智能识别大赛冠军,并入选“中国科学院百人计划”,建立了中科院人脸识别团队。此外云从科技还多次参与制定国家级标准,有人工智能“国家队”之称。
在云从科技具体业务上,主要包括人机协同操作系统和人工智能解决方案两大类,其中人机协同操作系统是云从科技的集大成之作,是业务开展的底层技术支撑平台,主要以软件服务为主。后者则是软硬件一体的多场景解决方案。
当前云从科技已经形成了业务上的生态闭环,以人机协同操作系统为核心,通过构建从感知到认知再到决策的一体化技术服务体系,为多个行业打造人工智能解决方案。
在细分领域上云从科技主要覆盖智慧治理、智慧金融、智慧出行、智慧商业四大应用场景,2022年板块营收分别为4.21亿、0.78亿、0.14亿和0.09亿,占比为80%、14.77%、2.65%和1.8%。
其中智慧治理所占营收比重较大。也是云从科技最为核心的业务场景。智慧治理即智慧城市,所涉及领域较广,主要围绕公安政法、交通、文教卫等政府和大型企事业客户。
可以看出,云从科技产品的主要应用场景也与大模型的落地方向的契合程度较高。一方面基于此前对多个领域的深耕,大模型能够针对不同行业特点更好地满足不同客户的差异化或者定制化需求;同时大模型生态也能和现有业务起到互补作用,凭借此前客户资源积累也有利于大模型的应用和推广。
当前从容大模型在行业落地上已经迈出了重要一步。在数字化运营、智算中心建设、游戏制作、智能运维、交通管理等方面与生态伙伴展开了深入合作。如同此前打造的生态合作伙伴计划“千帆计划”,意味着大模型的落地进程进一步加速。
例如在游戏方面通过与游族网络进行合作,致力于游戏的开发发行;与佳都科技、重庆城市交通开发投资集团共同开发了城市交通大模型;与金融行业头部客户和方案提供商共同研发金融行业大模型等。
综合来看,在国家大力倡导数字经济和AIGC浪潮下,云从科技在百花争艳的大模型舞台上已经走到了行业的前面。随着落地进程的加快,云从科技的引领效应正在逐步显现。
THE END
华商韬略旗下公众号,欢迎关注
◆◆◆
“点赞”是喜欢,“在看分享”是真爱
微信扫码关注该文公众号作者