讯飞星火大模型抢先进入「升级战」:中国版ChatGPT来了
ChatGPT引爆的大模型浪潮还在继续。
据不完全统计,今年3月以来,国内已有几十家企业入局这一赛道,不少已经发布相关产品。这其中,既包含阿里这样的互联网大厂,也有以商汤、出门问问为代表的AI企业,更有王小川、王慧文等大佬重新回归杀入这一赛道。
讯飞入局之时,市场上已有不少产品。但星火的发布仍然令人眼前一亮。从企业端到个人端,不少用户对星火大模型的体验是,“几乎是国内目前市场上与ChatGPT最接近的大模型产品之一。”
在“星火”发布一个月后的今天,科大讯飞如期发布“讯飞星火认知大模型”的新进展。这次发布会上,“星火”不仅展示了知识问答、数学、多轮对话等能力的提升,同时还发布了星火APP、星火语伴等产品。
应用落地上,星火语伴APP、医疗诊后康复管理平台、羚羊工业互联网平台、讯飞听见智慧屏等产品,均已开放了讯飞星火开发接口,讯飞将携手开发者共建“星火”生态。
30天的全新升级
一个月前,科大讯飞交出了其在大模型领域的“答卷”:星火。
“星火”大模型一经发布,便引发业内热议。彼时,科大讯飞董事长刘庆峰公布了星火年内的三次升级时间点,其还表示“今年科大讯飞持续升级大模型,10月24日要在中文上超越ChatGPT,在英文上要达到跟它相当的水平”,外界也称讯飞星火是国内唯一一家明确给出升级时间的大模型厂商。
如今,第一次升级如期而至。6月9日,讯飞正式发布星火认知大模型V1.5,在此前基础上,“星火”在开放式知识问答、逻辑推理和数学能力、多轮对话三大综合能力方面都实现升级。其中,知识问答能力提升24%,逻辑推理能力提升10%。
大模型带来的“智慧涌现”现象,正逐步影响人们的日常工作和生活。在科大讯飞看来,作为一个对话式AI系统,大模型未来的发展将呈现出六大趋势,包括改变信息分发和获取模式、内容生产模式、人机交互模式等。
这其中,人机交互的重构无疑是最令人兴奋的技术革新之一。万物互联时代,通过算法重构人机交互的方式,人机之间可能实现多模态“类人”的自然对话,打造个性化助手,必然会进一步降低学习成本,提高交互效率。
发布会现场,星火还发布了APP产品,实现大模型在手机端交互体验提升。与此同时,200+小助手正式上线星火APP,打造全新Prompt“应用开发”场景,深入职场、生活、出行、写作等用户高频场景,不仅支持个性化定制,还支持创作发布和分享。
其中“星火助手创作中心”的上新,令人眼前一亮。在现场,讯飞要求它“作为一名婚礼主持人,写一段欢快幽默的婚礼致辞,要引经据典,来祝福郭靖和黄蓉这对新人。”结果,星火的出色发挥令现场掌声不断。
从时间上看,讯飞正式参与到大模型的浪潮中并不算晚,但从最初发布到如今的快速升级,始终备受关注,最重要的因素,或许是其产品一经发布展示出的效果,超出人们对类ChatGPT产品的预期。
显然,这样一款产品的出现,并非一日之功,其背后是讯飞过去二十余年的技术积累。24年前,中文语音市场被国际巨头控制,国内市场陷入“卡脖子”状态,当时科大讯飞提出要让中国语音技术做到全世界最好。
这些年间,科大讯飞也曾经历过困境,但刘庆峰和讯飞团队始终保持着创业初心,努力点亮火把。
24年后的今天,中国企业正在夺回中文语音市场的“话语权”,如今,随着类ChatGPT应用带来的通用人工智能曙光的出现,新一轮星火正在被点燃。
而作为中文语音市场的“领队”,讯飞一直走在技术的前沿领域,从不吝惜研发投入。据讯飞相关数据显示,2022年,讯飞研发投入33.6亿元,占营收的比例为17.83%;研发人员达9281人,占公司总人数比例为61.68%。
大模型的出现不仅点燃了企业对通用人工智能的期待,也受到官方高度重视。
实际上,早在2021年11月,中国信通院就已经成立人工智能工程化推进委员会大模型工作组,至今已吸纳产学研用各方大模型成员单位100余家,共同推动大模型标准体系、评估测试等方面的建设。
今年5月底,在杭州通用人工智能论坛暨AIIA人工智能产业发展大会的大模型分论坛上,科大讯飞被列为工信部下设大模型工作组副组长单位。
从产品到应用
大模型产品的升级不足为奇:无论是OpenAI的ChatGPT,还是国内的大模型产品,随着训练数据规模的提升,产品升级是一件自然而言的事情,同时,这也正是大模型赛道竞争日趋白热化的原因。
如今,随着各家产品逐渐浮出水面,大模型已然进入关键的“升级战”,作为可以在市面上“掰手腕”的产品,讯飞则是其中之一。
从星火升级的发布会看,除数学能力以外,其在逻辑推理、知识问答等方面的能力也正在逼近ChatGPT。至于数学,在5月星火的发布会上,刘庆峰就曾表示星火认知大模型在文本生成、数学能力等方面已超ChatGPT。
适逢高考,莘莘学子也迎来人生第一场大考。高考第一天过后,搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。在测试中,搜狐科技选取了高考试卷前10道填空题,让包括星火在内的五家大模型进行了回答。结果显示,讯飞星火答对了5题,正确率50%,正确率在同等大模型中最高。
当然,星火的目标不止于产品能力的升级。在积极训练大模型的同时,星火还在教育、医疗等垂直领域带来不少实打实的产品。
去年12月,ChatGPT刚刚引发业内关注之时,科大讯飞便启动了“1+N”认知大模型专项攻关,其中1当然是指通用认知大模型,而N正是指在教育、医疗等领域的落地。
在5月份星火认知大模型的发布会上,刘庆峰也表示,“今天要看一个大模型系统到底好不好,首先要看它是不是能解决刚需、是不是真的有用,而不是一个简单的单点测试”。
实际上,在此前发布会上,讯飞已经展示过星火在教育、医疗、语音等多个领域的应用。以用户熟悉的讯飞听见为例,大模型加持应用后,其能通过AI分析文字内容,可以一键生成摘要、宣传文案、新闻稿件等特定需求的内容。
本次发布会,星火进一步展示了在学习、医疗、办公等领域的最新成果。
医疗方面,讯飞智医助理已经优先实现规模化应用。测试显示,讯飞智医助理得分456分,超过96.3
%人类考试,是全球首个通过国家级执业医师测试的产品。相关数据显示,我国每年出院患者2.5亿人次,但中级以上医师仅188万,绝大部分患者出院即脱管。
基于这一现象,讯飞推出诊后康复管理平台,科大讯飞总裁吴晓如介绍,数据显示,医生的管理效率提升10倍以上,患者康复过程中的随访率和咨询回复率达到100%,出院患者满意度达到98%以上。目前,这一平台已经得到星火认知大模型的加持,人机耦合保障患者安全,实现7*24小时全天候应答。
此外,基于大模型的讯飞听见智慧屏产品可以实现AI淬炼会议内容,自动生成待办事项等功能,将大模型赋能于会议室超级智能终端,实现字音同步、可灵活转写翻译,会议纪要、待办事项均可一键生成。
中国版ChatGPT的进化之路
从一个月间外界对星火的积极反馈,再到当下“星火”的如期升级,不难看出,星火正在成为中国最接近ChatGPT的大模型之一。
在5月份的发布会上,刘庆峰就曾表示,星火将于10月底整体赶ChatGPT。彼时,星火认知大模型刚刚问世,外界对这一说法持有不少怀疑态度。但随着星火大范围内测,用户在亲身体验后,也越来越期待这一关键性时刻的到来。
如今,经过一次全方位升级后的星火和ChatGPT的差距越来越小,基于过去的技术积累和成建制团队的搭建,星火目前每一个模块均已实现自主研发,软硬件平台都是在国产可靠平台上运行。
但更为重要的是,星火并不是头也不回地蒙眼狂奔。如前所述,在发展模型能力的同时,星火也积极探索大模型的落地应用场景。
刘庆峰也曾坦言:“科大讯飞一直认为,人工智能的发展绝不是单个企业和单个科研机构的事情,而是需要大家合作共赢的。”
业内广泛认为,ChatGPT的出现是AI界的“iPhone时刻”,客观来看,也确实吸引了广泛开发者。实际上,讯飞原本在开放平台已沉淀多年。如今,其正在通过增加星火认知大模型,以期赋能开发者打造更具价值的AI应用。
截至5月份,讯飞开放平台现在有400多万实名认证的开发者、500多万的合作伙伴。随着星火大模型的发布,讯飞开放平台未来可以降低技术开发门槛,帮助更多开发者完成诸多智慧涌现的工作,同时集成越来越多的专业插件,让生态体系更加繁荣。目前,讯飞已经与36个行业、超3000家企业达成明确合作意向。
随着“2023 科大讯飞AI星火营生态计划”的启动,讯飞或将为千行百业开发者提供技术赋能、方案打造、赛事运营、商业运作、创业扶持等多维度资源,推动大模型的应用落地。
值得一提的是,在今日的发布会上,星火认知大模型开发接口也正式发布,包括七大维度以及200+小助手对应的能力全部开放。同时,星火支持30分钟快速集成,满足PC等多终端接入;提供SFT微调的定制优化服务及版本持续升级。
写在最后
涌现一词,最初由一般系统论之父贝塔朗菲提出,是指个体简单规则起步、却造就无法预知复杂结果的现象。
美国心理学家约翰霍兰德在其经典著作《涌现:从混沌到秩序》中指出,“涌现系统处处皆是:蚂蚁社群、神经网络、免疫系统、互联网乃至世界经济等,只要整体行为比组成个体的简单行为错综复杂,都可称为涌现。”
大模型的问世,加快了智能涌现的脚步,基于涌现智慧的时代正在到来,中国科技企业们自然不会错过这一时机,讯飞星火正是其中之一。
从产品能力升级、产品应用到共建生态,基于多年技术积累,讯飞在大模型领域正有序快速迭代。
值得一提的是,8月15日,“星火”大模型聚焦于代码能力升级以及多模态交互能力提升的二次迭代,或许值得期待。
微信扫码关注该文公众号作者