Redian新闻
>
科大讯飞刘庆峰:星火大模型已在三个方面超越ChatGPT

科大讯飞刘庆峰:星火大模型已在三个方面超越ChatGPT

公众号新闻


内容来源:本文来自“讯飞星火认知大模型”成果发布会。
 
轮值主编 | 智勇  责编 | 青羊
第  7412  篇深度好文:2219 字 | 6 分钟阅读

AI

笔记君说:


今日科大讯飞召开“讯飞星火认知大模型”成果发布会。

科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪,从文本生成、语言理解、知识问答、数学能力、逻辑推理、代码生成、多模态输入及生成7个维度演示了大模型的通用能力,以及认知大模型与讯飞现有产品结合的商业应用成果。

国内认知大模型的最高水平是什么样?一起来看看。

一、认知大模型的七个能力维度


自从去年11月OpenAI推出ChatGPT以来,认知大模型技术在全球掀起了人工智能的全新浪潮,认知大模型的出现不亚于PC或者互联网的诞生。


通过统一的大模型学习后,系统具备了像人类一样触类旁通的能力,可以在跨领域形成良好表现,认知大模型已经实实在在开启了通用人工智能的曙光,星星之火开始出现。


目前,国内通用大模型的水平如何?


我们不得而知,但是讯飞的认知大模型已经具备了7大通用能力,在教育、办公、汽车、数字员工等多个领域都能落地应用,并且在文本生成、知识问答、数学能力三大能力上已超越ChatGPT。


1.长文本生成能力


刘聪现场用星火认知大模型生成了一段欢迎词,展示了大模型的文本生成能力。


为了测试不同文本类型的生成能力,刘聪还让星火认知大模型生成了邮件、故事、中英品宣文案等文字内容。


认知大模型,生成了一段孙悟空和奥特曼的故事,还使用语音朗读了这段现场生成的小故事。


所有内容都是大模型随机生成的,即使是同样的关键词和描述,每次生成的内容也是不同的。星火认知大模型在中文文本生成方面的能力已经超越了ChatGPT,英文方面达到了4.29分,而ChatGPT是4.48分。


2.语言理解能力


科大讯飞通过两个例子,演示了大模型在语法检查和语义理解上的成果。


在输入一段存在单词拼写错误、单复数错误、时态错误等问题的英文段落后,星火认知大模型迅速生成了一段纠正所有错误的文字。


展示语义理解能力时,刘庆峰以“俗话说男子汉大丈夫宁死不屈,但俗话又说男子汉大丈夫能屈能伸”为例,测试了大模型是否能准确理解这两句话背后的含义。


此外,对同一句话在不同语境中的不同理解,大模型也给出了准确的回答。



3.知识问答


大模型的知识问答能力包括生活常识类、科学知识、工作技巧、医学知识等。比如,在医疗领域,大模型将不仅成为医生的助手,还会成为每个人的健康助手。


后续更多科普知识也会被融入到大模型中。在中国科学院支持下,大模型将持续不断学习更多科学资料,不断提升科学问答能力。


4.逻辑推理


为了测试星火大模型是否真的可以理解人类提问,刘庆峰通过常识理解和故事编辑两种方式进行了演示。


现场问大模型“孔子在2008年奥运会上发表了什么讲话?”大模型基于历史和常识判断出孔子不可能出现在奥运会现场。让大模型以此为主题生成一个故事时,它则从创作维度根据给出的提示编辑生成了一个小故事。


5.数学能力


数学能力一定意义上代表了认知大模型通用能力的认知水平,星火认知大模型在数学能力方面遥遥领先。


从基础计算到三角形求度数再到应用题,星火认知大模型都在现场演示中给出了准确答案。


6.代码能力


发布会现场星火认知大模型进行了一小段“找出1到100之间的质数并输出结果”代码生成的演示。


代码生成能力主要针对工业互联网和企业内部使用,星火认知大模型仍在不断训练中,未来两到三个月代码运行能力将有很大提升。


7.多模态输入和表达能力


除了前文已经提到过的语音识别和朗读功能,发布会中还展示了大模型的图文输入和理解能力,不仅可以把英文菜单翻译为中文,还可以对菜单里的菜名进行解释,描述菜品的味道。


这一功能不仅可以应用在简单的图文翻译中,也可以成为旅行助手,在提供翻译功能的同时,介绍不同名胜古迹背后的含义和历史故事。


更值得一提的是,星火认知大模型还可以根据文字直接生成视频内容,无论是声音、虚拟人形象、唇型、手势还是视频背景都由大模型实时生成。


后续,星火认知大模型完善的方向如下:进一步提升大模型的开放式问答和多轮对话能力;实现代码生成能力升级,并将多模态交互能力开放给客户;全面实现通用模型对标ChatGPT等。



二、四个领域,取得落地成果


在教育领域,一直以来,作文提升都是教学中的一大难点,以批改为例,找出病句、好句、给出评语,一篇文章最少需要老师用30分钟才能完成。


而星火大模型的语言能力和学习机结合,可以对作文快速进行深度理解,自动生成评语和范文。


在办公领域,大模型升级产品,帮助智慧办公迈入了全新阶段,可以满足语音转写、会议记录等多语种翻译等多种办公需求,助力职场人提升工作效率。


在汽车领域和数字人领域,大模型和产品及业务进行全面结合,比如虚拟人智能交互机现已有1000多个虚拟形象资产、300多个专业声音、30多万用户自定义音库,可以提供更加自动化、个性化的数字员工服务,实现24小时不打烊营业。


三、中外大模型能力差距争议


追赶OpenAI首先需要一套科学系统的评测体系。


刘庆峰认为,认知大模型刚刚起步,还在快速成长和迭代过程中。


让这次智慧涌现的认知智能解决社会刚需,需要一套脚踏实地的科学系统的评测体系。


在认知大模型还在快速迭代中,如果只是找单点例子来证明某个系统的强弱,是没有意义的。


 *文章为作者独立观点,不代表笔记侠立场。


左战略、右组织,扫码成为笔记侠的朋友

领取10万字+的战略、组织干货合集,迭代你的赚钱思路

分享、点赞、在看,3连3连

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
绿研院日报 | 刘庆峰:通用人工智能的意义比互联网诞生还要大架构师要了解大模型的不足:科大讯飞AI研究院副院长聊GPT大模型混战:科大讯飞不能输的一战科大讯飞:6月9日发布星火认知 AI 大模型 V1.5,同步上线配套 App掘金大模型 科大讯飞押注专业领域苹果再面临欧盟反垄断审查,公众号可带货视频号小店,科大讯飞辟谣大模型套壳GPT,许冉将出任京东CEO,这就是今天的其他大新闻!马斯克已选定新任Twitter CEO/科大讯飞否认套壳 ChatGPT/Apple ID 出现大面积故障【城事】巴黎市长将重修Châtelet 广场以方便行人绿研院日报 | 刘庆峰:AI服务健康中国“非用不可”。早鸟报|公众号可带货视频号小店;科大讯飞回应“套壳”ChatGPT;京东集团CEO徐雷退休...讯飞星火大模型V1.5发布 刘庆峰:我们要追赶OpenAI科大讯飞年营收188亿:将于5月6日发布认知大模型“星火”绿研院日报 | 刘庆峰:把认知大模型的“智慧涌现”掌握在中国人手里科大讯飞招聘:校招与社招全职,大模型/NLP/计算机视觉/3D数字人等方向美国普林斯顿大学,建筑博览女子出上联:银枪虽利,难破千年草地,男子对出下联,女子红了脸科大讯飞发布星火认知大模型,预计10月底赶超ChatGPT!现场实测,三大能力超越ChatGPT,科大讯飞「星火」大模型如约而至巴黎市长将重修Châtelet 广场以方便行人科大讯飞公布讯飞星火认知大模型;羊了个羊涉“欺骗误导强迫用户”被通报 ;苹果手机或被欧盟禁售……杉桧花粉飞,运载火箭坠绿研院日报 | 刘庆峰:AI助力全球命运共同体更快构建录音直接成稿!一秒批改作文!科大讯飞星火认知大模型三大能力超过ChatGPT周鸿祎谈大模型扎堆:现在说超越ChatGPT的叫吹牛讯飞星火大模型抢先进入​「升级战」:中国版ChatGPT来了自称中文水平超越ChatGPT,科大讯飞发布星火认知大模型!!!讯飞发布星火认知大模型 刘庆峰:10月底整体赶超ChatGPT京东集团CEO徐雷退休;浦发银行回应员工“降薪”;理想CFO李铁年薪过亿;科大讯飞否认套壳ChatGPT...冬日重叹温泉南澳散记 (增订本) :第二十六章:我的中文学生(上)科大讯飞高建清:「底座+能力+应用」是科大讯飞AIGC整体布局的三层架构第一个超越ChatGPT的开源模型来了?网友并不买账科大讯飞正式发布星火认知大模型,刘庆峰:多题型可解析数学能力已领先 ChatGPTGPT作文能力比拼:GPT3.5、GPT4、百度文心一言、讯飞星火周鸿祎:现在说超越ChatGPT的叫吹牛
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。