Redian新闻
>
商汤大模型全面升级!「商量SenseChat 2.0」大语言模型疯狂上分

商汤大模型全面升级!「商量SenseChat 2.0」大语言模型疯狂上分

公众号新闻



  新智元报道  

编辑:编辑部
【新智元导读】「日日新」寓意「模型迭代速度和处理问题的能力可以日日更新」,面向AGI战略布局的商汤,大模型能力「又日新」。
今天,在商汤科技「大爱无疆·日日新」人工智能论坛上,我们看到升级版的「商汤日日新SenseNova」大模型体系。
而一系列模型和应用也都在最近2-3个月内实现了进一步飞速提升。
最受关注的千亿级参数的语言大模型商汤「商量SenseChat 2.0」,多项能力全面提升,而且搭建了完善的基模型体系与大小模型系统级方案。
  • 突破了大语言模型输入长度的限制
  • 新增地区语言支持(阿拉伯语、粤语等)
  • 推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求
  • 新增知识库接口,基于知识库能力优化模型幻觉


支持超长文本,能力全方位升级

在产品发布环节,商汤科技董事长兼CEO徐立,展示了「商量SenseChat 2.0」强大的超长文本理解能力。面对超过6000词的超长英文文本,不但可以准确理解,提炼、归纳中文概要。并且基于理解,它还可以通过多轮对话形式进行输出。
商量还能完美执行用户的多轮指令,例如按照顺序提出要求1、策划活动2、提供时间计划3、计划整理成表格4、处理表格,它都能够有效执行。
值得一提的是,「商量SenseChat 2.0」还能够理解表格化的信息,并准确提取其中的信息。
如果你需要一份旅行计划,也可以提供描述让「商量SenseChat 2.0」帮你进行生成,甚至可以以表格形式来展示出来。
在传统的文案生成和写作部分,「商量SenseChat 2.0」也完全不让人失望,让人不得不感叹AI的创造力。
我们看到「商量SenseChat 2.0」可以根据事件描述,提取关键信息、理解事件逻辑,并按照要求生成文案和报告。
除了作为工具使用,「商量SenseChat 2.0」还可以成为很好的伙伴,比如它能够理解隐喻。以下是面对同一个问题,商量给出的两种不同角度思考。

AI代码助手:精度超越GPT-3.5

随着在大模型体系在底层技术领域的快速迭代,商汤「日日新SenseNova」大模型体系及模型和应用,已经开始运到大量行业,包括金融、医疗、汽车、程序编写等等方面。其中AI代码助手吸能全面提升,精度超越GPT-3.5。
当我们体验「商量SenseChat 2.0」,发现它也能准确够理解和生成代码,表现出色。

可挂载知识库,专业能力过硬


除了日常办公,在专业领域大模型也是一把好手。
在金融领域,接入「商量SenseChat 2.0」大语言模型能力后,不但能提供投研分析、研报撰写等新功能。
并且挂载金融知识库后,还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。
在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型「大医」,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。
未来也即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,持续赋能医院诊疗效率及患者服务提升。

拥有开放世界理解,解决各种长尾问题

在商汤企业论坛上,徐立还展示了「商量SenseChat 2.0」应对开放世界的理解能力,比如能够理解各类图像信息,并且提供分析和建议。
实际业务应用中,大模型对开放世界的理解,可以用在城市管理等众多行业领域和场景,例如应对城市自行车摆放这类的长尾场景。
面对源源不断的真实世界需求,在智能涌现的全新技术浪潮下,商汤正在以大算力和大模型构建的基础上不断创新,探索人工智能规模化应用和发展的路径。
大模型的根本价值是重构生产力模式,为人工智能产业落地带来范式革新,真正实现「日日新、又日新」。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
战国故事《定风波》卷二(1):惊梦BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」“商汤日日新”大模型体系全面升级,飞速迭代赋能百业日日生新“商量2.0”的进化,站在商汤科技的大模型布局当前商汤日日新大模型90天大升级!CEO现场整活,主打突破想象力比 Spark 快 9 倍,超越 ClickHouse,在大语言模型时代构建全新数据平台PromptBench: 首个大语言模型提示鲁棒性的评测基准ChatGPT的朋友们:大语言模型经典论文一次读到吐性能超越GPT-4!谷歌推出大语言模型PaLM 2,全面升级Bard反击ChatGPT|环球科学要闻UCLA发布SciBench,评估大语言模型的科学问题解决能力大模型爱好者必看:60+大模型全场景落地案例集|QCon正式升级!“澳国立中国英才计划”全面升级为2.0——“澳”立职场LangChain:2023年最潮大语言模型应用开发框架【城事】巴黎市长将重修Châtelet 广场以方便行人大模型爆发!百度智能云千帆2.0全面升级,讯飞星火正式开放我时常漫步在小雨里ArchGuard Co-mate:一次关于大语言模型与架构治理、架构设计的探索跑步看世界-佩吉Page2024QS排名疯狂上分的澳洲八大,AP/AL/IB申请谁更有优势?第十四章微软发布 Guidance 语言,用于控制大语言模型谷歌I/O开发者大会发布全新大语言模型,反超GPT-4!办公全家桶炸裂升级,还带来了首款折叠屏手机大语言模型综述全新升级版:85页、600+篇参考文献学习生成式大语言模型,东北大学自然语言处理实验室有一堂课巴黎市长将重修Châtelet 广场以方便行人大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型剑桥、腾讯AI Lab等提出大语言模型PandaGPT:一个模型统一六种模态美元最大的敌人是黄金深度学习三巨头之一 Yann LeCun:大语言模型带不来 AGI马斯克黄仁勋将出席闭门AI会议;传商汤大规模裁员;面壁智能推出大模型LucaWhen RS Meets LLM:推荐系统如何从大语言模型中取长补短?面向应用视角的全面综述大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机14部门重磅发文,医疗反腐全面升级!大语言模型的多语言机器翻译能力分析微软开源TypeChat库,给大语言模型换种提示,一行代码安装
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。