Redian新闻
>
商汤大模型全面升级!「商量SenseChat 2.0」大语言模型疯狂上分

商汤大模型全面升级!「商量SenseChat 2.0」大语言模型疯狂上分

公众号新闻



  新智元报道  

编辑:编辑部
【新智元导读】「日日新」寓意「模型迭代速度和处理问题的能力可以日日更新」,面向AGI战略布局的商汤,大模型能力「又日新」。
今天,在商汤科技「大爱无疆·日日新」人工智能论坛上,我们看到升级版的「商汤日日新SenseNova」大模型体系。
而一系列模型和应用也都在最近2-3个月内实现了进一步飞速提升。
最受关注的千亿级参数的语言大模型商汤「商量SenseChat 2.0」,多项能力全面提升,而且搭建了完善的基模型体系与大小模型系统级方案。
  • 突破了大语言模型输入长度的限制
  • 新增地区语言支持(阿拉伯语、粤语等)
  • 推出不同参数量级的模型版本,可适配移动端、云端等不同终端及场景的应用需求
  • 新增知识库接口,基于知识库能力优化模型幻觉


支持超长文本,能力全方位升级

在产品发布环节,商汤科技董事长兼CEO徐立,展示了「商量SenseChat 2.0」强大的超长文本理解能力。面对超过6000词的超长英文文本,不但可以准确理解,提炼、归纳中文概要。并且基于理解,它还可以通过多轮对话形式进行输出。
商量还能完美执行用户的多轮指令,例如按照顺序提出要求1、策划活动2、提供时间计划3、计划整理成表格4、处理表格,它都能够有效执行。
值得一提的是,「商量SenseChat 2.0」还能够理解表格化的信息,并准确提取其中的信息。
如果你需要一份旅行计划,也可以提供描述让「商量SenseChat 2.0」帮你进行生成,甚至可以以表格形式来展示出来。
在传统的文案生成和写作部分,「商量SenseChat 2.0」也完全不让人失望,让人不得不感叹AI的创造力。
我们看到「商量SenseChat 2.0」可以根据事件描述,提取关键信息、理解事件逻辑,并按照要求生成文案和报告。
除了作为工具使用,「商量SenseChat 2.0」还可以成为很好的伙伴,比如它能够理解隐喻。以下是面对同一个问题,商量给出的两种不同角度思考。

AI代码助手:精度超越GPT-3.5

随着在大模型体系在底层技术领域的快速迭代,商汤「日日新SenseNova」大模型体系及模型和应用,已经开始运到大量行业,包括金融、医疗、汽车、程序编写等等方面。其中AI代码助手吸能全面提升,精度超越GPT-3.5。
当我们体验「商量SenseChat 2.0」,发现它也能准确够理解和生成代码,表现出色。

可挂载知识库,专业能力过硬


除了日常办公,在专业领域大模型也是一把好手。
在金融领域,接入「商量SenseChat 2.0」大语言模型能力后,不但能提供投研分析、研报撰写等新功能。
并且挂载金融知识库后,还能100%基于客户的产品说明进行内容问答输出,并实现信息及时更新。
在医疗场景,商汤基于海量医学知识和临床数据打造了中文医疗语言大模型「大医」,提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。
未来也即将支持医学图像、文本、结构化数据等多模态综合分析,并可不断提升医疗语言理解和推理能力,持续赋能医院诊疗效率及患者服务提升。

拥有开放世界理解,解决各种长尾问题

在商汤企业论坛上,徐立还展示了「商量SenseChat 2.0」应对开放世界的理解能力,比如能够理解各类图像信息,并且提供分析和建议。
实际业务应用中,大模型对开放世界的理解,可以用在城市管理等众多行业领域和场景,例如应对城市自行车摆放这类的长尾场景。
面对源源不断的真实世界需求,在智能涌现的全新技术浪潮下,商汤正在以大算力和大模型构建的基础上不断创新,探索人工智能规模化应用和发展的路径。
大模型的根本价值是重构生产力模式,为人工智能产业落地带来范式革新,真正实现「日日新、又日新」。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
第十四章【城事】巴黎市长将重修Châtelet 广场以方便行人大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型PromptBench: 首个大语言模型提示鲁棒性的评测基准UCLA发布SciBench,评估大语言模型的科学问题解决能力我时常漫步在小雨里大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机大语言模型综述全新升级版:85页、600+篇参考文献BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」谷歌I/O开发者大会发布全新大语言模型,反超GPT-4!办公全家桶炸裂升级,还带来了首款折叠屏手机“商量2.0”的进化,站在商汤科技的大模型布局当前马斯克黄仁勋将出席闭门AI会议;传商汤大规模裁员;面壁智能推出大模型LucaChatGPT的朋友们:大语言模型经典论文一次读到吐美元最大的敌人是黄金商汤日日新大模型90天大升级!CEO现场整活,主打突破想象力LangChain:2023年最潮大语言模型应用开发框架大模型爱好者必看:60+大模型全场景落地案例集|QConWhen RS Meets LLM:推荐系统如何从大语言模型中取长补短?面向应用视角的全面综述正式升级!“澳国立中国英才计划”全面升级为2.0——“澳”立职场比 Spark 快 9 倍,超越 ClickHouse,在大语言模型时代构建全新数据平台2024QS排名疯狂上分的澳洲八大,AP/AL/IB申请谁更有优势?大模型爆发!百度智能云千帆2.0全面升级,讯飞星火正式开放ArchGuard Co-mate:一次关于大语言模型与架构治理、架构设计的探索跑步看世界-佩吉Page微软开源TypeChat库,给大语言模型换种提示,一行代码安装微软发布 Guidance 语言,用于控制大语言模型学习生成式大语言模型,东北大学自然语言处理实验室有一堂课深度学习三巨头之一 Yann LeCun:大语言模型带不来 AGI“商汤日日新”大模型体系全面升级,飞速迭代赋能百业日日生新巴黎市长将重修Châtelet 广场以方便行人大语言模型的多语言机器翻译能力分析14部门重磅发文,医疗反腐全面升级!剑桥、腾讯AI Lab等提出大语言模型PandaGPT:一个模型统一六种模态战国故事《定风波》卷二(1):惊梦性能超越GPT-4!谷歌推出大语言模型PaLM 2,全面升级Bard反击ChatGPT|环球科学要闻
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。