国际科技财经博客移民网络热点娱乐民生时事公众号

>

商汤大模型全面升级！「商量SenseChat 2.0」大语言模型疯狂上分

商汤大模型全面升级！「商量SenseChat 2.0」大语言模型疯狂上分

公众号新闻

2023-07-07 09:07

新智元报道

编辑：编辑部

【新智元导读】「日日新」寓意「模型迭代速度和处理问题的能力可以日日更新」，面向AGI战略布局的商汤，大模型能力「又日新」。

今天，在商汤科技「大爱无疆·日日新」人工智能论坛上，我们看到升级版的「商汤日日新SenseNova」大模型体系。

而一系列模型和应用也都在最近2-3个月内实现了进一步飞速提升。

最受关注的千亿级参数的语言大模型商汤「商量SenseChat 2.0」，多项能力全面提升，而且搭建了完善的基模型体系与大小模型系统级方案。

突破了大语言模型输入长度的限制
新增地区语言支持（阿拉伯语、粤语等）
推出不同参数量级的模型版本，可适配移动端、云端等不同终端及场景的应用需求
新增知识库接口，基于知识库能力优化模型幻觉

支持超长文本，能力全方位升级

在产品发布环节，商汤科技董事长兼CEO徐立，展示了「商量SenseChat 2.0」强大的超长文本理解能力。面对超过6000词的超长英文文本，不但可以准确理解，提炼、归纳中文概要。并且基于理解，它还可以通过多轮对话形式进行输出。

商量还能完美执行用户的多轮指令，例如按照顺序提出要求1、策划活动2、提供时间计划3、计划整理成表格4、处理表格，它都能够有效执行。

值得一提的是，「商量SenseChat 2.0」还能够理解表格化的信息，并准确提取其中的信息。

如果你需要一份旅行计划，也可以提供描述让「商量SenseChat 2.0」帮你进行生成，甚至可以以表格形式来展示出来。

在传统的文案生成和写作部分，「商量SenseChat 2.0」也完全不让人失望，让人不得不感叹AI的创造力。

我们看到「商量SenseChat 2.0」可以根据事件描述，提取关键信息、理解事件逻辑，并按照要求生成文案和报告。

除了作为工具使用，「商量SenseChat 2.0」还可以成为很好的伙伴，比如它能够理解隐喻。以下是面对同一个问题，商量给出的两种不同角度思考。

AI代码助手：精度超越GPT-3.5

随着在大模型体系在底层技术领域的快速迭代，商汤「日日新SenseNova」大模型体系及模型和应用，已经开始运到大量行业，包括金融、医疗、汽车、程序编写等等方面。其中AI代码助手吸能全面提升，精度超越GPT-3.5。

当我们体验「商量SenseChat 2.0」，发现它也能准确够理解和生成代码，表现出色。

可挂载知识库，专业能力过硬

除了日常办公，在专业领域大模型也是一把好手。

在金融领域，接入「商量SenseChat 2.0」大语言模型能力后，不但能提供投研分析、研报撰写等新功能。

并且挂载金融知识库后，还能100%基于客户的产品说明进行内容问答输出，并实现信息及时更新。

在医疗场景，商汤基于海量医学知识和临床数据打造了中文医疗语言大模型「大医」，提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力。

未来也即将支持医学图像、文本、结构化数据等多模态综合分析，并可不断提升医疗语言理解和推理能力，持续赋能医院诊疗效率及患者服务提升。

拥有开放世界理解，解决各种长尾问题

在商汤企业论坛上，徐立还展示了「商量SenseChat 2.0」应对开放世界的理解能力，比如能够理解各类图像信息，并且提供分析和建议。

实际业务应用中，大模型对开放世界的理解，可以用在城市管理等众多行业领域和场景，例如应对城市自行车摆放这类的长尾场景。

面对源源不断的真实世界需求，在智能涌现的全新技术浪潮下，商汤正在以大算力和大模型构建的基础上不断创新，探索人工智能规模化应用和发展的路径。

大模型的根本价值是重构生产力模式，为人工智能产业落地带来范式革新，真正实现「日日新、又日新」。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章

相关阅读

战国故事《定风波》卷二（1）：惊梦 BLIP-2、InstructBLIP稳居前三！十二大模型，十六份榜单，全面测评「多模态大语言模型」“商汤日日新”大模型体系全面升级，飞速迭代赋能百业日日生新 “商量2.0”的进化，站在商汤科技的大模型布局当前商汤日日新大模型90天大升级！CEO现场整活，主打突破想象力比 Spark 快 9 倍，超越 ClickHouse，在大语言模型时代构建全新数据平台 PromptBench: 首个大语言模型提示鲁棒性的评测基准 ChatGPT的朋友们：大语言模型经典论文一次读到吐性能超越GPT-4！谷歌推出大语言模型PaLM 2，全面升级Bard反击ChatGPT｜环球科学要闻 UCLA发布SciBench，评估大语言模型的科学问题解决能力大模型爱好者必看：60+大模型全场景落地案例集｜QCon 正式升级！“澳国立中国英才计划”全面升级为2.0——“澳”立职场 LangChain：2023年最潮大语言模型应用开发框架【城事】巴黎市长将重修Châtelet 广场以方便行人大模型爆发！百度智能云千帆2.0全面升级，讯飞星火正式开放我时常漫步在小雨里 ArchGuard Co-mate：一次关于大语言模型与架构治理、架构设计的探索跑步看世界-佩吉Page 2024QS排名疯狂上分的澳洲八大，AP/AL/IB申请谁更有优势？第十四章微软发布 Guidance 语言，用于控制大语言模型谷歌I/O开发者大会发布全新大语言模型，反超GPT-4！办公全家桶炸裂升级，还带来了首款折叠屏手机大语言模型综述全新升级版：85页、600+篇参考文献学习生成式大语言模型，东北大学自然语言处理实验室有一堂课巴黎市长将重修Châtelet 广场以方便行人大模型竞争突然升级！亚马逊 CEO 亲自监督、组建新的核心技术团队，集中优势资源打造“最具野心”的大语言模型剑桥、腾讯AI Lab等提出大语言模型PandaGPT：一个模型统一六种模态美元最大的敌人是黄金深度学习三巨头之一 Yann LeCun：大语言模型带不来 AGI 马斯克黄仁勋将出席闭门AI会议；传商汤大规模裁员；面壁智能推出大模型Luca When RS Meets LLM：推荐系统如何从大语言模型中取长补短？面向应用视角的全面综述大型语言模型专场上线！四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机 14部门重磅发文，医疗反腐全面升级！大语言模型的多语言机器翻译能力分析微软开源TypeChat库，给大语言模型换种提示，一行代码安装

热点事件追踪