Redian新闻
>
拓尔思施水才:大模型产业落地需解决的五大问题

拓尔思施水才:大模型产业落地需解决的五大问题

公众号新闻


11月25日,由创业黑马主办的“第15届创业家年会”在北京举办,年会主题为“AI给世界一个确定性”。会上,拓尔思创始人施水才以《大模型产业落地的实践》为主题发表了演讲。


施水才在演讲中表示,“烧钱做大模型已经成为过去,烧脑做AI应用正在当时”。他认为:大模型产业落地需要解决“合规可信、模型安全、数据质量、业务深度融合以及部署成本”等五大问题,未来大模型在千行百业的数字化转型和赋能中有非常广阔的市场。

以下为创业家&i黑马编辑过的演讲节选:

01
创业30年的三点体会

感谢创业黑马给我颁发“2023年度创业家”这个荣誉称号,我先分享下创业的感受和体会:

第一个体会是我怀疑自己还是创业者吗?我1993年就下海创业了,到现在30年,经过努力在2011年把公司带上了创业板。有一次开会时,一个券商老总看到我们的股票代码(300229)说:“施总,你还在工作呀?”他觉得我早应该退休了,打球的打球,润走的润走,有的公司甚至退市了,这引发了我的思考,真正理解什么是创业。我在母校西安电子科技大学做过一次演讲,标题叫《创业永远在路上》。创业是一种体验,我仍然把自己当作一个创业者,我认为创业永远在路上,它和财富没有什么关系,更多是兴趣和体验。

第二个体会是关于科学家和企业家在未来的商业公司里的地位。我不是著名的科学家,而是非主流教授下海,所以我的体会有两点:1、创业一定要all in。很多教授出来创业时,作为学者创业,不想放弃之前的东西,虽然我也有学校教授身份,但我120%的时间都在做公司业务。2、必须学会自我批判、自我否定。因为教授和科学家追求完美、非常执着。但作为企业家,要学会妥协。比如产品上要妥协,不能等做到100%再卖,否则会错过时间窗口;还需要跟用户妥协,甚至于还要跟友商妥协,因为这是一个商业生态。这里面不存在谁主导的问题,一位科学家要创业的话,自我否定、自我批判是非常重要的。

第三个体会是我们公司已经成立30年了,为什么还能活下来?最近跟很多领导和同行交流这个问题,我们也在反思,我们是不是没有战略。有一本书叫《为什么伟大不能被计划》,我们能活到今天,绝对不是没有战略。里面有几个重要的核心点:1、行稳致远,公司这么多年发展的比较稳。2、稳的同时不折腾,很多上市公司折腾一下,可能就把自己的公司折腾没了。3、不断去学习,思维不能僵化,在学习中持续创新。

以上是我在创业的这个历程中的一些感想。

02
IT产业发生的两个重大变化:
智能化,数据化

我们发展到今天,整个IT产业发生了两个重大的变化:一、从自动化到智能化。以前IT公司做流程也很重要,这是信息化,我们一直在做文本的信息化和自动化处理,到今天这个时代智能化处理已经成为生产力编个的关键。二、从IT企业发展到DT企业,大家所知道的数据要素,包括人工智能都是以高质量且大量的数据为基础。如果我们抓住了这两个变化,就可以穿越产业的发展周期。

03
大模型产业落地需解决的五大问题

有句话大家可能会感同身受:“烧钱做大模型已经成为过去,烧脑做AI应用正在当时。”截至目前中国已经有320个大模型,美国有100多个,在美国做AI应用正在蓬勃兴起。这两句话,对我们来说是有启发的。大模型在产业落地时,有五个方面的必须解决:1.合规、可信。2.模型本身的安全。3.训练数据的质量。4.业务的深度融合。5.部署大模型应用的成本。

第一点,大模型生成内容的合规可信问题。一个知名的媒体机关做价值观对齐,要做1万个对齐的句子,看看回答的问题对不对。有些大模型,为了保证结果不违反规定,选择不回答。如果大模型不回答问题,那还要大模型干什么?所以大模型生成的内容合规问题很重要,它泛化产生的幻觉,时间、地点对不上,如何解决?

第二点,安全问题。分成三个层面,一是模型本身的安全,因为模型可能会被攻击,比如数据投毒;二是数据安全,私域数据交给大模型学习,意味着我们的业务数据丢失,也是不行的。三就是个人隐私的数据安全问题。

第三点,高质量的数据是大模型效果的核心。现在有一种观点,用千亿参数加低质量数据训练的大模型,还不如用高质量数据加百亿参数训练的模型效果好,我是认同的。因为大模型的原理和方法,大家都清楚了,更重要的是数据、调优和工程化的能力。数据黑盒存在“三不”问题:数据的质量不高、实时性不够和覆盖率不全。

第四点,大模型的技术和业务是两张皮,很难创造价值。微软把所有的任务都转化为对话,把所有的任务都变成Copilot,所以在office里面它可以做个助手,但企业业务系统里面只有助手是不够的,必须解决大模型能力和业务两张皮的问题。

第五点,成本高。高成本下的回报在哪里?ROI有多少?

要解决这些问题,拓尔思也一直在探索,有几个探索点:

第一,要用一些方法来保障大模型生成内容的这个质量,使内容合规可信。一是中文特性增强的可控生成技术,包括安全围栏提示工程、知识注入等,还有大模型和知识图谱怎么结合,包括用知识增强这个方法,如何把搜索技术和大模型结合来提高生成内容的相关性和质量。另外用一些向量数据库来加持并实现多模态长期记忆和克服这个上下文的限制。

第二,安全。一定要强化数据安全的保护。

第三,高质量的数据。我们三大数据资产平台大概积累有 2000 亿条数据,每天日增大概2亿。现在这三个数据中心也都在服务于各行各业。我们为了验证数据质量对大模型的用处,在今年6月开展了一个行动:把我们的数据开放给各大基础模型研发的公司,看他们是否需要。经过一个多月时间,已经实现商业化收入的有将近10家,另外还有10家左右在合作使用。

第四,与业务的深度融合也是非常重要的。跟业务融合时,现在的基座大模型是什么并不是很重要,重要的是把所有这些都变成AI Agent。

第五,大模型到底是选择私有化部署还是SaaS服务,主要考虑成本问题和数据安全问题。大模型私有化部署时,工程化能力是大模型产业落地的重要保障。

04
拓尔思大模型的行业落地

拓尔思在6月29号的时候推出了拓天大模型,首先应用在媒体、金融和政务,最近又推出了舆情和公安等行业大模型应用。在媒体行业主要用大模型来做三件事:第一,成为内容生产环节的助手;第二,在内容搜索和推荐方面可利用大模型的知识增强能力;第三,在传播方面。拓天媒体大模型已在人民日报社部署使用。在金融行业,像信贷、投研、审批和客户服务,比如招商银行的消费者保护平台,用大模型的技术,从投诉分析到给出解决方案。另外跟平安银行做的审计大脑也使用了大模型技术。

在政务方面的实践也是一个非常大的市场,具体的应用场景包括政策研究,办公以及办事咨询助手等。在舆情方面,舆情报告的写作和分析助手,可以大大减少人工,这是它的一些应用亮点。在公安行业我们推出了分析、研判、执法和重大事件处理的一些应用。

未来大模型在千行百业的数字化转型和赋能中有广阔的市场,是大模型的主战场!


扫描下方二维码

报名参加黑马AIGC产业大课

↓↓↓


点击阅读原文,立即报名。

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
雪泥鸿爪我的童年 (十)晋升副高:多地需要这件事做满一年才可以!开脑洞:巴以问题解决的几种路径大模型产品的付费时代正在开启,提供更精细化服务大模型产业实践专场(二):在市场调查、投资和文献引用预测中的实践 | 第16届中国R会议暨2023X-AGI大会中国AI大模型背后的五大推手,打得不可开交!对于癌症病友的疲乏问题,祖国医学是这样解决的大华股份殷俊:大模型要让行业敢提需求,产业侧落地才是发展重点小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大人均存款高,不是啥好事,藏着五大问题态创合成生物平台升级!链接产业链上下游解决掣肘合成生物产业化的三大问题2024年或成国产大模型应用爆发年!有道再推多款大模型产品及应用《湖天一览楼》1部6章(3.1) 包惠僧隐藏土坝(上)巅峰对话:大模型在金融行业的落地|FCon 日程确定大模型infra专场:大模型系统层工作 | 第16届中国R会议暨2023X-AGI大会【动脉严选新品鉴第37期】百度灵医大模型:国内首个产业级医疗大模型容联云孔淼:大模型落地要聚焦,金融数智化营销=常态化经营策略|甲子引力从开源模型到商业落地应用,亚马逊云科技构建实用路线图!大模型落地最后一公里:111页全面综述大模型评测累计服务1500+人次,「1V1课时包」帮你解决的申请问题!北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型唯老是尊——中国养老现状及探讨(三)问月这件事,不是有钱就能解决的重磅!工信部主办中国5G发展大会来了,5G-A/RedCap/工业落地进展一文速览二十年前就是这样解决的阿里夸克蒋冠军:大模型应用要解决知识正确性问题复旦战昕彤:中国企业落地ESG不能只关注分配 而要强调增长大模型产业实践专场(一):在市场调查、企业数字化、教育培训中的实践 | 第16届中国R会议暨2023X-AGI大会追一科技 CEO 吴悦:大模型落地,场景、成本及效果,缺一不可李开复零一万物发布首款大模型;马斯克xAI发布首个大模型;360、美团、昆仑万维等最新消息;vivo发布蓝心AI大模型中国工程院院士郑纬民:建好AI生态,大模型产业才能更好发展AI天才杨植麟交卷大模型产品,特点:长长长长长免费大模型实战课|首周聚焦百度智能云千帆大模型平台使用,《大模型应用实践》实训营11月16日开讲!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。