Redian新闻
>
在工业领域谈GPT和大模型究竟是不是“扯淡”?

在工业领域谈GPT和大模型究竟是不是“扯淡”?

科技

作者:Sophia

物联网智库 原创


导读

在接受智次方研究院调研的30余家工业互联网企业中,超过70%是生成式AI技术的“观望者”,在他们看来,该类技术在工业领域的应用落地还很遥远,甚至可能是个“伪命题”。当然,也有接近30%是生成式AI技术的坚定“支持者”,他们认为虽然生成式AI在工业制造领域的应用还不成熟,但其改变传统生产方式、推动制造业未来数字化转型的趋势已经势不可挡。


“最近GPT和大模型这么火?您怎么看待生成式AI在工业领域的落地和应用?”
“说实话,我觉得在工业领域谈大模型纯属扯淡。”
“我们之前采访XXX公司CEO的时候,他非常看好生成式AI对工业领域带来的颠覆。”
“呵呵......”

这是一段我们近日在调研工业互联网企业时真实发生的对话。

从2022年11月Open AI推出ChatGPT开始,如今不过半年的光景。在短短近6个月的时间内,人工智能的进化几乎在以“天”为单位疯狂迭代,生成式AI对许多行业带来的颠覆足以用“摧枯拉朽”来形容。游戏、传媒、电商、影视、教育、金融等领域的从业者已经直面感受到了被AI“抢饭碗”的压力,但与之相比,承担着国民经济支柱重担的工业/制造业对生成式AI的态度却显得有些“谨慎”和冷淡。

在接受智次方研究院调研的30余家工业互联网企业中,超过70%是生成式AI技术的“观望者”,在他们看来,该类技术在工业领域的应用落地还很遥远,甚至可能是个“伪命题”。当然,也有接近30%是生成式AI技术的坚定“支持者”,他们认为虽然生成式AI在工业制造领域的应用还不成熟,但其改变传统生产方式、推动制造业未来数字化转型的趋势已经势不可挡。


观望者:为什么在工业领域谈大模型是伪命题?


先来看看“观望者”们为何不看好生成式AI。

首先,“观望者”认为当前大多数生成式AI模型主要关注文本和图像,只有非常少量的模型关注将传感器数据作为输入。同时,工业场景中的很多数据是不可读取的,或者即使读取了也需要一个翻译和解读的过程才能理解。

这个观点不无道理,不过在笔者看来,这并不是主要原因。此前就有多位计算机科学家曾预测,到2026年ChatGPT等大型语言模型的训练将耗尽互联网上的可用文本数据,届时当没有新的互联网训练数据可供使用时,由传感器、机器设备等生成的物联网数据自然会成为“香饽饽”。

同时,相对于互联网,物联网数据是物理实体产生的数据,具有鲜明的客观性,且大部分场景主要目的是用于生产经营,因此实用性也更高。在这些特殊数据的“投喂”下,生成式AI模型或许能够更深入地学习各行业具体场景知识,输出更精准的信息,为行业经营者和物联网用户参考,例如大幅提高预测性维护、供应链协同的效率。

更重要的是,在数据之外,工业领域对安全、稳定、可靠等指标极其严苛的追求,才是生成式AI不能满足的地方。

今年2月,计算机科学家 Stephen Wolfram 在推特发表了一篇万字长文解释 ChatGPT 的工作原理。简单来说,ChatGPT 的核心任务始终是对已有的文本生成一个“合理的延续”,“合理”的意思是指根据人类在数十亿个网页中撰写内容的规律,来推测接下来可能出现的内容。

例如,我们随机输入了一句文本,ChatGPT 就会在数十亿页的人类文本中查找类似文本,然后统计下一个单词出现的概率。需要注意的是,ChatGPT 并不是直接对比文字本身,而是以某种意义上的“意思匹配”为依据。最终,ChatGPT 会生成一个可能的单词列表,并给出每个单词的概率排名。也就是说,当 ChatGPT 完成像写文章这样的任务时,它实际上只是一遍又一遍地询问:“在已有文本的基础上,下一个词应该是什么?”并且每次都会添加一个词(更准确地说,它添加一个“token”,这可能只是单词的一部分,这就是为什么它有时会“创造新词”的原因)。

换言之,生成式AI的技术原理往往是寻找一种“最有可能”的答案,所以我们在实际使用过程中经常会遇到一些ChatGPT胡编乱造的“惊喜”,但是工业界不需要“惊喜”,工业生产最害怕“意外”,因为一个小小的故障和停机就可能带来成百上千万的巨额损失。

上海优也信息技术有限公司首席科学家郭朝晖博士曾在和智次方创始人彭昭的一次对话中表示:“工业这个领域讲究的是确定性的东西,安全稳定可靠。为什么要求六西格玛?因为它关注的是确定性的东西和物理世界的规律。而人工智能——无论是写诗还是理解语言等等,都是研究人类自身。针对人类,人工智能研究的是一种随机性。而工业过程很多时候是针对一种确定性的,即针对某种对象。从这个角度来看,GPT-4对工业的理解可能还是不会太深,但是对于研发和服务,尤其是研发出能够满足用户需求的产品,它可能会发挥比较大的作用。对于生产制造过程,它的作用可能会相对较弱。”

更进一步工业制造细分领域众多,各领域在生产流程、工艺、生产线配置、原材料及产品类型上均具有较大差异,强调的是细分行业的机理融合和行业知识,没有海量数据标签,因此工业领域基本上不可能形成类似GPT这样的通用大模型。

对此,天泽智云联合创始人李杰(Jay Lee)教授认为:“工业智能如果通用化,不应单纯是一个语言的生成式模型,它应该是一个操作的精密模型。操作的生成式预训练模型(OperationGPPT)应该有三个特色:第一个是它的目的性,要产能最大,维护成本最低,这是优化的目标函数(objective function);第二个,它有它的逻辑性:什么时候该做什么,随工况(regime)变化而变化,它一定有是由某种操作逻辑决定的;第三个,很重要的,它有因果性,好跟坏、大跟小、高跟低,它一定有因果关系。”

AGI生成式预训练模型ChatGPT与IAI操作优化的精密模型OperationGPPT特性对比

ChatGPT

OperationGPPT

发散的

收敛的

提供可能性

聚焦使用性

通用

精密


支持者:生成式AI将深入制造企业的流程优化


当然,“支持者”们也有自己看好生成式AI的理由。

一位受访者告诉智次方·物联网智库:“过去,工业AI通常着重于故障检测、预测性维护等用例,但2023年的一个新趋势是生成式AI将深入制造企业的流程优化。

第一,在产品开发阶段,生成式AI能够压缩设计和迭代的过程,从而带来显著的效率提升。

初创公司Divergent 3D使用生成式AI为英国的豪华跑车制造商阿斯顿·马丁设计的概念车打造后车架,从设计的提出、对比分析,到评估其可制造性,在短短一个小时之内就可进行30~40次迭代。


无独有偶,Monolith AI公司在2023年工博会上带来其机械工程仿真解决方案,基于该方案,创建者依靠实时数据每次进行仿真都会开发一个模型,省去许多测试程序,该公司的目标是到2026年将100000名工程师的产品开发时间缩短50%。

第二,除了研发,数据追踪和分析的流程或许也将被重塑。对制造业管理者而言,实时了解生产进度是重中之重。在一些比较传统的中小制造企业车间里,生产流程的记录往往依靠纸质单据或者Excel表格,生产信息整体传递滞后。为了解决这类问题,不少企业开始部署数字化系统,但却存在周期长、成本高等痛点。而生成式AI可以使用自然语言处理和机器学习技术从工业现场的仪表板上,甚至纸质数据和表格中读取数据(GPT-4已经具备了识图能力),并快速提取有用的特征和信息。

国外的一位博主进行了这样的尝试,他为ChatGPT提供了Zerynth 仪表板的链接,生成式AI立即就读取了仪表板中的数据和图表,实时提供了正在发生的事情的概览。虽然分析结果很肤浅,但这的确有助于初步分析和了解工厂的运行情况,包括哪些机器运行情况良好,哪些指标值得关注等。


第三,人们与机器沟通的方式会发生深刻的变化。过去运营人员一般通过各种软件与机器沟通,现在则可以直接通过自然语言与机器交流。有了ChatGPT,不用学习编程,人们就有能力调动各种机器,达成某种结果。再往远处看,生成式AI和大模型让人们看到了利用虚实结合的方式控制物理世界的可能性。用数字虚拟的方式训练生产机器,最终实现全自动化的制造业,让机器制造机器,工厂成为产品。

实际中已经开始出现一些初步的用例,比如——阿里工程师通过钉钉对话框向机器人发出指令后,通义千问大模型在后台自动编写了一组代码发给机器人,机器人开始识别周边环境,从附近的桌上找到一瓶水,并自动完成移动、抓取、配送等一系列动作,递送给工程师。这一演示表明,AI大模型已经突破了机器人的局限,让人类可以通过自然语言指挥机器完成负责任务,让机器人真正拥有了“大脑”。如果相关成果能在工厂得到复现,将会具备广阔的想象空间。


写在最后


上文所述的争论正反映了生成式AI作为新生事物在成长过程中必然要面临的考验。至于“是骡子是马”,还需要技术的成熟和时间的考验。

除了关于生成式AI的话题,智次方研究院也通过对工业互联网产业的深入调研汇总而成了《2023年中国工业互联网产业洞察暨生态图谱报告》,并即将于5月31日北京开幕的“2023数智产业领袖峰会”之“工业+能源专场分论坛”上重磅发布。

如果您对报告全文感兴趣
欢迎扫码报名参与活动

文末福利:转发本文到朋友圈并截图发给【小智慧】,可于活动当天凭聊天截图来现场领取纸质版报告全文(数量有限,先到先得)。

备注关键词【领取工业互联网图谱】

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
金融领域FinBERT、BloombergGPT以及法律领域微调模型LawGPT_zh台湾艺人“大牙”发长文爆料曾被范玮琪老公陈建州性骚扰过,陈建州还说范玮琪“性冷淡”?只给大模型LeetCode编号,也能解题!大模型表现好是源于对训练数据的记忆吗?请不要迷信大模型掘金大模型 科大讯飞押注专业领域GPT-4使用混合大模型?研究证明MoE+指令调优确实让大模型性能超群陆奇最新演讲全文实录、完整PPT和视频:大模型带来的新范式核酸检测任正非谈ChatGPT和AI大模型!三年完成13000+颗器件替代开发2000元训练比肩ChatGPT的开源大模型!GPT-4亲自盖章认证,模型权重均可下载无人驾驶是不是“扯淡”?王传福、何小鹏、余承东谁是谁非?大型语言模型技术公开课上线4讲!直播讲解ChatGPT开源平替、类GPT4低成本定制以及GPT4Tools紅與黑之旅之火車上的見聞(原載《世界華人周刊》)百度华为阿里等入选大模型“国家队”;盘古大模型3.0发布;阿里云推AI绘画大模型丨AIGC大事日报阿里大模型敢对标GPT-3.5?我们让GPT-4给它上了点强度。“扯淡” 用英语怎么说?中文字幕视频:黄仁勋对话OpenAI首席科学家,谈GPT-4及未来大模型请问这棵树得了什么病?中国工业互联网研究院:通用人工智能大模型工业领域知识问答性能评估张峥、小白谈GPT与人工智能:可能是好事,也可能不是别 . 情ChatGPT和GPT-4胜出基于四个方面叫板ChatGPT?Stability AI 开源语言大模型 StableLM,参数仅为GPT-3百分之四,却能实现超高性能微软也搞起了开源小模型!利用OpenAI的ChatGPT和GPT-4 训练,实力碾压当前最强开源模型全文 | 工业领域数据安全标准体系建设指南(2023版)(征求意见稿)GPT-4知道它是不是“胡说八道”吗?一篇关于大模型“自知之明”的研究360正式发布自研大模型,周鸿祎:国产大模型追赶GPT4的速度远超想象开源中文医疗大模型华佗GPT来了,真人医生盲测效果优于ChatGPT大模型的思想钢印:如何让ChatGPT相信水是有毒的?​中文信息处理实验室最新研究揭示虚假信息在大模型中的扩散机制智赋工业,“碳”寻未来!2023数智产业领袖峰会“工业+能源专场”分论坛圆满落幕大羊驼、羊驼、小羊驼和ChatGPT比差在哪儿?CMU副教授测评了7个类ChatGPT大模型《定风波》瑾沐篇(34):父慈子孝马斯克成立X.AI公司对抗GPT,网易云音乐上线鲸云母带音质,GPT-5并不存在,雷军首谈AI大模型,这就是今天的其他大新闻!IBM加入战局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-4阿里达摩院大模型公开课上新!主讲中文个性化对话大模型ChatPLUG和模块化多模态大模型mPLUG-Owl工业互联网平台疯狂内卷?生成式AI在工业遇冷?一文看懂2023年中国工业互联网产业最新洞察
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。