Redian新闻
>
企业怎么才能用上大语言模型?

企业怎么才能用上大语言模型?

公众号新闻
题图|视觉中国

以ChatGPT为起点,大语言模型(LLM)用全面的技术创新,以及在用户和产业中的应用落地,再次掀起了一个AI新浪潮。

与它的前辈们相比,大语言模型因为打通了语言这一人类沟通中介,并且仅用一个模型统一了多种复杂的任务,在对个人和公司的潜在影响力上明显更上一层楼。受到“再不努力就要被机器,或者是会用机器的人取代”趋势的威胁,越来越多中国企业开始下定决心要投身到新的AI热潮中去。

但当他们站上起跑线,只会发现事情并没有那么简单,甚至有点让人迷茫。

AI新浪潮,倒逼企业重塑数字化底座

造成企业“想说爱你不容易”的关键,主要有两点:

1、波及面太广:相比过往数次技术革命,大语言模型影响力和范围更大,渗透到企业运转、经营的多个环节,并与人类工作流程相互交织;

2、倒逼企业重塑数字底座:大语言模型在运行逻辑上不同于互联网时代,且需要企业有相当坚实的数字底座。如果企业自身数字化基础不足,前期准备和调整环节将非常有挑战。

以具体的数字为例,根据全球知名专业服务公司埃森哲研究发现,自然语言任务占到了企业人员工作总时长的62%,其中65%的时间可以借助人员强化和自动化技术来提升工作活动的生产力。

将这两个数字直接相乘,就能得到一个简单而又直白的结论——所有行业中40%的工作时间,都能通过GPT-4这样的大语言模型实现革新。

这个数字听起来或许有些夸张,我们不妨具体到特定的产业中来看。


以埃森哲前段时间对“大语言模型为快消品产业链带来的机遇”研究为例,大语言模型能够在产业链中应用的环节实在太多。从最基础的需求确立、产品打造、商业模式创新,到具体的市场营销,再到后续的供应链和制造管理、可持续发展以及企业内部的管理,基本上覆盖了所有的环节。

从企业和产业竞争的视角看,尤其是快消品这样互相快速模仿借鉴、竞争激烈的产业,大语言模型的应用,正在以一个全新的维度为企业带来新的竞争力。

在埃森哲最近的一项技术趋势调研中,72%的受访中国企业高管对AI新能力表示了极大的兴趣,并将在后续的企业经营中积极探索和尝试这项新技术。

确定了“要做”,接下来的问题是“怎么做”。而这恰恰是大语言模型技术的最大挑战所在。

对于本身数字底座相当充分的企业来说,探索AI新技术的应用能力、如何将自己的业务和内部运行模块与AI技术结合,是一个非常烦琐的任务。

在一次聊天中,埃森哲对虎嗅表示:“大语言模型时代和互联网时代的思维方式和路径,其实发生了非常多的变化。”


就拿我们上面提到的“倒逼企业重塑数字底座”为例,过去互联网时代的“人工编写代码+数据库”的模式,正在遭受“模糊数据+神经网络模型”的挑战。企业在需要用大语言模型全面提升自身应用和服务能力的同时,也需要开始着手收集还未数字化的企业信息和知识积累,并将他们整理为神经网络能够理解吸收或者学习的格式、作为企业专属模型的数据输入。

而在企业内部员工的培训上,大语言模型相关的内容也正在成为刚需,尤其是员工日常使用大语言模型过程中的prompt(提示词)技巧。

根据埃森哲服务中国企业的经验,“光是应用云计算、真正实现数字化这一点,对于很多中国企业来说就已经是革命性的了。现如今任务中多了AI,变革的压力和难度其实变得更高。”

根据中国电子技术标准化研究院2022年的研究,占据了中国企业绝对主体的中小企业,79%处于数字化转型初步探索阶段,12%处于应用践行阶段,真正达到深度应用阶段的企业仅占9%。

很显然,大量中国企业急切需要充分理解了AI发展趋势、拥有打造企业数字化底座的解决方案、和拥有丰富企业服务经验的“帮手”来拉一把。

为企业落地AI打头阵的埃森哲

正如我们上文所分析的,大语言模型的场景覆盖各行各业的诸多环节,这也让其应用和落地无法一概而论,整体体现为高度的非标准化,“边摸索、边创新、边落地”成为了当下的解决思路。

埃森哲云服务团队结合自身对大语言模型、对企业业务的理解,将这种“边摸索、边创新、边落地”定义为六个步骤:

Dive in, with a business-driven mindset(以业务驱动的初心):以积极的心态全身心拥抱变革,将业务需求和目标作为驱动力,迅速行动。

Take a people-first approach(以人为本的方式):在解决问题和开展工作时,将关注点放在人的需求和体验上,确保以人为中心的方法来处理事务。

Get your proprietary data ready(准备好企业的专有数据):整理和准备企业拥有的独特数据资源,为后续的生成式AI的使用和决策提供必要的数据支持。

Invest in a sustainable tech foundation(投资于可持续的技术基础):在技术方面进行投资,建立一个稳固可持续的基础设施,以支持长期的生成式AI的业务需求和创新。

Accelerate ecosystem innovation(加速生态系统创新):推动生态系统内的创新,加快不同组织、合作伙伴之间的创新合作,实现更快的发展和增长。

Level-up your responsible AI(提升企业的负责任人工智能水平):进一步提升人工智能技术的水平,注重负责任的使用和开发,确保生成式AI的影响是积极和可控的。

具体步骤看起来不复杂,但实际每个步骤操作中,都有很多“Know-How”(经验诀窍)存在。

就拿“投资于可持续的技术基础 ”来说,在互联网和移动互联网时代,虽然每家云供应商的整体技术架构有所不同,但是其技术原理和能力大多是相同的。而现如今的大语言模型能力,都能够通过神经网络实现知识的输入和输出,但是不同厂商大语言模型的最终结果有所差别,因此如何选定合适的生成式模型并以此为基础构建可持续的生成式AI技术能力,成为了一个关键课题。

另一个是潜藏在“ 准备企业的专有数据 ”环节背后的数据安全问题,AI大语言模型在完成自然语言预训练的基础上,需要进一步结合应用场景的特定数据,才能够实现能力的特化。在企业应用视角中,就是需要大量的企业真实数据、知识,其中往往会存在涉及商业机密的内容。


现在有很多企业会直接禁止员工使用公开的大语言模型,就是担心他们在处理公司任务的过程中,将企业的数据泄露出去。如何确保在推广大语言模型的过程中,确保自身企业数据的安全,是一个必须解决的难题。

面对这些挑战,在AI新技术探索上足够前沿,同时又深入理解企业需求的埃森哲云服务,就体现出了明显的优势。

以大语言模型的选择为例,埃森哲与全球范围内的主流云供应商都有着深度的合作,同时全球范围内数量众多、覆盖各行各业的客户也让埃森哲在大语言模型这样的技术应用环节上积累了丰富的经验。

在具体的大语言模型应用中,埃森哲联合国内外各家云厂商携手推出了大语言模型sandbox(沙箱)平台。

企业客户可以在大规模投入之前,在云上结合自己的业务场景进行试验,甚至是完成端到端的交付,快速验证,快速纠错。

在数据安全方面,埃森哲云服务也做了两手准备,首先是对云供应商和大语言模型解决方案的调研和能力评估,提前帮客户“扫雷”。

其次是积极探索新的技术解决方案,除了公有云的方式,也有私有云和线下部署;在技术方案上进一步增加数据保存和留存的限制,例如部分敏感数据不被机器二次学习,企业机密数据限制其在神经网络中的保留时长等等。

埃森哲认为,“任何服务和产品,一旦上升到企业级,就会变成最为严肃的问题。从创立之初就专注为企业提供技术和咨询等服务的埃森哲,向来遵循这一准则。”


这一规则,也造成了埃森哲在做云服务、包括现如今的大语言模型这件事上,致力于帮助企业利用最新技术达成业务目标、变得更成功。

“回到大语言模型上,埃森哲的最终价值是帮助客户有效地将这种新技术趋势用起来,从而赢下未来的竞争。”

写在最后

客观来看,目前国内哪怕最先开始尝试应用大语言模型的先锋企业,现在仍然还在比较前期、研究怎么将企业数据、经营流程与大语言模型技术进行契合的阶段。

针对大语言模型技术在具体业务场景中的应用范式,国内的很多云服务商和创业公司仍在持续技术创新的过程中。但先行起跑、在行业中抢先推行技术变革、做好数据收集和准备,必然能在将来大语言模型最终落地时,获得先手优势。


在这一场必然发生的技术变革中,同时具备“对于AI技术未来发展趋势深入理解”和“企业真实需求/思考第一视角”的埃森哲,正在成为中国企业迈入AI新时代的最佳助力。


特别策划

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
大语言模型会偷懒?新研究:上下文太长,模型会略过中间不看 | 本周论文推荐大语言模型综述全新出炉:51页论文带你盘点LLM领域专业化技术MIT团队打造未来实验室:大语言模型与人类优势互补,全程紧密配合大模型竞争突然升级!亚马逊 CEO 亲自监督、组建新的核心技术团队,集中优势资源打造“最具野心”的大语言模型笑谈邂逅(20)走遍天下也相遇的胡发云如何评估一个大语言模型?MIT惊人再证大语言模型是世界模型!LLM能分清真理和谎言,还能被人类洗脑术后复查网上大病求助,怎么才能可信EMNLP 2023 | MMEdit——如何编辑多模态大语言模型?大型语言模型专场上线!四位AI新青年直播讲解MiniGPT-4、LLaVA、Gorilla以及大型语言模型Token危机暴雪旗下游戏登陆Steam,苹果或研发大语言模型,微信可绑定国际信用卡,上汽与奥迪共同研发电动汽车平台,这就是今天的其他大新闻!学术成果 | EMNLP2023:MMEdit——如何编辑多模态大语言模型?矢量数据库:企业数据与大语言模型的链接器PromptBench: 首个大语言模型提示鲁棒性的评测基准大语言模型击败扩散模型!视频图像生成双SOTA,谷歌CMU最新研究,一作北大校友ICCV 2023 | 基于预训练视觉语言模型和大语言模型的零样本图像到文本生成Google提出LaCLIP:大语言模型重写本文输入,让CLIP重焕光彩!双林奇案录第三部之歌星之死: 第三节基于MNN在个人设备上流畅运行大语言模型一文速览大语言模型在分子领域中的探索北京理工大学发布双语轻量级语言模型,明德大模型—MindLLM,看小模型如何比肩大模型大语言模型真能“理解”语言吗?MIT惊人证明:大语言模型就是「世界模型」?吴恩达观点再被证实,LLM竟能理解空间和时间WAIC 2023 | 张俊林:大语言模型带来的交互方式变革张俊林:大语言模型带来的交互方式变革面向真实用户需求的中文大语言模型评测第二期(LLMEVAL-2)发布WAIC 2023 | 微软Office产品团队技术负责人蔡玮鑫:Copilot中大语言模型应用实践经验北京内推 | 航天信息招聘大语言模型算法研究实习生(2023年暑期)改写游戏规则!Meta开源大语言模型Llama 2,可免费商用;微软Copilot定价每月每用户30美元 | 环球科学要闻《护士日记》忧郁的尽头是自杀!且看相应的护理哈工大发布大模型思维链推理综述:200+文献全面解析大语言模型思维链推理最新进展微软开源TypeChat库,给大语言模型换种提示,一行代码安装文档字越多,模型越兴奋!KOSMOS-2.5:阅读「文本密集图像」的多模态大语言模型花卉摄影,自信的成长
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。